下一章 上一章 目录 设置
3、第 3 章
f ...
-
for+时间→完成时havre has +过分eg:already/since,just,before
next →将来时will+动原tonorrIin the farture |In+时间1s/ shall lbe prgsing
一般现在时
always, usuall,often,Sometimes, selodo, e
一般过去时,ed.yesterday,last 十时间,Jost now,in+年
现在进行时 be+doing Look,liston! now,at the moment目前
过去进行时 was,were+doing,when,which,at 8点
时过完成时 had +过去分词,the time + done, before+过去
简述数据科学的核心流程及各环节核心任务
答案:数据科学核心流程为数据采集预处理·分析-建模·建模可视化。数据采集是获取原始数据;预处理含清洗、标准化等,提升数据质量;分析是探索数据特征与规律;建模是构建模型挖掘数据价值;可视化是将结果直观呈现,帮助理解与决策。
简述总体与样本的概念及二者关系
答案:总体是研究对象的全体,包含所有研究单元;样本是从总体中抽取的部分单元。关系:样本来自总体,是总体的代表:通过样本特征推断总体参数,是统计推断的核心依据。
论述时间序列分析中趋势、季节性的识别方法及移动平均法、季节指数法的应用原理
答案:趋势识别方法:一是图示法,通过折线图、趋势图直观观察数据长期上升/下降/平稳趋势;二是统计法,计算移动平均、线性回归拟合趋势线,通过斜率判断趋势方向。季节性识别方法:一是图示法,观察时间序列是否存在固定周期波动:二是计算季节指数,通过各季节平均值与总平均值对比,判断季节性强弱。
移动平均法应用原理:通过对时间序列按固定步长(如n期)计算平均值,修匀短期波动,凸显长期趋势。步长选择关键,步长越大,平滑效果越强,但易掩盖短期趋势。例如月度数据用3期移动平均,可消除短期随机波动,展示中期趋势。
季节指数法应用原理:先计算各季节(如季度、月份)的季节指数,反映季节波动幅度:再将原始数据除以季节指数,消除季节性影响,得到趋势序列;最后对趋势序列建模并结合季节指数还原预测结果,适用于存在明显季节性的时间序列预测,
数据按结构可分为结构化数据、非结构化数据和半结构化数据。
总体与样本中,根据总体特性计算的数值称为参数,根据样本计算的数值称为统计量
数据集中趋势的测度指标是均值、 中位数和众数
离散程度的测度指标中,反映数据与均值偏离程度的是方差与标准差。
正态分布的概率密度函数曲线早钟形分布。
假设检验的基本思想是先提出原假设,再通过样本数据判断是否拒绝它。假设检验中,犯第一类错误的概率称为显著性水平。
数据清洗中,处理缺失值的常用方法有删除法、填充法和插值法。 .异常值的处理策略包括删除、标记和修正。
数据标准化中,将数据映射到[0.1]区向的方法是最小-最大标准化(Min-Max Scaling).
数据归一化的核心作用是消除不同量纲对模型的影响。
数据可视化中,用于展示数据分布特征的基础图表有直方图、折线图、饼图和散点图