您当前位置: 圣才学习网首页 > 统计类 > SPSS

spss理论基础知识(二)

扫码手机阅读
用圣才电子书APP或微信扫一扫,在手机上阅读本文,也可分享给你的朋友。
评论(0
  第三章
  1.可是离散化的作用以及两类方法
  作用:可视离散化用于为定量变量创建分类变量,从而实现连续变量的离散化。在统计分析中,有时候需要了解总体的大致分布状况,而不需要了解属性的具体信息。
  两类方法:直接输入分割点和根据条件自动生成分割点。
  2.数据缺失的可能原因,缺失值的定义以及如何处理缺失值?
  1)原因:1在数据收集阶段,收集者没有收集到相应数据;
  2应答着拒绝回答该问题,比如该问题涉及个人隐私;
  3该问题对该应答者不适用,比如该问题是针对女性的,而应答者为男性。
  2)定义:缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类,分组,删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。
  3)如何处理:首先应该想到重新回到数据收集阶段尽量收集到该数据,如果实在收集不到该数据,再考虑怎么处理缺失值,如果缺失数据不影响到具体的统计分析,则不对缺失值作任何处理(即缺失数据还是作为缺失数据处理),如果缺失数据影响到了具体的统计分析,则必须考虑采取适当方法来填补缺失数据。
  3.SPSS提供的填补缺失值的方法有哪些?(作简要说明)
  1)序列均值为取整列数据的均值;
  2)临近点均值为去该缺失值临近的几个点的均值,具体几个点由附近点的跨度来设定;
  3)临近点的中位数为取该缺失值邻近的几个点的中位数,具体几个点由附近点的跨度来设定;
  4)线性插值法应用线性插值法填补缺失值。用该列数据缺失值前一个数据和后一个数据建立插值直线,然后用缺失点在线性插值函数的函数值填充该缺失值;
  5)点处的线性趋势法应用缺失值所在的整个序列建立线性回归方程,然后用该回归方程在缺失点的预测值填充缺失值。
  4.什么叫数据校验,作用是什么?
  数据校验即查找错误数据或者不一致数据的过程。
  作用:如果数据没有收集到则尽量想办法补全;如果是录入错误则重新录入;如果数据确实错误,则可将这些数据设置成缺失值(即丢弃这些数据不进行分析)。
  5.在选择个案If对话框中,构建选择“‘男性1’、‘黑种人2’、‘东北地区1’”的表达式:性别=1&种族=2&地区=1

小编工资已与此挂钩!一一分钱!求打赏↓ ↓ ↓

如果你喜欢本文章,请赐赏:

已赐赏的人
最新评论(共0条)评论一句