频数与频率的公式 3000字统计学入门——假装懂教育统计学
教育学专业的孩子大多是文科生,数学知识略少,但一些统计知识经常被运用到教育实践和研究中。
一.基本概念
1.等差中项
2.加权平均值
3.几何平均值
4.中位数
5.百分位
6.方式
7.全距离-四分位数距离-百分位数距离
8.方差-标准偏差
9.差异系数:标准偏差除以平均值
10.频率、频率和概率
11.样本的数据特征称为统计
12.统计分析被称为描述性统计
13.整体数据特征称为参数
14.从样本的统计中推断总体参数被称为推断统计
15.概率抽样方法:完全随机抽样、系统抽样、分层抽样、整群抽样等。
16.非概率抽样方法:滚雪球抽样、固定抽样、方便抽样、有意抽样、在空之间抽样等。
17.其他
以上不清楚,百度或者图书搜索都可以做。
二、抽样分布和推断依据
1.抽样分布是推断统计的理论基础。其中最著名的公式叫做“中心极限定理”:所有可能样本的平均值等于整个总体的平均值。
有点绕弯。我会把它作为课后问题卖掉。希望有课代表在文末留言区举个例子。
2.点估计:利用样本统计量的值来估计总体参数的值,称为总体参数的点估计,但很难说点估计是准确的
3.区间估计:基于样本统计量的抽样分布,按照一定的概率要求,用样本统计量的值来估计总参数值的范围,成为总参数的区间估计。
看起来是这样的:从一所学校随机抽取30名初中生,计算出平均分92。知道学校所有学生的方差就好了...最后经过计算得出全校平均分在89.5-93.7之间有95%置信,89.5和93.7分别称为95%置信区间的置信下限和置信上限。
4.假设检验:比如全省高三学生平均身高172cm。现在,一个城市随机抽取200名高三学生,测量平均身高173.2厘米,这200个样本的平均身高统计高于全省的参数,但你能解释一下这个城市所有高三学生的平均身高都高于全省吗?
虽然是随机抽样,但不可避免的会有抽样带来的误差。这时我们可以假设全市所有高三学生的平均身高也是172cm,然后用统计分析。
具体的数学过程我们不需要去了解,因为可以用软件来操作,但基本思路要理解:如果统计分析发现,按照假设,从平均高度为172的整个城市中随机抽取200个样本,这些样本的平均概率为173.2,小于1%,我们认为一个小概率事件在一个事件中是不可能发生的, 所以我们可以认为原来的假设是错误的,我们有99%的把握
三、T检验和方差分析
这两种方法一般用于推断连续变量,常用于比较平均值。
1.单样本t检验
使用其平均值和另一个假设数来推断样本。让我们假设这个样本所属的总体的平均值也是76,看看这个概率是否不在99%的置信区间内。
2.独立样本T检验
两个独立的样本,通过这两个样本的平均值,推断它们所来自的种群的平均值是否相同。
3.配对样本T检验
用于医学,10名患者在服药前测量一些指标,然后在服药一个月后测量相同的指标。两次测量的数据形成了一对一的匹配样本,经过统计,他们知道了药物是否有显著的疗效。
4.方差分析
如果组数超过2组,T检验效果不好,所以采用方差分析。
比如四块农田控制其他变量,施四种不同的肥料,最后根据产量看四种肥料之间是否有显著差异。化肥的自变量只有一个,叫做单向方差分析。如果有两个自变量,就叫双因素方差分析。
我不记得其他复杂的方差分析。必要时请现在检查。
5.方差齐性:两个样本来自两个总体,如果两个总体没有显著差异,称为方差齐性,这是上述推断的前提。然而,当样本数量较大时,方差齐性往往是默认的。
四.卡方检验
卡方检验的一般定义:是通过样本的频率分布推断总体分布是否满足某一假设的检验。
比如从某大学随机抽取50名男生和50名女生,发现40%的男生和30%的女生在高中数学考试中成绩优异。
那么,全校男生和女生人数多的优秀率相差无几的可能性有多大呢?我们假设全校男生和女生的优秀率是一样的,然后操作...最后我们给大家一个结果,其实就是假设成立的概率。如果低于1%,我们可以果断拒绝原来的假设,全校男生优秀率在99%以上,可能高于女生。
这时可能有同学问,直接统计学校所有成绩不就可以了吗?
没错。统计推断绝对不如人口普查。
总览:所有研究对象都被调查,得到的就是想要的。
但是现实中很多情况是无法调查的,这就需要太多的人力物力,有时候是不可能的。
比如你想看一部手机的屏幕抗压能力,从这次交付的1万部手机中随机选择7部就可以大致了解。你能用锤子砸碎一万部手机吗?
动词 相关分析和回归分析
1.相关性:两个变量之间不精确、不稳定的关系,两个变量具有相同的状态。
相关系数为0是不相关的,1是完全正相关,而-1是完全负相关。
2.回归:自变量和因变量,表示因变量和自变量之间的关系。一般认为回归比相关更准确、更稳定,但也不准确。
3.最小二乘OLS是一种常用的线性回归方法,其目的是最小化偏差的平方和。
4.相关性,甚至回归方程,都不能说明因果关系,但你的样本数据正好符合数学模型。判断因果需要相应领域的专业知识。
比如一个同学的物理成绩一直在不断提高,最近又掉了更多的头发,所以物理成绩和掉头发的数量是正相关的。那么,我们能说这两件事之间有因果关系吗?你可能需要物理老师和皮肤科医生之间的咨询。
不及物动词主成分分析和因子分析
这两个概念是相似的——降维。如果你测了十几个变量,分析太乱,需要把十几个变量整合成几个综合指标。两种方法在数学上有很多差异,但软件操作步骤基本相同。
比如你衡量影响幸福感的因素:身高、体重、年龄、学历、性别、健康状况、婚姻状况、孩子、职业、工资水平、家庭住址、宗教信仰、锻炼频率等。哪些因素影响幸福感?十几个变量太混乱了...
经过一些整理,可以画出几个综合指标来包含它们:身体特征;家庭特征;社会角色。然后方便分析。
读这部分的时候,经常看到“矩阵”和“特征值”这两个词。想起了近十年前学的线性代数,满是泪水。
七.信度和效度
可靠性:一致性、可靠性和稳定性。
如果买电子秤,第一次120斤,第二次123斤,第三次118斤...这叫不靠谱。
效果:有效性是你想要衡量的。
你退了产品买了新秤。这次没事了。连续称了好几次,120斤。这叫信誉。然而,你的真实体重实际上是123磅。在这一点上,我们说这个说法有很高的可靠性,但有效性很低。
因此,信度是效度的必要条件,也是不充分的条件。
难免有一些错误。请留言指正。