在概率论中, 我们研究的随机变量具有已知的分布,
研究的目的是刻画它的规律;
在数理统计中, 我们研究的随机变量具有未知的分布 (或者部分未知),
通过重复独立的观察, 得到许多观察值,
对这些数据进行分析来总结规律,最终目的是对所研究的随机变量的分布作出推断。
随机样本
总体
定义
我们将试验的全部可能的观察值称为总体, 每一个可能观察值称为个体。总体中所包含的个体数目称为总体的容量; 容量为有限的称为有限总体, 容量为无限的称为无限总体。
举例
考察某大学一年级共 2000 名男生的身高, 每个男生的身高是一个可能观察值,
所形成的总体容量为 2000, 是一个有限总体。
观察某一地点每天的最高气温, 该总体是无限总体。
考察全国正在使用某种型号灯泡的寿命所形成的总体,
由于可能观察值的个数很多, 可以认为是无限总体。(有限总体容量过大,
近似认为是无限总体
与概率论联系起来(理想与现实
总体中的每一个个体是随机试验的一个观察值,
因此它是某一随机变量的值。
因此,
我们可以认为总体对应随机变量,今后近似认为二者等同,总体对应的随机变量的分布函数和数字特征就是总体的分布函数和数字特征。
理想中我们对每个个体进行检测,但实际上,比如检测灯泡是不可能每个都检测的,通常从总体中抽取一部分个体,
根据获得的数据来推断总体分布。
样本
抽样分布
样本是进行统计推断的依据. 在实际应用中, 往往不是直接使用样本本身, 而是针对不同问题构造样本的适当函数, 利用这些样本的函数进行统计推断
统计量
定义
设
估计
估计量的评选标准
无偏性
含义
反复多次使用估计量后, 就“平均”来说其偏差为零。