收藏
0有用+1
0

一致估计

统计学名词
一致估计亦称相合估计和相容估计,是一种优良点估计。按收敛的意义不同将一致估计分为两种:弱一致估计和强一致估计。
点估计又称定值估计,是指直接用样本平均数或样本成数代替总体平均数或成数,而不考虑误差的一种估计方法。例如对100名大学生进行收视率调查,调查结果是30%每天收看电视新闻,从而推断, 在全体大学生中30%每天收看电视新闻。
中文名
一致估计
外文名
consistent estimator
别    名
相合估计相容估计
领    域
数学
学    科
统计学
性    质
点估计

概念

播报
编辑
一致估计(consistent estimator)亦称相合估计和相容估计。是一种优良点估计。设总体ξ的概率分布函数为F(x;θ),θ∈Θ为未知参数,若可估函数g(θ)估计量θ(ξ1,ξ2,…拳叠几,ξn)当n趋于无穷时,在某种意义下收敛于g(θ),则称θ(ξ1,ξ希抹殃2,…,ξn)是g(θ)在这种收敛意义下的一致估计。它要求作为估计量的统计量,当样本容量无限增大时,在某种意义下,收敛于待估计参数的真值。按收敛的意义不同将一致估计分为两种:若当样本容量n→∞时,对任意给定的ε>0,有: [1]
则θ整芝雄渗(ξ1,ξ2,习元…,ξn)称为g(θ)的弱一致估计;若有:
则θ(ξ1,殃厦户ξ2厚厚坑,…,ξn)称为g(θ)的强一致估计。一致估计是点估计中最基本的大样本准则。例如,正态总体N(μ,σ想旬举2)的样本均值ξ就是E(ξ)的一致估计,因为根据大数定律,对任给ε>0,当n→∞时,有:
成立。这就表明ξ是E(ξ)的弱一致罪碑估计。

估计

播报
编辑
根据观测值来推测母体参数的值或范围的过程称为估计。估计分为点估计和区间估 计。点估计,是根据观测值估计出对母体参数θ的估计值T(X1,X2,…… Xn) 的过程。例如,在进行灯泡寿命测定时,根据几个灯泡寿命 来推测一批灯泡寿命的过程,就为点估计。其过程是: 先抽取若干个灯泡做样本来测取寿命值 (以小时为单位) ,样本的寿命分别是X1,X2,……Xn,求出平均值X=X1+X2+……Xn/n和方差:
此时就用平均寿命去估计母体寿命μ,用方差S去估计母体 σ,即是点估计。

点估计

播报
编辑
点估计又称定值估计,是指直接用样本平均数或样本成数代替总体平均数或成数,而不考虑误差的一种估计方法。例如对100名大学生进行收视率调查,调查结果是30%每天收看电视新闻,从而推断, 在全体大学生中30%每天收看电视新闻。
一般说来,用抽样指标估计总体指标,总会存在一定差异,但如果满足下面3个要求,就可认为是合理估计或优良估计。1.无偏性。用抽样指标估计总体指标时,个别样本指标与总体指标间会有偏差,而用很多样本指标的平均值估计总体指标,平均说来是无偏差的。2.一致性。用抽样指标估计总体指标,当样本单位数充分大时,抽样指标将充分接近总体指标。3.有效性。用抽样平均数和总体某一变量来估计总体平均数时,虽然两者都是无偏估计量,但样本平均数更靠近总体平均数,平均说来,它的离差较小,因此,是更优良的估计量。 [2]

区间估计

播报
编辑
设总体或总体分布的某个参数为θ,从该总体抽取含量为n的样本,按一定概率估计总体参数θ在哪个范围,即由样本观测值求θ的1-α可信区间,1-α称可信度,通常取95%可信度,即α=0.05,求θ的95%可信区间。如求总体均数μ的1-α可信区间,求总体率π的1-α可信区间,求总体回归系数β的1-α可信区间等。θ的区间估计常和其点估计θ相结合。一般当样本含量较大时(如n>30),θ近似服从正态分布,可用正态近似法求总体参数的1-α可信区间:
或简写成θ±uαS(θ)。s(θ)为θ的标准误。通常求总体参数θ的95%可信区间:
或简写成θ±1.96s(θ)。可信区间的含义为:固定样本含量n,从总体中作随机抽样,每个样本可以算得一个可信区间,如95%可信区间,意味着做100次抽样,算得100个可信区间,平均有95个可信区间包括总体参数(估计正确),只有5个可信区间不包括总体参数(估计错误)。5%是小概率事件,实际发生的可能性小,因此,在实际应用中就认为总体参数在算得的一个可信区间内,冒5%犯错误的风险。可信区间的两个要素:一是准确度,反映在可信度1-α的大小,越接近1越准确,如可信度99%比95%准确;二是精密度,反映在区间的长度,越小越精密。二者是矛盾的,需要兼顾。

统计量

播报
编辑
样本的已知函数,其作用是把样本中有关总体的信息汇集起来,是数理统计学中一个重要的基本概念。常用统计量有样本矩、次序统计量、U统计量和秩统计量等。其中U统计量是W.霍夫丁于1948年引进的。统计量的充分性和完全性是两个重要概念,充分性是费希尔在1925年引进的,内曼和P.R.哈尔莫斯在1949年严格证明了一个判定统计量充分性的方法,叫做因子分解定理。统计量的分布叫做抽样分布,它的研究是数理统计中的重要课题。对一维正态总体,有三个重要的抽样分布,即χ分布、t分布和F分布。其中χ分布是F.赫尔梅特于1875年在研究正态总体的样本方差时得到的;t分布是英国统计学家W.S.戈塞特(笔名“学生”)于1908年提出的;F分布是费希尔在20世纪20年代提出的。 [3]