食物中毒

首页 » 常识 » 问答 » 统计推断,要不要扶
TUhjnbcbe - 2021/1/13 14:40:00

老人要不要扶,送的优惠券要不要拿,这时候很大可能是各种辩论开始了,不管社会学家,还是逻辑学家,还是商业资讯,哲学家,工程师,数学家当然还有普通公民都会有个相对固定的言论,但是到了统计学派,却说了这个被坑的概率是0%,或是说有60可以相信吧

妈妈还是没说要不要扶

好吧这就是统计推断的推断,这不是逻辑推理,而是靠样本说明总体的计算方法。

当然到底靠不靠谱,科学工程等方面都是再用的,这些东西的基础都是基于推断统计,而且就像我们看总统大选,比赛都会研究很多胜率,人说这才是他们的核心科技,只是我们都是用别人的结果罢了。

我们看下为何推断性统计,这其实在之前都是很明显了

我们要研究一个大群体的问题不可能所有都去看过,比如我们不可能对一个批次的牛奶都拿去检测,大选的时候都会有民调那肯定是不会所有人都问过去,所以要以一种少数样本的计算得出总体的情况,从而得出一些发现。

那么首先就是这个样本怎么取了

1、抽样方法和中心极限定理

抽样是为了从样本中得出关于群体的结论,它使我们能够通过直接观察群体的一部分(样本)来确定群体的特征。

选择一个样本比选择一个总体中的所有个体所需的时间更少

样本选择是一种经济有效的方法

对样本的分析比对整个群体的分析更方便、更实用

另外样本分布要尽量接近总体,比如正态

思考步骤:

以总统大选的民意调查为例

第一步

抽样过程的第一步是明确定义目标群体。

因此,为了进行民意调查,投票机构仅考虑18岁以上且有资格在人口中投票的人。

第二步

抽样框架(SamplingFram)–这是构成样本总体的个体列表。

因此,这个例子的抽样框架将是是名字出现在一个选区的所有投票人列表。

第三步

一般来说,使用概率抽样方法是因为每一张选票都有相等的价值。不考虑种姓、社区或宗教,任何人都可以被包括在样本中。不同的样品取自全国各地不同的地区。

第四步

样本量(SamplSiz)-是指样本中所包含的个体的数量,这些个体的数量需要足量以对期望的准确度和精度进行推断。

样本量越大,我们对总体的推断就越准确。

在民意调查中,各机构试图让尽可能多的不同背景的人参与抽样调查,因为这有助于预测一个**可能赢得的席位数量。

第五步

一旦确定了目标人群,抽样框架,抽样技术和样本数量,下一步就是从样本中收集数据。

在民意测验中,机构通常会向人民提出问题,例如他们要投票给哪个**或前**做了什么工作,等等。

根据答案,各机构试图解释选民投票给谁,以及一个**要赢得多少席位。

这里的抽样框架或是抽样方法就是需要针对不同的目的和场景,进行选择了,常见的抽样方法有:#概率抽样总体中的每个个体都有相等的被选中的机会。比如每个选民被选中的概率是均等的。?简单随机抽样;这也就是最简单的方式,人口中每个人的机会均等,比如用蒙特卡洛法进行模拟选择。?分层抽样;可以根据人口特征比如男女比例,种族等进行分组,然后按比例抽样;?整群抽样(先将总体中若干个单位合并为组,这样的组称为群,再直接对群进行抽样);?系统抽样(将总体中所有单位按一定顺序排列,在规定的范围内随机抽取一个单位作为初始单位,然后再按事先指定好的规则确定其他样本单位);假设,我们从第3个人开始,样本容量是5。因此,我们要选择的下一个个体将是(20/5)=,从第3个人开始,即7(3),依此类推。?阶段抽样(先抽群,然后在群内进行二阶段抽样)。#非概率抽样对于非概率抽样,这些概率是不相等的。一个人被选中的机会可能比别人大。?方便抽样(依据方便原则自行确定);方便抽样容易产生显著的偏见,因为抽样可能不能代表诸如宗教或人口的性别等具体特征。?判断抽样(依据专业知识进行判断);?自愿样本(调查者自愿参加);?滚雪球样本(类似树结构);现有的人被要求推荐更多他们认识的人,这样样本的大小就会像滚雪球一样增加。当抽样框架难以识别时,这种采样方法是有效的。类似分享裂变。雪球抽样有很大的选择偏见风险,因为被引用的个体将与推荐他们的个体具有共同的特征。?配额样本(类似分层抽样);

因此,编号为、8、12、16和20的个人已经为我们的样本保留。

在配额抽样中,选择的样本可能不是未考虑的人口特征的最佳代表。

#两者抽样方法之间的比较:?非概率抽样适合探索性的研究,为更深入的数据分析做准备,特点是操作简便、时效快、成本低。而且对于抽样中的统计专业技术要求不是很高;?概率抽样的技术含量更高,调查成本更高,统计学专业知识要求更高,适合调查目的为研究对象总体,得到总体参数的置信区间。由中心极限定理得出的几个结论

不管进行多少次抽样,每次抽样都会得到一个均值。当每次抽取的样本容量n足够大时,一般大于30个为界限,样本均值总会围绕总体均值附近,呈现正态分布。

当样本容量n足够大时,样本均值构成正态分布,样本均值近似等于总体均值μ,而样本方差等于总体方差σ2除以n,即σ2/n。

样本均值分布的标准差,我们称之为标准误差。

当样本量小于30的时候,总体近似正态分布时,此时样本服从t分布。样本的分布形态决定了我们在假设检验中采用什么方法去检验它。

接着才是开始推断统计

根据样本数据推断总体的数据特征。1、基本步骤产品质检的时候用的几乎都是抽样方法的推断性统计,推断性的过程就是一种假设检验,在做推断性统计的时候我们需要明确几点:1)问题是什么?——2)需要明确的证据是什么?3)判断标准是什么?明确后可以对应我们假设检验的几个步骤了:1)提出原假设(H0)和备选假设(H1),确定显著性水平(原假设为正确时,人们把它拒绝了的概率)2)选择检验方法,确定检验统计量3)确定P值,作出统计推理假设对于某一个器件,国家标准要求:平均值要低于20。某公司制造出10个器件,相关数值如下:15.....19.16....9运用假设检验判断该公司器件是否符合国家标准:1)设假设:原假设:器件平均值=20;备择假设:器件平均值20;2)总体为正态分布,方差未知,样本为小样本,因此采用T检验。3)计算检验统计量:样本平均值17.17,样本标准差2.98,检验统计量为(17.17-20)/(2.98/√10)=-3.)当置信度选择97.5%,自由度为9,此时为单尾检验,临界值为2.。5)由于-3.-2.,拒绝原假设,因此接受备择假设,该器件满足国家标准。2、假设检验类型?单样本检验:检验单个样本的平均值是否等于目标值?相关配对检验:检验相关或配对观测之差的平均值是否等于目标值?独立双样本检验:检验两个独立样本的平均值之差是否等于目标值3、统计检验方法Z检验:一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数平均数的差异是否显著。T检验:用于样本含量较小(例如n30),总体标准差σ未知的正态分布样本。F检验:F检验又叫方差齐性检验。在两样本t检验中要用到F检验。检验两个样本的方差是否有显著性差异这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。(T检验用来检测数据的准确度,检测系统误差;F检验用来检测数据的精密度,检测偶然误差)卡方检验:主要用于检验两个或两个以上样本率或构成比之间差别的显著性,也可检验两类事物之间是否存在一定的关系。也叫anova、双尾检测和单尾检测这个和我们提出的原假设相关,例如我们检测的原假设:器件平均值=20;我们需要拒绝的假设就是器件平均值20,此时就是单尾检验;如果我们的原假设是器件平均值20,则我们需要拒绝的假设就是器件平均值20和器件平均值=20,此时就是双尾检测;

要了解置信区间和置信水平得先认识些推理思路和概念

什么是小概率事件

小概率事件”指的就是在一次随机试验中,几乎不可能发生。

假定参数是射击靶上10环的位置,随机进行一次射击,打在靶心10环的位置上的可能性很小,但是打中靶子的可能性确很大。然后用打在靶上的这个点画出一个区间,这个区间包含靶心的可能性就很大,这就是区间估计的基本思想。

怎么认识假设检验

就如前面的产品检测,假设检验也叫显著性检验,通过样本的统计量,来判断与总体参数之间是否有差异,这里就是差异是否显著。

比如验证一种幼儿教育方法是否有效,然后要选择样本,比如分为两组,肯定要做好之前的样本方法,比如不能相差太多年龄,男女比例等,然后选择判断的指标,比如语言,逻辑,专注力,想象力等,然后就要分别控制这些影响,比如不能用了别的方法,或是有的增加了别的活动或是更好的环境营养等等,然后再去看实验后两组是否有显著差异。

假设检验也就是遵循“疑罪从无”的逻辑,就是如果显著差异很小,就是说拒绝原假设,因为这是可能是小概率事件发生了。违反逻辑和常规的结论就是小概率事件,可以认为再一次实验是不会发生的。我们首先认为原假设为真,如果小概率事件发生,那么就拒绝原假设,否则接受他。

P值

假设检验说是否存在显著性差异,那多少是小概率呢,或多少是显著呢,这其实是统计学家定的或是人为的设定,P-valu表示样本统计量和总体参数无差异的概率。然后我们设定个阈值,这个阈值就是显著性水平a,一般为0.05(1-a叫置信度),p值大于a,接受原假设。也就是说明无差异的概率大于显著性水平时,接受它,就是说发生差异的不是小概率事件。

在统计学中,几乎都是依据样本来推断总体的情况的,但在推断的过程中,我们会遇到各种各样的阻碍和干扰,所以我们推断出的结果不是一个切确的数字,而是在某个合理的区间内,这个范围就是置信区间。但整体中所有的数据都在这个范围也不现实,我们只需要绝大多数出现在置信区间就可以了,这里的绝大多数就是置信水平的概念,通常情况我们的置信水平是95%。置信区间[a,b]的计算方法为:(z分数:由置信水平决定,查表得)a=样本均值-z*标准误差,b=样本均值+z*标准误差

用一个详细的案例说明:如果对总体返回抽样次,每次抽样的样本量都是n,每个样本都会得到一个区间估计,那么次抽样,就会得到个区间。当置信水平1-α=95%时,那么就表示个区间中包含总体参数的有个抽样样本,只有个样本不包含总体参数,这个不包含总体参数的样本就相当于我们估计错误。这个概率只有5%,是小概率事件,也就是说在一次随机试验中,这个小概率事件不可能发生。

来源

1
查看完整版本: 统计推断,要不要扶