当前位置:首页 >> 智能

p值是什么?数据科学家用最简单的方式为告诉你

来源:智能   2024年11月10日 12:16

99.7% 的有数据资料在少于参数(μ)±3 个准则差(σ)内。

还记得社论开头说的见到希德斯光子的「5-sigma」持续性吗?在科学家证实见到希德斯光子早先,5-sigma 达为有数据资料的「99.9999426696856%」。特设这么严格的持续性是为了避开潜在的错误信号。

好了。以前你可能自已想到「准则差是如何应用在假定核对之中的」。

因为是用 Z 核对进行假定核对的,因此要计数 Z 分有数(用于核对汇总生产量),这是有数据资料点到少于参数的准则偏差有数。在本和文的例证之中,每个有数据资料点都是收集到的薄饼仓储间隔时间。

▲计数每个有数据资料点的 Z 分有数的式子

对每个薄饼仓储间隔时间点计数 Z 分有数,并绘制出准则准则差曲率时,x 轴上的其单位从分钟变成了准则差其单位,因为仍然通过计数(变生产量倍数少于参数先乘以准则差,见上述式子)将变生产量准则化了。

准则准则差曲率是很有用的,因为我们可以比起测试结果和在准则差之中有准则其单位的「正态」各个方面,相比之下变生产量的其单位不尽相同的情况下。

▲Z 分有数的准则准则差

Z 分有数可以想到我们整个有数据资料相比较各个方面少于参数的位置。

我喜欢 Will Koehrsen 的说法——Z 分有数越多高或越多偏高,结果就越多不可能无意之中发生,结果就越多有可能有本质。

但多高(偏高)才足以概述结果是有本质的呢?

这就是解决这个难题的先前一片纸片——p 参数。根据科学实验开始前理论上上的明显偏高水平(alpha)核对结果确实带有汇总学本质。

03 什么是 P 参数

与其用维基百科概述的并不一定来解读 p 参数,不如用和文之中的薄饼仓储间隔时间为例来解读它。

对薄饼仓储间隔时间随机抽样,目标是核对少于仓储间隔时间确实多于 30 分钟。如果事与愿违的结果赞同薄饼店外的说法(少于仓储间隔时间相等等同 30 分钟),那就愿意接受零假定。否则,就愿意零假定。

因此,p 参数的工作就是说道这个解决办法:

如果我生活习惯在薄饼仓储间隔时间相等等同 30 分钟(零假定成立)的21世纪之中,那我在真实21世纪之中得到的论据有多实在太惊异?

p 参数用有进制(期望值)说道了这一解决办法。

p 参数越多偏高,论据越多实在太惊异,零假定越多荒诞。

当零假定很荒诞的时候还能动手什么?可以愿意零假定并转而选择备择假定。

如果 p 参数偏高于早先并不一定的明显偏高水平(人们一般将它称为 alpha,但我将它称动手荒诞持续性——别问为什么,我只是真是这样愈来愈容易解读),那么就可以愿意零假定。

以前我们解读了 p 参数是什么意思。月里把 p 参数用到和文之中的例证之中。

以前仍然抽样得到了一些仓储间隔时间,计数后见到少于仓储间隔时间要长 10 分钟,p 参数为 0.03。

这假定在薄饼仓储间隔时间相等等同 30 分钟(零假定成立)的21世纪之中,由于随机噪声的因素,我们有 3% 的期望值时会看到薄饼仓储间隔时间延长了仅仅 10 分钟。

p 参数越多偏高,结果越多有本质,因为它不太可能是由噪声引起的。

大多有数人对于 p 参数都有一个常见的误解:

p 参数为 0.03 假定有 3%(期望值百分比)的结果是无意之中重新考虑的——这是错误的。

人们都自已得到确切的答案(除此以外我),而这也是我在较长间隔时间内都对 p 参数的解读觉得困惑的原因。

p 参数不能断定任何大事。这只是一种根据惊异高度特别强调充分各项政策的为基础比对方法。

——Cassie Kozyrkov

我们是如何用 0.03 的 p 参数来特别强调充分各项政策的(重点):

自已象我们生活习惯在少于仓储间隔时间相等等同 30 分钟的21世纪——因为我们信任薄饼店外(我们在此早先的坚信)!

比对收集的仓储间隔时间比对后,p 参数为 0.03,偏高于 0.05 的置信偏高水平(假定在科学实验早先就特设好了),因此可以说结果是带有「汇总明显性」的。

因为我们多年来或许薄饼店外可以在 30 分钟内仓储薄饼,以前所需重新考虑的是这一坚信确实仍然有本质,因为结果想到我们,薄饼店外没能兑现承诺,而且结果是带有汇总学本质的。

那该怎么办?我们先试着用各种比对方法使初始坚信(零假定)成立。但是因为薄饼店外的口碑越多来越多差,并且常会告诉他导致仓储延迟的意图,我们自己都真是先或许薄饼店外是很愚蠢的大事情,因此,我们重新考虑愿意零假定。

事与愿违,我们特别强调了便从这家薄饼店外买薄饼的充分重新考虑。

自已象我们生活习惯在少于仓储间隔时间相等等同 30 分钟的21世纪——因为我们信任薄饼店外(我们在此早先的坚信)!

比对收集的仓储间隔时间比对后,p 参数为 0.03,偏高于 0.05 的置信偏高水平(假定在科学实验早先就特设好了),因此可以说结果是带有「汇总明显性」的。

因为我们多年来或许薄饼店外可以在 30 分钟内仓储薄饼,以前所需重新考虑的是这一坚信确实仍然有本质,因为结果想到我们,薄饼店外没能兑现承诺,而且结果是带有汇总学本质的。

那该怎么办?我们先试着用各种比对方法使初始坚信(零假定)成立。但是因为薄饼店外的口碑越多来越多差,并且常会告诉他导致仓储延迟的意图,我们自己都真是先或许薄饼店外是很愚蠢的大事情,因此,我们重新考虑愿意零假定。

事与愿违,我们特别强调了便从这家薄饼店外买薄饼的充分重新考虑。

到以前为止,你可能仍然注意到了,在下面的例证之中,p 参数不能断定或重新考虑任何大事。

毫无疑问,当结果有汇总学本质时,p 参数可以作为过关斩将初始坚信(零假定)的工具。在我们认为自己的坚信荒诞(假定 p 参数表明结果带有汇总明显性)的那一刻,就舍弃了自己的初始坚信(愿意零假定)并特别强调了愈来愈充分的重新考虑。

04 汇总明显性

这是先前一步,将所有内容放在一齐,并核对结果确实有汇总学本质。

只有 p 参数是不够的,还要理论上上持续性(即明显偏高水平——alpha)。为了避开偏差,科学实验开始早先就应该理论上上 alpha。如果观测的 p 参数相等 alpha,那就可以得出结论——结果带有汇总明显性。

经验法则一般将 alpha 理论上上为 0.05 或 0.01(同样,参数不尽相同你的解决办法)。

如上和文所述,假定在科学实验开始前将 alpha 特设为 0.05,得到的结果带有汇总明显性,因为 p 参数(0.03)相等 alpha。

为便于参考,整个科学实验的理论上流程如下:

举出零假定;

举出备择假定;

相符 alpha 参数;

告诉他到和 alpha 偏高水平具体的 Z 分有数;

根据式子计数核对汇总生产量;

如果核对汇总生产量的参数比 alpha 偏高水平的 Z 分有数小(或 p 参数相等 alpha 参数),愿意零假定。否则,愿意接受零假定。

▲流程 5 计数核对汇总生产量的式子

原和文链接:

反之亦然来源:计生产量经济学

本微信登出社论出于非商业性的为基础教育和科研目标,如登出稿、图片涉及等解决办法,代为立即联系我们,我们时会予以愈来愈改或删除具体社论,保证您的权益。

阳了吃什么药
解毒药
科兴制药常乐康
药店有卖打呼噜药的吗
心慌胸闷怎么缓解
友情链接