您好,欢迎访问蜗牛网!

浅谈运营工作中的贝叶斯陷阱

分类:探索科技 浏览数:18 2019-10-06 22:56 产品中国 Ziv 编辑: 蜗牛

贝叶斯定理广泛应用于各类场景,如机器学习、大数据挖掘、工程分析、金融投资等,本文仅探讨贝叶斯定理在运营数据分析中的一点思考。

一、什么是贝叶斯定理

贝叶斯定理是关于随机事件A和B的条件概率(或边缘概率)的一则定理。

频率主义学派认为参数是客观存在的,即使是未知的,但都是固定值,不会改变。频率学派认为进行一定数量的重复实验后,如果出现某个现象的次数与总次数趋于某个值,那么这个比值就会倾向于固定。

最简单的例子就是抛硬币了,在理想情况下,我们知道抛硬币正面朝上的概率会趋向于1/2,而贝叶斯提出了一种截然不同的观念,他认为概率不应该这么简单地计算,而需要加入先验概率的考虑。先验概率也就是说,我们先设定一个假设,然后通过一定的实验来证明/推翻这个假设,这就是后验。随后,旧的后验会成为一个新的先验。

以下便是贝叶斯公式:

P(A|B) 是在B发生的情况下,事件A发生的概率;

P(A)是A发生的概率;

P(B|A)是在A发生的情况下B发生的概率;

P(B) 是B发生的概率。

简单讲,贝叶斯定律是在已知某条件的前提下,推算某事件发生的概率。

二、贝叶斯定律的应用

贝叶斯方法对于由证据的积累来推测一个事物发生的概率具有重大作用,它告诉我们当我们要预测一个事物,我们需要的是首先根据已有的经验和知识推断一个先验概率(或者根据事实引入先验概率),然后在新证据不断积累的情况下调整这个概率。

我们以下面的例子,来一窥贝叶斯定律的妙用。

如果某种疾病的发病率为千分之一,现在有一种试纸,他在患者得病的情况下,有99%的准确率判断患者得病;在患者没得病的情况下,有5%的可能误判患者得病。现在试纸说一个患者得了病,那么患者真的得病的概率是多少?(在看下文之前大家先凭感觉预估一下,真正的得病概率应该很高吧?)

为了方便理解,我们先通过一个树形图进行判断,我们假设有100000的人群。

通过以上树状图,逻辑就会比较清晰。在题干给出的条件下,患者真正的得病率是多少呢?用真正得病的99作为分子,测出有病的4995+99作为分母,99÷(99+4995)=1.94%

在此案例中,用贝叶斯公式计算:

P(A1|B)代表试纸查出患病前提下,真实的患病概率;

P(A1)代表真实患者概率,即0.1%;

P(A2)代表健康人群概率,即99.9%;

P(B)代表试纸查出患者的概率;

P(B|A1)为真实患者条件下试纸查出患者的概率,即99%;

P(B|A2)为健康人群条件下试纸误判为患者的概率,即5%;

点击分享到:

版权与免责声明:

凡未注明"稿件来源"的内容均为转载稿,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性;


本文地址:http://www.syepg.com/news/2019/10/06/83228606.html

转载本站原创文章请注明来源:蜗牛网