“贝叶斯公式”的意思、由来-中文百科全书

词条

贝叶斯公式

释义

§ 简介

假设B 是由相互独立的事件组成的概率空间{B1,b2，...bn}。则P(A) 可以用全概率公式展开：P(A) = P （A|B1)P(B1) + P（A|B2)P(B2) + ..P（A|Bn)P(Bn)。贝叶斯公式表示成：P(Bi|A) = P(A|Bi)P(Bi)/(P(A|B1)P(B1) + P(A|B2)P(B2) + ..P(A|Bn)P(Bn))；常常把P(Bi|A)称作后验概率，而P（A|Bn)P(Bn)为先验概率。而P(Bi)又叫做基础概率。

贝叶斯公式：贝叶斯公式

贝叶斯公式看起来很简单，但是在自然科学领域应用范围及其广泛。同时理论本身蕴含了深刻的思想。

§ 其诊断模型

1、背景材料及引言

7岁女孩晓宇（化名）患急性支气管炎,在武汉市儿童医院住院4天，医生为确诊病情，为她抽血化验了32个指标，仅化验费就花费1130元。晓宇的家长质疑：医院如此看病，是过度检查。晓宇的接诊医生李志超说：“晓宇入院时,根据其家长自述病情，我认为孩子的情况有些严重,于是确定了上述化验指标”。该院四内科副主任李医生说：在当时情况下,李志超对患者的病情判断、以及开出的化验指标,都是有道理的。但如果是我接诊，会以自己的经验有针对性地进行化验检查,可能不会一下开出这么多化验指标。该科主任温玟莉主任医师称：一次抽血化验32个指标，是因为李志超当时怀疑孩子得了败血症，这样处理没有问题。但最后的检查结果并不是败血症，这只能说明李志超较年轻，缺乏丰富的临床经验，只有通过全面检查才能确诊。

在医患关系紧张，看病难、看病贵的现实情况下，我们应如何看待这个颇有争议的案例，医生看病是应该有针对性地开方,还是列出“算法式”的化验指标进行排查，本研究以贝叶斯公式为依据，从中国现行的医疗体制出发,对此类问题进行了有益的探索，以期建立一种定量化的诊断模型。

2、模型建立

设“患者有某种病症”为事件A ，引起事件A 的病因为样本空间Ω。B1，B2，… Bn为Ω 的一个分划，即Bi∩Bj=Φ，i≠j , Ｕn　 i=1Bi=Ω，并假定P(Bi)>0。由贝叶斯公式，由某病因引起事件A的概率为：

P（Bi|A)=P(Bi)P(A|Bi)/n/j=1P(Bj)P(A⌒Bj)(1)

公式(1)为医生有针对性地确诊提供了参考。

在疹疗过程中，医生要根据临床经验对各种病因Bi 进行权衡。如果误诊，则有可能承担相应的医疗事故风险，相应的误诊概率记为P′(Bi) ，并设因可能承担风险而承担的赔偿费用为C′i ，患者承担医生针对病因Bi 开出的疹疗方案的费用为Ci ，于是在一次诊治过程中患者承担的平均费用为：

E(A)=n　 i=1P(Bi)Ci(2)

医生可能承担的平均赔偿金额为：

E′(A)=n　 i=1P′(Bi)C′i(3)

我们称该模型为诊断模型，并以δ1≤E(A)-E′(A)≤δ2 为标准来衡量诊断方案的合理性，其中δ1≥0,δ2 为某一不是特别大的正数。即患者所承担的平均医疗费用应比医生可能承担的平均赔偿金要多，但两者不应差别太大。

3、模型检验

我们以发热和上腹疼痛两个病症的相关数据对该模型进行检验。设原假设为H0 ：诊断是合理的。备择假设为H1，诊断合理与否需要进一步考查。

对表1和表2中相关数据的说明：中国2002年9月1日实施的《医疗事故处理条例》(以下简称《条例》)第五十条对赔偿项目和标准的规定与当地上一年度职工平均工资水平紧密挂钩，实行一次性结算。表1和表2中的工资水平参考了2007年2月湖北省第十届人民代表大会上的湖北省政府工作报告中的数据：2006年城镇居民人均可支配收入为9803元。对发热症状中的“非典”及“某种类似非典的突发疾病”所可能带来的医疗事故我们以一级医疗事故中的死亡来处理，赔偿金额按《国家赔偿法》第二十七条的规定，检查费用以一次全身检查所需费用10000元进行计算；对“心肺功能缺陷”所可能带来的医疗事故我们按二级医疗事故处理，赔偿金额取202110，检查费用按心电图20元次，心脏彩超180元次,心肌酶谱60元次，肺检查80元次进行计算，药费以相应检查费用的0.8计算。对上腹疼痛症状中的“胃癌”及“心、膈等器官有病变”可能带来的医疗事故我们按二级医疗事故来处理,赔偿金额取202110，对B3的检查费用以B超40元次，催C120元次，胃镜(无痛)240元次进行计算，药费以相应检查费用的0.8计算，对B4 的检查费用以胃镜(无痛)240元次和心脏彩超180元次进行计算，药费以相应检查费用的0.8计算。对两种症状中“其它”原因对患者可能造成的损害我们以《条例》第三十三条(三)的规定进行处理：在现有医学科学技术条件下，发生无法预料或者不能防范的不良后果的，不属于医疗事故。对两种症状中“其它”原因，患者的一次医疗费用我们取城镇居民人均可支配收入的5%，即490元进行计算。所有医疗费用均指一次诊治的检查费和药费之和,不包括后续治疗的费用。检查费用以武汉市某三级甲等医院的相关标准为参考。表1 发热症状诊断模型的相关数据注:B1=人体生理功能的正常表现：B4=某种类似非典的突发疾病；B5=心肺功能缺陷。表2 上腹疼痛症状诊断模型的相关数据注，B2=胃溃疡、十二指肠溃疡；B4=心、膈等器官有病变。

设“发热症状”为事件A1 ，“上腹疼痛症状”为事件A2 ，由表1和表2的数据计算得(四舍五入精确到元)：

E（A1）=121，E′（A1）=187165；E（A2）=265，E′（A2）=22232

我们会发现原假设H0：诊断是合理的，是不成立的。这些数据告诉我们医生这个职业的确是个高风险的职业，在中国建立医疗责任保险制度有着必要性与迫切性。

4、模型评价

该模型在合理假设的基础上,对“对症下药”进行量化,对诊疗方案的合理性给出了一个量化的标准，有一定的合理性与临床参考价值。特别是在用数据对模型检验后，证实了医生的确是个高风险的职业，也显示了在中国建立医疗责任保险制度的必要性和紧迫性。但在模型应用过程中还需要注意以下几个方面： ① 病因的复杂性。病因的复杂性会导致样本空间的分划的个数n 比较大，因此需要结合医学规律对样本空间分划进行合理的选择。②患者体质的差别。不同的患者对同类的医疗事故，由于体质的差别可能带来不同程度的损害。③医生临床诊断水平的差异。不同的医生，由于经验等方面的因素，误诊概率可能有较大的差别。④医院的潜规则。有的医院把医生的收入与其给医院的创收挂钩，这样同一病症在不同的医院治疗，诊疗费用会有较大的差别。⑤实际赔偿金的差别。不同地区上一年度人均收入差别较大,加之实际赔偿金还与实际谈判能力有关系，这样就可能导致同类医疗事故在不同地区及不同的患者(或家属)身上，实际赔偿金差别也较大。⑥ 现行医疗体制对模型的影响。下面对此进行较详细的分析。

中国现行的医疗事故赔偿责任者只有一个，就是医疗机构，但医疗机构作为理性人，会尽量减少其自身的医疗成本以实现利益的最大化。医疗机构会将其自身受到的损失通过以下三种主要方式进行转移：一是利用价格机制，提高医疗费用，即将损失分散于所有的就医者身上；二是由具体责任人承担风险，即将损失的一部分转移给与事故直接相关的医务人员；三是通过责任保险机制，将损失转移给保险公司。但长期以来，在中国实际上只有第一种和第二种途径在发挥着作用,责任保险机制可以说作用甚微。

这样,就很容易导致医疗费用上涨，引发医患关系紧张。医学的专业化使得医疗机构和患者之间存在巨大的信息差，医疗机构有动机也有能力通过使患者进行重复或者不必要的检查项目等方法多收费用,弥补自身损失.因此模型作用的发挥,还需要以下几方面的配合：①重视医德建设,提高医护人员自身修养。裘法祖院士在文献里有很深刻的认识。② 加强医患之间的沟通，进行换位思考，让医生理解患者的苦衷，让患者理解诊疗的风险。③ 加强误诊规律的研究。医疗技术的进步从来都是和风险相并存的，从某种程度上说误诊是不可避免的，但作为医护人员要提高生命权保护意识，不断提高自身的临床思维能力诊断能力力争把误诊率降到最低。④ 加强医护人员临床思维能力和临床经验的提高。医学很大程度上是经验学科,医学理论最终还要内化为医护人员的实际诊断能力才能发挥作用。公式(1)为医护人员提高诊断水平提供了一个很好的参考。⑤ 探索适合中国国情的、于患于医均有益的医疗责任保险制度。尤其是在生命意识越来越受到重视的今天，只有切实的降低行医的风险，才能从根本上解决医患关系紧张的现状，实现医患关系的和谐。[1]

§ 在ACM比赛中的应用

赛题：POJ 3716 Panda’s Birthday Present

题意是说，有4个六面的骰子，在一开始的时候对每一面各以50%的概率染成红色或蓝色，然后掷了两次，每次的得分为4个骰子里面掷出红色向上的数目。给定两次的得分x,y (0 <= x,y <= 4)，问第三次的得分的期望是多少。

这道题目最后的“期望”的定义不甚明确。如果按照解ACM题的思路，我会这样考虑问题：把四个骰子的红色面数组合成一个状态<s1,s2,s3,s4>，求出每个这种四元组的概率，然后利用x,y这两个值，可以排除掉肯定不可能的四元组，把剩下的概率重新归一化，再求第三次的期望，但是按这种算法无论如果对不上样例（也可能是我写错的），一囧之下我就yy出下面一个算法：

从贝叶斯概率的角度来想这个问题，在不知道x,y时计算出的四元组<s1,s2,s3,s4>的概率作为先验概率P(<s1,s2,s3,s4>)，然后我们进行一次试验，设得到的值为x，则由贝叶斯公式，后验概率后验概率

在等号右面，先验概率P(<s1,s2,s3,s4>)通过dp和组合公式容易得出，似然函数P(x|<s1,s2,s3,s4>)也可由dp得到，P(x)是归一化因子，可以先不予考虑。于是得到观测值<x,y>的后验概率为：验概率为

这里Z是归一化因子，即为对所有四元组<s1,s2,s3,s4>求得的P(<s1,s2,s3,s4>|<x,y>)之和。

求得了这个之后，第三次得分的期望即为：第三次得分的期望即为

ps. 据说有人得到超级简单的公式，最后结果就是(x+y+10)/7，再ps. 这次月赛单挑拿了个第三，居然是在退役后拿到历史最好成绩……[2]

§ 举例

举个例子来说明：假设有一台癌症诊断仪，通过对它以往的诊断记录的分析，如果患者确实患有癌症它的确诊率为90%，若果患者没有癌症，被诊断成癌症的概率为10%。

问题：如果一个人被这台诊断仪确诊成癌症，这个人患有癌症的概率是多少？

根据贝叶斯公式设 A：癌症诊断仪给出癌症诊断。B1：病人是癌症患者。B2 病人不是癌症患者。

P(A|B1) = 90%； P(A) = 90%*P(B1) + 10%*P(B2)；

则P(B1|A) = P(B1)*90% / (90%*P(B1) + 10%*P(B2))；

我们知道人群中癌症患者的比重是很小了，假设为1%，则 P(B1) = 1%；P(B2) = 99%；

可以算出： P(B1|A) = 8%!

看出什么问题了吗？如果医生仅仅根据癌症诊断仪给出的确诊信息就认为病人有很大可能性患有癌症(医生经常这么做)，那就太不付责任了！因为即使这样，这个病人得癌症的概率还是只有8%!

对公式P(B1|A) = P(B1)*90% / (90%*P(B1) + 10%*P(B2))做一下简单的变形：可以得到 P(B1|A) =1 / (1 + (10%*P(B2))/(P(B1)*90%)).在结果中只有一个变量 P(B2))/(P(B1)，这个比率也叫做基础比率。　基础比率越大，P(B1|A)的值越小。在本例中P(B2))/(P(B1) = 99：1。

在推理中基础比率起到的至关重要的作用。可是大部分人在生活中做判断的时候却忽略了它,从而对于必然的小概率事件的发生深信不疑。

随便看

百科全书收录594082条中文百科知识，基本涵盖了大多数领域的百科知识，是一部内容开放、自由的电子版百科全书。