贝叶斯推理：从猜硬币到刷手机，其实你每天都在“贝叶斯”_大白话聊透人工智能_巴蜀魔幻侠

1. 如果“你真的喜欢美食视频”，那么“你点赞火锅视频”的概率有多大？——很高，比如90%（喜欢美食的人大概率会点赞火锅内容）；

2. 如果“你不喜欢美食视频”，那么“你点赞火锅视频”的概率有多大？——很低，比如5%（不喜欢的人偶尔误点）。

这时候90% vs 5%，差距很大，说明“点赞火锅视频”这个信息，能帮AI更确定“你喜欢美食视频”。

简单说，似然度就是在算“新信息更支持哪个猜测”。支持度差距越大，信息越有用。

第三步：更新猜测，得到“新判断”——这叫“后验概率”

有了“先验概率”和“似然度”，最后一步就是把两者结合起来，算出“更新后的概率”，专业名叫“后验概率”（“后验”就是“在看到新信息之后”的意思）。

这一步是贝叶斯推理的核心，但不用怕，咱们用“猜硬币”的例子算一遍，保证不用公式也能懂。

场景：你朋友的硬币，先验概率是“99%的可能是均匀的（正面50%），1%的可能是作弊的（正面80%）”。现在抛了10次，8次正面（新信息），要算“这枚硬币是作弊的”的后验概率。

第一步：先算“两种猜测下，出现‘8次正面’的似然度”：

- 如果是“均匀硬币”（50%正面），抛10次得8次正面的概率很低，大概是4.4%（你不用算，记住“很低”就行）；

- 如果是“作弊硬币”（80%正面），抛10次得8次正面的概率很高，大概是30.2%（记住“很高”就行）。

第二步：对比“似然度”和“先验概率”的乘积（这是贝叶斯的核心计算逻辑，不用懂为什么，看差距就行）：

- 均匀硬币：先验概率99% × 似然度4.4% ≈ 4.36%；

- 作弊硬币：先验概率1% × 似然度30.2% ≈ 0.302%。

哎？这时候均匀硬币的乘积反而更高？但别急，因为这只是“相对值”，我们要算“作弊硬币占总概率的比例”：

总概率 = 均匀硬币的乘积 + 作弊硬币的乘积 ≈ 4.36% + 0.302% ≈ 4.662%；

作弊硬币的后验概率 = 0.302% ÷ 4.662% ≈ 6.5%。

也就是说，抛了10次8次正面后，“这枚硬币是作弊的”的概率，从原来的1%（先验）升到了6.5%（后验）——虽然还是低，但已经提升了6倍多。

如果再抛10次，还是8次正面（新信息），再算一次：

- 均匀硬币：先验概率现在是93.5%（因为上次后验是6.5%作弊，所以均匀是93.5%） × 似然度4.4% ≈ 4.11%；

- 作弊硬币：先验概率6.5% × 似然度30.2% ≈ 1.96%；

总概率 ≈ 4.11% + 1.96% ≈ 6.07%；

作弊硬币的后验概率 ≈ 1.96% ÷ 6.07% ≈ 32.3%。

你看，现在概率就升到32.3%了！如果再抛10次还是8次正面，这个概率会继续升到80%以上——越来越靠近“这枚硬币是作弊的”真相。

这就是贝叶斯推理的魔力：哪怕初始猜测错得离谱（比如一开始只觉得1%是作弊），只要有足够多的新信息，就能一步步修正，最终逼近真相。

AI也是这么干的：比如AI一开始觉得“你喜欢美食视频”的概率是30%（先验），你点赞1次火锅视频，概率升到50%（后验）；你又收藏1次烧烤视频，概率升到70%；你再转发1次甜品视频，概率升到90%——最后AI就确定“你肯定喜欢美食视频”，然后给你推更多相关内容。

三、为什么AI离不开贝叶斯推理？因为它解决了AI的“老大难”问题

你可能会问：AI的算法那么多，为什么偏偏要靠贝叶斯推理？其实是因为贝叶斯能解决其他算法搞不定的“老大难”问题，这些问题在AI里太常见了。

问题1：AI没那么多“完美数据”，贝叶斯能“用少数据猜真相”

很多AI算法需要“海量完美数据”才能干活。比如要让AI识别“猫”，得给它10万张标注好“这是猫”“这不是猫”的图片，它才能学明白。但现实中，数据往往不够——比如要识别“一种新发现的动物”，全世界可能只有几百张照片，这时候其他算法就歇菜了，但贝叶斯能上。

因为贝叶斯可以用“先验概率”补数据的缺口。比如要识别新动物“XX兽”，先根据“它跟老虎长得像”，定一个“先验概率”：“XX兽的图片里，有80%会有‘条纹’特征”，然后用仅有的几百张照片做“新信息”，不断修正这个先验——哪怕数据少，也能一点点靠近“正确识别XX兽”的目标。

小主，这个章节后面还有哦，请点击下一页继续阅读，后面更精彩！

喜欢大白话聊透人工智能请大家收藏：(m.zuiaixs.net)大白话聊透人工智能醉爱小说网更新速度全网最快。