1. 如果“你真的喜欢美食视频”,那么“你点赞火锅视频”的概率有多大?——很高,比如90%(喜欢美食的人大概率会点赞火锅内容);
2. 如果“你不喜欢美食视频”,那么“你点赞火锅视频”的概率有多大?——很低,比如5%(不喜欢的人偶尔误点)。
这时候90% vs 5%,差距很大,说明“点赞火锅视频”这个信息,能帮AI更确定“你喜欢美食视频”。
简单说,似然度就是在算“新信息更支持哪个猜测”。支持度差距越大,信息越有用。
第三步:更新猜测,得到“新判断”——这叫“后验概率”
有了“先验概率”和“似然度”,最后一步就是把两者结合起来,算出“更新后的概率”,专业名叫“后验概率”(“后验”就是“在看到新信息之后”的意思)。
这一步是贝叶斯推理的核心,但不用怕,咱们用“猜硬币”的例子算一遍,保证不用公式也能懂。
场景:你朋友的硬币,先验概率是“99%的可能是均匀的(正面50%),1%的可能是作弊的(正面80%)”。现在抛了10次,8次正面(新信息),要算“这枚硬币是作弊的”的后验概率。
第一步:先算“两种猜测下,出现‘8次正面’的似然度”:
- 如果是“均匀硬币”(50%正面),抛10次得8次正面的概率很低,大概是4.4%(你不用算,记住“很低”就行);
- 如果是“作弊硬币”(80%正面),抛10次得8次正面的概率很高,大概是30.2%(记住“很高”就行)。
第二步:对比“似然度”和“先验概率”的乘积(这是贝叶斯的核心计算逻辑,不用懂为什么,看差距就行):
- 均匀硬币:先验概率99% × 似然度4.4% ≈ 4.36%;
- 作弊硬币:先验概率1% × 似然度30.2% ≈ 0.302%。
哎?这时候均匀硬币的乘积反而更高?但别急,因为这只是“相对值”,我们要算“作弊硬币占总概率的比例”:
总概率 = 均匀硬币的乘积 + 作弊硬币的乘积 ≈ 4.36% + 0.302% ≈ 4.662%;
作弊硬币的后验概率 = 0.302% ÷ 4.662% ≈ 6.5%。
也就是说,抛了10次8次正面后,“这枚硬币是作弊的”的概率,从原来的1%(先验)升到了6.5%(后验)——虽然还是低,但已经提升了6倍多。
如果再抛10次,还是8次正面(新信息),再算一次:
- 均匀硬币:先验概率现在是93.5%(因为上次后验是6.5%作弊,所以均匀是93.5%) × 似然度4.4% ≈ 4.11%;
- 作弊硬币:先验概率6.5% × 似然度30.2% ≈ 1.96%;
总概率 ≈ 4.11% + 1.96% ≈ 6.07%;
作弊硬币的后验概率 ≈ 1.96% ÷ 6.07% ≈ 32.3%。
你看,现在概率就升到32.3%了!如果再抛10次还是8次正面,这个概率会继续升到80%以上——越来越靠近“这枚硬币是作弊的”真相。
这就是贝叶斯推理的魔力:哪怕初始猜测错得离谱(比如一开始只觉得1%是作弊),只要有足够多的新信息,就能一步步修正,最终逼近真相。
AI也是这么干的:比如AI一开始觉得“你喜欢美食视频”的概率是30%(先验),你点赞1次火锅视频,概率升到50%(后验);你又收藏1次烧烤视频,概率升到70%;你再转发1次甜品视频,概率升到90%——最后AI就确定“你肯定喜欢美食视频”,然后给你推更多相关内容。
三、为什么AI离不开贝叶斯推理?因为它解决了AI的“老大难”问题
你可能会问:AI的算法那么多,为什么偏偏要靠贝叶斯推理?其实是因为贝叶斯能解决其他算法搞不定的“老大难”问题,这些问题在AI里太常见了。
问题1:AI没那么多“完美数据”,贝叶斯能“用少数据猜真相”
很多AI算法需要“海量完美数据”才能干活。比如要让AI识别“猫”,得给它10万张标注好“这是猫”“这不是猫”的图片,它才能学明白。但现实中,数据往往不够——比如要识别“一种新发现的动物”,全世界可能只有几百张照片,这时候其他算法就歇菜了,但贝叶斯能上。
因为贝叶斯可以用“先验概率”补数据的缺口。比如要识别新动物“XX兽”,先根据“它跟老虎长得像”,定一个“先验概率”:“XX兽的图片里,有80%会有‘条纹’特征”,然后用仅有的几百张照片做“新信息”,不断修正这个先验——哪怕数据少,也能一点点靠近“正确识别XX兽”的目标。
小主,这个章节后面还有哦,请点击下一页继续阅读,后面更精彩!
喜欢大白话聊透人工智能请大家收藏:(m.zuiaixs.net)大白话聊透人工智能醉爱小说网更新速度全网最快。