最近的小米合作伙伴大会,绝对是科技圈的一场“AI真心话局”。新上任的小米MiMo团队负责人罗福利,上来就捅破了一层窗户纸——为啥现在的AI看着聪明绝顶,真让它干点家务、帮你开个车,就笨得像个新手?
答案特简单:现在的AI就是个“语言模拟器”,是个读了万卷书却从没行过万里路的“书呆子”。它靠啃海量文本数据长大,能跟你聊哲学、写代码、编段子,但它压根没见过真实世界的样子。你让它“帮我把客厅的灯打开”,它可能不知道你家客厅的灯在哪;你让它“提醒我开车转弯减速”,它不懂什么叫“转弯”,什么是“减速”的物理感觉。
而小米要干的事,就是把这个“书呆子”从聊天框里拽出来,扔进咱们的真实生活,让它学会在人车家的生态里摸爬滚打,变成一个能扛事、能干活的“全能助手”。今天咱们就掰开揉碎了说,罗福利到底想怎么干?小米发布的新模型有啥用?这事儿对咱们普通人到底意味着啥?
一、先把话说明白:AI为啥是“空中楼阁”?
罗福利上台第一句话就很炸:“AI正在以非线性的方式重演人类大脑6亿年的进化史”。这话听着玄乎,翻译成人话就是:AI进化的速度,比人类大脑的生物进化快了成千上万倍。人类花了几亿年才从单细胞生物的简单反应,进化出能思考、能创造的大脑;而AI只用了短短几年,就从只会识别图片的“小学生”,变成了能跟人对答如流的“大学霸”。
那为啥AI进化这么快?核心原因就是语言是个“超级压缩包”。罗福利说,语言是人类思维和物理世界在符号空间的投影。这句话咱们拆开看:你看到“苹果”两个字,脑子里会浮现出苹果的样子、味道,知道它能吃、能榨汁;你看到“跑步”两个字,会想到迈开腿、心跳加速的感觉。这些真实世界的体验和想法,都被压缩进了“苹果”“跑步”这些文字符号里。
大模型就是靠啃这些“压缩包”长大的。它读了亿万本书、亿万条聊天记录、亿万篇文章,从这些文字里还原出了人类的思维方式。你问它“天为什么是蓝的”,它能搬出大气散射的原理;你让它写一篇“春天的作文”,它能给你整出花红柳绿的句子。但问题的关键在于:它只知道“文字里的世界”,不知道“真实的世界”。
这就像一个人一辈子待在房间里,只靠看书了解外面的世界。他知道“游泳”是手脚划水、身体漂浮,但他从没下过水,真把他扔到泳池里,他还是会呛水;他知道“开车”是踩油门、打方向盘,但他从没摸过方向盘,真让他上路,他还是会手忙脚乱。
罗福利直接点出了当前大模型的致命缺陷:相比生物演化的稳固根基,AI的发展更像空中楼阁。生物的进化是跟真实世界互动出来的——长颈鹿为了吃高处的树叶,脖子慢慢变长;人类为了适应环境,学会了制造工具。每一步进化都有真实的物理反馈。但AI不一样,它的“进化”只发生在数据和算法的虚拟世界里,跟真实的物理规律脱节了。
这就引出了一个业内吵翻天的话题:光靠语言,能不能实现通用人工智能? 有些大佬,比如OpenAI的伊利亚,觉得能——只要把语言模型做到足够大、足够强,它就能理解整个世界。但罗福利不这么认为。他的观点很明确:下一代智能体系统,不能只是语言模拟器,而必须是真正理解世界并与之共存的智能体。
这话啥意思?简单说就是:好的AI不能只会耍嘴皮子,还要会干活。只会聊天的AI,顶多是个“电子陪聊”;能操控你的智能家居、辅助你开车、预判你需求的AI,才是真正的“生活助手”。这个判断太重要了——它直接决定了小米未来的产品会长什么样。
如果小米觉得“语言就够了”,那它根本没必要费劲巴拉搞什么人车家生态,直接做个聊天机器人就完事了。但如果小米认定“AI必须懂物理世界”,那它就要把AI跟手机、汽车、家电、机器人这些硬件绑在一起,让AI在真实的生活场景里练手。这两条路,差的可不是一星半点。
二、小米甩出真家伙:Memo-V2-Flash到底是个啥?
基于“AI要融入物理世界”的判断,小米在大会上甩出了自己的王牌——Memo-V2-Flash大模型。罗福利明确说了,小米做Agent模型(也就是能自主干活的AI),就盯三个核心方向,每一个都冲着“让AI落地干活”去的。
第一个方向:超强的代码和工具调用能力
这是AI从“聊天”到“干活”的关键一步。咱们现在用的AI,大多是“你问我答”的模式——你问它“明天天气怎么样”,它告诉你“晴转多云,20度”;你问它“怎么订外卖”,它给你讲步骤。但小米的这个模型不一样,它不是“告诉你答案”,而是“直接帮你办事”。
本小章还未完,请点击下一页继续阅读后面精彩内容!
喜欢大白话聊透人工智能请大家收藏:(m.zuiaixs.net)大白话聊透人工智能醉爱小说网更新速度全网最快。