第三,为什么AGI的起点是语言模型?Large Language Model(LLM)也是大家听到的词,图像处理成就之前的AI四小龙企业,但从信息时代走向智能时代,开启方反而是语言。为什么是语言?著名的作家兼哲学家路德维希·维特根斯坦在其《逻辑哲学论》一书中提到:“我的语言的界限,意味着我的世界的界限。”
对我们而言,承载世界的知识、思考、沟通和文化靠的是语言。我们可以想象一个原始部落可能只有800个单词进行简单的沟通,文明一定不强,因为词汇本身的发明代表着每多一个词汇就让世界多了一个认知的维度,词汇之间建立的逻辑关系和表达代表了我们对世界完整的建模。这个模型不是在图像里面,而是通过语言进行承载,所以语言边界就是世界边界,语言是知识文化的载体;Word Model is World Model,词的模型就是世界的模型。 我们今天讲AI For Science,包括创业,核心就是把现实世界的现象翻译成为数学模型,通过语言把物理学或者生命理解到现实世界和数据是什么关系。牛顿开启了科学时代,通过观察、假说和实验建立一套对世界现象的认知体系,最著名的就是提出万有引力和牛顿的力学三大定律,通过一个公式解释或者预测一个真实世界中的现象。
我的理论特别简单,一个公式讲完,一个现象能够精确预测,解释过去发生啥、未来发生啥。所以牛顿很自豪地讲苹果是怎么落地的,天上的星星是怎么运动的,一切的规律都浓缩在万有引力定律里面。在牛顿之前其实没有科学,也没有物理学,那会儿牛顿的巨著叫做《自然哲学的数学原理》,牛顿之前是自然哲学,现在变成数学,康德也认为牛顿把物理学变成数学。今天OpenAI代表的技术能力把语言变成数学模型,变成公式已经不太行了,就是用底层不太够。
我们这次会议的主题是“涌现”,“涌现”的背后还有一个词是“衍生论”,就是在还原论的体系把世界中微观的原子和分子搞明白就构建起世界的规则。今天从衍生论来讲,不同层次的世界的规则和现象属性是不一样的,一群人和一个人的属性是不一样的。物理学能够解释的世界非常有限,现在用物理学解释超导现象也解释不了,因此不同层次需要不同的描述方法。 我们已经走出了原来物理学靠一个公式解释世界的方法,更多是靠暴力的数据在不同层次单独建模,上层建模就是由大量的数据驱动,AI For Science已经从公式导向走向AI模型导向。语言模型如此,生命建模也是如此,2021年最伟大的成就就是DeepMind的AlphaFord系统,针对基因到蛋白质的三维结构建模,通过这个模型预测基因被转录或者表达为蛋白质以后拥有的形态,也是全世界轰动的生命领域的突破,靠的也是数据和AI的驱动。
今天的语言模型已经做得非常好了,不是100分也是99分的样子。生命建模到现在进展还很少,基因到蛋白质的结构建模,但人体内不是一个基因,有着两万三千个基因,中间都有相互的作用,二万三千个基因只代表DNA核糖核苷酸的5%,95%的调控网络没有办法理解它交互的作用。即便把基因变成蛋白质被预测到,蛋白质作为PET3怎样构建身体,使得我们更加健康,里面还有很多未知的事情。
现在制药还很难,十年时间、十亿美金砸进去,成功率只有10%,所以对生命建模还远没有完成。制药还是用一种小分子、大分子偏还原论的方式去做,甚至未来医学需要提出新的体系,能够在衍生论的指导下从人的整体结构涌现出现象去定义生命背后的规律。
思考4:AGI的世界会变成什么样
什么行业会被改变?
现阶段的共识分为三个领域:
1.生产力方面,指给企业本身赋能,调用的时候能够使得知识的推理速度Insight更多。
2.智能助理这个领域,不再是简单工具调用,更像是伙伴。可能未来,它是你的私人医生、私人律师、搜索助手、购物达人,就是像人一样能够帮助我们,像L1、L2、L3的无人驾驶,现在是CoPilot辅助决策,未来是智能助理时代。
3.如果没有大模型的支持,元宇宙是做不起来的,Word Model is World Model(词的模型是世界的模型),不仅是文生图、文生视频,甚至能够做到世界的驱动引擎,以游戏行业为代表首先会带来新的颠覆。
思考5:什么职业会被取代