陆奇最新演讲:当前中国人工智能创业的3大机会(附全文)
来源:海豚商业研究院(微信号ID:htsy08)
作者:海豚商业研究院研究员黄海涛
在互联网技术圈,他是一个“振臂高呼,应者云集”的管理者。
在硅谷,他是一个传奇人物,全球最知名的公司IBM、雅虎、微软等,都有他的身影,他是美国科技行业中职位最高的华人之一,曾任微软全球执行副总裁。
最近几年陆奇虽不在互联网一线,但江湖处处是他的传说,尤其是最近人工智能的大爆发,再次印证了他的远见,在人们怀疑AI或者不好看时,他一直保持对 AI的乐观前景。陆奇是中国AI领域的布道者之一,在AI这个圈子里,江湖声望极高。陆奇是OpenAI创始人奥特曼的同事兼好友。2018年陆奇加入YC就是受到时任YC掌门人的山姆·奥特曼的力邀。
“他集资深专业技术知识、出色的领导能力和广泛的商业知识于一身,在业界是非常罕见的奇才。”微软原CEO斯蒂芬·鲍尔默曾这样评价陆奇。
2018年5月,在百度“All in AI”16个月后,他选择离开,同年8月任YC中国创始人及首席执行官,开始亲自下场孵化有技术信仰的创业者。
2019年底YC中国停止运营,陆奇带领奇绩创坛独立运营,继续为中国创业公司提供孵化器服务。据奇绩创坛官网介绍,自创立以来已经开设10届创业营,累计加速480多个早期项目,项目总估值900亿。
陆奇是典型的硅谷投资人风格,偏爱颠覆性技术,愿意长期押注技术周期,更看重团队潜力而非短期KPI,不签对赌协议,更容忍失败,愿意长期陪伴创业者前行。从曾经的打工人到亲自下场做投资人,陆奇坦言有过“被投资人按在地上摩擦”的痛苦经历,他感慨创业融资很难,希望自己及奇绩创坛,能够改变投资机构对创业者的看法,对他们更友好一些。
6月25日,奇绩创坛创始人陆奇博士现身浙江大学管理学院,作主题为《新时代 新趋势 新机会》的主旨演讲。他认为,当前技术创业是创造财富的最大职业选择,关键在于把握好势能。他判断当前有三大创业机会:研究型创业公司(Researcher Founder)、智能体(Agent)、系统性做全球化公司。
陆奇表示,创业者要从自身需求出发,寻找“未被解决的问题”而非“创业点子”,创业要敢于冒险,解决别人不敢做的问题,创造稀缺性价值。
他判断,这一次中美人工智能的竞赛,中国不必过分担心。因为中国人口密度高、产业密度高,全球30%的制造业在中国。“有时候国运上升就会碰上好运气。”陆奇认为,中国是以生产力为主的国家,而这次AI的变革是生产力变革。“只要我们基于国情,利用密度高、场景多形成新的供应链、产业链,中国的AI产业体量、价值创造上会成为全球最好的。”
以下是演讲全文,部分有删减:
以电商为例,电商行业复利强劲的原因在于其涉及多个经营维度,如产品选品、线上购物、产品体验、付费模式、物流配送等,每个维度均可通过技术不断提升效率。
这些维度相互独立,产生的价值呈相乘效应。因此,同学们应关注技术驱动下的创业与创新,因其具有复利特性。只要时间足够,其成长空间非常大。同学们应关注技术驱动下的创业,这是创造财富的最大职业选择,关键在于把握好势能。
雷军曾言,平地无法成就伟大公司,必须顺势而为。任何时代都应借助重要势能。当前时代有三大势能:通用智能AGI、不同创新范式及关键赛道。接下来,我们将重点讲解如何判断这些重要势能和趋势。在讲述新趋势之前,先与各位同学分享通用智能的相关知识。
我们需要了解通用智能的内在结构和发展体系,只有对其有清晰的认知,才能把握智能时代带来的机遇。首先,我们可以通过观察碳基智能的发展来预测硅基通用智能的发展路径。
首先,讲解通用智能和非通用智能的区别。我从事人工智能领域已20多年,我认为过去的人工智能方法存在方法论的错误。过去的人工智能多是专有智能,环境或数据一变,需求就变了,需要重新建模。而通用智能则无论环境如何变化,都能形成认知体系,在环境中完成任务。例如,将人类扔到火星上,没有任何关系,我们仍能通过观察理解火星的引力是怎么回事,尝试在火星上种植等。
通用智能的典型案例是人类。通过了解人类的技术发展冲突及其形成过程,我们可以推断未来硅基智能AGI的结构和发展路径。
在了解这些背景后,我们可以更清晰地判断AGI的发展趋势和带来的机会。所以先讲碳基的作用是什么,它的结构三维一体,包括认知、感知、行动,它的载体是大脑,加上交互界面。
人的结构,它的交互界面是什么,我们的五官、手和脚,尤其是手,所以人的通用智能是我们的大脑,加上我们的交互结构,五官、手和脚,在环境中进化而形成的。我为何花这么多精力讲解,跟同学们举例子,这是建立的基础。总结一下,人的通用智能是大脑、五官、手和脚在环境中进化形成的,我们用硅基基本上同样的方法来做。
这里要提一个点,人的大脑为何这么聪明?跟手的灵巧是完全分不开的。通用智能发展到今天,核心是看开始用工具。过去两年,大部分做大模型的,其实有认知上的误区,以为只要数据更多,模型就会变得更纯,不会,而是要用更多的工具,要做更多的环境交互,模型才会变得更聪明。
人的手非常灵巧,有32个自由度,能发明很多工具,所以人今天有这样的大脑,跟手的灵巧性根本分不开,而且跟我们成长的环境有很大关系。必须有足够复杂的环境,才能有很高的智能。今天的AGI,做的不够好,重大的原因之一就是环境不够好。今天只有互联网,互联网没法训练出很好的模型,互联网是一个太简单的环境。
有了这个作为基础之后,那人的通用智能怎么形成?就是进化过程当中的记忆和泛化,就是通用智能形成的过程,这是碳基。硅基一模一样,硅基也是一个模型,加上它的交互界面也有认知、感知、行动,这样三位一体的。硅基成长的环境是数据,算力是进化的过程,有多少算力、token,就是多少的进化过程。
所以,有了这个作为基础之后,我们讲今天的硅基智能,它进化的环境是互联网。
互联网是什么?是全球整个社会公开的文本信息和图像信息。我强调的是公开,是传播用的,它里面有一部分是产品信息。用互联网这个环境来进化,今天硅基能学到、能进化出来的智能是相当有限的。因为通用智能,它的关键是两个,再怎么复杂的模型和架构,我们一定要核心关注的,第一是推理能力,reasoning。推理的定义,就是说给我一个任务,我似乎很快可以找到一个有效的完成这个任务的路径。对于人来讲,人的任务只有两类,生成和减少。
第二是能动性。前面我讲了硅基智能,今天我跟同学们对能动性要花时间讲的多一点,因为大家都会面临这个问题的影响。创业也好,创新也好,大家都会用智能体,Agent的词根名词是agency,中文叫能动性,它是一个心理学和教育学的概念。能动性是什么?就是说一个智能体,它可以针对它的一个任务来做规划。
首先,规划能力,其次,使用工具的能力,再次,利用工具与环境进行操作。最后,最重要的是,能够通过规划和工具操作达到既定目的,尤其是能够判断规划达成目的的概率有多少。因此,能动性是这次通用智能,从创造价值的角度来看,一个核心概念是agency,我们需要深入理解如何打造新的agency,以及如何让agency转化为生产力并产生价值,这其中的关键在于推理能力和能动性。
另外,环境和数据,尤其是重要,有进化是使智能变得聪明的唯一途径。训练即进化,但环境决定了一切。稍后我会重点讲解,如果你们选择创业或进行某个领域的创新,核心要考虑的环境因素包括:你们拥有什么样的数据,以及能做出什么样的能动性。这里我提到的是如果你用的能动性还是互联网,不是不行,但机会很少,这也是为什么OpenAI 至今没有商业模式。大家都知道,用互联网做模型做得再好,你的优势顶多能保持100天,之后人家追上来,价格更便宜。而且,互联网已经有头部玩家。互联网做连接的,我们在杭州有阿里,它就是电商与广告这种商业模式。如果用互联网的数据来做,并非不可行,你可以作为尝试,但一定要走向另一个方向,有更多的创新。
因此,这一页我核心想讲的是,硅基通用智能的发展与碳基是并行的结构和路径。我们可以通过这种并行性来帮助每一位同学,无论你们从事什么样的创业和创新,来判断未来发展趋势。这里我再跟同学们讲一下今天投资模型的基础结构,尤其是如何通过这个基础结构来判断未来可能的能动性、趋势和效应。首先,我先声明一下,这个模型今天可能并不完全正确,我们再回溯一下,它有一个界面,就像对话框一样吗?
它具有推理能力,它的能动性。今天我们用transformer做大模型,内在包含两个模型,一个是世界模型,用语言表达世界模型,另外是对大脑、对模型、对智能体本身的建模。通过思维链这样的模型,能够对自己的思维行为、推理行为做出判断,认知比较重要。
任何一个智能物种,都需要一个大模型,包括一个世界模型和一个认知模型。只有世界模型是不够的,所以还需要认知模型,所以这个模型有很重要的关键组成部分。
第一是编码,第二是解码。编码将文字、图像等原始数据压缩到一个高维向量空间的过程。在这个向量空间里面,通过接近线性的操作,我们基本上可以解决大部分想解决的任务。
第二是解码,任务完成后,可通过解码形成文字、声音、图像等。其中最重要的是推理能力。根据当前的模型架构,它源自80层全自动模型,一层层往上构建,其内在推理能力基于贝叶斯、马尔可夫和索罗莫夫理论。
这里简单讲一下,本质上有了上下文后,模型可通过贝叶斯进行推理,因为所有动作推理都基于过去的信息推测未来。通过计算边际概率,可进行马尔可夫的下一个状态预测。当前状态不会简单延续,而是遵循索罗门诺夫的执行任务路径,选择概率密度高的短路径,因此正确的推理能力,当前模型架构基本都能实现,只要有上下文数据,推理就能进行。
关于能动性,此处不再赘述,它需要更多的需求环境。将这样的模型组合起来,我们可以判断需要什么样的环境、数据,以增强模型的推理能力,并证明其更强的能动性。上下文加训练工具是关键。接下来,我想和同学们讲讲推理能力和能动性的区别。我经常和同学们交流,发现认知上可能存在一个误解。
推理能力与能动性相关,但并非同一回事。我们需要的是两者的组合。尤其是我们要创业,大部分价值来自流动性。推理能力要强,但能动性是创造价值的核心。有些东西需要规划并用工具去操作以达到目标。
我给大家举个例子,虽然有些夸张,但能说明问题。爱因斯坦的推理理论非常强,从黎曼几何到狭义相对论,爱因斯坦都能推演出。但爱因斯坦的能动性并不强,他主要是发表文章、写书。如果让爱因斯坦去团队执行任务,他还真做不来。反过来,奥本海默的物理水平显然不如爱因斯坦,但他的能动性很强。他张罗着在新墨西哥的一个小山镇组团队做设备,不断做实验,最终硬是把原子弹试验出来了。能动性与强大的推理分析能力相关,但并非同一回事。不过,用硅基做智能体,我们可以让其既具有爱因斯坦的推理能力,又具有奥本海默的能动性,只要把数据合在一起就可以。我们可以创建一个智能体,具有乔布斯、盖茨、马斯克的特质。
所以,我再和同学们强调一下能动性的重要性。
能动性就是搞定一件事情的能力。我举个例子,我们每天都与很多人一起工作。一个能力强的人,你把一个复杂的任务交给他,两个人中,一个能力强,一个能力弱,能力强的人领到了任务后,两个礼拜过来说老板结果,能力弱的人半个小时就回来了,说哪里哪里卡住了,这就是能动性低。我们要的是高能动性。
在探讨通用智能的发展前,我再强调一下,通用智能能系统性地、全方位地改变整个社会、整个世界。先讲一下我们的模型,这样的大模型,其内核如何转化为外延,这些话也可为创业创新所用,成为改变社会、改变世界的机会。
首先,这个模型打开来看是一张表格。模型打开呈现为一张很大的表,里面包含古典的权重,但这张表格可以通过叠加来处理文档。早期的模型是document model,可以应用于对话框、智能体、操作系统等,稍后会讲解如何构建操作系统,还可以应用于硬件设备、手机、电脑、机器人、自动驾驶等领域,以及计算体系、新能源系统等,都是通过叠加来实现的。有了这个叠加之后,我们可以从行业和人群的角度,系统性地改变社会,尤其是C端和B端机会并进,而且其中创造者机会更多。
稍后我们会重点讲解今天的通用智能将如何通过特定赛道和一群人,这样的方法来创造价值、改变世界。前面讲的是基础模型的内核是什么,以及它是如何形成外延的,包括能动性和推理能力等方面。
接下来讲大模型产业、通用智能产业的发展趋势。从2022年11月到现在,两年半多一点的时间,已经进入第三阶段。第一阶段是利用互联网数据预先压缩数据,以支持其运行。
第二阶段是强化学习,通过数学代码和思维来学会思考。破局的是浙江杭州的DeepSeek发布的模型R1,但发布时正值春节,所以我们基本上都没过春节,每天都在讨论这个东西。同时,第三阶段也开始了,第三阶段对各位同学来说更为重要,是在实际环境中学习,通过工具与环境交互,不再依赖于人类标注数据来学习,这样的模型才能真正成为专家,未来这些模型甚至可能成为大师。因为第一阶段本质上就像从幼儿园到大学毕业,学习知识。
第二阶段本质上像进入研究生,导师给你题目,让你变得更聪明,思维能力更强,但真正成为专家一定要从环境中学习。核心就是两点,一是能动性,如何拥有越来越强的规划能力,二是如何拥有越来越强的工具调用能力、交互能力和操作能力,以达到智能体想要达到的目标。
第二是推理。具体的如多轮对话,通过多轮对话来理解意图和指令,遵循能动性越来越强的原则,能够理解人的意图,且任务理解清楚,同时对指令的遵循。
今天这个产业已经发生的一些奇怪现象。比如说Wacom设备,其写代码能动性超强,可以重新修改整个滤波设置,但多人对话意图理解和指令遵循能力不够。它经常自说自话,就像团队中有个能动性很强的人,交给他的任务却不打招呼就随意改动,无法理解人的意图,缺乏很强的指令遵循责任。所以,对于从事产业创新的同学来说,今天这个产业在第三步,如果你加入模型团队,核心要关注的是,如何用自己的数据提高模型能动性,通过多论对话增强指令遵循。从模型训练角度讲,已经没有什么悬念,使用强化学习底座作为语言模型,只要数据强大,指令遵循能力就会越来越强。你可以指定先后顺序,比如“先做这个,再打个招呼,之后再做那个”,它基本上都能很好地执行。关键是要有强化训练,强化学习需要训练环境、好的数据,包括过程监督数据和结果监督数据,智能体模型具有很强的能动性和推理能力。我强调的推理能力主要基于多轮对话和意图理解,多轮对话中的推理能力没那么重要。
有了这个基础之后,我们来讲一下这张图。今天OpenAI的产品体系已经非常难用,我也每天都用,同学们可能都用,这个问题需要分析研究选GPT-o3,问题简单回答要真诚我要用GPT-4o。为什么要这样,这非常不自然,我们更需要的是一个通用的智能体。预训练的核心就是用数学与代码,大模型它具有很强的思维能力。
这里我跟同学们讲一下,为什么是数学与代码,尤其是数学这么复杂。今天就是靠数学,其实道理挺简单的,如果我们可以让这些模型解很难的数学题目,模型自然会学会长线思考,把看似连不起来的东西找到内在连接。大家都知道这些模型底层都是AB,AB是美国高中数学竞赛的题目,我就找了中国国家奥数队的总教练请教。
大家都用模型来做AB,有点像奥数比赛,高中比赛的老将对抗老将,而且中国的老将经常能打败美国的老将,那中国的奥数队一定会有更好的方法。我就问总教练,负责出题的人,说你们怎么出题目,有什么办法能筛选出真正聪明的人。
原理是这样,一个好的数学题,将多个数学知识点组合在同一道题目中,例如一道题既涉及平面几何,又涉及线性代数和微积分。能拿到金牌的题目,可能需要运用四个或五个知识点来解答。为何模型如此强大?因为数学是人造的,四向体系的概念,数学能力好,写诗也会很好,因为数学泛化能力强,它是结构的结构。简单来说,数学题解决得好,其他领域也能看到这种长线思维推理能力。
最重要的是学能动性,学习多轮对话,理解多轮对话的意图,将能力加在一起,我们要做一个认知编排体系。所以GPT-5有很高的概率,将开启我们这个产业新纪元,以后不再是给你一个模型或一个通用智能体,你可以针对这个通用智能体去做开发,开发你的产品。所以,这是产业的下一步会形成的状态。这样一种状态的核心驱动因素是我前面讲的模型的内核记忆和泛化,它的能力来自于环境,最重要的是推理和agency。
有了这个作为基础之后,大模型产业在高速发展,有四大领域齐头并进。第一是认知智能,具备更强的推理能力,本质上是用AI做软件,用AI做AI。比如OpenAI内部就定义了超智能的指标,两年之内,我估计能达到一个全新的科学命题,比如一个物理命题100%由AI提出,AI找数据,AI做验证。今天OpenAI内部很多研究课题是AI生成代码,AI找数据。
第二是场景智能,情景智能,端到端,可以进入生活、工作的方方面面。第三是具身对人的生活空间的建立,形成一个外脑,开启人类最大的一个产业,具身产业。第四,长期更为重要,尤其是我们像浙大这样的学校,用科学、新的建模方法来研究科学。我们整个人类社会所有的重要知识和认知都在以极大的速度来推进,这是我们整个产业的大盘大趋势。
在这个里面有三个大的机会,我重点跟同学们分享。第一是新的创新范式,新的创业方式,它为了产生价值潜能更大,它的发展速度会很快。
第二,2025年是智能体元年,这将带来根本性生产力改变。我们每个人都有系统性机会去做一流的工作,打造一流的企业。第三,在中国,如果想创业开公司,我们每个人都可以做全球公司。在硅谷,起步就是全球公司,在中国,你们起步也是个全球公司。
今天重点讲这三个重要机会点。第一,研究型创业公司,Researcher Founder将成为主流。首先,为什么Researcher Founder会成为这个时代的主流?这是一个结构性因素,是人类社会科学发展范式的驱动造成的。我分析一下这张图的背景,这是产学研的结构,其主要结构源自1944年。1944年有一本小册子改变了世界,标题是《科学:无尽的前沿》,作者是范内瓦·布什。罗斯福总统在1944年认为美国已经赢了,便让他写规划,如何让美国可以长期保持领先?他写的报告就是现在基本上全球所有的创新产学研都是以这个体系为主,也就是说我们研究型大学,在大学里面做基础研究和工程研究,导师带研究生。越来越多研究机构,他们启动了一个知识探索体系,科学怎么解释,怎么预测技术,怎么把解释和预测的能力用于满足人类需求,这是一个体系。
另外一个需求是满足产业体系,把已经做好的技术,往往在论文上待了很多年,现在可以拿来做产品去满足更广泛用户需求。需求拉动这个体系,基本上以现有企业、大厂和创业公司为主驱动,但是现在发现有越来越多的企业开始做研究,尤其是创业公司,他们不断在做更前沿的研究,今天走在前沿的已经不再是大厂。
即便今天我在浙大,我也可以讲,走在前沿的也不是大学。具体所在地的研究型的创业公司,这是历史进程所决定的,背后的原因是什么?前面讲的通用智能,有了通用智能,有了越来越强的能动性,越来越强的推理能力。我们可以用通用智能,用算力,用数据来探索科学的前沿。
这个趋势已经持续很长一段时间了,OpenAi一开始就是这样,今天越来越多的研究性创业公司在美国出现,在中国也会不断诞生,所以Researcher Founder是这个时代的主流趋势。
这个主流趋势为什么重要?我建议每位同学都关注创新的范式,因为从创造价值、改变社会的角度来讲,创业是最好的价值纽带。创业是一个系统性的优化体系,只要任何有技术、有研究去创造价值、改变世界,创业生态就无处不在。尤其是年轻人,只要有机会就有人去做。我再强调一下,这是一个最优的探索体系,能让年轻人有机会实现财务自由,极大提高社会地位。只要有机会,创业就是最好的探索体系,它无处不在,每个机会点都有人去探索。
大厂里面大部分的动作都是让老板对你有好感,而不是说市场真的有这个需求,而不是技术真正可以变成科学。创业公司是真正按照市场需求和技术先进性去做决策的。
总结一下,研究离价值越来越近,因为我们可以用通用智能来做研究,创业是更好的价值探索体系,所以Researcher Founder毫无疑问将会成为改变未来的主流。这是这个时代的一个重要创新范式的变革。
有了这个认知之后,再看一些数据,为什么这个值得我们每一个人关注。大家看一看OpenAI,可以说是第一个顶级的Researcher Founder突破,三年时间,其年收入已经达到100亿左右,估值涨了多少不用说,这个趋势还会持续。OpenAI作为一个Researcher Founder只是在一个通用对话的机制上产生的。
AI For science,具身智能、能源有太多的research合作机会,它的价值空间更大,因为研究可以开拓全新的发展空间。而且Researcher Founder公司,它成长速度一定会更快,它的曲线是更陡。所以,中国有很多机会,尤其是在杭州,在浙江。我个人是江苏人,但我做投资做了很多工作。浙江的土壤和别的地方不一样,在浙大真的有得天独厚的优势。
这里氛围就是很好,我这里都列了杭州的企业,这些都可以顺应Researcher Founder发展,创业创新的范式变革走得更快,体量更强。而且Researcher Founder,我们每个人都可以参与,大家不要害怕,今天认知模型让我们每个人都可以做研究,因为每一次research,最重要的是认知突破。工业社会、农业社会,尤其是通用智能,认知突破可以用工具,今天头部模型厂商都有研究产品deep researcher。
而且Deep researcher产品会变得越来越强大,其能动性和指令遵循能力会不断增强。我们追求的是每个人拥有独特认知,更重要的是,我要说的是,每个人有好的品位和独特认知,也可以成为一个一流的researcher,有通用智能,可以助你做researcher。
这里有个重要的点要讲,每个同学都有机会打造一个researcher funder的研究型创业公司,这其中的核心要素是做到高斜率公司的特征,取决于三个斜率:认知斜率、能力斜率和价值斜率。
你在单位时间能获得多少新的粉丝或资源,今天有很多工具可以让你每月获得更多粉丝,新的认知有三类情况需要记住。
今天有新的认知,一种情况是发现新的思维链,比如这个问题可以这样拆解、这样思考,新的思维链代表新的本质。第二是不同的思维同步问题连在一起,我能知道这两件事情其实可以有内在连接,往往是根据不同找到背后的连接。第三分支是找到一种新的验证手段,有人觉得这是可行的,有人觉得这是不好的。认知就是三件事,找到新的思维链,连接不同的思维链,找到更好的验证手段,我们可以系统性地用工具,用今天的大模型帮助每个人建立一个团队,是高斜率的团队,投入更好的基础设施,让单位时间可以开发更多能力,可以触达更多用户,复制更多产品价值。
最后要讲的一点,这次通用智能变革认知被工程化之后。上古时代,知识被工程化,这一次认知被工程化,也就是说加在一起,这是一个非常利好的消息,我们每一个人都有机会去打造一个研究驱动的创业公司,认知可以被工程化,所以这是创新范式的变革。成为高斜率团队,我前面也讲它的核心特征是研究加工程加商业化,最典型的是OpenAI、Deepseek,我们要做的就是通过人才、工具、价值观的打造,每个人都有机会去组织建立这样一个高斜率的团队。
高斜率就带来了,前面讲的这个公司,它的价值增长空间是如此之快。在这个时代,我个人也会跟各位同学讲,如果你不是加入这样的团队,长期没有很好的表现,因为其他行业都是朝着这个方向做这类公司,它的成长速度一定是更快,这是必须走的路。
这是第一个机会,是结构性的机会,是范式的机会。
第二大机会是Agent,智能体2025年是元年,真正全方位商业化落地可能要十年,但是它可以改变整个社会,因为它代表生产力的变革,从底层构造生产力。这里尤其和同学们讲的,6月18日,硅谷度过了一个不眠之夜,什么事情发生了?奇绩原来的老东家YC,6月18日做了一个YC AI Startup School,它的表现阵容无话可说。
开场的是萨姆·奥尔特曼,第二个是伊隆马斯克,后面还有其他人。但真正引发刷屏效应,让每个人停不下来,不断寻找资料的是前特斯拉AI总监Andrej Karpathy。许多人听说过,他是李飞飞的学生,2016年毕业于斯坦福。起初马斯克与萨姆·奥尔特曼抢他,最后他去了OpenAI。做了几年后,他最终被马斯克挖到特斯拉,自动驾驶,后来又离开特斯拉,回到OpenAI做gpt4,大约一年后离开,现在自己创业。
他进行了约35分钟的演讲,题目是《软件正在发生根本变化》。为何会引发如此大的共鸣?我的社交圈内每个人都在讨论,迫不及待地去收集资料、讨论。我想讲两点:第一,智能体在这个阶段有些像盲人摸象,有些人看到这里,有些人看到那里,这并无问题。
第二,Andrej Karpathy我认为是非常少数的,既是一流的研究者,又是极具判断能力的Software用户,他自己使用AI非常厉害。他把整个智能体盲人摸象的大象大致轮廓描述出来,这个轮廓被称为软件3.0。我跟同学们讲一下,为何是软件3.0非常重要,我建议每位想要创业、思考创业的人都需要花一部分精力去思考。
有Software 3.0,就会有Software 2.0、Software 1.0。
Software 1.0就是图灵机编程编译的高级编程语言,Software 1.0适合做什么,适合相对稳定、固定的,不怎么变的,因为人只能线性思维,人大部分都能解决人的问题,但也可以用数学去解决一些数学描述的问题。软件1.0还会继续存在,不会有消亡。
软件2.0不是人写代码,是用数据渲染出来的模型,如搜索引擎、推荐引擎、广告等,这些都是很大的软件,承载了大量的商业价值,但它们都是用数据训练出来的,不是人写的,而是软件,需要很强的专业能力。软件3.0,让我们每个人都可以写代码,自然语言可以写在这个软件上,这给我们带来了空前的机会。
背后的原因与智能体有关,与大模型有关。
当前的大模型或者说通用智能体,本质上是一台计算机,是一个操作系统。
首先讲为什么大模型就像操作系统,不管是windows还是android都只做三件事情:第一,管理资源;第二,调度进程、执行任务;第三,提供一个编程对象。
今天的大模型,很像计算机产业早期的大型机时代。从发展趋势来看,我认为大模型未来会普及到每个企业、每个桌面,甚至每个人的手机上。它本质上是一个在token space上的操作系统。
任何一次产业变革,尤其是信息产品,交互往往是开启下一代产业的关键。历史上,鼠标、键盘开启了微软的时代,手指、触控开启了苹果的时代,异步通信也开启了新的交互方式。
那么,人工智能的交互方式是什么呢?
Andrej Karpathy的这家公司会非常厉害。中国的版本是谁呢?就是在座的各位。它代表了全新的交互方式,需要很强的能动性和多轮对话指令、意图理解能力,既服务于b端也服务于c端。这是YC的生意,他们也来不及做,加了一期创业,刚刚结束的,这是YC智能体的七大扩散场景项目,大家可以看一下,涉及企业AI基建、AI代理协议基建、AI教育、AI个人助理、Voice AI、AI个人理财等。
这其中既有b端也有c端应用,但b端应用会更多一些。
这一次中美人工智能的竞赛,我们本质上不必过分担心。因为中国人口密度高、产业密度高,全球30%的制造业在中国。有时候国运上升就会碰上好运气。中国是以生产力为主的国家,这次的变革是生产力变革。只要我们基于国情,利用密度高、场景多形成新的供应链、新的产业链,中国的AI产业体量、价值创造上会成为全球最好的。
大家可能不知道中国东南部的平均智商是109,全球只有另外一个地区平均分高于中国,就是犹太人。但我们体量比他们大得多,而且比他们卷得多。
我们中国为什么这么聪明?本质上跟我们环境复杂有关。中国地理环境复杂,我们的祖先大禹一开始就要治水、夸父一开始就要射日,越复杂的地理环境越能催生智慧。
我们奇绩 S25刚刚一个星期前结束,一样的赛道、一样的发展前景。大家可以看一下,覆盖多个前沿赛道,半数为Ai Agent,有垂直行业的Agent,有知识与内容Agent,有协作与办公Agent,有互动与体验Agent。
前面两个机会讲完了,最后一个机会是做全球公司。我们这里有很多优秀的校友,我认为你们未来会成为做全球公司的佼佼者。过去做全球公司,都在美国,同学们有没有想过为什么?
硅谷公司能做成这件事,原因在于信息产业软件的供应链都在美国,拥有最完整的供应链和最高的产品力。硅谷具备最高的人才密度、资金密度和机会密度。
但通用智能需要更多模型,需要数据,需要软硬结合和更强的能动性。中国拥有更好的供应链,因此模型、供应链和算力是制约因素,需要时间解决。从目前看来,中国的模型在全世界已经迈出重要一步。
DeepSeek坚持开源,通义千问坚持开放。从策略上讲,要开源必须从小处着手,而不是一开始就追求大规模。因此,我们有最强的供应链,中国特色在于大政府和大市场。以电动车为例。电动车之所以拥有供应链优势,是因为中国长期支持光伏和锂电池,这是中国的优势。美国则完全依赖市场。中国现在为智能聊天机器人等提供系统性的服务矩阵。未来一定是供应链为王,我们的模型供应链在中国不会差。在中国,尤其在杭州,商业氛围良好,起步就可以做全球性的公司。但AI有陷阱,我们可能需要小心。然而,本质上未来的创新结构和新的供应链,将决定中国能否系统性地成为全球化的公司。软件的供应链、硬件的供应链、模型的供应链以及能源功耗的供应链都至关重要。
我个人最感兴趣的是认知的供应链,我们已有不少人在跟进。最后,我会介绍一个奇绩的认知产品,如何帮助每个人提升认知能力并形成体系。
中国可以像硅谷一样发展,可以先走东南亚,也可以先做北美,但北美要避开敏感问题。这是第三个重要需求。
如何把握好不同时机,核心要做的第一步。小扎同学在硅谷分享时说过一句话,创业者永远无法完全准备好,最终都要走出第一步。走出第一步后,核心要素是什么?要把控好需求,技术当然重要,但理解需求、把控需求更为重要。尤其是年轻人,结构性的优势是从自己的需求出发,因为你们的需求很有可能是未来的主流需求。如何把握好自己需求?推荐一种玩心的方法,硅谷教父Paul Graham的个人方法,“不要过于努力地寻找创业点子。你只是想寻找能激发思考的东西。” 。
举个例子,若想用大模型做游戏,应思考大模型能解决游戏行业的什么问题。研究发现,大模型能够解决游戏行业的策略问题。进一步追问,解决了策略问题后,哪些方面的体验会最好?游戏产业价值为何会提升?通过这样一路追问,就能找到好的切入点。
创业核心的第一步是找问题,而不是找点子。要从自己的需求出发,寻找需要解决的问题,这一点很重要。
第二点尤其重要。在找问题的过程中,要进入一个好的探索状态。一个好的搜索状态有三个要素,但只需满足其中一个即可。第一,成为某个领域的专家;第二,掌握动手的技巧;第三,加入创业公司。其中任何一个要素都能构成一个非常好的探索状态。
这是萨姆·奥尔特曼同学一周左右前讲的。为什么会讲这个?为什么要打造一些怪的产品?我们都听说过YC的座右铭,原本强调“build something people want”,但现在这个理念已经不行了。因为有大模型,大家都能做,必须独特才行。
背后的原因是价值的东西。创业用技术改变世界,本质上就是产生价值。价值是什么?是需求乘以稀缺性,如果大家都能做,那就不是稀缺性。稀缺性怎么来?两大来源,攻坚和勇气。攻坚当然重要,解一个很难的问题,别人都解不了,但更重要的是勇气。
如果解决一个很难的问题,别人都解不了,那当然是很好。但同学们更聪明的是,胆子更大,别人不敢做,你来做。胆子大,是更聪明的选择。一定要胆大,做别人不敢做的。
这里我跟同学们分享一下Peter Thiel(彼得·蒂尔)最近分享的观点,他研究了马斯克。马斯克是这个时代典型的胆子大,什么都敢做的人,他从小就对风险有认知,我们也在系统性地寻找这种天生的敢死队。这种人有但不多,但我们要吸取经验教训,重新系统地思考什么是风险,什么是低风险。
同学们一定要这样思考:第一,如果我做成功,机会大不大?第二,我个人付出的机会成本是不是很高?如果我们有兜底,机会成本付出不高,你可以冒越来越大的风险。在这个时代,一定要考虑胆子大,要敢于攻坚。当然,要做难度高的事情,一般的事情就别做了,因为大模型本身就能做到。
最后,这是我们奇绩的slogan“惠人达己,守正出奇”。我认为,要创业,必须要汇总需求并满足需求。第二,要创业,必须满足我的乐趣。YC现在的掌门人Gary Tan也一直讲,你要做的不仅是make something people want,更要make something people you have a passion for,要惠人达己。同时,必须守正和创新,一定要在主赛道上顺势而为,同学们,借不到势能别干。听我一句话,你干任何事情都要明白势能是什么。
守正就是势能,一定要借势,没有势能平地不起高楼。平地起高楼,因为地形变了,这是雷军讲的。各位要做好把握这个时代的机会,加入我们的社区,因为创业很难,九死一生,加入社区可以系统性地帮助到每一位创业者。奇绩我们打造的就是这样的社区。给同学们简单介绍一下,我们奇绩的基本盘有四个组成部分,第一是创业营,我们创业营跟创业者一起解决核心的问题,包括技术问题、产品问题、市场驱动问题。
第二是我们的路演日,我们每一届创业营结束就有路演日,我们的路演日有1000多个投资人来参加。这很重要,因为今天中国资本非常强势,如果我们一个人去融资,用创业者的话,经常被他们按在地上摩擦,我们很吃亏。但是每个投资人都害怕错过下一个阿里,下一个字节,下一个腾讯。路演日就是把他们集中在一起,倒过来让他们来追求我们,把他们按在地上摩擦,让他们来抢,提高创业者的融资概率。
第三是校友社区,通过校友互动和社区的运营,系统性地帮助到每一个创业者。第四我们也给钱,我们是先投资,一旦给被录取,我们就投,我们是标准的210万元人民币或者等价美元,换取7%的股权。我们没有对赌,不干预企业经营,支持到底,我们的投资没有任何其他的目的。我跟同学们讲讲我个人的经历,我自己做奇绩创坛,我还投资了几家公司。
因为我自己有个想法,在奇绩创坛的时候,美国有句俗话和中国一样,没有当过兵,不能当元帅,我凭什么资格就跟创始人讲,你要这样那样做。虽然我早期在创业公司,我去雅虎也很早,但是我从来没有自己一个人做融资。我要做融资,签合同,经历吃亏,每次融资真的被人家按在地上摩擦,我自己体会是在中国融资太难,很辛苦,而且融资过程当中很多投资机构,故意埋雷。
我们奇绩每次投资无需任何条款就签,我们秉持诚信原则,且不仅自身要如此,还要鼓励所有投资机构改变对创始人不友好的做法。因此,我们投资必须坚守价值,秉持长远眼光。最后讲一下奇绩2.0。在这个时代,奇绩必须拥抱未来,范式在变,赛道在变,一切都变,奇绩2.0在积极向前推进。首先,我们有奇绩创业公开课,帮助学生从0到1开启创业。今天在学校里,你可以学工程、理科,但你必须学习数学,有创业思维。
创业是未来的核心价值,是创造财富最大、推动社会进步最强的做法。第一是课程。第二是算力,我们奇绩也拥有算力,有各种算力机制,可为创业者提供算力支持。第三,潜空间,我们定期邀请大模型前沿创业者分享产品实践探索,邀请前沿科研学者分享最新技术进展。
我们潜空间已经办了很长时间,与硅谷潜空间类似。第四点非常重要的是我们的奇绩前沿信号体系,是我们奇绩的认知产品。前面提到,我们每个人都可以从事研究驱动的工作,创建研究驱动型公司,每个人都可以Researcher,但起步时需找到工具和产品,以加快认知提升。 杭州的创业氛围确实浓厚,身边不少浙大校友都在AI领域折腾,陆奇提到的供应链优势深有体会,阿里园区里那些智能物流机器人就是活案例。 陆奇说中国AI产业能成全球最好,就像把480多个项目放火锅里涮,密度高自然味道足,不过杭州的创业咖啡我喝过确实偏甜 东一句西一句就是奇绩打广告 我想还再第一首先还有就是另外而且总结补充重要的是…思维结构混乱[哭笑] 写长篇小说呢
页:
[1]