腾讯混元「小」模型来了
大模型的配置门槛,终于被打下来了。现在,只要一部手机,普通人也能跟大模型交朋友,开发属于自己的小应用、小工具。
是的,你没看错。腾讯混元大模型团队一口气带来了4位新朋友:
0.5B、1.8B、4B、7B
全部开源,消费级显卡就能运行
开发者闭眼入
向左滑动查看更多
开发者“玩AI”再也不用盯着超算配置,手机、电脑、平板都能当“开发阵地”。
这些小而精的模型,能轻松住进你的手机、电脑,甚至智能座驾、智能家居设备里。
ARM、高通、MTK、Intel……等主流芯片全都兼容。
技术门槛直接砍半。
上Github 和 Huggingface就能直接下载使用。再也不用眼巴巴等专业机构的调用权限。
单卡就能跑。显存占用更少、计算更高效、部署更灵活。
SGLang、vLLM、TensorRT-LLM 这些主流推理框架,也都能搭伙。
双脑协作,反应超灵。
指的是这四款「小」模型,有两个 “脑子”:
一个反应超快,瞬间秒回你的信息;
一个擅长深思熟虑,替你处理复杂问题。
就像你问它 “附近好吃的川菜馆”,快脑能马上给出推荐;
要是问 “如何设计一个自动写周报的系统”,慢脑就开始替你细细规划。
有了它,就有了24h随时在线的「最佳拍档」。
超强记忆,有问必答。
能一次性处理 256K的上下文,相当于看一遍就熟记3 本《哈利波特》。
你和它聊项目方案,来回几十轮讨论,它都能记得每一个细节。后续再提问,它也能对答如流。
Agent能力出色,J人助理。
能帮你深度搜索资料,有「十万个为什么」不如先问问它;
替你「整理去年的消费账单」,自动生成excel进行分析;
甚至规划旅行,从路线搜索到制定攻略一手包办。
实测中:
四个新模型在语言理解、数学、推理等领域,得分都达到领先水平。
1.8B的那款,表现尤为出色。
这四款「小而精」的模型,也早已在腾讯内部「实战练兵」:
日常开会、看书就用得很多,
@腾讯会议AI小助手、@微信读书AI问书均搭载新模型,让AI帮你 “读完、记住、理解” 所有长内容。
在端侧应用上,
@腾讯手机管家利用小尺寸模型,精准实现垃圾短信毫秒级拦截,还不上传用户隐私。
@腾讯智慧出行智能座舱助手也能充分实现「低功耗+高效交互」,让车机「更聪明」。
在高并发场景中,
@搜狗输入法能准确识别嘈杂环境的语音。
@腾讯地图更能「猜你喜欢」,帮你推荐更顺路的地点。
聊天时,也能用@微信输入法在输入框里直接「问AI」,边打边问更方便。
在垂直行业,
@金融AI助手,能够95%猜中你想办的业务
@游戏翻译和@QQ飞车手游的NPC,方言外语都能和你唠两句
这些能力,都来自腾讯混元模型的「小尺寸」+「强适配」。
以前自身在小尺寸开源模型的缺口,现在补上了。
以前难以满足的终端场景,现在可以跑起来了。
未来,腾讯混元还会有更多尺寸、更多本事的朋友来。
技术迭代是场接力赛,我们先跑这一棒。
去官网,立刻体验:腾讯混元
官网体验地址:https://hunyuan.tencent.com/modelSquare/home/list
腾讯这波开源操作确实给力,小模型让AI开发门槛低到手机都能玩,开发者再也不用被硬件劝退了。双脑协作和超强记忆很实用,感觉未来会有更多接地气的AI应用冒出来。 之前折腾大模型得用高端显卡,现在手机就能跑,开发小工具方便多了。 ai越来越改变生活了 工作节奏提升有希望!
页:
[1]