还在用Gemini 3写PPT？这才是最酷炫的玩法（附提示词）

疯了吧 · 发表于 2025-11-27 19:14

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

Gemini 3 发布之后这些日子里，我逐渐感到疑惑：为什么总让 AI 写网站写 PPT，Gemini 都发到第三代了，不能干点更有意思的事吗？要那种科幻感强的、效果酷炫的、难度系数高的，但小白也能做的。比如这种：

或者这种：

Gemini：手势交互？没问题，包的。在开始之前，先准备好 Gemini 3，这里是一点点的注意事项👇🏻目前有三种方式开启玩耍：Gemini 客户端 Canvas 模式、Google AI studio-Playground 和 Google AI studio-Build。其中，最不推荐的是客户端，亲测无法有效拉起摄像头，并且，下面都是手势互动项目，举着手机，手自然也是没法做操控的。

后两者中，Build 是直接形成一个 app，你可以分享给其它朋友，缺点是 tokens 有限。而 Playground 会生成一套代码，需要下载到本地再打开，一旦换个电脑就可能运行不了，但优点是几乎没有 tokens 限制，每天一百万，量大管饱。

考虑到交互项目比较消耗 tokens，所以 Playground 更为合适，个别小项目用 Build 也可以，这就看个人情况而定。JarvisJarvis HUD 面板是在推上超过二十万次浏览的热门爆款，手势操控仪表球，就像钢铁侠操控 Jarvis 那样，酷毙了。

参考 prompt 如下：create a webapp using vanilla js， html， css， modern threejs， mediapipe. it should be a sci-fi tony stark / iron man / jarvis experience focused on simulating an AR heads up display experience. full screen webcam input shown. add a heads up display that tracks the user's head (offset to the right)， with live updating metrics. a minimal 3D world globe should be shown on the left center of the screen， that should be able to be rotated / sized by the user hand gestures在 Build 模式下，亲测完全可以实现一次成型，Gemini 会自动安排任务、编写代码，调用不同的接口，进度条显示完成后，点击 Preview 就能直接打开——记得放行摄像头权限。

Gemini 3 自己就把效果设计安排得明明白白：左手是放大缩小，右边是转动，双手进入摄像头范围后会显示触控点——这些都是 prompt 里没有的，都是它自己的「想」出来的。搭配大屏幕或者投影，真的很有 Jarvis 既视感。

左边的地球建模和右边的面板的内容都是可以改变的，最初 Gemini 3 让右边的面板显示人体体温（显然是凭空编的），后来被我改成了实时显示左侧地球模型的直径。反正就是 vibe 一下，想怎么改怎么改。雨滴控制Jarvis 都有了，惊天魔盗团不也得安排上。

《惊天魔盗团 2》里的控雨术堪称名场面，九年前全靠电影特效，但现在，有 Gemini 3 了。参考 prompt 如下：用 HTML+JS+ML 模型做个网页应用，通过摄像头检测手势，实现用手势来控制雨滴动画的暂停、静止和升格效果。动画效果保持在雨滴垂直方向，风格参考电影《惊天魔盗团》这个 prompt 的第一轮表述完全是按照我看电影之后的想法写的，每个细节都可以通过 vibe coding 再调节。根据第一轮 prompt，Gemini 会加入它自己的设计，比如这具体的手势就是它想出来的。

虽然是用 AI 做的，但是在识别手势动作时非常灵敏，包括不同手势之间的切换都能够快速响应。

3D 粒子控制雨滴曾经是非常复杂的特效技术，就在《惊天魔盗团 2》上映之后，有一个饮料公司做了一支广告，通过控制雨滴，实现静态的粒子效果。

那么参考「控雨术」，Gemini 完全可以实现上面这种结合实拍和速度控制才能出现的效果，最接近的就是 3D 粒子。所以我又做了一个 3D 粒子效果的交互案例。

非常酷炫！prompt 参考如下：用 Three.js 创建一个实时交互的 3D 粒子系统。通过摄像头检测双手张合控制粒子群的缩放与扩散，提供 UI 面板可选择爱心/花朵/土星/佛像/烟花等模型，支持颜色选择器调整粒子颜色，粒子需实时响应手势变化。界面简洁现代，包含全屏控制按钮一次成型，最后出来的交互非常丝滑，尤其是对于手势的识别很准确又灵敏。

小技巧涉及到颜色、布局、UI 设计等等细节，如果每次都用 vibe coding 的方式来调节，表述起来会很麻烦。并且每一次 vibe code 都存在抽卡的情况，所以有一个非常实用的技巧是：加上自定义模块，尤其是颜色、大小等，这样可以完全自主搭配自己喜欢的配色方案。

技能五子棋由雨滴想到粒子，由粒子想到移动，由移动想到——五子棋！我终于可以做技能五子棋了！！仔细想想，五子棋不也是一个手势控制、飞来飞去的交互方式吗！飞沙走石移动棋子，力拔山兮移动棋盘，全都安排上！

Prompt 参考如下：做一个手势互动小游戏「技能五子棋」：主页面为五子棋棋盘，默认已经摆放好棋子。当用户做出「单手甩手」的动作时，棋子会跟随甩动的方向飞出棋盘。当用户做出「双手甩动」的动作时，棋盘会跟随甩动方向飞动Gemini 自己完成了物理逻辑和手势之间的衔接，我的 prompt 只需要描述效果，而具体的速度向量计算、检测阈值，都不用我管。

它甚至还重新命名了「技能」：万象天引。

这叫飞沙走石啊 Gemini 老师！节奏音乐游戏综合上面的几个尝试，Gemini 的毋庸置疑，而且回想一下这些技能树：手势识别、色彩变化，这些组合起来，不就是小游戏吗？于是我尝试了更复杂一点的项目：节奏游戏。音游玩过很多了，但是零经验小白真要做一个游戏、怎么给 Gemini 形容我想达到的效果，还真是花了一点脑筋，后来第一版 prompt 如下：做一个用手势操控的音乐游戏，主界面为四条音轨，用户上传音乐文件后，四条音轨上按节拍出现光点，用户需要用手势准确拍击出现的光点，背景为复古合成波（Synthwave）风格，背景、音轨和光点的颜色可以自定义调节这基本上是我能想到的雏形，根据第一版 prompt，Gemini 选择了 Pygame 作为游戏引擎，继续使用 MediaPipe 做手势追踪，并且加入了 Librosa 用来分析音乐。

选择复古合成波风格是因为它有明确的视觉标志——Gemini 也识别出来了——落日、霓虹渐变色、网格和驶向地平线的道路，非常适合节奏音游。果然做游戏比前面的一些小交互复杂多了……先是只能识别一只手，得调整；然后是无法上传音乐，得调整；到了第三版才稍稍有点样子

但是在体验过中我发现一个比较 bug 的地方：判定线的位置离屏幕边缘太近了，而摄像头的识别范围是有限的，我的手稍微放低一点就无法被识别。一开始我尝试的方法是，把判定线移动到屏幕居中位置，保证我的手始终能在摄像头捕捉范围内。

但是又出来一个问题：光点出口和判定线之间的距离过短，留给我的反应时间也很短，更别提点击动作还有一点点点的延迟，整个可玩性大大下降。可是放太低就还是会出现手掉出识别范围的情况。一时之间我还真想不到这个矛盾该怎么办，于是，我直接去问了 Gemini 能怎么解决。

它直接指出了这个问题的症结所在，并且提出了「视觉欺骗」的方式来优化体验，并且加了一个自定义滑块来调节偏移，这样一来无论手在什么位置，都可以通过调节滑块来对齐判定线。天才。

后来我还指出，感觉光点的出现跟节奏不太一致，为了解决这个问题，Gemini 又加了一个滑块用来调节延迟。虽然我仍然认为它并没有很好地分析节奏型，但是这个滑块的设计还是很有效，尤其是解决了戴着蓝牙耳机导致的延迟。

小技巧本质上，只要有 prompt 就有抽卡的情况存在，但抽卡未必就不好。当碰到非常硬伤的 bug，比如始终无法调用摄像头、无法上传文件等等，vibe coding 时反复修改也没效果，不如就直接「新建项目」。核心功能反映在代码上时，彼此之间有所牵连，重新跑一遍，让 AI 整体性地补足，远比一点点 vibe coding 要更有效率。当然，能看懂代码就会更有效率，可以针对性地解决。只不过，对于完全的零码选手来说，还不如直接重新抽卡。

在 AI 之前，做手势交互的应用，得先学点儿 Touch Designer，最好还懂点儿部署。这些都得一点点翻教程，反复研究，在这个过程中搞不好就被劝退了。有了 AI 之后有多简单，自然不用多说。更关键的是，手势交互原本的门槛远比生图、做 PPT 要更复杂，却又能让小白零码选手快速领略到做应用的乐趣。唯一留下的，是对审美的挑战。在这些案例里能看到，Gemini 有点审美，但不多，设计、配色等等都是差强人意。代码的「硬」技能它可以掌握，留给我们的，就是对于审美的挑战。

wifai · 发表于 2025-11-27 20:30

Gemini 3玩出手势交互黑科技，小白也能整活，未来还能更酷！

咖啡豆 · 发表于 2025-11-27 20:30

Gemini 3 手势交互这技术太牛了，就像给小白开了个魔法盒，100 万 tokens 量随便用，比以前学一堆教程简单太多，就是审美还得自己抠

com2 · 发表于 2025-11-28 09:52

谢谢楼主分享！

账号		自动登录	找回密码
密码			注册

[综艺大观] 还在用Gemini 3写PPT？这才是最酷炫的玩法（附提示词）

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。

浏览过的版块