2025 年 11 月,谷歌 Gemini 系列衍生模型 Nano Banana Pro 凭借一系列创意玩法引爆 AI 圈。从将专业论文转化为趣味漫画,到精准识别手写草稿并以真人笔迹解题,这款模型的多元交互能力获得田渊栋、Andrej Karpathy(卡帕西)等 AI 大牛力荐,成为谷歌 AI 近期强势崛起的又一力证。
最令人惊喜的玩法来自 AI 大牛田渊栋的分享 —— 他通过整合 Nano Banana Pro 生图能力的 NotebookLM 工具,将一篇讲解神经网络 “顿悟(Grokking)现象” 的学术论文,改编成了哆啦 A 梦主题漫画。漫画中,大雄面临神经网络 “训练准确率满分、测试却失效” 的难题,哆啦 A 梦用 “领悟显微镜” 拆解出 “懒惰学习、独立特征学习、交互式特征学习” 三个核心阶段,把权重衰减、能量函数等专业概念转化为直观画面。田渊栋直言,这款 AI 生成的宣传海报 “比自己做的好太多”,网友则在评论区纷纷求分享提示词,NotebookLM 产品负责人也回应将优化导出和分享功能。
特斯拉前 AI 总监、OpenAI 创始成员卡帕西的体验同样刷屏。他上传包含随手涂鸦和示意图的考试卷照片,Nano Banana Pro 不仅精准识别题目,还以逼真的手写字体完成解题过程 —— 从量子力学薛定谔方程验证,到化学化合物命名、物理波函数方向判断,解题步骤清晰规范。经 ChatGPT 核验,除一处化合物命名标注不规范、一处拼写小误差外,其余答案全部正确。卡帕西评价,这种 “智能画布” 式的可视化交互,就像为大模型打造了图形界面(GUI),彻底改变了传统文本交互的局限。随后他还加码体验,用模型生成个性化每周健身计划海报,可直接打印张贴,甚至特意要求 “更具男子气概”,让周二的训练强度显著提升。
普通网友的创意玩法同样精彩。有用户上传手写数学题照片,要求 Nano Banana Pro 用自己的笔迹解题,生成的答案不仅步骤正确,笔记版式、字迹质感都高度还原真人风格,一度让网友质疑 “是不是真人手写”。卡帕西后续验证确认,只需在提示词中明确 “用我的手写字体生成更新后的图片”,模型就能精准复刻笔迹风格。不过仔细观察仍能发现 AI 痕迹:螺旋笔记本的线圈连接逻辑不符、数字 “2” 的写法过于统一、墨水无压力变化等细节,暴露了其 AI 生成的本质。
这场趣味体验热潮背后,是 Nano Banana Pro 强大的多模态理解与生成能力。它既能解析学术论文的核心逻辑并转化为通俗漫画,又能精准识别手写内容、还原人类书写特征,还能响应个性化创意需求。而谷歌 CEO 劈柴哥的互动更是让热度再升一级 —— 他用 Nano Banana Pro 生成芝士汉堡结构示意图,清晰标注 “芝士需放在肉饼上方才能正常融化”,呼应 8 年前谷歌安卓汉堡 emoji “芝士在下” 的乌龙事件,用技术圆满了陈年老梗,马斯克也在评论区用表情互动,引发网友热议。
随着 Nano Banana Pro 的玩法持续解锁,谷歌 AI 的生态优势进一步凸显。这款模型的爆火,不仅让普通用户感受到 AI 的趣味与实用,更通过专业人士的认可印证了谷歌在多模态交互领域的技术积累。在 AI 竞争从单一模型性能比拼转向生态体验的当下,Nano Banana Pro 的创意落地,无疑为谷歌增添了更多市场好感度,也让行业看到了大模型更贴近生活的应用可能。