安卓用户福音！阶跃开源4B Agent模型，全设备适配+一键部署，手搓党也能玩转

0 0

2025年11月30日，国内AI团队阶跃星辰（StepFun AI）正式开源GELab-Zero项目，其中核心的4B参数GUI Agent模型（GELab-Zero-4B-preview）引发行业关注——该模型不仅在多类安卓设备上实现流畅运行，更配套完整推理基建，支持开发者“一键部署”，彻底打破移动端Agent开发“工程基建复杂、设备适配难”的行业痛点。实测显示，这款轻量级模型在多个GUI任务榜单上刷新同尺寸性能纪录，甚至超越32B参数级竞品，为消费级移动端AI应用落地提供了全新解决方案。

核心突破：4B参数实现“性能+轻量化”双平衡

移动端Agent开发长期面临“性能与设备兼容性”的两难——大参数模型虽能力强，但难以在手机等消费级硬件上运行；轻量级模型又常因参数限制导致任务执行精度不足。阶跃开源的GELab-Zero-4B-preview则实现了突破，通过优化模型架构与推理效率，在4B参数规模下兼顾高性能与轻量化。

从测试数据来看，该模型在ScreenSpot、OSWorld、MMBench-GUI等主流GUI任务基准测试中表现亮眼：在Android World评测中，其准确率达75.86%，远超SeedVL-15（64.20%）、Gemini Mobile Agent v3（66.40%）等同尺寸模型；在ScreenSpot-Pro测试中，以84.45%的成绩大幅领先GUI-Owl-32B（58.00%）等大参数模型。更关键的是，该模型可在安卓手机本地运行，推理延迟控制在200-500毫秒，满足日常交互需求，且无需依赖云端算力，兼顾隐私保护与使用便捷性。

模型的泛化能力同样突出。无论是饿了么、腾讯视频等国民级APP，还是企业福利类小众应用，GELab-Zero-4B-preview都能精准识别界面元素、拆解任务逻辑。例如在“外卖跨品类采购”测试中，模型可准确识别“红颜草莓300g”“好欢螺加辣加臭螺狮粉”等11种商品的规格信息，自动完成搜索、加购、结算等多步骤操作；面对“找成龙经典动作片”这类模糊指令，模型会自主定义“经典”标准，优先选择评分最高的影片播放，展现出接近人类的任务理解与决策能力。

基建革新：一键部署解决“工程噩梦”，手搓党也能上手

除模型本身外，阶跃同步开源的完整推理工程基建，是降低开发门槛的关键。此前，移动端GUI Agent开发需处理多设备ADB连接、权限配置、依赖安装等繁琐流程，工程成本极高，普通开发者难以涉足。而GELab-Zero项目提供“即插即用”的基建方案，将复杂流程封装为标准化工具，实现三大核心能力：

一是“轻量级本地推理”，支持4B模型在安卓手机、平板等消费级硬件上直接运行，无需额外部署服务器，低配置设备也能流畅使用；二是“一键任务启动”，开发者只需调用预设脚本，系统会自动处理环境依赖、设备适配等问题，从下载模型到启动任务最快仅需3分钟；三是“多设备任务分发”，可同时连接多台不同品牌、系统版本的安卓设备，实时记录交互轨迹，方便开发者测试模型在不同环境下的表现。

“以前搭建一套移动端Agent测试环境，光调试ADB连接和权限就花了3天，现在用GELab-Zero的基建，一键就能拉起服务。”一位AI开发者在GitHub评论区分享道。这种“降低门槛”的设计，让个人开发者、中小团队也能快速参与移动端Agent创新，推动行业从“少数巨头主导”向“开源协作”转变。

评测升级：自建基准贴近真实场景，填补行业空白

为解决现有GUI Agent评测“脱离消费级应用”的问题，阶跃团队还开源了自建评测标准AndroidDaily，聚焦“饮食、出行、购物、居住、信息消费、娱乐”六大真实生活场景，填补行业空白。与传统基准多关注邮件、文档等生产力工具不同，AndroidDaily选择外卖、打车、视频播放等用户高频使用的生活服务类APP作为测试对象，更能反映模型的实用价值。

该评测采用“静态+端到端”双轨体系：静态评测包含3146个动作任务，检验模型对界面元素的识别与动作规划能力；端到端评测则设计235个完整任务（如“在给到APP领取员工餐券”“规划周末亲子出行路线”），要求模型在真实设备环境中自主完成全流程操作。测试结果显示，GELab-Zero-4B-preview在AndroidDaily中的准确率达73.4%，远超UI-TARS-1.5（47.0%）、GPT-4o（19.6%）等竞品，证明其在真实场景中的实用性。

“现有评测大多是‘实验室场景’，而用户真正需要的是能帮自己点外卖、订车票的Agent。”阶跃团队负责人表示，希望通过AndroidDaily的开源，推动GUI Agent评测向“消费级应用”倾斜，让模型研发更贴合用户需求。

行业影响：加速移动端Agent规模化落地

GELab-Zero项目的开源，不仅为开发者提供了“低门槛、高性能”的移动端Agent解决方案，更将推动整个行业的规模化发展。从短期看，个人开发者可基于该项目快速搭建个性化Agent，如“自动抢演唱会门票”“智能整理手机相册”等工具；企业用户则能直接复用基建与模型，降低AI功能接入成本，例如电商平台可开发“智能导购Agent”，帮助用户快速筛选商品。

长期来看，该项目的开源或将形成“协作创新生态”。目前，GitHub仓库已吸引超千名开发者关注，不少用户提交了模型优化建议与新场景适配方案；阶跃团队也计划持续迭代，未来将支持iOS、鸿蒙等更多系统，并丰富多智能体协作、定时任务等功能。“我们希望让移动端Agent像APP一样普及，每个人都能轻松拥有自己的智能助手。”团队负责人说道。

对于普通安卓用户而言，这一开源项目意味着“更智能的手机体验”即将到来——无需等待厂商推送更新，通过部署GELab-Zero模型，就能让手机具备自动完成复杂任务的能力。从“被动使用APP”到“Agent主动帮你做事”，移动端AI的实用化进程，正因这样的开源创新而加速。

# AI 资讯