导航进入“真人指路”时代高德发布大模型驱动视觉认知步行系统

0 0

2026年3月6日，高德地图正式推出全球首个由大模型驱动的视觉认知步行导引系统——地标AI领航，通过深度融合千问大模型、亿级POI数据库与千万级高精街景图像，让导航首次具备视觉认知与人类语言理解能力，彻底告别传统“方向+距离”的机械指令模式，以“所见即所导”的真人化指引，破解步行导航的核心认知难题。

步行导航场景中，用户长期被三大痛点困扰：起步阶段方向感模糊、行进中对距离进度缺乏直观感知、抵达目的地附近难以精准定位终点。此次高德推出的地标AI领航，正是基于多模态人机交互、地理语义理解与生成式AI的技术突破，复刻人类“方向语义+地标锚定+上下文感知”的指路逻辑，为用户提供零认知负担的“直觉式行走”体验。

要实现真人级指路效果，核心在于构建覆盖真实世界的可视可听地理语义网络。高德地图依托三大核心基础能力筑牢技术底座：超亿级POI数据库提供全面的实体信息支撑，高精度步行路网拓扑保障路线规划的精准性，覆盖全国大部分城市及景区的千万级高精街景图像则还原真实环境细节。结合千问大模型的多模态能力，系统可精准识别交通设施、商铺招牌、地标建筑等实体，并智能评估其视觉显著性，进而生成符合人类交流习惯的自然语言描述。

为避免地标提示杂乱无章，该系统创新采用“双重筛选”机制提升指引有效性：在时间与空间维度，仅在起点确认、转弯变道、方向调整及临近终点等关键决策节点进行播报，避免无效干扰；在参照物选择上，优先筛选地铁标识、银行大牌、连锁餐饮招牌等视觉冲击力强、易识别的地标。同时，播报文案采用口语化、具象化表达，突出颜色、形态与相对位置特征，例如“穿过红色建筑后左转”“左侧第二个玻璃门即为终点”，并能根据场景动态调整信息详略。实测数据显示，用户接收视觉地标提示后，平均比传统导航快2秒确认正确路径，看手机频次显著减少，尤其降低了老人、亲子家庭、外地游客等群体的步行出行门槛。

此次地标AI领航的发布，是高德在空间智能领域深耕的重要成果，也是其AI战略的又一实践落地。此前，高德已构建起集“感知、规划、执行、表达”于一体的全链路AI导航智能体，并通过与智能硬件的跨终端合作拓展服务边界。而此次通过多模态大模型对物理世界进行视觉语义蒸馏，进一步完善了可视、可感、可用的空间智能应用体系，推动出行服务从软件功能驱动向空间智能驱动的结构性跃迁。

从技术创新到场景落地，高德地标AI领航重新定义了步行导航的交互逻辑。随着大模型能力与地理数据的持续优化，未来导航系统或将实现更深度的环境感知与更自然的人机交互，为用户带来更智能、更便捷的出行体验。而这一技术突破也为位置服务行业树立了新标杆，推动整个行业向更贴近人类习惯的智能导航方向迈进。

# AI 资讯