

近日,高德舆图肃肃推出各人首个由大模子入手的"视觉通晓步导"系统——地标 AI 领航,该系统深度交融千问大模子、亿级 POI 与千万级街景图像,让导航系统初次具备了"视觉通晓与东谈主类言语远大"的空间智能感知才气。它不再仅仅距离和方针指示,而是能像真东谈主相似,通过用户目下真的世界的地标进行谀媚,杀青"所见即所导",从根底上措置了走路场景下的导航通晓贫苦。

在导航场景中,用户时常面对三个主要痛点:起步时方针感朦拢、对距离与走路经由缺少直不雅感知、到达指标地隔壁仍无法证明准确特殊。
高德基于多模态东谈主机交互、地舆语义远大与生成式 AI 利用上的冲突,推出了更合适东谈主类指路俗例的视觉通晓导航,灵验措置了上述痛点,为用户提供零通晓背负的"直观式行走"体验。
东谈主类在平方指路往往用"在那儿""走那条路""穿过红色建筑""下个路口有排餐饮店"等抒发表情,通过融入面前环境的地标参考,让开线信息更明确,其中枢依赖"方针语义 + 地标锚定 + 潦倒文感知"的通晓逻辑。导航器用若要达到东谈主类语境下的指路后果,领先需要构建障翳真的世界、可听可视的地舆语义收集。
为此,高德舆图基于三大中枢才气,成立导航系统对空间关联的深度远大:超亿级 POI 数据库、高精度走路路网拓扑,以及障翳寰宇大部分城市及景区的千万级高精街景图像。聚首千问的多模态才气,开元棋牌官网系统可识别交通轮番、商铺、地标建筑等实体,并评估其视觉显耀性,从而生成更合适东谈主类俗例的当然言语描述。
{jz:field.toptypename/}真的场景中,并非通盘 POI 王人顺应用于指引,地标不清、领导不准会导致用户拿不准"第几个路口转""何时该提醒"。为擢升指引灵验性,高德地标 AI 领航选定"双重筛选":一是时空要津节点筛选,仅在最先、转弯、偏航及相近特殊等有蓄意点播报;二是显耀感知筛选,优先经受更扎眼、更易识别的参照物,如地铁璀璨、银行大牌、餐饮牌号等。
同期,播报案牍选定更白话化、具象化的抒发,卓越脸色、方法与相对位置(如"左侧第二个玻璃门"),并笔据场景动态退换详略。实测知道,用户在听到视觉地标领导后,平均比传统导航快 2 秒证明正确旅途,减少看手机频次,进一步缩小老东谈主、亲子家庭、旅客及从容力易漫步东谈主群的走路出行门槛。
这次推出的地标 AI 领航,是高德在空间智能界限深耕的又一力证。通过多模态大模子对物理世界进行视觉语义蒸馏,高德构建起可视、可感、可用的空间智能利用。