高德TrafficVLM模型升级,预知超视距路况,AI带来天眼视角。
9月19日消息,今天傍晚,高德官方公众号发布消息称,其已成功实现TrafficVLM(交通视觉语言模型),该技术有助于用户更全面地掌握交通状况,从而提升驾驶体验。 从行业发展的角度来看,高德此次推出的TrafficVLM标志着智能出行领域在融合视觉与语言处理能力方面迈出了重要一步。这一技术不仅能够提升导航的精准度,还能在复杂路况下为用户提供更直观、更及时的信息支持,进一步优化用户的出行效率和安全性。随着人工智能技术的不断进步,类似创新将更广泛地应用于日常交通管理中,推动智慧城市建设进程。
根据介绍,在现代交通环境中,驾驶者常常面临信息盲区的挑战:在复杂的路口穿梭时,只能看到眼前的车流,却无法预知百米外哪个车道即将拥堵;在畅通的高速上行驶时,却难以预见前方因轻微刹车而引发的“幽灵堵车”。这些局部视角的限制,使得驾驶者难以做出最优的决策。因此,TrafficVLM模型此次升级即是为了应对上述难题。 随着城市交通日益复杂,驾驶员对实时、全局信息的需求愈发迫切。现有的视觉和感知系统往往局限于车辆自身的传感器,难以提供更广阔的路况视野。TrafficVLM模型的推出,正是为了弥补这一短板,通过更智能的信息整合与分析,帮助驾驶者提前预判潜在风险,提升行车安全与效率。这种技术进步不仅有助于缓解交通压力,也为未来智能出行奠定了基础。
基于空间智能架构,全新升级的TrafficVLM为用户提供了“天眼”般的视角。它能够帮助用户全面掌握整体交通情况,从而在复杂路况中做出更优判断。据悉,该系统可为每一位驾驶者提供“全知视角”,在经过路口或高速路段时,不再受制于有限的视野范围,从而更直观地预判前方路况,从容应对潜在风险。
例如,在用户前方3公里的主干道上,左侧车道因一起突发追尾事故导致新的交通拥堵点出现。TrafficVLM系统通过实时交通孪生技术迅速感知到这一异常情况,并推理判断出事故位置及其可能的发展趋势:拥堵可能会迅速扩散,形成一段长达3公里的拥堵路段。基于TrafficVLM的分析,高德地图能够在用户抵达拥堵区域之前,及时推送出行建议:“前方三公里发生事故,大量车辆向右变道,请您提前靠右行驶,注意避让应急车辆。”
通过云端调度系统的高效响应,系统在交通拥堵出现的第一时间下达监测指令,调取现场的视觉数据,并利用图像中的深度信息进行智能分析,准确还原拥堵区域的空间布局和交通状况。
据介绍,这意味着用户不仅能直观看到“前方堵车”,更能清楚理解为何需要变道、何时该减速,以及拥堵的真实成因与范围。这种从被动接收提示到主动洞察全局的转变,让用户摆脱了“盲人摸象”般的局限,实现对复杂路况的可视化、可感知、可预判的智慧导航体验。
该模型以视觉语言模型通义Qwen-VL为基础,结合高德提供的海量且高度还原的交通视觉数据,进行了强化学习与数据训练,进一步提升了模型在交通场景中的理解和处理能力。 从技术发展的角度来看,这种将大模型与真实交通数据相结合的方式,体现了人工智能在实际应用场景中不断深化的趋势。高德的交通数据具备极高的真实性和覆盖范围,为模型训练提供了坚实的基础,有助于提升系统在复杂交通环境下的适应能力和决策水平。这种方式不仅增强了模型的实用性,也为未来智慧交通的发展提供了新的方向。