【环球网科技报道 记者 林迪】“自动驾驶已经进入数据驱动的3.0时代。”日前,毫末智行CEO顾维灏首次提出,“毫末正在通过低碳超算来降低自动驾驶成本,通过改进车端模型和芯片的设计来实现大模型的车端落地,通过数据的组织让大模型发挥更大效力。”
在他看来,自动驾驶近十年的发展可分为硬件驱动、软件驱动、数据驱动三大时代。其中,数据驱动时代,是完全不一样的时代,大模型+海量数据“双剑合璧”,数据开启自训练模式;感知技术上,用多模态传感器联合输出结果;认知技术上,以可解释的场景化驾驶常识为主;自动驾驶里程由硬件驱动、软件驱动时代的百万公里、上千万公里,直接飙升到了1亿公里以上。
顾维灏表示,“毫末一直在为自动驾驶3.0时代做准备,在感知、认知、模式建设上,都是按照数据驱动的方式建设的。毫末所做的一切,都是为了能够做出数据通道和计算中心,以便可以更高效地获取数据,并把数据转化为知识。”以数据驱动为核心,以上4个技术条件并行成立才能称为真正进入自动驾驶3.0时代。
顾维灏告诉记者,Attention大模型是当前AI发展的新趋势,但由于其对算力的需求远远超出摩尔定律,由此带来的高算力需求、高训练成本、高落地难度等挑战,正成为当前毫末重点解决的问题。基于Attention大模型,自动驾驶需要大规模且多样性的训练数据,而基于大规模真实人驾数据的乘用车辅助驾驶,才有能力积累到足够规模和足够多样的数据。“我们有理由认为,辅助驾驶是通往自动驾驶的必由之路。因为只有辅助驾驶,才有能力积累到足够规模和足够多样的数据。”
Attention大模型带来的机遇和挑战,正驱动自动驾驶行业的技术变革。
他对记者表示,“毫末正在通过低碳超算来降低自动驾驶成本,通过改进车端模型和芯片的设计来实现大模型的车端落地,通过数据的组织让大模型发挥更大效力。”
低碳超算层面,毫末在日前的AI DAY上正式官宣了中国自动驾驶科技公司首个超算中心。顾维灏表示:“如何提升训练效率降低训练成本,实现低碳计算,是自动驾驶走进千家万户的一个关键门槛。”毫末超算中心的目标是满足千亿参数大模型,训练数据规模100万clips,整体训练成本降低200倍。
在算法模型层面,顾维灏介绍,毫末早在2021年6月便启动了针对transformer大模型的研究和落地尝试。正是基于过去一年多在训练平台改造升级、数据规格和标注方法的切换准备、针对感知、认知具体任务的模型细节探索等方面的成功实践,为现在毫末在城市导航辅助驾驶场景中的快速发展打下了坚实基础。
另外,顾维灏还分享了毫末数据智能体系MANA在自动驾驶城市场景中面临的挑战与功能升级。
他表示,城市道路主要存在“4类场景难题、6大技术挑战”。其中场景难题主要包括“城市道路养护频繁”“大型车辆密集”“变道空间狭窄”“城市环境多样”。解决上述场景难题,技术层面面临六大挑战:如何在自动驾驶领域应用大模型,如何让数据发挥更大的价值,如何使用重感知技术解决现实空间理解问题,如何使用人类世界的交互接口,如何让仿真更真,如何让自动驾驶系统运动起来更像人。
为了应对上述挑战,MANA感知智能、认知智能等方面均迎来更新升级。
首先,MANA通过使用大规模量产车无标注数据的自监督学习方法打造模型效果,相比只用少量标注样本训练,训练效果提升3倍以上,这让毫末数据优势得以高效转化为模型效果,以更好适应自动驾驶各种感知任务需求。
其次,MANA感知能力提升,让海量数据不再被区别对待。面对巨大数据规模下的“数据效率”难题,MANA构建了增量式学习训练平台,抽取部分存量数据加上新数据组合成一个混合数据集。训练时要求新模型和旧模型的输出保持尽量一致,对新数据的拟合尽量好。相比常规做法,整体算力节省80%,响应速度提升6倍。
第三,MANA感知能力更强。通过使用时序的transformer模型在BEV空间上做了虚拟实时建图,使得感知车道线的输出更加准确和稳定,让城市导航自动驾驶告别高精地图依赖。
第四,MANA感知能力更准,让中国没有不能识别的车辆信号灯。MANA通过升级车上感知系统,对刹车灯、转向灯状态进行专门识别,让驾驶员在处理前车急刹、紧急切入等场景中更安全和舒适。
第五,MANA认知能力也再次进化。面对路口这一城市最复杂场景,MANA在仿真系统中引入了高价值的真实交通流场景,与浙江德清、阿里云合作,将路口这一城市最复杂场景引入仿真引擎,构建自动驾驶场景库,通过自动驾驶的真实仿真验证,时效性更高、微观交通流更真实,有效破解了城市路口通过“老大难”问题。
现场,毫末联合浙江德清、阿里云发布“中国首个基于车路协同云服务的大规模自动驾驶场景库”。作为其首个使用真实交通数据生成、满足数据合规要求的自动驾驶场景库,将进一步加速中国自动驾驶成熟度提升以及车路云协同发展。
本文网址: