媒体报道详情 龙猫数据  / 媒体报道详情

龙猫数据副总裁胡邱飞发表“大模型驱动下的自动驾驶智能标注”主题演讲

来源:龙猫数据作者:龙猫数据时间:2023-08-22

8月23日,由博闻创意会展集团及OE汽车联合举办“第五届智能座舱与自动驾驶创新技术论坛”在深圳顺利召开。行业专家、主机厂及供应链上下游专家齐聚一堂,以促进业内交流,为智能座舱与自动驾驶产业未来发展提供了创新思考。 


1693897815034-1.png

龙猫数据副总裁胡邱飞受邀参会,并针对当下热点技术,在论坛上发表“大模型驱动下的自动驾驶智能标注”主题演讲。

1693897848680-2.png

数据、质量、成本作为自动驾驶实现在数据层面所面临的三大难题,如何破局一直是大家持续关注和探索的方向。大模型的出现为行业带来了新的机遇,但同时也带来新的挑战。

1693897884435-3.png

相比小模型,大模型具备更强的泛化能力,也意味着需要海量的多模态训练数据喂养,这个规模预计在PB~EB量级。目前公开数据库在数量、场景上均难以满足训练需求。若合并数据库,则会因为数据库数据分布差距大,导致模型参数分布较大,总体效果反而不如单一数据库训练的效果。

1693897925440-4.jpg

针对大模型训练中的数据问题,胡总指出,龙猫数据通过网络结构设计,自研DAM(Domain Adapatation Model)模块,可将多个数据库合并在一起,通过跨域适配结构解决合并数据训练效果下降的问题。

1693897943765-4.png

通过数据对齐,龙猫数据可在大模型训练上获得足够量的数据及足够多的标注内容,模型参数量和精度可以随着数据量的增加(数据量主要来自数据库的增加,而不是单一数据库)而上升。

1693897966417-5.png

目前,龙猫数据已经推出智能驾驶领域首款自动标注模型-AutopilotGPT,其具备强泛化能力,可解决图片、点云等数据识别痛点问题;兼容多类型传感器,如禾赛、图达通、大疆等多款激光雷达;可识别多种应用场景,如目标检测、目标追踪、车道线识别、可行驶区域识别、图像分割、点云分割等。

1693897986628-6.png

大模型驱动下,龙猫数据将在自动驾驶智能标注上持续发力,为行业提供更优质的AI数据解决方案。