媒体报道详情 龙猫数据  / 媒体报道详情

AIGC背后的数据标注:看龙猫数据如何提质增效?

来源:龙猫数据作者:龙猫数据时间:2023-08-29


2023年8月25日,首届人工智能生成内容国际会议(The 1st International Conference on AI-generated Content, AIGC 2023) 在上海顺利开幕。这是首届、也是世界范围内第一个专门聚焦生成式人工智能的国际会议。在大模型引爆生成式人工智能热潮的当下,本届大会的举行为学术界和产业界贡献了一场饕餮盛宴。

 1693822958051-图片1.png

会议得到了复旦大学、中国科技大学、同济大学、上海交通大学、上海人工智能实验室、香港中文大学等知名院校的支持,汇聚全球人工智能生成内容领域的顶级专家、学者以及企业家,探讨最新的研究成果和应用前景。

龙猫数据副总裁胡邱飞受邀参会,并在会上发表了《AIGC背后的数据标注》主题演讲。

 1693822991305-图片2.png

数据作为AIGC实现的重要环节,直接影响模型效果、业务效果及产品体验。数据标注的过程中,标注质量及标注效率一直是亟待解决的难题,针对行业痛点问题,胡总在演讲中详细介绍了龙猫数据的标注解决方案。

质量保障:引入大模型,交叉验证人工对齐评测结果

龙猫数据针对AIGC数据标注项目,制定了科学的执行流程,对人员筛选、人员培训、标注方式、结果验证等环节进行优化。标注环节通过大模型结合多人拟合,当模型结果与人工输出评测结果出现偏差,则进行二次校验;只有三方结果达成一致,评测结果才会通过。通过众多项目结果验证,标注准确率极大提升

 1693823094292-图片3.png

 

效率提升:人机结合,智能辅助释放标注人力

标注过程中,龙猫prompt工程师会对数据需求进行分析处理,调试出合适prompt,将prompt输入龙猫模型,通过AI自学习,模型自动输出标注结果,标注员会对结果进行实时反馈,通过人工微调的方式,不断调整标注模型,提升标注效率与输出质量。

1693823134672-图片5.png

AIGC在带动数据标注行业规模增长的同时,也对数据标注行业进行了全面赋能。龙猫数据将把握机遇,不断提升自身实力,为行业提供更优质的AIGC数据解决方案。