2023年8月25日,首届人工智能生成内容国际会议(The 1st International Conference on AI-generated Content, AIGC 2023) 在上海顺利开幕。这是首届、也是世界范围内第一个专门聚焦生成式人工智能的国际会议。在大模型引爆生成式人工智能热潮的当下,本届大会的举行为学术界和产业界贡献了一场饕餮盛宴。
会议得到了复旦大学、中国科技大学、同济大学、上海交通大学、上海人工智能实验室、香港中文大学等知名院校的支持,汇聚全球人工智能生成内容领域的顶级专家、学者以及企业家,探讨最新的研究成果和应用前景。
龙猫数据副总裁胡邱飞受邀参会,并在会上发表了《AIGC背后的数据标注》主题演讲。
数据作为AIGC实现的重要环节,直接影响模型效果、业务效果及产品体验。数据标注的过程中,标注质量及标注效率一直是亟待解决的难题,针对行业痛点问题,胡总在演讲中详细介绍了龙猫数据的标注解决方案。
质量保障:引入大模型,交叉验证人工对齐评测结果
龙猫数据针对AIGC数据标注项目,制定了科学的执行流程,对人员筛选、人员培训、标注方式、结果验证等环节进行优化。标注环节通过大模型结合多人拟合,当模型结果与人工输出评测结果出现偏差,则进行二次校验;只有三方结果达成一致,评测结果才会通过。通过众多项目结果验证,标注准确率极大提升。
效率提升:人机结合,智能辅助释放标注人力
标注过程中,龙猫prompt工程师会对数据需求进行分析处理,调试出合适prompt,将prompt输入龙猫模型,通过AI自学习,模型自动输出标注结果,标注员会对结果进行实时反馈,通过人工微调的方式,不断调整标注模型,提升标注效率与输出质量。
AIGC在带动数据标注行业规模增长的同时,也对数据标注行业进行了全面赋能。龙猫数据将把握机遇,不断提升自身实力,为行业提供更优质的AIGC数据解决方案。