本项目旨在对模型生成的问答内容进行质量评估和逻辑检查。我们接收模型生成的问题和答案,其中多轮对话会包含上一轮的问题和答案。项目的核心任务是根据预设的规则,对模型的答案进行AI回复和逻辑检查,并将其分类为“合格”或“不合格”。针对模型生成的答案,使用先进的自然语言处理技术,生成AI回复。AI回复将模拟真实用户或专家的反馈,对模型答案进行补充或纠正。我们的评估团队由自然语言处理专家和语言学专家组成,具备丰富的行业经验,能够准确判断模型答案的质量。