阿里天猫精灵推出AI治理开源数据集

阿里巴巴天猫精灵通义大模型团队联合多领域学者、组织推出大语言模型治理开源中文数据集100PoisonMpts,宣布十余位知名专家学者成为首批“给AI投100瓶毒药”的标注工程师。标注人各提出100个诱导偏见、歧视回答的刁钻问题,并对大模型的回答进行标注,完成与AI从“投毒”和“解毒”的攻防。

据阿里联合团队负责人介绍,相比国外厂商的治理方法,100PoisonMpts数据集在技术方法上将具备更加完整的标注流程、更隐性的问题领域、更全面的有效性。标注数据对模型在继续训练、微调、强化学习、线上服务等多环节产生效益。

目前,首批领域数据围绕AI反歧视、同理心、商榷式表达等目标,已覆盖法理学、心理学、儿童教育、无障碍、冷知识、亲密关系、环境公平等维度。100PoisonMpts数据集预计在6月开放第一批问答数据,目前正在魔搭等技术社区征集更多垂直领域专家。