2021年2月15日,由张义策、林子杰、祝清麟、孙婧伊等同学组成的“HITSZ-HLT”团队在SemEval-2021国际语义评测比赛Task 5: Toxic Spans Detection任务中取得了第一名的好成绩。

SemEval由国际计算语言学协会(Association for Computational Linguistics, ACL)的 SIGLEX 专委主办,是全球范围规模最大、参赛人数最多的系列权威语义评测竞赛。自2001年起,SemEval已成功举办十五届,在业界和学术界具有极高影响力。

Task 5 Toxic Spans Detection任务是分析和识别攻击性言论中包含的侮辱性语言。现有的大多数侮辱性语言检测研究都是对整个评论或文档是否存在侮辱性语言进行分类,但无法识别具体的攻击性表达片段。本次评测任务更具有创新性和挑战性,也是成功实现自动评论审核的关键技术。这一任务吸引了来自世界各地的473个参赛团队。HITSZ-HLT团队充分结合预训练语言模型、深度学习模型、语言学知识等技术,充分利用了不同模型之间的互补性,最终取得了F1值0.7083的好成绩,位列第一名,并受邀在SemEval 2021大会进行报告。

发表评论