- 赛题名称:OAG-Challenge
- 赛题类型:大模型、知识图谱
- 赛题任务:论文溯源、匹配与消歧
赛题背景
学术数据挖掘富有很多以实体为中心的应用,比如论文检索、专家发现和期刊推荐等。然而,学术知识图谱挖掘相关的数据基准的缺乏严重限制了该领域的发展。在KDD Cup 2024,我们推出OAG-Challenge,这是一个由三个现实而具有挑战性的学术任务组成,旨在推进学术知识图谱挖掘技术的最新发展。
赛题任务
在这个技术蓬勃发展,信息迅速更新的时代,为研究人员和大众提供多领域的高质量前沿学术知识已成为当务之急。 本次比赛要求参与者开发一个模型,能够通过检索相关论文来回答专业问题。
AQA 任务
在本任务中,参与者的任务是使用问题-论文对来训练检索模型。 该数据集来源于OAG-QA,OAG-QA从StackExchange和知乎网站检索问题帖,提取答案中提到的论文URL,并将其与OAG中的论文进行匹配。参与者将获得问题数据集,并需要找到与这些问题最匹配的论文。
PST任务
论文源头追溯任务的目的,是在给定一篇论文p的全文的情况下,从这篇论文中找出ref-source。ref-source即最重要的参考文献(叫做“源头论文”),一般是指对本篇论文启发性最大的文献。每篇论文可以有一篇或多篇ref-source,也有可能没有ref-source。对于论文的每一篇参考文献,论文源头溯源都要给出一个范围在[0, 1]的重要性分数。
WhoIsWho-IND任务
给定每位作者的个人资料,包括作者姓名和发表的论文,参赛者需要开发一个模型来检测论文中错误分配给该作者的论文。 此外,数据集还提供了所有涉及论文的详细属性,包括标题、摘要、作者、关键词、地点和发表年份。
赛题时间轴
- 2024年3月20日:2024年KDD Cup开始
- 2024年5月31日:团队合并截止日期
- 2024年5月31日:发布测试数据。所有参赛者有7天时间提交他们的结果。
- 2024年6月7日:所有赛道结束。
- 2024年6月14日:宣布KDD Cup获胜者。
赛题奖金
- 金牌(第一名):3,000美元
- 银牌(第二名):2,000美元
- 铜牌(第三名):1,000美元
- 优秀奖(第四名至第十一名):每个团队500美元。