交大荣昶杯数据集标注资源
2022年7月16日至23日,第四届上海交通大学“荣昶杯”算法打榜赛道的比赛在线上线下同步进行,近百支队伍参加了这一赛事。本次比赛的主题是通过数据集标注训练模型实现对给定文本的标签自动标注。
本次比赛需要对给定的文本标注4种标签,分别是人名(PER),地名(LOC),组织(ORG)以及时间(DATE)。这是一件相当繁重的工作,由于在网络上目前缺乏符合要求的免费资源,我们决定在赛后公开我们队伍的train.txt(约2350万行),方便后来者更好地训练模型,同时节约无聊的标注时间。
然而,为了证明你不是一个偷资源到CSDN上去卖的fw,我们准备了一套试题用于检验你是否拥有一个高一学生的数理化认知水平。资源在一个QQ群里,群号是9位数。云剪切板https://www.luogu.com.cn/paste/xyctfr47 中有9道试题,每题的答案都是0~9中的一个数字,依次串联起来即可得到群号。该群允许任何人加入。
祝 训练愉快!