欢迎光临散文网 会员登陆 & 注册

9月28日+29日,大牛带你精读前沿论文,一小时解读信息抽取大一统模型UIE

2022-09-28 16:18 作者:沃恩智慧  | 我要投稿

2022年了,有人说信息抽取领域早已是诸神黄昏。然而即使这样,依然“内卷”不止。似乎这个卷成麻花的领域已经看不到希望?

但是不久前,这个沉寂之地忽然翻起了浪花,一篇发表在ACL2022上的工作昭示着这个领域终于获得了里程碑式的突破

图片

用一个架构实现了对该领域诸多子任务的统一建模,就好像秦始皇终于实现了大一统,消除了各个诸侯国之间不互通的度量衡(不是)。

之所以说是里程碑式的突破,是因为这项工作,屠爆了学术界榜单,成为信息抽取领域学术层面的SOTA并且是人人可傻瓜式使用的开源工具,这意味着在这个应用场景非常广泛的领域,它能够快速的大规模落地开花~

原本应为任务难度大,落地成本居高不下的信息抽取,在各个领域都有了史无前例的可能性。无论是实体抽取还是事件抽取,都可以做到简洁并且精准!简直好用到让人觉得有点梦幻了!

这不禁让人好奇,这个开源工具的背后是怎么做到的呢?

这个在ACL2022大放异彩的信息抽取技术UIE,联合增强语言模型ERNIE3.0,强强联合带来让人惊艳的效果!

9月28、29日,直播解读超强UIE。

私信进群免费看直播

拥有“十八般武艺”的UIE不仅具备超强的zero-shot开放域信息抽取能力,还身具小样本定制训练能力。所以哪怕它在某些场景中表现欠佳,只要人工标几个样本丢过去就能大幅提升效果。这个强大的Few-Shot能力是工具在大量长尾场景落地的最后一公里保障。

简单来说,UIE借鉴近年来火热的Prompt概念,将希望抽取的Schema信息转换成“线索词” (Schema-basedPrompt作为模型输入的前缀(SSI),使得模型理论上能够适应不同领域和任务的Schema信息,并按需抽取出线索词指向的内容,生成结构化语言表述的抽取结果(SEL)从而实现开放域环境下的通用信息抽取。

经过UIE预训练后,模型的小样本学习能力得到了极大的提升,这便是UIE工具具备强大定制化能力,进而实现中长尾行业落地的关键。

对更多细节感兴趣的小伙伴,可以扫码预约UIE讲解直播哦~

讲师介绍⬇⬇

图片

当然,对于NLPer来说,最关心的还是能够对做科研,写论文有什么帮助?

不论是继续读博还是为了后面优质的就业机会,甚至就算是毕业,也对论文水平和质量有要求。

而对于发论文,最核心的一点仍然是你的工作有没有作出贡献,有没有创新。

那么及时了解领域内最前沿的技术,了解最新的sota,对于激发出一个好的idea,至关重要。

9月28、29日,大牛带你精读前沿论文,掌握最新sota,为你的科研答疑解惑。


9月28日+29日,大牛带你精读前沿论文,一小时解读信息抽取大一统模型UIE的评论 (共 条)

分享到微博请遵守国家法律