欢迎光临散文网 会员登陆 & 注册

Dense Passage Retrieval for Open-Domain Question Answering

2023-08-22 22:53 作者:三月phanta  | 我要投稿

方法:

  • a. 理论背景:

    • 本文提出了一种用于开放领域问答的密集检索方法,称为Dense Passage Retriever(DPR)。该方法使用双编码器架构将段落和问题编码为密集向量。

  • b. 技术路线:

    • 使用BERT预训练模型对问题和段落进行编码。

    • 使用度量学习来优化问题和段落之间的点积相似度函数。

    • 使用FAISS对段落嵌入进行预计算和索引,以便在推理时进行检索。

    • 通过在训练中考虑不同类型的负面段落,使用批内负面方法获得最佳性能的模型。

结果:

  • a. 详细的实验设置:

    • 在训练中,从BM25或DPR检索系统返回的前100个段落中,对每个问题采样一个正面段落和m-1个负面段落。

    • 训练目标是最大化正面段落中所有正确答案范围的边际对数似然,以及正面段落被选择的对数似然。

  • b. 详细的实验结果:

    • DPR在五个问答数据集上的表现优于之前的模型,其中四个数据集的检索准确性得到了显著提高。

    • DPR可以处理每个问题的最多100个段落,并且在检索准确性方面优于TF-IDF或BM25等稀疏向量空间模型。

    • 使用密集向量而不是稀疏向量可以显著提高问答性能。

    • 作者证明了一个简单但有效的解决方案可以展现更强的实证性能,而无需依赖额外的预训练或复杂的联合训练方案。


Dense Passage Retrieval for Open-Domain Question Answering的评论 (共 条)

分享到微博请遵守国家法律