基于机器阅读理解的问答系统

浏览: 时间:2021-12-27 分类:核心技术

自然语言处理(Natural Language Processing, NLP)是实现人类无障碍人机交互愿景的基石,被誉为“人工智能皇冠上的明珠”。而机器阅读理解(Machine Read Comprehension, MRC)是近年来 NLP 领域的研究热点之一,被视为“自然语言处理皇冠上的明珠之一”。机器阅读理解的主要应用之一是抽取式问答(Extractive QA),即给定文章和问题,机器需要在文章中找到答案对应的区域(span),给出开始位置和结束位置。代表数据集有SQuAD(Stanford Question Answering Dataset)、DuReader(百度)、MS MARCO(微软)等。

抽取式问答模型的通用架构如图1所示,主要包括向量化层、编码层、交互层和答案层。比较经典的抽取式问答模型有BiDAF、R-Net、ReasoNet等,其中BiDAF模型架构如图2所示。

01

图1 抽取式问答模型的通用架构

02

图2 BiDAR模型架构图

我们在问题生成模型(如图3)、多段落问答模型选择器设计(如图4)、多轮问答模型、医疗知识问答等方面有重要的技术创新和应用创新。

03

图3 问题生成模型

04

图4 多段落问答选择器