基于机器阅读理解的问答系统

浏览：时间：2021-12-27 分类：核心技术

自然语言处理（Natural Language Processing, NLP）是实现人类无障碍人机交互愿景的基石，被誉为“人工智能皇冠上的明珠”。而机器阅读理解（Machine Read Comprehension, MRC）是近年来 NLP 领域的研究热点之一，被视为“自然语言处理皇冠上的明珠之一”。机器阅读理解的主要应用之一是抽取式问答（Extractive QA），即给定文章和问题，机器需要在文章中找到答案对应的区域（span），给出开始位置和结束位置。代表数据集有SQuAD（Stanford Question Answering Dataset）、DuReader（百度）、MS MARCO（微软）等。

抽取式问答模型的通用架构如图1所示，主要包括向量化层、编码层、交互层和答案层。比较经典的抽取式问答模型有BiDAF、R-Net、ReasoNet等，其中BiDAF模型架构如图2所示。