博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
DrQA基于维基百科数据的开放域问答机器人实战教程
阅读量:5897 次
发布时间:2019-06-19

本文共 863 字,大约阅读时间需要 2 分钟。

目录:

官方介绍
实战

DrQA 是一个基于维基百科数据的开放域问答系统,它由检索器和阅读器组成。其中检索器用于从海量的文本(例如维基百科)中获得相关的文章;阅读器用于从文章中获得相应的答案。

一 . 官方介绍

DrQA是一个应用于开放域问答的阅读理解系统。特别是,DrQA的目标是“大规模机读”(MRS)。在这个设定中,我们在可能非常大的非结构化文档集中搜索问题的答案。因此,系统必须将文档检索(查找相关文档)的挑战与机器对文本的理解(从这些文档中识别答案)的挑战相结合。

我们使用DrQA的实验侧重于回答factoid问题,同时使用Wikipedia作为文档的独特知识源。维基百科是一个非常适合大规模,丰富,详细信息的来源。为了回答任何问题,必须首先在超过500万个文章中检索可能相关的文章,然后仔细扫描它们以确定答案。

请注意:

DrQA将Wikipedia视为一个通用的文章集合,并不依赖于其内部知识结构。因此,DrQA可以直接应用于任何文档集合。

数据集:维基百科

框架:PyTorch
版本:PyTorch torch-0.3.0
论文:Reading Wikipedia to Answer Open-Domain Questions
项目:
系统架构:

image

二. 实战

交互模式下提问(一):

where is stanford university

image

可以看到检索到的文档是 Stanford University,问题的答案是:浅绿色标注的部分,答案非常的精准。

交互模式下提问(二):

where is Barack Hussein Obama from

image

回答不是很精准,我其实想问的是奥巴马来自哪里。答案返回的是奥巴马在哪里,奥巴马在华盛顿,不过也还是相当不错。

交互模式下提问(三):

who is Donald Trump

image

这个问题并没有找到准确的答案,虽然文档是相关的。

原文发布时间为:2018-07-26

本文作者:fendouai
本文来自云栖社区合作伙伴“”,了解相关信息可以关注“磐创AI”。

转载地址:http://qaasx.baihongyu.com/

你可能感兴趣的文章
vue路由传值params和query的区别
查看>>
Vue源码解析:虚拟dom比较原理
查看>>
【译】 WebSocket 协议第七章——关闭连接(Closing the Connection)
查看>>
函数柯里化
查看>>
JavaScript高级程序设计(第3版)第3章
查看>>
力扣(LeetCode)31
查看>>
【1】解析与编译
查看>>
利用ES6进行Promise封装总结
查看>>
解决ubuntu 远程连接问题
查看>>
区块链2.0:智能合约
查看>>
深入理解Webpack核心模块Tapable钩子[同步版]
查看>>
jsonp跨域资源引起CORB
查看>>
移动端H5页面阻止图片和文字被选中
查看>>
手写双向链表LinkedList的几个常用功能
查看>>
cross-env使用
查看>>
Fundebug计费标准解释:事件数是如何定义的?
查看>>
一文彻底弄懂 for forEach for-in for-of 的区别
查看>>
《前端十年心路-我把一切告诉你》的书稿大纲&问题收集
查看>>
前嗅ForeSpider教程:运行设置(一)
查看>>
2019
查看>>