自动问答系统中常问问题库的研究 |
发布时间:2025-02-24 15:09:48 | 浏览次数: |
句子相似度计算在 FAQ 中的应用 王洋 秦兵 郑实福 (哈尔滨工业大学 321 信箱, 哈尔滨 150001) E-mail: {wy,qinb★,zsf}@ir.hit.edu.cn 摘要: 本文设计并实现了 一个基于常问 问 题库的中文问答系 统。 对用 户 以自 然语言输入的问题, 该系统能够自 动地在 FAQ( Frequently-Asked Question) 库中寻找候选问题集★, 通过计算句 子相似度, 将匹配的答案返回给用 户 ★。 该系统还能够自 动地更新和维护 FAQ 库。 文中着重介绍了 用 于查找候选问题集的数据结构以及句 子相似度的计算方法。 关键词: 自 动问答; 常问问题库; 候选问题集; 句子相似度 引言 自动问答系统是目前自然语言处理领域一个非常热的问题, 它即能够让用户用自然语言句子提问, 又能够为用户返回一个简洁、 准确的答案, 而不是一些相关的网页★。 因此, 自动问答系统和传统的依靠关键字匹配的搜索引擎相比, 能够更好地满足用户的检索需求, 更准确地找出用户所需的答案, 具有方便、 快捷、 高效等特点。 在国际上每年一度的文本信息检索(TREC)会议上, 自动问答(Question Answering Track)是最受关注的主题之一★。 常问问题库 (FAQ)是很多自 动问答系统中的一个组成部分★。 它把用户常问的问题和相关答案保存起来★。 这样, 对于用户输入的问题, 可以首先在常问问题库中查找答案。 如果能够找到相应的问题, 就可以直接将问题所对应的答案返回给用户★, 而不需要经过问题理解、 信息检索、 答案抽取等许多复杂的处理过程。 本文将对自动问答系统中 FAQ 的设计和实现方法做一全面介绍, 并着重介绍了其中的句子相似度计算★。 本文所介绍的句子相似度的计算方法不仅能够用于 FAQ 的检索, 还能够用于自 动问答的其它阶段, 本文简要地介绍了其在答案查找中的应用。 1 系统概述 系统主要包含三个部分: 候选问题集的查找, 句子相似度计算, FAQ库的更新。 2 候选问题集的查找 这一步骤的目的是要从常问问题库(FAQ)中找出若干个候选的问题组成候选问题集★, 以缩小查找的范围, 使后续的相似度计算等较复杂的处理过程都在候选问题集这个相对较小的范围内进行★。 在本系统中, 我们选出 FAQ 中 50%的问句作为候选问题集★。 设用户输入的问句(简称为目标问句) 有 n 个词:1W ★、2W 、 、nW ★。 FAQ 库有 m 个问句★, 第 i(1 i m)个问句含有in 个词:1Q ★、2Q ★、 ★、inQ 。 第 i 个问句和目 标问句之间重叠的词个数记为iNum , 即{} {}nniQQQ★。 我们将iNum 值最大的前 50%的 FAQ问句选出来, 组成候选问题集。 句子相似度计算在 FAQ 中的应用 王洋 秦兵 郑实福 (哈尔滨工业大学 321 信箱, 哈尔滨摘要★: 本文设计并实现了 一个基于常问 问 题库的中文问答系 统。 对用 户 以自 然语言输入的问题★, 该系统能够自 动地在 FAQ( Frequently-Asked Question) 库中寻找候选问题集, 通过计算句 子相似度, 将匹配的答案返回给用 户 。 该系统还能够自 动地更新和维护 FAQ 库★。 文中着重介绍了 用 于查找候选问题集的数据结构以及句 子相似度的计算方法★。 关键词★: 自 动问答; 常问问题库; 候选问题集; 句子相似度 引言 自动... |
上一篇 : |利来平台招生常见问题问答
下一篇 : |利国娱乐国际老牌w66日常趣味知识问答题库 |
027-8329 0007
180-6266-8722
扫一扫 加关注
© 2019 利来最老的品牌官网首页,利来老牌国际官网app,利来最老的品牌官网智能装备制造武汉有限公司版权所有 备案号:鄂ICP备19016456号-2 鄂公网安备 42011202001759号