智能问答机器人（智能问答机器人小度下载）

2022-11-28 948 小Q

本文目录一览：

1、智能机器人对话是人工客服吗
2、容联七陌X-Bot智能客服机器人怎么样？有什么功能？
3、腾讯算法高级研究员陈松坚：智能问答技术及其应用
4、聊天机器人概述

智能机器人对话是人工客服吗

不是人工在和你聊天，但是AI是由人工客服对话训练出来的。

ai智能客服机器人是利用ai智能算法结合海量语料库构建行业知识图谱后实现的智能问答机器人程序，拥有某领域相对齐全且权威的问答知识库，可以轻松理解用户咨询意图并给予正确回答，被应用在海量用户咨询解答、营销留联套电等场景中。

实际上能够代替人工客服实现自动接待的ai智能客服机器人是真实存在的，尤其是医疗、美容机构那些随时大半夜回复用户咨询问题的客服基本上都是ai智能客服机器人，并不是真实的人工。

智能问答机器人（智能问答机器人小度下载）

容联七陌X-Bot智能客服机器人怎么样？有什么功能？

总的来说，容联七陌X-Bot智能客服机器人很好用，我感觉比我们之前用过的智能客服机器人都好用，它的智能化很高，解决问题的能力很强，在大大提高工作效率和客户满意度、节约人力成本方面很有帮助，它就像个有经验的客服，除了基础的智能问答、辅助坐席外，还能智能营销，针对不同的用户X-Bot智能客服机器人会给出不同的答案，个性化与智能化被拉满，非常厉害~

腾讯算法高级研究员陈松坚：智能问答技术及其应用

随着人工智能的飞速发展以及广泛落地应用，越来越多的设备将会被植入智能问答技术，人机交互场景随处可见，智能问答在未来将会成为一个非常重要的入口。

腾讯小知凭借着业界领先的智能AI引擎算法和海量大数据仓库，已将智能问答技术落地实施，并且经过大量的业务考验和优化，知识点匹配度和准确率都已达到90%以上，在2018 年 GITC 全球互联网技术大会上，腾讯小知荣获年度互联网最具价值产品奖。

腾讯小知算法负责人陈松坚也在会场发表了关于智能问答技术原理及其在To B场景下的应用的专题演讲，从自己的角度为我们展现智能问答技术的最新成果。

他首先从智能问答是什么，为什么和怎么做的三个问题出发，阐明了他对当前智能问答技术的定位和价值，首先，现阶段的智能问答是信息检索技术的升级，是量变而未达到质变。但是无论在To B还是To C的场景下，当前的技术都能够切实解决一些用户的痛点，提升用户体验，是亟待推进和充满想象的方向。

在回答怎么做这个问题时，他详细介绍了几种不同的问答机器人的实现路径，包括单轮问答机器人，多轮问答机器人及阅读理解机器人。其中重点阐述了单轮问答机器人的实现原理，包括字面匹配，词向量匹配，深度语义匹配，迁移学习等技术。

此后他还分享了小知团队将上述技术产品化的经验，包括智能客服机器人和电话机器人两大块，主要分享了当前产品的形态，亮点和实际项目中取得的一些成果。

最后，他简单总结了小知目前完成的工作以及就智能问答的发展提出了自己的几点看法。

--------------------------------------------------------------

以下是演讲稿全文：

各位下午好，很高兴今天能在这里给大家做分享报告。先介绍一下，我们腾讯小知是致力于为政府和各行业提供一揽子智能问答解决方案的团队，目前已经落地的包括基于文本的智能客服机器人和基于语音的电话机器人等。

在大多数人的认知里，智能问答很可能是以上的3个印象，2011年打败了人类取得问答竞赛冠军的waston;2017年被沙特授予公民身份的机器人sofia;更为大家熟知的钢铁侠中的机器人管家jarvis。在大家心目中，智能就意味着能够像真人一样交流。然而作为从业者，很遗憾地告诉大家，目前的技术还远没有达到这个目标，我认为本质上目前的智能问答技术是对信息检索技术的一次升级，是量变而未到质变。这个皇冠上的明珠还等待我们去摘取。

既然问答技术还不成熟，那为什么还要投身到这个领域呢。我想从To B和To C两个角度去回答。对企业来讲，当前的问答技术虽然无法解答复杂的咨询，但是大部分的简单的头部问题是可以比较好的解答的。从本轮AI大潮NLP赛道的几名种子选手都从智能客服这个方向切入就可以看出企业是确实存在对智能问答的刚性需求。而对普通用户来讲，一方面siri等语音助手每天都在为用户提供便捷的交互界面，另一方面像amazon echo这一类的智能家居产品也逐步进入千家万户，成为物联网生态的中心入口之一，这便是智能问答的价值所在。

那如何实现智能问答机器人呢?我们先来看最基本的单轮问答机器人的实现原理。

熟悉搜索引擎的朋友会发现这个架构跟搜索引擎的很类似。单轮问答一般来说就是FAQ问答，是基于业务问答对组成的问答库进行检索匹配。其中FAQ问题集包含多个相似问法供用户问题去匹配。预处理阶段一般会进行文本纠错，标准化和底层NLP特征提取;召回阶段会在倒排索引中召回若干个候选问题(粗排)，而最后的匹配阶段会基于各种模型进行匹配打分并返回得分最高的结果(精排)。匹配阶段还会引入其他模块，如知识图谱和拒识模型，目的是辅助提升匹配的最终准确率。

retrieval中的匹配可以看做是naive solution，词袋+VSM, 筛选候选够用了，但是精排需要更精致的策略，第一，要利用监督信息做拟合，我们构建基于问题对的训练语料，拟合是否匹配这个二分类目标。第二，特征上抛弃稀疏的词袋模型，而是构造各种相似度来做base scorer，然后利用非线性的抗噪能力强的xgboost来做融合，比如我们用到词bigram, 字bigram, 核心词，名词等特征集合的相似度。这种方法的优缺点是一体的，由于模型只学习字面相似的特征，因此不受领域影响，通用性强，适合用在冷启动阶段;但也因为只考虑字面相似，无法处理更深层的语义匹配。

那如何度量语义的相似呢。词向量技术的兴起是语义匹配的前提，所谓词向量，是将孤立的传统的token表示映射到相互关联的向量空间中，这种关联性，或者说是相似性，是通过词语的上下文的来描述的。也就是说，上下文越相似的词语，他们的语义就越相似，词向量的欧式距离就越近。这是很容易理解的，更妙的是，通过对向量进行简单加减运算，能够呈现出概念的关系，比如king-man+woman的结果非常接近于queen, 因此说明词向量能够一定程度刻画语义。那对句子如何做向量表示呢?一个简单的想法是直接求和平均，WMD是另一个比较有意思且有效的做法，他将计算句子到句子的相似度建模成一个运输的问题，把句子p的各个词，运输到q的各个词上，也可以说是变换;运输成本是词向量的cosine相似度，而要运输的是各个词在句子中的权重，用线性规划求解一个最优解，即为p到q的距离。另外还有个有效的方法是SIF，思路是做词向量加权求和，但是突显出句子中非通用的部分，即权重用词频倒数来计算权重，实验效果也很不错。

上面的方法有一个问题就是没有利用有监督信息，所以效果有明显的天花板。下面介绍这个工作是基于深层网络做有监督学习的匹配的，做法也比较简单，首先把句子文本用one-hot编码，假如词典大小是500K，那编码完长度就是500K维，其实等于是词袋模型，然后输入到一个多层的神经网络去学习，最终得到一个128维的向量作为句子的语义表示，然后用cosine计算两个句子与文档的相似度作为模型输出。这个方法其实是将高维稀疏的token特征映射到低维语义空间，跟词向量的思路很类似，只不过训练目标不同，并且这里使用了深层网络结构。

但是CNN对上下文的处理能力依赖于窗口大小，远距离就没办法处理了，因此要考虑另一种网络单元RNN，这种单元是专门为时序模型量身打造的，简单来说，每一时刻t上的隐藏状态，或者说第t个词上的语义编码，都由两个输入共同决定，即上一时刻的隐藏状态和当前时刻的原始输入，而为了解决远距离传递导致的梯度消失和梯度爆炸等问题，RNN有一些变种结构来应对，比如 LSTM和GRU等。

CNN和RNN都是对原始输入进行语义编码的基本单元，编码后的向量就可以接入多层感知机进行相似度计算，如果是直接计算cosine相似度，那就是dssm的升级版，而更常见的做法是把两个句子的编码向量拼接在一起，再经过一个多层感知机计算相似度，而这种方法统称为表达式建模;

另一种方案考虑到两个句子之间的交互信息对学习他们是否匹配显然更为重要，这一类方案被称为交互式建模，右边是一个典型的例子，他最大的不同是首先对两个句子的所有窗口组合进行拼接和卷积，得到交互信息。然后再进行多次卷积和池化得到表示。其他的交互方式还包括编码之后，进行交互操作，如作差，点乘等，还有计算attention表示，也是常见的交互方式。

下面介绍我们的方案，跟上面介绍的模型相比，我们的方案主要做了两处改动，一个是使用了稠密连接的网络结构，让rnn层的输入和输出拼接在一起做为下一层的输入，第二个是混合注意力机制，即在计算attention向量进行交互式建模的基础上，增加self-attention向量计算，然后把两个attention向量经过门机制进行融合，这样做一方面引入了问句间的交互信息，同时又增强了对自身的表达建模。

上面的模型是比较复杂的模型，参数量有5.8M。在实际中应用中训练语料会严重不足，为了解决这个问题，我们引入了迁移学习的策略。首先第一种是多任务联合学习，比如在拟合两个问句是否匹配的同时，也对问句进行分类预测;另外还可以同时对匹配的问题对做seq2seq的翻译模型训练。这两个策略都证明能有效提升准确率。

而另一个思路更加直观，即引入其他领域的语料，所谓多语料迁移。Fine-tune即参数微调是其中一种做法，即先用通用语料训练网络，固定底层表达层的参数，然后再使用领域语料调整上层参数;另一种思路参考了对抗学习的思想，即引入一个新的任务“混淆分类器”去判别当前样本是来自源语料还是目标语料，通过在损失函数中增加反向的混淆分类损失项，让混淆分类器尽可能地无法区分样本的来源，从而保证共享了参数的表达网络能够学习到两部分语料中共性的部分。

以上的介绍都是为了完成一个基本的单轮对话机器人，而实际应用中，往往存在需要需要交互的场景，比如查询社保余额，就需要用户提供指定信息，如姓名，身份证号，手机号等。这种是所谓任务导向型机器人，而另一种，基于知识图谱的机器人也往往会涉及到多轮交互。这里简单介绍一下多轮对话机器人的架构，整体上是一个对话管理系统，总的来说是管理会话状态，包含4个模块，分别是输入部分：自然语言理解模块NLU，负责意图识别和抽取槽位实体，比如这里匹配到了意图是查询社保余额，抽取到了社保号1234。得到的意图和槽位值会送入到对话状态追踪模块，DST，他负责会话状态的更新，形式化来说是一个函数，输入是当前状态s和当前的query经过NLU处理过得到的意图和槽位值q, 输出新的状态s‘，下一步是把s’送入DPL，对话策略模块，这个模块是根据新的状态s‘输出行动a，通常这个决策选择会依赖于一个外部数据库或知识图谱，最后，由输出部分，自然语言生成模块NLG负责将行动转换为自然语言文本，返回给用户。

前面提到的单轮FAQ机器人，有一个问题是问答准确率依赖于问答库的质量，而问答库的构建耗时费力，所以针对数据较大的非结构化文档，如果可以直接从中抽取答案，是非常理想的做法。比如斯坦佛大学开源的drQA，就是基于wikipedia的语料做的一个开放域上的问答机器人，我们来看看这种阅读理解机器人的架构示意，他也是基于检索重排的思路，首先把可能的文段从语料库中摘取出来，然后送入阅读理解模型进行答案定位，打分，排序和选择得分最高的答案。阅读理解模型与匹配模型是类似的，需要先对问题和候选文段进行编码表示，不同之处在于最终预测的目标是答案的起始和结束位置。我所在的团队在去年，在阅读理解的权威公开测评Squad v1中取得过第一的成绩，同时参加这个测评的包括了google, facebook, 微软，阿里idst, 科大讯飞等国内外同行。说明业界对这种技术还是非常看重的。

下面分享小知在把以上技术落地产品化的经验。首先我们来看看小知的整体架构图，核心引擎有两部分，一块是上面重点阐述的深度语义匹配模型，另一块是本次分享没有展开的知识图谱引擎，在此之上，我们构建了FAQ机器人，多轮会话机器人(任务机器人)，闲聊机器人等。以下是我们单轮和多轮机器人的示例。

在我们实际的落地项目中，得益于深度迁移模型的语义匹配能力和行业知识图谱的的精准匹配和辅助追问，小知机器人能够做到95%左右的问答准确率，并且节省了50%以上的服务人力，切实为政府和企业提升效率和降低成本。

在智能客服的基础上，我们又打造了基于语音的电话机器人，力主融合智能客服，人工在线客服，工单系统和电话机器人，为客户打造从售前售中售后的整体解决方案。

以下是电话机器人的整体架构图，核心是自然语言理解NLU模块，负责识别用户提问意图

提取相关实体。根据NLU输出的结果，内置的对话管理引擎会进行流程状态流转和跟踪。

另外，ASR语音识别和TTS语音合成是不可或缺的重要服务，这三个模块相互协作，共同完成与用户的交互。

最后对智能问答的未来发展提几点我的看法。目前学术界比较公认的一个方向是，需要更有机地结合模型和规则，而在问答领域，规则的一大组成部分就是知识图谱，包括开放领域的知识图谱和专业领域知识图谱。而更进一步地，我们需要研究带有推理性质的事理型知识图谱去描述领域内的规则和知识，让机器人能够处理带有复杂条件的问题，提供更智能的回复。在我看来，智能问答的一个突破口就在于解决以上三个问题。以上就是今天分享的内容，谢谢大家。

主讲人介绍：

陈松坚，腾讯数据平台部算法高级研究员，有着8 年的 NLP 研发经验，2017 年加入腾讯 TEG 数据平台部，负责智能客服产品腾讯小知的算法规划和落地。负责过多个智能客服项目，对封闭领域的智能问答有丰富的实战经验。

聊天机器人概述

聊天机器人，是一种通过自然语言模拟人类，进而与人进行对话的程序。

1950年，图灵（Alan M. Turing）在 Mind 期刊上发表的文章 Computer Machinery and Intelligence ，这篇文章开篇就提出了“机器能思考吗？(Can machines think?)”的设问，提出了经典的图灵测试（Turing Test）。通过图灵测试被认为是人工智能研究的终极目标，图灵本人也因而被称为 “人工智能之父” 。

1966年，最早的聊天机器人程序 ELIZA 诞生，由麻省理工（MIT）的约瑟夫·魏泽鲍姆（Joseph Weizenbaum）开发，开发用于临床模拟罗杰斯心理治疗的 BASIC脚本程序。实现技术仅为对用户输入计算机的话语做关键词匹配，并且回复规则是由人工编写的。

1972年，美国精神病学家肯尼思·科尔比（Kenneth Colby）在斯坦福大学（Standford University）使用 LISP 编写了模拟偏执型精神分裂症表现的计算机程序 PARRY 。

1988年，英国程序员罗洛·卡彭特（Rollo Carpenter）创建了聊天机器人 Jabberwacky ，项目目标是“以有趣、娱乐和幽默的方式模拟自然的人机聊天”，这个项目也是通过与人类互动创造人工智能聊天机器人的早期尝试，但 Jabberwacky 并未被用于执行任何其他功能。技术是使用上下文模式匹配技术找到最合适的回复内容。

1988年，加州大学伯克利分校（UC Berkeley）的罗伯特·威林斯基（Robert Wilensky）等人开发了名为UC（UNIX Consultant）的聊天机器人系统。UC聊天机器人目的是帮助用户学习UNIX操作系统。

1990年，美国科学家兼慈善家休·勒布纳（Hugh G. Loebner）设立了人工智能年度比赛------勒布纳奖（Loebner Prize）。勒布纳奖旨在借助交谈测试机器的思考能力，它被看做对图灵测试的一种时间，其比赛的奖项分为金、银、铜三等。目前为止，尚无参赛程序达到金奖或银奖标准。

在勒布纳奖的推动下，聊天机器人迎来了研究的高潮，其中较有代表性的聊天机器人系统是1995年12月23日诞生的 ALICE（Artificial Linguistic Internet Computer Entity）。随着 ALICE 一同发布的 AIML（Artifical Intelligence Markup Language）目前在移动端虚拟助手的开发中得到了广泛的应用。

2001年，SmarterChild在短信和即时通信工具中广泛流行，使得聊天机器人第一次被应用在了即时通信领域。2006年，IBM开始研发能够用自然语言回答问题的最强大脑 Watson ，作为一台基于IBM“深度问答”技术的超级计算机， Watson 能够采用上百种算法在3秒内找出特定问题的答案。

2010年，苹果公司推出了人工智能助手 Siri ， Siri 的技术来源于美国国防部高级研究规划局公布的CALO计划：一个简化军方繁复事务，且具备学习、组织及认知能力的虚拟助理。CALO计划衍生出来的民用版软件就是 Siri虚拟个人助理。

此后，微软小冰、微软Cortana（小娜）、阿里小蜜、京东JIMI、网易七鱼等各类聊天机器人层出不穷，并且这些聊天机器人逐渐渗透进人们生活的各个领域。

2016年，全国各大公司开始推出可用于聊天机器人系统搭建的开放平台或开源架构。

2010年至今，标志性的聊天机器人产品如下图所示。

总结：随着人工智能相关技术“东风”渐起，自然语言处理研究硕果颇丰，聊天机器人相关技术迅速发展。同时，聊天机器人作为一种新颖的人机交互方式，正在成为移动搜索和服务的入口之一，毕竟搜索引擎的最终形态很可能就是聊天机器人。众多人工智能领域的探索者和开发者都想紧紧抓住并抢占聊天机器人这一新的交互入口。

下面从几个维度对齐进行分类介绍。

在线客服聊天机器人系统的主要功能是自动回复用户提出的与产品或服务相关的问题，以降低企业客服运营成本、提升用户体验。代表性的商用在线客服聊天机器人系统有小i机器人、京东JIMI客服机器人、阿里小蜜等。以京东JIMI客服机器人为例，用户可以通过与JIMI聊天了解商品的具体信息、了解平台的活动信息、反馈购物中存在的问题等。另外，JIMI具有一定的拒识能力，因此可以知道用户的哪些问题时自己无法回答的，且可以及时将用户转向人工客服。阿里巴巴集团在2015年7月24日发布了一款人工智能购物助理虚拟机器人，取名为“阿里小蜜”，阿里小蜜基于客户需求所在的垂直领域（服务、导购、助手等），通过“智能+人工”的方式提供良好的客户体验。

娱乐场景下聊天机器人系统的主要功能是同用户进行不限定主题的对话（闲聊），从而起到陪伴、慰藉等作用。其应用场景集中在社交媒体、儿童陪伴及娱乐、游戏陪练等领域。有代表作的系统如微软的“小冰”、微信的“小微”、北京龙泉寺的“贤二机器僧”的等。

教育场景下的聊天机器人系统可以根据教育内容的不同进一步划分。这类聊天机器人的应用场景为具备人机交互功能的学习、培训类产品，以及儿童智能玩具等。

个人助理类应用可以通过语音或文字与用户进行交互，实现用户个人事务的查询及代办，如天气查询、短信手法、定位及路线推荐、闹钟及日程提醒、订餐等，从而让用户可以更便捷地处理日常事务。

智能问答类聊天机器人系统可以回答用户以自然语言形式提出的事实型问题及其他需要计算和逻辑推理的复杂问题，以满足用户的信息需求并起到辅助用户决策的目的。不仅要考虑如 What、Who、Which、Where、When 等事实型问答，也要考虑如 How、Why 等非事实型问答，因此智能回答的聊天机器人通常作为聊天机器人的一个服务模块。

从实现的角度来看，聊天机器人可以分为检索式和生成式。检索式聊天机器人的回答是提前定义的，在聊天时机器人使用规则引擎、模式匹配或者机器学习训练好的分类器从知识库中挑选一个最佳的回复展示给用户。生成式聊天机器人不依赖于提前定义的回答，但是在训练机器人的过程中，需要大量的语料，语料包含上下文聊天信息和回复。

尽管目前在具体生产环境中，提供聊天服务的一般都是基于检索的聊天机器人系统，但是基于深度学习Seq2Seq模型的出现可能使基于生成的聊天机器人系统成为主流。

基于功能的聊天机器人可以分为问答系统、面向任务的对话系统、闲聊系统和主动推荐系统4种。

目前，对问答系统和主动推荐系统的评价指标较为客观，评价方式也相对成熟。而面向任务的对话系统和馅料系统，在给定相同输入的情况下，系统回复形式可以多种多样，对于用户的同一输入，通常有多种合理且数目不固定的回复，这使得很难通过一种客观的机制对其进行评价，所以在评价时需要加入人的主观判断作为评价的依据之一。

通常，一个完整的聊天机器人系统框架如图，其主要包含自动语音识别、自然语言理解、对话管理、自然语言生成、语音合成5个主要的功能模块。需要指出的是，并不是所有的聊天机器人系统都需要语音技术。

例如，以文字方式实现人机交互的聊天机器人系统，就不需要自动语音识别模块和语音合成模块。

Amazon Lex是一种可以在任何程序中使用语音和文本构建对话界面的服务。Amazon Lex提供可扩展、安全且易于使用的端到端(end2end)解决方案，以构建、发布和监控开发人员发布的机器人。下图展示了聊天机器人如何通过对话的方式协助用户完成订花的需求。

另一个典型的聊天机器人框架是Facebook的Wit.ai。Wit.ai积累了大量高质量的对话数据，有效促进了聊天机器人系统的发展，并通过将人工智能和人类智能结合，进一步提升了聊天机器人的智能水平。

聊天机器人的4种分类，包括问答系统、面向任务的对话系统、闲聊系统和主动推荐系统。

Siri被定位为面向任务的对话系统，为用户提供打电话、订餐、订票、放音乐等服务。Siri对接了很多服务，且设置了 “兜底” 操作，当Siri无法理解用户的输入时就命令搜索引擎返回相关的服务。Siri的出现引领了移动终端个人事务助理的商业化发展潮流。

下图是Siri的技术框架：

2011年2月，IBM耗资3000万美元研发的IBM Watson登上了美国著名智力问答竞赛节目《危险边缘》(Jeopardy)，面对节目中充满双管意思的英文问题，IBM Watson能做出分析并在庞大的自然语言知识库中寻找线索，将这些线索组合成答案。最终，IBM Watson压倒性地优势击败了节目中最聪明的人脑，同时创下了这个知识竞赛系列节目27年历史上的最高分。IBM Watson作为IBM公司研发的问答系统，集成了自然语言处理、信息检索、知识表示、自动推理、机器学习等多项技术的应用，形成了假设认知和大规模的证据搜集、分析、评价的深度问答技术。IBM Watson可以分析自然语言形式的数据，通过大规模学习和推理，为用户提供个性化服务。

2012年7月9日，谷歌发布了智能个人助理Google Now。Google Now通过自然语言交互方式为用户提供页面搜索、自动指令等功能。Allo是谷歌在前述工作的基础上发布的语音助手。Allo具备随时间推移学习用户行为的能力。

2014年4月2号

主动推荐系统采用的是一种实现个性化信息推送的技术方式。主动推荐系统并不需要用户提供明确的需求，而是通过分析用户的历史行为数据建立用户画像，从而基于用户画像主动向用户推荐系统认为能够满足用户兴趣和需求的信息。在电商购物（如阿里巴巴、亚马逊）、社交网络（如Facebook、微博）、新闻资讯（如今日头条）、音乐电影（如网易云音乐、豆瓣）等领域均有广泛而成功的应用。主动推荐系统本质上是一项帮助人们解决信息过载(information overload)问题的工具。所谓信息过载，是指用户真正需求、真正感兴趣的东西被淹没在其同类物品的海洋里。主动的交互方式能够显著提升用户体验，且机器人主动交互的方式更接近真实的人与人之间的对话方式，使得对话更自然。

一种主动推荐的方式，是基于知识图谱（Knowledge Graph）的主动推荐系统。例如，在建立音乐领域的主动推荐系统时，可以先建立音乐领域知识图谱和用户知识图谱，然后在进行用户信息搜索的过程中建立起用户的音乐喜好画像，从而更精准地对用户进行音乐推送。

从图中可看出，在用户点播歌曲的过程中，主动推荐系统可以结合音乐知识图谱、用户个人知识图谱，以及用户的历史对话数据，综合给出最优的音乐推荐。

主动推荐系统与问答系统、面向任务的对话系统和闲聊系统被认为是聊天机器人产品的4种主要分类。

本文地址：https://www.scrmnews.com/post/6402.html