业界|骚扰电话太烦人?转接AI帮你回应吧
AI 科技评论按:今年 315 晚会曝光了智能骚扰电话机器人产业链,让我们意识到那些令人不堪其扰的销售来电背后,好多都是没感情的 AI。对此深恶痛绝的阿里人工智能实验室研究员聂再清决定「以其人之道还治其人之身」,近日发布一款名为「二哈」的防骚扰电话 AI 技术,让我们在接到骚扰来电时,可以选择转给 AI 代为应答。
阿里巴巴人工智能实验室近日发布的一段录音显示,「二哈」已达到以假乱真的对话水平,录音中的人类销售对此毫无察觉,不知与之对话的竟是一名 AI。
在这段长达 1 分多钟的对话中,「二哈」对答如流,不但会主动向女销售咨询「北京能不能贷款?」、「最多能贷多少钱?」,甚至还在对话中「调戏」对方:「你之前给我打过电话吧,听起来挺耳熟的?」
阿里 AI labs 北京研发中心负责人聂再清介绍,「二哈」应用了他提出的「智能聊天」概念,需要理解用户请求,用强大的知识图谱生成知识点,在对话中将知识点「输出」给用户,同时用基于深度强化学习的对话策略引导对方的问题,从而将聊天进行下去。
「大家可能看视频觉得这是一个特别逗的产品,但这里面其实应用了非常多的前沿技术。我们现在已经申请了几十项人工智能领域的技术专利,今天大家就可以在支付宝小程序和天猫精灵的 App 上『调戏』我们的这个小机器人了。」
相关技术积累
在聂再清一篇 2018 年 AAAI 录用论文中,他提出一个聊天机器人人机协作框架 CoChat,该框架可以让人类工作者随时干预机器人的学习过程,机器人能够通过从标注过的对话日志、人类工作者的反馈以及用户的反馈中学习,由此使对话质量获得持续改进。换句话说,CoChat 结合了监督学习(标注日志)以及有延迟奖励 / 反馈的强化学习(人类工作者/用户反馈),可以持续不断地自我完善。
CoChat 框架示意图
此外,该论文还进一步提出对话管理器模型 MemHRNN,可以让机器人迅速对人类提出的新问题作出回应(原来数据库所没有的)。
在具体操作上,首先将对话历史、语言理解结果和 API 调用结果等外部信息组合起来作为输入,然后输出所有动作的概率分布以用于动作选择。当出现新动作时,该 HRNN 的架构可以相应地改变,而不会丢失在之前的学习过程中积累的知识。最重要的是,聂再清团队还在 MemHRNN 中进一步引入了外部记忆来处理由即时引入新动作所导致的单样本学习难题,即这些新动作出现的次数太少,让 HRNN 难以学习与它们有关的有效策略。
论文链接:
https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/view/16748
聂再清的「实用产品」梦
聂再清此前在微软亚洲研究院主要负责微软自然语言理解、实体挖掘的研发工作。在对象级别搜索与大数据挖掘方面申请国际专利十余项。
在 2017 年年底,他选择加盟阿里人工智能实验室,当时被媒体称为「阿里达摩院成立后打响的人才强夺战第一枪。」,在业界的分量不言而喻。对于选择加盟阿里的原因,他在接受采访时表示,阿里可以让他「把一些想法做成真正影响很多人生活的一个东西。」,而到了阿里巴巴人工智能实验室的他主要专攻知识图谱与自然语言理解两个研究方向,为阿里巴巴提供包括意图理解、实体抽取、对话管理以及知识图谱在内的技术支持。
去年接受媒体采访时,聂再清总结了当时 NLP 领域的阶段性问题,并提出相应的 4 大对策,可以看作是他过去 1 年试图攻克的事情:
- 其一,从公开大数据中积累更多的可替换词典和语义模板。以「请帮我打辆车」为例,「请帮我」有很多说法,如「麻烦帮我」、「给我」等,「打车」可以叫「约车」等,这些同类词(或同义词)叫做可替换词典,它可以增强自然语言的通用性,能够很好的解决语言的歧义性问题。而语义模板侧重这句话中语义的顺序,不同顺序问答的积累,也可以解决一部分自然语言歧义性、多样性的问题;
- 其二,他希望建立一个知识图谱的生态平台,让大量的开发人员在上面去建立知识图谱,使用积累的知识图谱,不断扩大知识图谱在常识性和专业性方面的积累,即共建知识图谱,产生 1+1>2 的效果;
- 其三,随着语音交互进入千家万户,通过强化学习、深度学习等不同的策略,让机器在与人沟通中判断用户的喜好,并进行不断的自主学习和迭代,当有大量用户大量数据的时候,自然语言理解就会更准确和个性化;
- 其四,把知识库、知识图谱运用起来,让这些结构化的数据促进自然语言的理解。
因此,「二哈」如今看来令人惊叹的对话水平,其实早有相应积累。这既是聂再清加盟阿里后的阶段性成果,也是他个人「实用产品」梦的实现,让人不禁期待,他在未来又将为我们带来哪些有意思的产品。
更多有关 NLP 的学术和论文话题,欢迎点击阅读原文加入 AI 研习社 NLP 顶会小组~
相关文章
-
迪士尼、苹果、Netflix、HBO:一场关于人类注意力的诸神之战
-
Uber再次裁员3000人,关闭45个办事处
-
隐私泄露:“爱又米客服”诈骗猖獗三年数百大学生哭天无门
-
小视频伪免费版视频去水印怎么去视频手游
-
互联网运营过冬指南|“不懂用户留存的还不辞职”
-
苹果AppStore遭美国反垄断审查,主要针对苹果税等支付政策
-
河南洛阳坚持创新引领,优化营商环境——激活高质量发展新动能
-
学会这招,打造高长留的产品增长
-
大手笔!马云的这个决定或将联通直接推向巅峰,联通用户了解下
-
无实际功能苹果近日移除了这个Safari设置
-
库克在《时代》杂志发专栏文章呼吁美国会通过全面联邦隐私立法
-
罗永浩长文回应成为老赖,苹果申请环绕屏专利......
-
不妖魔化算法但也不合理化算计
-
谁是新零售领跑者?这份2018新网商大奖入围榜单告诉你
-
苏宁易购拟融资 40 亿元支持海外业务发展
-
战斗民族也怕冷!俄罗斯人喜提17000多条中国秋裤
-
微软Chromium版Edge浏览器正式在WindowsUpdate中出现
-
如何规避字体版权的天价索赔?你需要这样做……
-
热点|华为将在ARM总部隔壁建芯片研发工厂
-
瑞幸发布无人咖啡机:全自动出品口味不变,或成重要盈利来源
-
课程转换不高,那么你知道这3个课程宣传推广的方法吗?
-
特立独行!这款浏览器化繁为简,未来或成最舒服的主流浏览器
-
出海日报 | 快手海外业务调整,海外一把手已离场;阿里国际站启动“数字化出海”计划
-
软银向员工贷款200亿美元;涉"通俄门"OverstockCEO辞职
-
还没正式开售就好评就达98%?OPPOEncoX2预定千元最香TWS耳机!
-
广东首个5G全连接智能制造示范工厂正式亮相
-
除了黄酒和表情包,丁磊今年还把这个神器带去了乌镇
-
2021最新台湾苹果id共享你的appleid甜蜜蜜
-
未来全球嵌入式主板市场将如何发展?