会说话的机器人纷纷上岗 目前还难达人类对话水平
2019-12-31 10:37:11 来源: 科技日报
人类的对话是极其复杂的,其中每个语句都建立在对应的语境和上下文的基础上。因此,对话智能体需要通过对语言和语境的深度理解来更加有效地学习。
“我想买手机有什么推荐吗?”“三星的不错,我之前一直用三星的。”“魅族是国产手机十大品牌之一,好不好,用了才知道哦。”“小米也不错。”“小米比大米有营养。”这些看似时而认真,时而无厘头的对话和我们日常微信群聊看似并无二致,但其实在这个群里聊天的都是机器人。
能让机器人们聚在一起好好聊个天可是个技术活,不仅要把多智能体强化学习的方法应用在自然对话场景中,还需要优化社交机器人在不同上下文语境下的谈话策略。在日前天津高新区举行的第三届社交机器人论坛暨首届机器人群聊比赛研讨会上,多个社交机器人在同步对话的比赛现场一较高下。
这群机器人聊天有点“尬”
据了解,本次比赛尝试将多智能体人机对话的技术应用在自然对话场景中。比赛选取特定主题的启动句,打乱启动顺序,经过单轮或者多轮,生成符合主题且流畅的对话,最终采用自动评价和人工评价相结合的方式,根据主题相关性、语言流畅性和语境相关性进行打分。
“刚刚还是一群在认真聊天的机器人,却可能因某一个机器人的话锋一转,整个话题就被带入尬聊场景。就像那个推荐手机的话题,明明是在聊手机,就因为一个机器人说了小米,整个话题就变成了美食和养生。”大赛组委会委员、哈尔滨工业大学副教授张伟男介绍说,通过这次比赛,我们看到机器人们的聊天能力有所增强,但是与真人聊天相比还存在几个问题:多样性程度比较低,语言比较贫乏,回复重复率高;一致性能力弱,同一个群聊下,机器人经常前后回复出现矛盾;主题漂移,就是我们常说的跑题,几乎每个群聊到最后都跑题;质量不稳定,回复质量差的机器人严重影响群聊质量,机器人不能很好地筛选对话历史进行回复决策。
三种主流技术各有优缺点
让机器人群聊看似简单,却都需要人工智能的交互式实现技术——人机对话技术的发展作为支撑。获得首届机器人群聊大赛第一名的队伍FunNLP的指导老师,天津大学副教授张鹏介绍说,在研究上,大数据和深度学习共同推动了自然语言理解技术的发展。目前实现人机对话有三种主流技术,各有优缺点。
基于规则的人机对话系统,机器人需根据系统中预先定义的一些规则来进行回复,例如关键词、if-else条件等。这种技术最大的缺点是需要人工撰写规则,要定义的规则太多,需要付出极大的努力来做规则设计。
基于检索的人机对话系统,直接从预先定义的候选池中选择最佳的答案,但缺点是无法应对自然语言的多变性、多义性、语境结构、连贯性等,且当输入消息的语义差别很小时,机器人便无法精确识别,以至于无法生成新的回复。
“目前基于生成模型的人机对话系统是研究的热点。”张鹏表示,与检索型对话机器人不同的是,它可以生成一种全新的回复,因此相对更为灵活。但是这种系统有时候会出现语法错误,或者生成一些没有意义的回复。
目前还难达人类对话水平
在我们日常生活中,不同类型的人机对话可谓是随处可见:闲聊式对话,如微软小冰;任务驱动的多轮对话,如订餐对话系统等;问答式的对话,如汽车语音系统;推荐式对话,如一些客服机器人。其中闲聊、问答和任务型对话是用户输入内容后系统才会给出相应的回复,而推荐式系统主动向用户提供服务和信息。但由于各项技术尚未成熟,因此对话机器人还达不到类人的对话水平,表现不够灵活,甚至会产生一些笑料。
对于本次比赛的机器人在群聊回复方面出现的一些问题,张鹏解释说,这主要是由三方面原因造成的。首先对话机器人在理解群聊对话记录,回复的情感一致性及与其他机器人的交互三个方面存在一定的问题。所以群聊过程中出现了机器人自顾自回复或者是矛盾性回复等现象。
其次,训练机器人聊天是需要大量数据的,但某些特定领域的对话数据相当有限,如本次比赛中的数码产品和美食主题。并且,这些领域的中文闲聊型对话数据的收集和对话系统的构建都是十分耗费人力的。
第三,目前基于神经网络的对话系统主要依赖于大量结构化的外部知识库信息和对话数据,系统通过训练来“模仿”和“学习”人类说话,这也导致了回复语句单一的问题。因此,对话智能体需要通过对语言和语境的深度理解来更加有效地学习。
像人一样聊天还需深入理解语境
“虽然深度学习技术被充分运用,技术水平有所提高,但是以目前的技术来说,要做到让机器人像人一样聊天还有一定的难度。”张鹏表示,人类的对话是极其复杂的,其中每个语句都建立在对应的语境和上下文的基础上,朋友们在聊天时甚至能在对方说话之前就预料到下一句会说什么。
若想要达到相当于人类对话的水平,目前有几种方法可以探讨。其中一种是构造庞大且高度复杂的AI模型,如现在基于Transformer结构的Bert模型和GPT模型,其参数量已达到数亿级。然而模型越大,从用户输入信息到对话系统反应之间的延时就越长,而且实质上,此类模型仍然需要依赖于大量的数据,这与人类的思考和学习方式不符。
第二种是Meta Learning技术,这种技术需要机器人具备学会学习的能力,能够基于过往的经验快速地学习。这类模型是模拟人的思考与学习方式,从本质上更接近人类间的相互对话。但问题是我们需要结合具体的任务,提出基于Meta Learning的解决方案,这无疑需要更加深入的研究。
第三种是强化学习技术,强化学习系统由智能体、状态、奖赏、动作和环境5部分组成。现在的研究工作主要是将强化学习应用于任务型对话系统的策略学习上,强化学习能解决基于规则策略存在的泛化能力差、人工成本高等问题,并且无需大量的训练语料,只需要一些目标,便能够提高任务型对话的质量,弥补了深度学习的一大缺点,当然强化学习也会带来很多挑战,比如智能体会给当前互动的环境带来一定的影响等,这些都是需要我们去不断探索和深入研究的。(陈曦)
标签: 会说话的机器人
为您推荐
精彩放送
热门文章
-
舆情预警丨搜于特:实控人及其一致行动人合计约2.16亿股持股被司法冻结 占公司总股本比例7.08%
-
热推荐:中科江南:已就数字人民币在财政国库资金支付领域应用进行试点
-
今日报丨超500家企业签约参展 第六届进博会公布首批参展商名单
-
环球通讯!交易所债券收盘:地产债多数下跌 “21旭辉01”跌超4%
-
环球观焦点:舆情预警丨如皋沿江开投:企业本部涉及重大诉讼
-
世界热资讯!小米汽车数字钥匙专利公布,可提升设备续航
-
双枪科技投资设立自动化设备新公司
-
世界头条:山高环能于天津投资新设生物能源销售公司
-
天天讯息:工信部:2022年全国家用电冰箱产量8664.4万台 同比下降3.6%
-
微信已全面支持“小号” 全量开放辅助账号注册功能
-
自然资源部:取消集中供地制度系误读
-
机构:2022年Q4苹果全球智能手机市场份额达到历史最高水平
精彩图片
-
成本大减!新一轮的旗舰大战也将在即将到来的9月正式拉开帷幕
-
博览会开幕 中国首款具有自主知识产权的国产通用型科学计算软件正式发布
-
技术下降!Intel独立显卡驱动一次评测就发现43个Bug
-
高性能的台式机彻底告别“光污染” 雷克沙推出简洁纯白外观设计
-
韩国媒体率先报道:三星电子236层NAND闪存预计年内开始生产 市场竞争更激烈
-
新科技!苹果正在积极研发某种形式的AR/VR头显或智能眼镜
-
谷歌测试开展新功能 向用户展示哪些云流媒体服务拥有特定的视频游戏
-
支付宝积极响应国家为小微降费的政策号召 一年降费让利近80亿
-
京东汽车就与浦林成山旗下新能源车轮胎品牌浦林达成战略合作 助力轮胎“电动化转型”
-
苹果新专利公布:暗示未来 iPhone手机或许有陶瓷材质版
-
盖茨和韩国能源供应商SK共同牵头 其中SK投资2.5亿美元
-
海底捞早已经捞不动了 据统计上半年最高亏损达2.97亿
热文
-
谷歌母公司下季度将调整财报:AI研究部门将单独披露
-
我国新增18处国际重要湿地 总数达82处 面积764.7万公顷
-
激发国企科技创新活力
-
爱一个人是什么感觉的说说_爱一个人是什么感觉
-
安徽省有哪些市区县名称_安徽省有哪些市区县
-
北京海淀区GDP首破万亿元大关
-
广东移动大数据解码春节:跨省出行热度高 莞深空城率超70%
-
世界动态:挪威称雷克萨斯的自费混合广告误导
-
今日要闻!又一批跨国公司地区总部和研发中心落户上海
-
环球微头条丨科大讯飞与杭州市签署全面战略合作协议
-
奥维睿沃:海信系电视2022年12月单月出货量居全球首位
-
南财投资日历(2月3日)
-
珠海:涉及知名大盘!11家房企、中介因违法违规被查处
-
世界焦点!证监会:更好保护中小投资者合法权益 树牢“大投保”理念
-
环球消息!Q4“固收+权益”理财定价下行明显,近6月收益猛跌101BP丨机警理财日报(2月2日)
-
证监会:稳妥有序化解私募基金、地方交易场所、债券违约等重点领域风险
-
当前热文:恒瑞医药人事变动频繁?董事长孙飘扬回应
-
银川优化生育措施征求意见:提高二三孩生育住院分娩医疗费报销比例
-
热门:国家卫健委发布国家血液病医学中心和国家血液病区域医疗中心设置标准
-
环球观焦点:长三角G60科创走廊:锚定“科创+产业+金融+人才”高水平融合发展
-
北京:到2025年新孵化国家高新技术企业2000家
-
环球简讯:《煤矿安全改造中央预算内投资专项管理办法》发布
-
美国联邦快递管理层将裁员超10%
-
巴比食品:2022年净利润2.22亿元 同比下降29.21%
-
空客与卡塔尔航空就A350订单纠纷达成和解
-
动态焦点:国家能源局负责人会见香港中电总裁
-
全球快资讯:北京这个区 GDP总量首次突破一万亿元!
-
天天快报!高质量发展 | 亮出“作战图” 跑出“加速度”
-
北京关停三里屯酒吧街?官方回应
-
中汽协:2022年全国汽车商品累计进出口总额为2486.5亿美元 同比增长11.7%
-
龙虎榜丨中国长城今日涨停,上榜营业部席位全天成交2.83亿元
-
立讯精密董事长王来春:未来20年立讯要有30%产品进入全球行业无人区
-
当前观点:ChatGPT热度爆棚 谷歌开测“学徒巴德”等多款竞品
-
环球即时:沪硅产业:向专业投资者公开发行不超过13.4亿元科技创新公司债券申请获批
-
天天微资讯!商务部:继续稳定和扩大汽车消费 支持新能源汽车消费
-
新年“开门红” 江苏中欧班列今年首月开行突破200列
-
舆情预警 | 小米汽车设计泄密供应商被处罚100万
-
股票破位怎么办?股票破位必须止损吗?
-
股票一字线会持续几天?股票丁字线说明什么?
-
每日速递:商务部:研究制定海南自由贸易港禁止、限制进出口货物物品清单
-
焦点短讯!舆情预警 | 交通银行四川省分行原党委委员、副行长刘志刚被“双开”
-
股票分红对以后走势有没有影响?分红和股票涨跌有关系吗?
-
环球热点!舆情预警丨云天化:从未在任何网络平台开展众筹集资
-
【环球播资讯】商务部:研究制定海南自由贸易港禁止、限制进出口货物物品清单
-
环球简讯:上海浦东GDP突破1.6万亿元
-
博亚精工:公司目前与成飞集团无业务往来
-
【天天报资讯】商务部:2022年社会消费品零售总额44.0万亿元,与2021年基本持平
-
世界最资讯丨银保监会就人身保险公司分类监管办法业内征求意见 涉及高风险业务、分支机构和非标资产投资
-
商务部:2023年要强化贸易促进 合理扩大进口
-
每日看点!沪指震荡收涨0.02% 半导体和白酒板块表现强势