北晚首页

新闻科技

智能音箱如何做到听清和听懂?专家详述奥秘

2019-08-18 21:04 北京晚报 TF010

放歌、问天气、听新闻......

越来越多的用户正在通过家中的智能音箱来播放这些影音资讯。据《2019年Q2智能音箱厂商&OS出货量和使用量市场份额按区域划分》显示,今年Q2智能音箱的全球销量持续飙升,已达到3030万台。火热的智能音箱背后,到底是怎样的技术能力在支撑?对此,百度智能生活事业群组首席技术官朱凯华进行了一番详述。

“智能音箱的智能性,一直是用户和行业关注的焦点,也是决定一款智能音箱体验的重要标准。”朱凯华在一场近日举办的媒体沟通会上表示。值得一提的是,国内智能音箱小度在Q2创造了470万台的出货量,在全球智能音箱市场销量亮眼。

对于一款智能音箱来说,“听清”应该怎么衡量?朱凯华认为,简单来说,首先是要做到唤得醒,且这一点应在充分考虑外部噪音和内部噪音干扰的前提下。在内外噪音的干扰之下,机器能够准确地识别用户的指令,将声波转换为文字,这需要强大和细致的技术支持。拿小度来说,它有严格的测试标准,包括噪音干扰、声源远近等。

听懂又该怎么衡量?朱凯华坦言,听懂这部分,最考验智能音箱的“实力”。在他看来,“知之为知之,不知为不知”或可成为智能音箱的“人生信条”。市面上一些产品的“趣味性回答”,其实并没有做到很好的用户体验,第一次这样互动用户或许会觉得有趣,但是多次如此,用户则会产生抵触和厌烦的情绪。朱凯华现场使用小度演示了其在遇到这方面难题时的解决方案:当他对小度说“我想听….”的时候,小度的回答是,“你想听什么呢?”当他再次说出“我想听刘德华的歌”时,小度响应并播放了刘德华的歌曲。这种“听懂”在于,当它获得模糊需求、不清晰指令的时候,它会尝试分析和校对自己的指定,以便更准确地满足用户的需求。

说起“对用户的满足”,这一点又如何衡量?朱凯华称,智能音箱的满足能力主要看两点:设备的知识完备程度和技能服务生态。首先,因为背靠百度,小度拥有十亿级的知识图谱,百亿级的搜索请求,和万亿级的网页内容支持。这在智能音箱领域,是得天独厚的核心资源。另外在技能服务生态方面,小度助手的开放平台上,已经拥有了33000多名的开发者,

关于软硬一体结合方面,小度推出了全双工免唤醒技术。朱凯华具体讲解道,软件和硬件要结合,在智能音箱这个行业里面,很重要的一点,就是硬件构建的时候,需要为软件的特征进行专门制作。小度在设计的一开始,就对声学效果有非常高的要求,在高噪音的环境下,也可以进行唤醒。这个前提是对于硬件整个声学结构的高要求,而小度则是从硬件设计伊始就做好了准备。语音识别需要和语义理解完全结合起来,能够做到端到端的识别和理解。

此外,朱凯华还讲到了关于智能家居和语音交互技术的未来发展,他认为科技不停地向前发展,在技术落地的过程中一定会有各种不同的产品形态,但最核心的是技术能力有没有更好地在阶段时间内满足用户的需求。只有解决用户的需求,提供有服务价值的技术,才能够有更持续的生命力和发展空间。

 

 

来源:北京晚报 记者 殷呈悦

编辑:tf10

分享到

家用智能音箱也能窃听?过度收集用户信息谁来监控

智能音箱被曝“偷听”用户隐私 不唤醒、提示灯不亮也能远程静默窃听

百度发布首款带屏智能音箱 加块屏是新需求还是画蛇添足?

互联网公司为何纷纷布局智能音箱? 从“语音战”升级为“视觉战”

智能音箱为何山寨不动了? 内容服务平台比硬件本身更关键

“天问”“嫦娥”新帮手:我国首个深空天线组阵系统正式启用

全国首批!延庆挂牌“民用无人驾驶航空试验区”

戴口罩也能人脸识别、蓝牙解锁车门……进博会勾勒智慧生活新图景

“天问一号”完成第三次轨道中途修正,已在轨飞行98天

华为Mate40系列正式发布,亮出史上最强手机,对决新iPhone12

讯飞输入法10周年:A.I.赋能重新定义输入 日语音交互次数超10亿