icassp ICASSP2016圆满落幕 多麦阵列成为关注重点
历时五天的ICASSP2016终于圆满落幕。这是电气和电子工程师协会组织的信号处理领域最权威的国际会议。它首次位于中国上海,代表了对中国语音技术发展的高度认可。来自国内外的3000多名优秀从业者参加了本次大会。苹果、微软、阿里、谷歌、Esprit、科大讯飞、海天盛瑞等众多语音公司也在本次大会上展示了自己的前沿技术。
语音识别不再是讨论的焦点;
过去,语音识别率作为行业内外最为关注的技术方向,也被作为评价各种技术的重要标准,往往被视为企业宣传的重点。然而,随着技术的发展和实际应用的扩大,人们逐渐意识到语音识别并不是唯一的标准。再高的识别率,也只是显示底层的基础技术还不错。在本届ICASSP上,语音识别率不再是大家关注的焦点,更多的是它是否好用,是否支持口语对话,是否支持自然语言理解,是否支持多轮对话。
语音数据开始面向场景;
海天盛瑞、Data Hall等国外数据公司,如DefinedCrowd,都在本次ICASSP中提到,将推出更多聚焦垂直场景的语音数据,如机器人等特定产品、车辆等特定使用环境、儿童等特定用户。这与过去通常遵循的通用词库有很大的不同。语音数据是整个语音技术发展的基础。随着深度学习和大数据理论的发展,数据量已经成为一个非常重要的基础因素。如今,语音交互越来越垂直化、场景化,数据支持变得尤为重要。这个行业有特色。百度以搜索大数据为基础,在语音搜索方面优势明显。搜狗基于输入法的大数据积累也帮助他们提高了语音输入能力。阿里基于产品搜索的数据沉淀也给语音电商带来了便利。但是有更多的垂直字段,仍然处于数据级别。
多麦阵列备受关注:
在参观了多家参展商并与业内专业人士交流后,我发现多麦阵列是本次ICASSP中讨论最多的。讯飞推出了基于8麦的音箱,其语音唤醒、远场交互和后端服务能力都非常出色。勇气号推出机器人用6+1环麦和家庭WiFi音箱,推出家庭用4麦线阵,5米。远场交互识别达到92%;声学研究所还在为会议系统开发8麦声源定位,可以同时定位三个声源,完成语音识别和录音...以Esprit的环形6+1远场麦克风阵列为例,它具有声源定位、远场降噪、波束形成、回声消除等特点。,可以随时随地实现与机器人、WiFi音箱等家庭智能终端自由交互的目的。也许语音交互能做的事情比我们想象的要多。
中国的语音智能在国际上备受赞誉:
本届ICASSP首次在中国举办,许多外国专家、学者和从业者第一次接触到中国语音企业。据上海交通大学老师介绍,此次展会上,Esprit带来的产品给国际友人留下了最深刻的印象。能口头交流、能跳舞唱歌、能学英语、能读诗的萝卜机器人,能被美国初学者的“你好,远方”快速唤醒的借读后视镜,能拨打微信听歌指导导航的车载萝卜HUD,都给国际专家留下了非常深刻的发言人。除了Esprit之外,Mobvoi展示的Ticwear智能手表、丁咚音箱、讯飞展示的优秀机器人都获得了业界的高度认可。
此外,除科大讯飞外,国内语音企业在国际上很少被提及,此次ICASSP为中国语音企业连接国际交流提供了很好的平台。也希望优秀的中国语音企业,不仅让国内的智能产品越来越智能,也走出去,让越来越多的国际优秀产品越来越“中国化”。