未来时代男人的天敌 智能音箱会是灵魂伴侣

陈加乐 / 2017-8-3
分享到:

从爱迪生发明电灯点亮创造,贝尔发明电话沟通世界,莱特兄弟发明飞机连接各地,世界仿佛一下子被按下快进键,还是128X的那种,令人目不暇接。这次咱们来谈最近大火的智能音箱。自从2014年亚马逊发布Echo音箱,智能音箱突然横空出世,它将未来的一种模糊概念变成一个实物让大家有了无限遐想,如今遐想正逐渐成为现实,人们对其充满浓厚兴趣。

 

好东西当然被争相抢占,随后智能音箱市场进入了大航海时代,京东推出叮咚音箱,谷歌推出GoogleHome,微软推出Invoke,苹果推出HomePod,天猫推出天猫精灵X1,小米推出小爱同学,就连喜马拉雅和酷狗也出了类似产品。但是这才是一个开始,据有关消息称,腾讯的“耳朵”,百度的“DuerOS”正在赶来的路上,Facebook的智能音箱也正在研制。

 

智能音箱是音箱的升级产物,它的特点体现在名字里面,就是“智能”。它有两个最大的特点,一是可调戏,它具备WiFi连接和语音交互功能。二是管家化,它可提供信息查询、播放音乐电影和一些其他互联网功能,以及智能家居控制能力。现如今市场上的智能音箱大多数均可做到面面俱到,但是也有厂商只专注于一个细节,比如喜马拉雅的小雅专注听书,酷狗的则专注听歌。

 

随着物联网的发展,智能家居市场越来越火爆,作为一个控制枢纽,智能音箱也越发受关注,那么智能音箱的竞争具体在哪般?智能音箱的核心竞争力在于AI技术,其次再是远场识别技术,语音识别技术,语义理解技术以及对话。对话属于AI方面,需要庞大的数据库以及深度AI技术支持。高深精湛的AI技术都掌握在谷歌,微软,苹果,百度,腾讯,阿里,亚马逊等这些世界顶级科技公司手中。

 

远场识别是指语音交互可以达到5米以上的远场识别距离,解决背景噪音、其他人声干扰、回声、混响等多重复杂因素影响的技术。现如今百度、IBM 和微软等各个大公司都已经开始布局此方面,2016年百度 Deep Speech 2 的短语识别的词错率降到了 3.7%,IBM Watson 会话词错率低至 6.9%,微软英语语音识别词错率达到了 5.9%,媲美人类。Skype、YY语音、腾讯等公司也都深耕于其中。

 

语音识别技术,也被称为自动语音识别 (ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。它主要包括三个方面,分别是特征提取技术、模式匹配准则及模型训练技术。语音识别技术发展也是一个组合过程。苹果收购Siri、Novauris Technologies、VocallQ和Emotient这么多公司才有了现在的Siri。谷歌收购Say Now,Phonetic Arts,Wavii,SRTech Group及出门问问才有了现在的Google Home。亚马逊收购Yap,Evi,Ivona Software才有了现在的智能音箱Echo。当然这些只是时代的小缩影,而且这些收购只是针对于智能音箱的语音识别技术。

 

语义理解技术是人工智能的关键,它涉及到人工智能的自然语言处理方面,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。举个例子,“咬死猎人的狗”这句话我们看着也不能确切理解它的意思,更别提计算机了。但是如果我们看到前面的主语:“那只狼咬死猎人的狗”我们就很好理解了,但是机器在这种时候该如何进行理解?语义理解技术研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。

 

当然这些只是构成智能音箱的基础,一个优秀的智能音箱应该还包括有软件、硬件、平台、内容资源配套设施各方面。目前智能音箱市场中做的最好的是亚马逊的Echo音箱,Echo模式其实是有局限性的,尽管Echo产品销售了千万台,并且亚马逊Alexa本身正在成为开放平台,但只是基于亚马逊自己的生态。接下来再是苹果的HomePod,苹果一直在建智能家居生态圈,但是由于它进入战场有些晚,配套设施还是不够齐备,相信未来还需要走一段路。京东的叮咚则是国内布局比较早的了,目前叮咚拥有150多项服务并且拥有自主的开发者平台,在众多巨头加入后,其一直在默默巩固布局,大时代来临之际它可能就是一方巨头。

 

在小编看来,智能音箱产业还有一大段路要走,针对于现在的自然语言处理的发展水平,以及家居配套设施的匮乏,智能语音音箱并没有达到不可或缺的状态。但是其创造的便利性,和一些简单实用的功能提升了一定生活水平和乐趣,相信未来只是需要一个契机,也许是人工智能技术再来一次突破,智能音箱便会成为最佳灵魂伴侣,它能做到的到那时已经无法想象。

1为本文点个赞
返回到页面顶端