回退到五年前,可能并不会有人想到给Google造成最大麻烦的会是亚马逊,Alexa的成功事实上正在对Google造成根本性威胁。现在再回头看亚马逊一路采取的行动,你会发现它几乎每步都做对了:
从收购三家语音公司打造Echo;
再到花4~5年打造一款产品的体验而不是草草拼凑一款好像能用的产品;
然后确定一个柱状的ID而不是拟人态的机器人来降低用户预期;
销量一旦站到百万以上则开放后端Alexa Skills Kit以及Amazon Voice Service;
再到最近的开放七麦克风阵列。几乎每一步都高度务实和正确,与之相比有些国内公司就显的太想抄近路了。
从麦克风阵列说起麦克风阵列是把多个麦克风组合在一起来对声场的空间特性进行采样并处理的系统,形状不局限于环形,而可以有线性、十字等。
亚马逊Echo这产品虽然用到了很多技术,也连接了很多内容,但最为核心的部分正是麦克风阵列。因为在柱型ID下面,人们的预期已经被大幅收窄,这样内容外的核心的体验点就只有速度和精度。而在远场语音交互中由于真实场景中各种干扰声源的存在,精度的瓶颈就变成了声学,而不是已经相对成熟的深度学习等。声学技术中对最终体验比较关键的正是这次亚马逊授权给第三方的:麦克风阵列,唤醒、回声抵消、降噪、去混响等算法,当然还有一部分是融合到AVS中的已经开放出来的远场语音识别。
亚马逊开放自己的7-Mic阵列的本质含义在于亚马逊正式把Alexa的优先级放在Echo这个产品之上。基于亚马逊的7-Mic阵列以及配套技术,理论上讲少数其它公司是可以打造出交互体验与Echo一样的产品的,而显然的用亚马逊阵列其背后必须集成的是亚马逊的Alexa。