您的位置 首页 传感器

揭秘Amazon Echo语音操控的奥秘面纱

揭秘Amazon Echo语音控制的神秘面纱-亚马逊(Amazon) Echo可说是目前最热销的物联网(IoT)装置,无论你称它为智慧麦克风、虚拟数位助理、家用机器人、语音控制或R2-D2,这一类以语

  亚马逊(Amazon) Echo可说是现在最热销的物联网(IoT)设备,不管你称它为才智麦克风、虚拟数位助理、家用机器人、语音操控或R2-D2,这一类以语音为根底的产品正敏捷兴起。..

  相较于Echo,最新的第二代Echo Dot的价格从89.99美元调整为49.99美元,并将于本月在美国上市出售。

  Amazon Echo(及其随后推出的Dot)拓荒了一个新的商场,让设备供货商能够在语音撷取、进步麦克风消息解析度、更先进的布景杂讯过滤、更好的音场侦测与安稳连线才能等方面打开竞赛,以供给更佳消息质量。

  Amazon Echo (左)及其第二代产品Dot

  而像XMOS等公司尽管自家晶片并未用于Echo中,但也瞄准了这个新的语音介面商场。XMOS行销与事务开展副总裁Paul Neil表明,“物联网现在正是一场快速移动的盛宴。为了操控IoT设备,语音是最天然的运用者介面。”

  Neil说,因为交融了“传统的微操控器(MCU)功用、嵌入式DSP以及灵敏的I/O组合,使得咱们的技能成为语音介面的抱负挑选。”

  可是,硬体设备之间的战役仅仅构成整个才智麦克风/扬声器商场的一部份。IHS Markit连网家庭资深分析师Paul Erickson着重,“真实的竞赛变数来自云端。”

  为了寻求更“聪明”的才智麦克风(能够处理杂乱的查询和随机问题),云端服务范畴的竞赛越来越剧烈。 Google估计将于今年年底推出Google Home与Google Assistant (Google Now的新版别),并借此进入这个商场。Erickson表明,“并且商场上盛传苹果(Apple)很或许将在2017年挟其Siri进入这个范畴。”

  Amazon Echo——这款IoT设备如此抢手的另一个原因在于它极具潜力,可完成IoT的重要长处:经得起时刻检测(Future-proofing)。

  芯科科技(Silicon Labs)软体副总裁Skip Ashton解说,Future-proofing的意思是“保证设备可随时刻发展继续添加更多功用特性。”例如,Alexa为Echo供给的语音服务功用一开始有70种,现在现已添加到超越1,700种了。

  Echo能够答复问题、阅览新闻、为运动评分、操控灯火、从Amazon网站订货产品以及设定闹铃等。运用者还能够运用该设备向Uber叫车或订货披萨外送等。

  “现在Echo大约每两周透过云端更新一次,”Ashton说,“Amazon会在星期五时发送电子邮件给Echo用户发布新功用, ”而Echo用户“也关于产品的功用继续添加怀抱着等待。”

  本地才智

  IHS Markit嵌入式处理器首席分析师Tom Hackenberg分析Amazon Echo关于电子工业带来严重影响的原因:才智麦克风/才智扬声器运用“关于处理器供货商来说极具价值。”

  因为这种设备要害之处并不仅仅供给了“本地才智”。语音介面正遍及运用在广阔的商场范畴。不仅仅数位助理商场呈现,成为才智型手机App的消费电子设备版别,还有扬声器,也不是它仅有的外形运用。

  例如,他解说说,“家庭自动化中心和数位助理能够内建于电视、机上盒(STB)、HVAC/环境操控中枢等等。此外,在车载资讯文娱方面也存在很多的运用,特别是着眼于其免手持的长处。”

  拆解Echo与Echo Dot

  透过拆解Echo与Echo Dot并进一步比较后,Hackenberg说,“除了记忆体供货商,我发现Echo和Echo Dot的处理元件并没有显着的不同。”

  

  拆解Echo与Echo Dot (来历:iFixit)

  依据iFixit所进行的拆解,Amazon Echo选用:

  三星(Samsung) K4X2G323PD-8GD8 256MB LPDDR1 RAM (挥发性记忆体)

  SanDisk SDIN7DP2-4G 4GB iNAND Ultra Flash (非挥发性贮存)

  而到了新版的Dot则改用:

  美光(Micron) MT46H64M32LFBQ 256MB (16Meg x 32 x 4Banks) LPDDR SDRAM (挥发性记忆体)

  三星KLM4G1FEPD 4GB高功用eMMC NAND Flash (非挥发性贮存)

  两款产品运用的处理器则是相同的。在Echo与Dot的中心选用的是“德州仪器(Texas Instruments;TI)的媒体处理器DM3725”,此外,高通(Qualcomm) Atheros QCA6234运用专用规范处理器则用于供给“衔接性”。

  Hackenberg解说说,尽管记忆体或许略微影响功用,但记忆体定价是动摇的。因此,关于Echo系列的一切产品而言,在其整个生命周期中改动所运用的元件也很往常。

  相形之下,“连线模组,尤其是媒体处理器愈加杂乱,假如不是严重的产品更新,一般并不会改动,”他说。

  Hackenberg指出,Atheros处理器专用于作为衔接运用规范产品。其规划是以Tensilica客制化XTensa中心为根底,并且“它只做一件事——和谐与网路的通讯,以利作业进行。”

  Erickson弥补说,“衔接才能至关重要,因为它触及哪些材料可被撷取、传送与接纳云端材料的速度与牢靠度等。因为速度/呼应的可用性要素,它直接影响到与扬声器之间的互动有多么“即时”。因此,Wi-Fi的吞吐量、服务质量(QoS)与规模的改进,都将有所协助。”

  一切的“本地”(local)才智功用是由TI DM3725进行处理。Hackenberg指出,“这是一款专为STB、TV、显现器、视讯游戏体系等各种多媒体运用而规划的体系单晶片(SoC)。”

  DM3725是一款以ARM Cortex A8为根底打造的元件,并整合TI的C64x+DSP与3D绘图加快引擎。“Cortex A8是一款老练且经济型的运用处理器,但又彻底满足用于本地履行简略的使命,”Hackenberg表明。

  可是,“假如运用变得杂乱,而不仅仅一款扬声器这么单纯,或许就会有所改变。”


  

  Amazon Echo Dot主板 (来历:iFixit)

  整合DSP

  依据Hackenberg,这颗SoC的要害就在于整合了DSP,乃至或许是GPU。

  “在一个典型的规划中,存在多个输入感测器(主要是麦克风)。整个消息输入首要经DSP高度滤波,使体系快速地了解用户的语音和环境杂讯之间的差异,”他说。

  “它乃至能够解读相关于该设备的方位或乃至发话者是谁;它还建立了一种形式,能够通过处理以匹配该形式(一般发送至云端),”他弥补说。

  可是,GPU做什么呢?

  Hackenberg以为,“关于本地才智,GPU能够用于更简略、但快速且高效的本地形式匹配。”

  这能够让设备依然回应所贮存的操控形式,例如“下降音量”、“切换频道”或其他简略的操控,而无需网路衔接,他解说说。 “接着,运用中心依据所需供给的回应、发动/封闭所需的输入或操控以及有必要显现的内容等条件来履行运用程式。”

  麦克风阵列

  Amazon Echo和Dot之所以吸引人之处在于它运用了7麦克风阵列。Amazon宣称,Echo和Dot因为运用了多支麦克风和波束成型技能,因此“能在整个室内都听到你的声响——即使是正在播映音乐的环境下。”该公司还表明,Echo是一款专业级的调音扬声器,能以360°沉溺式音效充溢在整个房间中。

  依据IHS Markit担任MEMS和感测器的资深分析师Marwan Boustany表明,Echo选用了楼氏电子(Knowles)的MEMS麦克风。

  Dot选用7支麦克风阵列

  Boustany指出,为声响频率进步其信号杂讯比(SNR)、匹配和功用,将有助于远场消息撷取,一起改进语音辨识。

  但终究,“演算法才是完成更优质语音辨识的真实要害,”他说,“所谓的『才智』就在于云端或许继续作为要害运用,而本地处理则能够进步关于简略/预界说片语(如Hey Siri等)的辨识才能。”

  他以Cypheras为例表明,“这一类的软体供货商将有利于才智家庭体系(如Alexa)中的语音辨识功用。”

  

  Amazon Echo Dot (来历:iFixit)

  竞赛日益加剧

  以供货商来看,现在有几家供给微操控器(MCU)和衔接用ASSP的供货商或许在此范畴打开竞赛,包含Apple、博通(Broadcom)、赛普拉斯 (Cypress)、微芯科技(Microchip)、恩智浦(NXP)、瑞萨(Renesas)、意法半导体(STMicroelectronics) 以及芯科科技(Silicon Labs)等。Boustany表明,”802.11n与BT 4.0的组合并不常见,但有些规划针对较低本钱的解决方案或许将会只用蓝牙。

  媒体处理器较为扎手。尽管多家举动设备运用处理器供货商都可供给,但关于简略的运用来说本钱太高。依据Hackenberg的调查,供货商们或许会挑选不供给功用适当的DSP或形式匹配功用。

  “我或许会考虑选用Apple Ax、Broadcom BCM7xxxx、海思(Hisilicon) Hi3xxx、NXP i.MX、联发科MT8xxx、意法STIHxxx、高通(Qualcomm)Snapdragon等。当然,TI或许在本钱方面具有最佳DSP援助(关于语音辨识至关重要)的优势,但其他的这几家供货商也在不断地缩小差距中。”

  XMOS信任该公司将在这个商场上取得动能。关于比如Echo这一类的语音助理产品,进步功用的要害在于远场语音撷取才能、波束成型与处理速度等。Neil以为,“凭藉着很多的处理才能和嵌入式DSP,咱们的XMOS单晶片元件供给了可扩展和差异化的解决方案。”

  

  XMOS xCore语音介面事例 (来历:XMOS)

  编译:Susan Hong

  (参阅原文:Amazon Echo How It Resonates,by Junko Yoshida)

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/yingyong/chuanganqi/169208.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部