VoiceGurus

Blog about voice enhancements

wearable device interaction

语音是与受限设备互动的明智方式。

语音是与受限设备互动的明智方式。

多年以来,我们形成了一种思维定势,认为手指是我们与机器和设备互动的唯一方式。自19世纪60年代问世以来,打字机就把双手宽度规定为最便利的文字输入尺寸。近年来,触摸、滑动等手势也在智能手机一类的小型设备上流行开来。但是,我们如何与放在耳中的设备或者戴在手上的漂亮设备互动呢?

答案就是语音。直径小于一毫米的麦克风是控制可穿戴设备最小、最合理、最经济的手段。

NXP Software业务拓展经理Vlatko Milosevski 就声控技术和音频检测技术在可穿戴受限设备中的作用谈了自己的看法。今后几年,这个市场将从一个近乎空白的市场发展为一个年销量达10亿台设备的大规模市场。

可穿戴设备行业将练就一整代使用者,使他们忘记自己的手指,只需对着设备说话即可完成一切事情,无论那是一台电脑、一部智能手机、一台自动售货机、一套家用供暖系统,还是是他们的汽车。

Vlatko。NXP Software在可穿戴产品或受限产品领域主要有哪些挑战?

正如其名,受限设备这个类别的产品主要有三大限制:尺寸、外形和互动方式。

这些设备需要做到穿戴舒适——耳中、手上、身上或头上。它们体积小巧,重量轻盈,符合人体工程学设计理念,可与目标佩戴位置完美相融。它们还要做到外形美观、时尚。最后,人们还要快速而直观地知道它们的用法。

基于此类考虑,受限设备一般都没有可以触摸的屏幕,也没有可以按的按钮。它们关注的是以有限的功能取胜:比如,拨打电话,跟踪身体活动,听音乐,或快速检查通知。由于这些设备做得更小、更薄、更轻、更简单,这就对多个要素产生了限制:电池尺寸和容量,这些设备中嵌入的处理能力和内存,以及人们与其互动的方式。

NXP Software面临的挑战是在充分考虑这些系统和外形限制条件的情况下,LifeVibes技术如何完善这些设备的核心功能?

NXP Software为什么要斥资研发一种解决方案?

可穿戴智能设备呈爆发式增长之势。2015年1月在美国拉斯维加斯举办的国际消费电子展上,这一趋势十分明显。当然,随着苹果智能手表的推出,这一浪潮将加速推进。苹果、三星和其他公司的公关部门将增进市场对可穿戴设备的��知。

据市场情报公司预测,在2019年,仅腕带式智能设备的出货量就将达1.5亿个单位。我们预计,当无线耳机和物联网设备进入千家万户之际,市���上每年将有10亿台设备可能从NXP Software的语音增强和音频检测技术中受益。

NXP Software的解决方案能带来哪些好处?可以从中受益的客户有哪些?

从成立的第一天起,NXP Software就在为可穿戴设备开发软件产品。

数以百万计的索尼和三星蓝牙耳机都集成了LifeVibes VoiceExperience软件。而三星的智能手表也集成了LifeVibes。

我们以超小的封装,提供了最先进的通话质量,无需耗费过多电池电量,也不会影响设备的设计或人体工程学素质。这正是我们的客户摘得一项又一项国际大奖的原因所在。例如,Plantronics BackBeat Go无线耳机在2014年的CES展会上一举夺得最佳穿戴设备大奖。

我们的使命和对客户的价值主张非常简单:创新。通过创新,我们将在外形、人体工程学设计和成本方面不断突破,化解面临的众多难题。

我们的解决方案能给消费者带来哪些好处?

从哪里开始呢?我觉得最常见的一个情景是,人们可以用微型无线耳机随时随地接听电话。不用找个安静的地方,也可舒舒服服地通话。

人们也可以在各种环境和情景下,通过语音命令与设备互动。我们的技术可以有效地提高语音命令的识别准确性和可靠性。

借助我们的声学技术,可穿戴设备可以自行检测所在位置——比如,在汽车中、公交车上或火车上,或者在办公室中——并自动适应具体环境。当您在办公室或公共交通工具上时,自然不希望消息被大声朗读出来,但是,如果您在开车,让设备读出消息却是件很便利的事,不是吗?

我们目前也开始涉足一个全新的领域,把声学技术应用在可靠心率监测等创新应用之中。在这种用例中,心率传感器读数中已经排除了来自设备、环境或身体动作的“噪声”。如此,用户锻炼身体时,就可以获得更加可靠的心率测量结果。在有的情况下,这种可靠的心率测量可能起到救命的作用。我觉得NXP Software在音景管理领域处于世界领先水平。

相比竞争对手,我们有哪些优势?

我很自信地说,我们拥有世界上最好的音频处理人才队伍。我们的团队由来自世界各地的顶级声学专家构成。

我们把专业声学技术与深厚的计算机架构知识有机地结合起来。这意味着,我们能够开发出强大的软件算法,只需超小、有限的微处理器功率和内存容量即可顺畅运行。

与此同时,我们还可确保,我们的处理性能不会被人称岁月的万能力量所左右。无论用户如何穿戴设备,无论采用何种风格和外形设计:我们的算法都能正常运行,并产生最佳结果。

最后,无论客户身在何处,我们始终都能贴近客户。我们在“智能可穿戴革命”正在上演的所有重点市场都设有专家团队和实验室。

发展趋势是什么?在今后几年中,这一趋势的发展动向是什么?

如前所述,在今后几年中,这个市场将从一个近乎空白的市场发展成一个年销量达10亿台设备的市场。可穿戴智能手表市场年销量将达1.5亿个单位,对于物联网来说,只有天知道极限在哪里。

对我来说,这场革命真正令人兴奋的地方在于,它会提高消费者对语音控制的�������知。Siri和Cortana使人们认识到了语音的能力……但多数消费者在与设备互动时仍然诉诸打字或手势。我认为,届时,在设备链的后端,语音将成为与受限设备的唯一互动方式,这样,越来越多的人将开始通过语音与智能手机或电脑互动。

我们为什么要合作,合作方式是什么?合作伙伴有哪些?

行业生态系统非常复杂,也很庞大。

有些公司专注于开发最好的嵌入式处理器架构。ARM、CEVA、Cadence等等,不一而足。我们与这些合作伙伴密切合作,确保在算法的执行过程和设计方面做到极致,尽量减少在他们架构上所需要的功耗。

其他公司专注于制造终端设备中集成的音频处理芯片组。这些公司有Cirrus Logic,或我们的“大哥”恩智浦半导体。我们与这些公司合作,把我们软件产品预先集成到他们的芯片组中,这样,即可为终端设备制造商提供“现成”的产品组件。

当然,还有谷歌、微软这样的软件生态系统的大拿们。我们与他们一道塑造着软件操作系统框架的未来,确保应用开发员可以在他们的应用中无缝应用我们的技术。

我们的合作伙伴为什么要信任我们?为什么要选择NXP Software集成到他们的具体平台上?

部分原因在于,他们希望与行业最好的技术提供商合作;另一部分在于,他们自己的客户希望把我们的软件产品与他们的产品结合起来。

现有和潜在的合作伙伴一定要知道,我们拥有长达十年的制胜经验:我们赢得了广大合作伙伴的信任。如今,世界前进的步伐不断加快,任何公司都无法包办一切。他们需要依靠专家,依靠来自合作伙伴的友好帮助。

可见,今天的快速创新步伐增加了深化业内合作的必要性。

接下来会怎么样?客户和消费者的预期会怎样发展?

技术正变得越来越人性化,越来越简单、直观。人们只是希望技术能为他们工作;希望技术能理解他们的需求,无论他们身在何处;希望技术能帮助他们更快、更好、更轻松地完成日常任务。

从这个意义上来说,声控设备就像一个个人助理、管家、教练、导师、医生,甚至朋友,全部角色都集成到一台设备中!戴在您的手上还要好看、时尚。就像您自己的个性化表现一样。

这些要求不算高!

我们已经看到一些有望实现这一愿景的技术突破。例如,语音命令取代菜单导航;Google Play实时提醒/推荐取代手动检查;报事贴风格的提醒,嘱咐您完成该做之事。

如今,音乐应用可以快速学到您的音乐爱好,它们可能向您推荐您从未听说过的歌手的作品,结果却表明,这正是您所想要的。朋友或同事提出的建议也不过如此,我们将继续开发这类互动算法。

从我们的角度来看,下一步有什么计划?我们目前正在做什么?

有意思的是,尽管我们从公司成立以来开发的所有音频增强工具主要是面向手机的,但实际上,我们好像是在为可穿戴设备、受限设备和物联网革命做准备。

是的,我们的音频增强工具使手机变得更好。毕竟,如果智能手机加载网页要多花一秒钟时间,没人会注意到。但是,如果呼叫质量不好,用户很快就会转变对设备和/或移动网络的态度。

从声控可穿戴设备中过滤掉背景噪声的能力至关重要。同时,用音频音景检测用户所处环境的能力也极其重要:比如前面提到的办公室中或汽车上的例子。

在这两个领域——语音增强和环境检测——NXP Software在研发和专业知识积淀方面都遥遥领先。

如果可行,这与提高听音智能化水平和对话清晰度有什么关系?

正如我前面说过的那样,可穿戴市场将成为运用我们的技术提高听音智能化水平和对话清晰度的制高点。

事实上,我要说,如果没有NXP Software已经开发并将继续开发的算法,可穿戴市场根本不可能存在。对可穿戴设备来说,唯一合理的输入/输出方式就是人的声音,这正是我们所擅长的领域。

Leave a Reply