在以智能音箱“百箱大战”为代表的AIoT市场火热的背后,实则是“带着镣铐跳舞”,作为业界翘楚,云知声给到产业五把钥匙。
1
“百箱大战”下的智能音箱市场滞胀
近日,人工智能算法公司云知声发布了基于首款 AIoT 芯片“雨燕”的智能音箱和智能家居解决方案,并宣布将该方案开源。
今年5月,云知声推出全球首款面向IoT的AI芯片UniOne,在一系列芯片设计中,雨燕是第一代产品,也是第一款面向物联网人机交互场景的AI芯片,适用于智能家居和智能音箱领域;在“雨燕”之后,公司表示还将推出面向智能车载领域的第二代芯片“雪豹”,以及用于构建智慧城市的第三代“旗鱼”,两款产品预计将分别于明、后年面世。
“UniOne 雨燕”发布现场
作为初代,“雨燕”所处的智能家居语音交互市场异常火热。此次发布会上,云知声副总裁康恒博士这样描述当前的智能音箱格局:“从2017年开始,有一个现象叫‘百箱大战’,与之相应的,音箱的解决方案在今年出现了‘百家争鸣’。”
商战本为利,AIoT的战争也不例外。据相关数据显示,仅是中国,2018年智能家居的产业规模将达到1800亿,两年之后,这一数据很可能翻倍,而在2021年,将会达到5000亿元。
然而,市场利得并不是那么容易收入囊中。
春秋、战国可以决出五霸、七雄,但在当今市场经济和世界贸易的生存规则下,如果不掌握真正的武功秘籍,那AIoT领域胜出的更有可能是亚马逊、谷歌、苹果这些无论端、云、芯都居于世界顶尖的科技巨头。
在国内智能音箱市场上,“天猫精灵”和“小爱同学”在价格战上打的火热,但不知道是否赔本赚吆喝;百度的战略最初是想收购渡鸦进入高端市场,但在没有商业模式的支撑,最终也只能以带屏的小度在家略显差异化的进入战局;作为BAT最后一家,“腾讯听听”在千呼万唤中于今年4月始出来,没有太多亮点,主打设计和性能,也得到了一些死忠粉的支持。
总体来看,无论是“百箱大战”还是BAT入局,行业整体还是呈现出雷声大、雨点小,并不能让市场形成消费习惯的滞胀状态。
自2012年成立以来持续在语音交互领域深耕的云知声,面对如上的市场问题,提出了他们的几点思考,以及解决方案。
康恒博士整体介绍基于雨燕AIoT 芯片的开源方案
2
定制芯片,用语音交互逻辑解决终端碎片化困境
为什么智能音箱、或者智能家居的概念属性高于实际价值表现?
康恒首先从IoT的终端呈现出非常明显的碎片化困境做出解释:
“物联网和传统互联网相比,产品形态和使用方式都呈现出高度多样化。在互联网时代,终端只有电脑、手机,或者平板。进入IoT时代,产品形态包括车机、电视、智能音箱、机器人,甚至空调、冰箱、洗衣机、厨电、小家电,所有的设备都可以连接到物联网上,产品形态是高度碎片化和多样化的。”
在碎片化的终端形态下,真正能够体现出产品价值的,除了产品性能,更重要的是连接的性能。简单说,就是面要大、接口要广、逻辑要强。
但说起来容易,做起来难。如何能够让终端如人脑的神经网络一般连接?这是一个追求极高速率,但又异常复杂的操作,在康恒看来,唯有芯片可以完成。
“我们把语音交互的逻辑在芯片上得到实现。”
目前,云知声有专门面向AI的加速器DeepNet,包括面向语音交互、麦克风阵列降噪和处理的数字信号处理器DSP,以及内置通用ARM核。同时,也在通用CPU上实现了8倍的性能提升。
在专门针对AI的性能设计方面,TTS实现了16倍的速度提升,深度神经网络则实现了50倍的提升。
在硬件加强和性能提升的基础上,所有硬件设备实现了感知、表达、思考三个核心方面的增强赋能,同时,将语音交互逻辑放在芯片上得到实现。
技术、产品、服务全栈应对分散供应链下的风险
其次,多元化的需求和碎片化的终端,导致了分散的供应链。
对此,康恒举例说明:
“以前,在手机行业做应用方案,合作的供应链除了常规之外,最重要的只有两个,一是主控芯片CPU,二是安卓的源代码和谷歌合作。但对于AIoT来说,则除了芯片、硬件和操作系统,还需要增加AI算法、云端,甚至需要把它们打包成应用程序。所以,架构的复杂程度完全不同。”
在应对方式上,云知声给出的建议是,让方案商选择包括技术、产品和服务的全栈式解决方案。
事实上,一个完整的语音交互过程需要前期的语音唤醒、声纹识别、麦克风阵列、回声消除等步骤,之后才是语音识别。文字所表达的意图,则需要由广义自然语言理解来处理。如果将自然语言理解拓展开来,还要涉及到对话、内容的推介,知识图谱等非常深厚的技术框架。
在对语音交互技术的复杂性存在普遍的认知盲区下,康恒指出了一个非常常见的谬误:“业界有不少产品商会觉得产品可以自己做,算法公司只需要提供算法,或者引擎就可以。一般这种情况,都是低估了技术架构的复杂度。”
然而,并不是技术全栈之后就可以完全避免风险。
最稳妥的方式,还是进一步达成产品和服务的全栈。在达成技术全栈基础上,产品的全栈要考虑交互、能否量产等问题。而服务的全栈之所以重要,原因在于它可以把技术元素、硬件和生产等元素结合起来,这中间有很多需要协助客户完成的工作。
3
优化产品体验需运用工具和SOP提升测试规范
第三个问题是难以把控的产品体验。
和考试不一样,在 AIoT领域,即使产品的每个零部件都是高分性能,它的最终表现有可能是非常低分,这里牵涉属性冲突的问题。
“真正的好产品不是纸面设计的高大上,而是极佳体验。各部分零部件的性能磨合非常重要。”康恒表示说。
而性能磨合需要的是不断的试验和测试,目前在产业界,这点做的并不好。不少欠成熟的企业还是粗放式验收,“把生产出的音箱摆在测试工位上,然后让测试员不断重复欢迎词和查天气,类似的验收方式都是很不正规的。”
对于如何为客户提升测试的标准化从而提升产品体验,云知声提供了一系列工具,以及SOP,可以把控客户在测试环节的规范运作。
“比如说,麦克风是否有不良,一致性是不是够好,装配之后,结构是否有密封或者振动问题?我们有一系列的工具来帮助大家,无论是IQC或者最后的产测,甚至有一些是自动化的工具。”康恒说。
产品本身性能和团队协作决定了产品周期
产品周期对于厂商来说也是一个极大的考验。
其中,最常见的问题是盲目乐观,不少厂商自认为做硬件经验很丰富,做音箱、或智能家居就可以得心应手。
但这个逻辑,在康恒看来是不成立的。
在他看来,实际与产品周期紧密相关的,不是做硬件是否有经验,或者说企业的规模、实力、人数,这些都是边缘因素。真正起决定性的,一是上述产品本身的性能体验可以在多长时间内做到极致,二是团队协作,在新品的架构上,AI、硬件、软件和云端服务都需要不断磨合。
在如何缩短产品周期的问题上,康恒表示云知声会根据具体服务公司的业务提供方案。
4
开源代码设计促进产品实现快速复制
最后一点,是如何能够在不同的产品之间实现快速复制。
产品形态的碎片化,导致了方案商在获得收益方面不能靠单一的产品形态或者方案获得满足,需要考虑不同的应用场景。那么,一个产品的开发能否用到之前积累的代码和设计,能否将成功经验复制到新的产品项目中,对方案公司来说至关重要。
“有时候,这点甚至事关方案公司的生死。”康恒强调说,如果产品之间可以实现快速复制,投入将可以极大减少。
在如何优化提升产品复制的问题上,云知声采用了代码开源和根据客户需求完成定制两种方式。据康恒介绍说,云知声目前都是开源代码设计,方案商可以根据需求修改代码,在云端服务层,会根据客户的需求,或者具体产品的需求来完成定制的工作。
结语
无论是“百箱大战”还是“百家争鸣”,在AIoT大火的背后,终端碎片化、供应链分散、产品体验难提升、产品周期难把控、产品经验难复制,这五大暗流成为影响产业良性发展的重要风险因子,定制芯片,技术、产品、服务全栈,运用工具和SOP,优化团队协作,开源代码设计是云知声给到行业的五大对策。
雨燕 AIoT 芯片的开源方案现场展示
对于云知声来说,“雨燕”在智能音箱和智能家居中的应用让其迈出了驰骋在AIoT领域的第一步,其后的“雪豹”和“旗鱼”还将致力于智能汽车和智慧城市。在产业界,优秀的公司会担纲领导者的角色,它们未来会有怎样的建树,“机器人文明”将与您一起持续关注!