“让机器行为看起来就像是人所表现出来的智能行为一样,包含言语、图画、行为等的自主了解、判断、履行”。是目前智能语音芯片还处于开展早期的一个定义。在应对市场,只有极少数语音芯片厂家推出了量产型芯片产品,大部分公司的芯片产品仍处于规划或样品样品摸索阶段来应对需求。
智能语音芯片的玩家主要分为三类:
一直从事语音或主控芯片研发及生产的公司
代表性公司是科胜讯、MicroSemi、联发科、九芯电子、全志、瑞芯微等
科胜讯:发布AudioSmart语音处理计划,包含CX20924 四麦克风和CX20921 双麦克风语音输入处理芯片,首要的功用包含语音增强(4麦回声消除、噪声按捺、去混响)、360度声源定位和语音唤醒。
MicroSemi:发布ZL38051芯片计划,首要功用包含语音增强(回声消除、波束成形、噪声按捺、声源定位),支撑全双工通话,支撑音频播映,支撑编解码。
联发科:现在主推的是MT8516语音专用芯片, 支撑高达 8 通道的 TDM 麦克风阵列接口和 2 通道的 PDM 数字麦克风接口,非常合适远场麦克风语音控制和智能音响设备。现在阿里天猫精灵、百度 DuerOS、索尼的谷歌语音帮手智能音箱均采用了联发科的计划。
九芯电子:推出与华邦深度合作的N588D语音芯片产品,是一款集单片机和语音电路于一体的可编辑语音芯片。工业级性能,有串口按键并口等多种触发方式,有上位机软件,用户可以编辑语音并下载,完全傻瓜式操作语音芯片。
全志:R16采用了极具性价比的四核ARM Cortex-A7架构处理器,具有强壮的运算功能和丰厚的接口;支撑根据Linux的开源体系Tina(全志自己开发的体系), 现在被叮咚音箱、小爱mini等产品采用;同步推出的R311,内置了完好的降噪算法,并支撑带屏音箱的计划,降低了产品公司的开发难度。
瑞芯微:RK3229根据Cortex-A7四核,支撑4-8Mic。在语音算法上,支撑声源定位、声源增强、回声消除、噪音按捺技术。RK3229仍是首先支撑8路数字I2S数字硅麦直连的芯片计划,不只大大节约本钱,并且兼容不同麦克风阵列算法及渠道。
人工智能草创企业
代表性公司是微纳感知、启英泰伦、Rokid、声智科技等
微纳感知:供给从软核算法、芯片模组、到声学规划的一站式声学处理计划公司。现在现已与君正联合推出X1800智能音箱计划,与杭州中天微联合发布CK805轻量级AIoT处理器。同是自主智能语音芯片计划规划现已完结,第四季度完结投片,该芯片集成了AD、DSP和神经网络加速模块,可以完结2~8麦阵列的远场拾音、唤醒和打断、降噪和回声消除等功用。
启英泰伦:是一家专注于人工智能芯片规划及配套智能算法引擎开发的公司,它于2016年9月推出了专用的深度神经网络智能语音识别芯片CI1006,并已完结了量产和出货。
智能语音芯片的未来趋势
边际计算
现在除了语音唤醒及前端的音频处理可以在本地完结之外,杂乱场景的语音辨认、语音交互和实时翻译等都必须连接云端的服务器来完结。未来当芯片算力满意,完全可以完结悉数语音处理流程都在片上运行,而无须依靠云端和网络,在保证用户数据隐私的一起拓宽更多的移动端使用。
可以兼容多种神经网络框架
现在的智能语音芯片一部分是依靠传统的数字信号处理算法,一部分是利用RNN/CNN等神经网络算法进行数据处理,未来或许出现更多类型的神经网络算法,满意各种语音交互的场景,而这些算法都可以被同一颗智能芯片所兼容,在不同的状况调用不同的网络来满意客户需求。
低功耗,小体积
现在的各类语音芯片因为功耗和体积的问题,无法大规模使用于可穿戴、玩具、无人机等不通过电源供电、硬件空间及其有限的设备,如果可以处理这些问题,那么语音交互将可以深入到更多的行业,落地更多的产品。