百度牵头成立的智能语音联盟,或将成为中国的ARM

语音技术作为人工智能的重点研究领域,不仅可以带来全新的、变革式的人机交互方式,还有机会催生出人类和机器的情感交流。源于语音对人类的重要性,科技巨头们再一次将目光投到了智能语音领域。

语音技术作为人工智能的重点研究领域,不仅可以带来全新的、变革式的人机交互方式,还有机会催生出人类和机器的情感交流。源于语音对人类的重要性,科技巨头们再一次将目光投到了智能语音领域。

近日,由百度、海尔、京东、中兴通讯、中国普天、北汽股份、京东方联合发起,二十余家单位共同组成的智能语音知识产权产业联盟正式成立。该联盟通过组建专利池的方式,引导和促进语音技术跨行业的实施和应用,并对联盟成员免费开放专利池专利。

理想主义者的分享

这是百度继两年前开放语音能力后,又一次“工程师式的理想主义”的实现。基于在智能语音核心技术中的的长期积累,百度率先将首批满足专利池标准的100多件语音技术专利放入专利池中开放许可给联盟成员使用。

从开放语音能力,到开放技术专利,百度分享的初衷和尽头永远都是希望科技能真正解决人们的问题让生活更美好。在过去的两年中,包括联想智能电视、小米手机、信利智能可穿戴设备、特斯拉电动汽车等厂商以及去哪儿、陌陌等APP都使用了百度语音开发技术成果。这种免费开放的合作接入为企业提供了语音问题的解决方案,极大的缩短了开发周期,也在一定程度上减少了开发成本。除此之外,对许多创业型的中小开发者而言,技术的开放为他们的创新提供了更多的可能。

同样,事实也在不断证明投桃总会报李,正是由于百度平台技术的提供与核心技术的免费开放,才吸引到了更多更优秀的开发者。对语音技术来说,一个重要依赖便是“语料”。大量开发者带来足够多的用户频繁使用语音功能所积累的语料,让百度语音有机会被不断训练,进而提升了准确率、抗噪率、语义识别准确性,不断获得完善。同时也搭建了有效获取用户的生态系统。

在今年的百度世界大会上,百度首席科学家吴恩达就现场演示了百度新一代语音识别技术。测试显示在比较嘈杂的环境下,机器识别已经超过人类。百度语音识别率接近95%,成为目前世界上最先进的汉语语音识别技术。日前资料显示,百度的汉语安静环境普通话语音识别技术的识别相对错误率比现有技术降低15%以上,识别率已接近97%。而从95%-99%是量变到质变的过程,这也许会彻底改变人与设备的交互方式。

语音技术的这一突破与百度开放的思维与模式是不无关系的,包括成立联盟将专利拿出来分享,都是以一种更为开放的心态希望能够共享语音技术成果,推动技术的进步和语音产业发展,服务于移动时代。这是一条朴实的道路却有孕育创新与颠覆的泥土。

联盟下的中国式颠覆

所谓颠覆式技术,就是说有一种技术可以取代原有技术,让人类需求更好的实现,语音识别也是如此。在2011年之前,语音识别技术主要是采用混合高斯模型。2011年深度学习技术引入语音识别领域,并推进了整个工业界的人工智能技术应用进入深度学习时代。

而随着物联网、车联网的发展,将会有越来越多的设备对语音控制提出需求,因为语音识别是以一种非物理接触式的交互方式,让机器拥有真正的“听觉”,使人们甩掉键盘。这将解放用户的双手,节省用户的时间和体力,以百度新闻的语音播报为例,借助于自然语言处理技术生成新闻的摘要,在信息严重过载的今天,无异帮助用户提高了信息获取的效率。因此未来语音识别功能将向电脑芯片一样,成为每个智能终端必备的能力。并实现人机交流之上智慧生活的重要切入口。

语音联盟让我想到了过去英国的ARM,它将技术专利开放出去,打破了技术垄断,现在全球超过95%的智能手机和平板电脑都采用ARM的技术架构,让各家企业都能享受到性能高、成本低、能耗低的芯片技术,让老牌芯片制造商intel备受挑战。

同样,语音联盟也许就是下一个中国式颠覆,未来通过分享语音技术专利及成果,可以在人工智能、移动互联网、智能终端、智能家居、可穿戴设备等领域深入发展。比如用于声控语音拨号系统、信息网络查询、医疗服务、银行服务等,为更多产业上下游企业提供更多尖端技术,带动智能语音以及相关产业的发展,形成新的业态与增长点。

语音联盟通过开放式创新与开放式知识产权许可的结合,共享语音技术成果,孕育出一个连接各种智能硬件设备并且提供各式各样服务的语音交互新平台。甚至可以想象除了技术之外,语音识别这种富含人类情感的交流方式,未来的发展也许不仅仅是一个帮助我们解决问题的功能和应用,更是科学计算中情感与文化的承载与体现。

个人微信公众号:太保乱谈,对游戏感兴趣的朋友可关注:toutiaoyouxi