DingDong!人类从此踏上了“狂虐”AI的旅程……

时间线君邪恶的安利一下,如果你的老板难缠、女朋友难搞,来一盘烧脑什么都解决了,反正机器人不嫌烦。

【时间线君注】本文首发《时间线》杂志百度百家专栏,转载请注明作者和来源。

作者:刘楠

以下是一个人和一台机器的对话:

——叮咚,外面雾霾好大呀,赶紧打开空气净化器吧!

——好的,已经为您打开。

——叮咚,这屋子里怎么这么干呀,打开加湿器才好呢!

——好的,已经为您打开。

——对了,我想听张学友的《飞的更高》

——对不起,张学友没有唱过这首歌,您是想听汪峰的《飞的更高》,还是想听张学友的歌?

——汪峰的吧。(《飞的更高》歌声响起)

——我明天要回家,帮我订一张车票吧。

——好的,您是要坐飞机还是坐火车呢?

——飞机吧。

——好的,已经为您查询到所有航班。

——我要国航的。

——好的,已经为您找到所有国航航班。

——我要最便宜的。

——好的,已经为您选中最便宜的车票。

——嗯……还是不了,我想坐高铁回去。

——好的,请问您选一等座还是二等座?

——一等座。

——您确定预定最早的车次吗?

——确定。

——好的,已经为您预定2015年12月22日早7:35返回合肥的高铁票。

什么什么?你以为时间线君在写未来人工智能的小说?No,No,No,我赌十块钱这不是小冰。你想调戏小冰唱歌,她只会打个岔说个话,小心给你讲个鬼故事。

以上是在科大讯飞2015“A.I.复始 万物更新”新品发布会上发生的一段人机交互演示,这个会说话的家伙叫做DingDong,是个智能音响。

科大讯飞董事长刘庆峰在发布会上表示,人工智能未来会像水和电一样无所不在。计算智能、感知智能和认知智能是人工智能的三个层次,以语音和语言为入口的认知智能革命是当前突破人工智能的重要切入点。目前,认知智能的三大核心支撑能力是人机交互、知识管理与推理学习,讯飞超脑2.0正是围绕这三方面来持续展开的。

老板要求太多,来一盘烧脑

科大讯飞一直专注于研究智能语音及语音技术、软件及芯片产品开发和语音信息服务,语音识别、语音评测、语音合成等技术都处于行业前列。“讯飞超脑计划(Hyper Brain)”在去年8月首次发布。

在科大讯飞承担的科技部人工智能领域第一个示范性标准重大项目“类人答题机器人项目”中,讯飞超脑计划的目标就是,要让机器从“能听会说”到“能理解会思考”,而且在不久的将来可以参加高考并考上一本院校。

能主动提问、对结果反问、被抢话打断还能立刻接话、持续聆听、前后反应不间断、拥有长时间记忆和强大的背景知识,这是我们能想到的所有关于人机智能交互的体验。没错,今天被一个叫做DingDong的家伙实现了,文章开篇的就是ta跟美女倩倩在发布会上的对话和操作。

刘庆峰认为,在万物互联的浪潮下,以语音为主,键盘、触摸为辅的人际交互时代已经到来,对人机交互也有更高的要求。但是,目前大多数设备没有屏幕并且与用户之间有一定的距离,而且多方交互的即时需求越发明显。为了满足多方需求,科大讯飞发布了具有里程碑意义的人机交互新产品AIUI,定义了“万物互联”时代的人机语音交互标准,其基本能力应该包括三方面:远场识别、全双工、多轮交互。

AIUI集成了科大讯飞一些系列尖端科研成果和完善服务,包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和内容服务等。开发者将可以一键获取解决方案,通过集成麦克风阵列、集成SDK以及定制云端服务等方式。

多轮交互实现了机器对上下文的连贯理解,使得人机交互不再是单调的一问一答,而是可以连续交流、间断交流。对话纠错机制使人可以随时纠正对话中双方的错误,不用多次重复输入指令。这些技术都极大降低了环境、说法、方言、习惯等对人机交互的干扰,实现了高度自然的人机交互体验。

DingDong音响就是这样一个产业化应用,作为一个载体,它不仅可以用来听音乐、操控家居,还可以帮助完成各种助理的事务。目前,这款智能音箱已经开始在市面上销售。

时间线君邪恶的安利一下,如果你的老板难缠、女朋友难搞,来一盘烧脑什么都解决了,反正机器人不嫌烦。

所听即所见,速记员要失业了

现场两块大屏幕上“嗒嗒嗒”出现的字让时间线君很是惊奇,难道怕后面的观众听不到来分分钟跟速记,不用这么贴心吧?

“这是讯飞听见全球首次会议字音同步直播。”什么什么?竟然是即时语音转写,我可以说演讲人的普通话不标准么。

在大屏幕上,识别出来的字先是红色,等到演讲人说下一句话的时候,这句话自动断句并检测,如果没问题就变成白色,一条过。如果因为发音不标准或出现方言而使字音识别出现不确定的字词,那么红色字词会闪两下,通过上下文识别后自动修正。

太神奇了有没有!看到这里,时间线君脑洞又开了一圈——隐隐的想到,是不是以后可以偷懒不用整理采访录音了。

果然。

针对大型会议、现场采访、个人交流等场景下的内容整理需求,科大讯飞集成了单麦克解混响技术、阵列解混响技术、口语化识别等技术,全球首发智能“软件+硬件+服务”于一体的语音科技产品“讯飞听见”,包括手机APP(录音宝)、PC端网站和智能硬件(录音笔)。购买录音笔还配送各种服务。

据刘庆峰介绍,录音宝、录音笔与讯飞听见网这三款新锐产品,将与讯飞输入法(2.8亿用户)、灵犀语音助手(1.2亿用户)、DingDong智能音箱(2015年市场份额最大的WiFi音箱)、智学网、E听说一道,构成科大讯飞的To C产品线第一阵营。目前,录音宝产品已经有了超过100万的用户。

听到这里,时间线君只想贱贱的笑一笑,以后整理采访速记省出来的时间可以睡觉了。

妈妈再也不用担心我的学习了

教育产业也是科大讯飞将自身科研成果产业化最成功的领域之一。

在中小学课堂上总是出现各种不满意,进度快的学生对已经熟练掌握的习题不愿意再听,进度慢的学生总是希望老师能再多讲一遍,而老师对前一天布置的作业只能等第二天学生交上来批改后才能判断哪个知识点需要重点跟进。总之,“老师忙、学生盲、资源茫”,这已然是教育行业的一个困境。

科大讯飞推出的高科技教学与考评产品,实现了语音与文字的识别、合成与分类,同事实现智能批改、全科阅卷、资源库自动建设等真正具备“人工智能”的产品目标,为实现个性化教学提供了有力支撑。目前,全国已经有31个省市的8000万师生在使用这些产品。

“如果你问我未来20年最重要的技术是什么,毫无疑问,我会告诉你就是人工智能。”这是凯文·凯利先生在新书《必然》中的明确表述。在“万物互联时代”,人机交互将成为人类生活的新常态,人工智能技术的突破是用来延伸人类能力而非替代人类。人工智能将使人类更幸福、更富想象力和创造力。

热门文章HOT NEWS