突破图像识别技术,微软为小冰开眼

可以肯定的是图片识别技术的奇点就在各个垂直应用场景当中。

本文首发百度百家

文/开眼二郎(微信号:tmel0211)

记得,之前看过一篇文章中谈到人工智能的发展和成熟取决于三个要素,算法、大数据和应用场景。前两者不由分说,包括谷歌、微软、Facebook、百度、阿里巴巴在内的科技巨头都花费了大量的人力财力做研究,而在垂直应用场景里的行业特质挖掘和经验积累往往会被忽视。这就是为什么,很多黑科技是活跃在实验室里,并不能得到广泛的推广应用。不过,微软小冰,这个原本只是微软亚洲互联网工程院开发出来的一个产品,却在电子商务、智能家电、智能汽车,乃至航空航天领域等各个应用场景里得到了应用,而今又要登陆到即将发布Windows10操作系统当中,借助操作系统进一步融入人类社会。

过去一年来,微软小冰先后和京东、触宝、东航、海尔、壳牌等公司跨界合作,微软希望小冰成为互联网+人工智能框架,应用到各垂直细分行业的行业,从而为其打造全世界最智能的云计算平台铺路。这也是微软此项黑科技露面的最大不同之处,作为微软中国亚洲互联网工程院的产品,微软小冰一开始并没有上升到微软战略的高度,和大众对于微软小冰的了解是基于她的一次次跨界出台一样,包括微软CEO纳德拉乃至比尔盖茨都是在不断学习、摸索,认识到小冰的魅力所在。当下科技巨头所做的都是以面向大众的通用型产品为主包括搜索引擎、操作系统、APP、浏览器等,比较实用主义,只要是触网的人都会接触到。而微软小冰刚研发出来时候只是扮演的聊天工具角色,是基于算法和大数据的梳理、采集、整合,给用户提供个性化的聊天服务,在很多人眼里小冰就只是有点科技时尚感的人工智能代表,作为闲暇无聊时打发时间的玩伴还是蛮不错的,不过事实证明,微软小冰的脚步不止于此。

一、突破图像识别技术,垂直场景中普及

现在的人工智能大多停留在关键词程序匹配层级,简单的文字交互并不能满足日常人机信息交互的需要。然而,更高级的图像识别技术,尽管计算机识别技术已经突破,但尚且存在错误率较高的识别问题。这是因为,传统的图像识别技术主要基于统计学原理,依靠分析视觉数据的特性,借助统计学建模等数学分析方式提取出来,最后应用到图像当中,这种图像识别技术,目前主要在OCR文字识别、人脸识别、图像处理等领域,但这种识别技术实现的门槛比较高,我们提供的图片光线、像素、角度等问题都会造成识别不准确,对图像类型,质量等都有一定局限要求,故而这种技术还局限在个别刚需的垂直专业领域,比如医疗成像分析的疾病预测以及安防监控领域的嫌疑人指认等等。让机器能读懂图,人类能做到了,但是也清楚地明白图像识别技术的奇点还未到来。

在前天举行的人工智大会上,微软全球执行副总裁,同时也是图像识别技术领域的专家沈向洋向媒体介绍了微软小冰在图像识别领域的技术性突破。为了提高读图准确度,微软亚洲互联网工程院的专家们尝试用高维的数学模型和优化工具来解决问题,不像之前只抓取局部,而是以更立体的角度观察图像本身。这种高维的图像识别技术可以利用图片中的个别像素点而获取图像中物体的规则结构,比如楼房的窗户都是矩形,只要看到一层就可以看到整栋楼房的样子。这就使得这种读图技术更加立体精准。根据沈博士的描述,小冰的图像识别技术在imageNet1000挑战中错误率仅为4.94%,超过了人眼辨识。除此之外,微软为小冰构建了一套超越图像识别语义的人工智能评价系统,为了让用户形象的理解这一技术的意义所在,沈博士举了一个例子,假设一个图中有两只猫,小冰能识别出各是什么猫,但是还能和人一样紧跟着说一句“这小眼神太犀利了吧”的评价。这是基于小冰背后的必应搜索大数据为其提供的评价系统。区别于传统静态的图片识别,小冰可通过动态决策,自行寻找和把握影响的焦点和内涵,从而做出判断。

有分析称,图像识别技术之所以一直处于实验室的阶段,没办法普及的真实原因是还停留在个别应用场景当中,而没有为更多垂直化的应用场景提出解决方案。微软小冰并没有想一下子通吃整个行业,考虑的也是从各个垂直行业平台逐个爆出。就在此次大会上,微软小冰宣布和美图秀秀进行合作,在用户PS照片的硬场景需求下,小冰会发挥其识别衣服服装搭配的能力,而且准确度可达到87%以上,小冰的思路很简单,就是在具体的生活场景当中,赋予人工智能以判断意识,并发挥其情感监测功能。根据用户拼图的角度和亲密度,判断用户图片中的人物关系。这种垂直延伸,会把图像识别技术在场景化的应用解决方案提升到通用层次,也给这项技术在各垂直行业的应用指明了方向,不过是否达成绝对的智能化识别,达到搜索引擎的智能匹配级别,恐怕还有点难度,但可以肯定的是图片识别技术的奇点就在各个垂直应用场景当中。

二、嫁接入Windows10,逐步走向通用

那么,掌握图像识别技术的微软小冰会如何被更多人接受呢?此次Windows10嵌入的微软小冰,正是把微软小冰铺向整个桌面革命的起点。此次微软Windows10,把小娜和小冰聚在了一起,小娜是微软发布的全球第一款个人智能助理,能够根据用户的喜好和习惯来回答问题,进行日程安排,还可以用来语音唤醒等,更偏向办公助手,而小冰是一款人工智能伴侣虚拟机器人,重在休闲娱乐。这对姐妹花出现在Windows10系统当中,对小娜而言是一次跨越升级,因为纯粹做智能助手,常常会被误读,比如小娜的语音助手功能就一度被认为是Siri的PC版本,充其量只是个工具罢了,具体实用价值还有待考证,而有了黑科技范十足的小冰加入,会给小娜提供更多的潜在用户流量,帮助小娜从“功能”逐渐向“工具”转化。

此次Windows10的发布,给了微软姐妹花一个很显眼的入口,预示着小娜小冰的智能交互已经趋于成熟,开始尝试向通用化阶段应用。微软小娜作为办公工具在Windows10系统中出现还能够理解,微软小冰一款主打聊天交互的软件,任何体验感上的瑕疵都会造成用户的Windows10体验降级,所以在决定嵌入微软小冰前,微软肯定是做好十足的准备的。通过一年以来的跨界合作,微软在全国范围内集聚了一大批粉丝群体,品牌知名度积累到了一定层次,据微软亚洲互联网工程院院公布的数据,小冰与每一个人类用户现的平均对话轮数为16轮,说明小冰作为人工智能聊天机器人已经足够成熟,这应该也是微软能够放心给予小冰平台接口的信心所在。另外,智能助理适用于PC端、移动端甚至可穿戴等多个智能平台,未来发挥的也会是硬件软操作系统的价值,业界苹果、谷歌、Facebook等都在不遗余力,微软自然不可能缺席。

三、情感机器人的未来,能读懂人心?

此前,微软小冰之父李笛在接受媒体采访时称,微软小冰的愿景是成为类似人工智能电影《her》当中的萨曼莎,完全和个人的工作、生活、情感等细微层面融为一体。但,真正实现机器意识化,恐怕不是一件易事。

不过,此次在图像识别技术领域的突破,让微软小冰掌握了立体化观察事物,在动态决策中回馈事物,然后再基于情感进行意识化情感判断。小冰的智能聊天服务已经突破了一问一答简单的交流模式,而是进入了一个自我进化的过程,小冰会采取动态决策的机制,跟用户交流,可以调动数据,根据记忆,来判断用户此刻的心情,从而做出相应的回答。

看得出来,小冰依赖于技术本身,又超脱于技术。关于人工智能,人类想象的翅膀就一直张开着,人造人、会思考的机器等科幻题材一直饱受喜欢,然而这些黑科技未必能立马实现,反而会在现实的骨感当中打击人类的信心。关于此微软小冰做了突破尝试,把“感性”的情感连接放在第一位,再把人机间的执行命令交互放在其二,应该说是对人工智能的重新定义,不仅局限于语义学,而是基于搜索引擎、大数据、和机器学习的情感、记忆、决策等方法,以更现实地姿态在为人工智能的社会化普及努力着。未来机器意识化程度会越来越高,将来有一天能读懂人心也未可知。

---------------华丽丽地分割线--------------

新思维、新视角,力求独特,帮您劈开脑海,淬炼新思维,扫描关注我,或者搜索“kjsiwei”,敬请关注!

热门文章HOT NEWS