【猎云网(微信号:ilieyun)】4月26日报道(编译:燈桀)
自从神经网络在2012年复兴以来,机器视觉一直是AI研究人员和企业用户学习和创新的领域。同时,深度学习也让机器视觉完成了一项项看起来天方夜谭的任务。如今,各大企业已经将这项技术迅速变为了商业资产。
Clarifai是一家行业领先的机器视觉公司,主要提供视觉智能API工具。最近,它们家的产品被用在了棒球比赛中,通过分析数百张粉丝的照片,能确定他们什么时候能够抓到球员投过来的“幸运之球”。另外,Clarifai开发的视觉分析工具还能检测出最有希望能够带回这一纪念之球的座位号。从商业角度来看,这些数据可以帮助企业制定更为有效的分级定价策略。
这类技术同样适用于暴雪的纸牌游戏。通过观看多个回合的比赛,AI理解了游戏之后,甚至能做出实时点评。在“黑客马拉松”中,开发人员将Clarifai的视觉API工具用在了Tinder的交友配对当中。这些算法参考了其中一位开发人员的个人喜好,直接帮他匹配到合适的对象。
Clarifai创始人兼CEO的Matthew Zeiler解释说:“用户定制化是我们考量的重点。你可以告诉平台任何你想要辨别分析的对象,即使你身处一家大公司,这一方法也同样适用。”
事实上,许多大公司也已经与Clarifai达成合作,以加快照片搜索和数据分类此类的工作。数字媒体巨头 BuzzFeed采用视觉智能来协助网站编辑找到于文章匹配的图片;Clarifai的另一个倡导“自然之美”化妆品客户,通过视觉智能来寻找不化妆的时尚女性,并与之合作来推广品牌。
不过,Clarifai并不是唯一一家押宝视觉智能的公司。谷歌、微软、IBM,Salesforce之类的巨头,还有GumGum和Ditto等小型企都有在提供相类似的服务。Google Cloud Vision API让用户能够轻松地整理照片;亚马逊的Rekognition让开发人员能够将面部识别系统嵌入App中,并且统计用户的浏览记录;GumGum则是通过社交平台、流媒体以及主流赛事等渠道为企业提供品牌推广服务。
Zeiler表示:“机器视觉的下一个发展阶段,就是能够展现出你的产品在世界上是如何被使用的。”
不过,挑战仍然存在,特别是在品牌数据方面。例如,许多零售商都会用白色背景来拍摄产品图片。虽然可以研发出一种算法来识别产品,但是一旦产品被摆在了真实世界中,被花花绿绿的背景干扰到,那么这种算法就难免可能会出现偏差。
Zeiler提到,平台不会像一个AI专家一样,自动收集数据。它应该是一个贴近生活的,了解生活方方面面的“寻常人”。为了实现这一点,Zeiler和他的团队正在改进技术,让其开发工具更为人性化,并且使用的范围更广。
此外,另一个挑战是缺乏高分辨率图像。许多品牌都在追捧AI的自动仿冒品检测功能。不过,仿冒品和真品之间的区别是非常微妙的,钱包扣或鞋带上的轻微变化在低分辨率照片中可能根本无法被识别出来。许多时候,人眼都难以发现的地方又怎么能够依赖于机器视觉呢?
Zeiler认为,能并行处理多种类型数据的多模态神经网络是下一个创新重点。他指出,“融合多种类型数据十分困难。并且,多功能神经网络的性能比不上单一数据类型网络的处理能力”。但是,如果能够一次性分析产品的多个方面,比如图像、描述、价格、用户反馈、视频效果等等,那么这就价值斐然了。Zeiler希望,未来能够实现一次性完成10种类型数据的分析处理。
虽然,科技巨头们一直在抢购像Orbeus,Alchemy和MetaMind这样的AI创业公司,以赶上AI大潮。不过,Zeiler认为,从各个方面为客户考虑,满足他们的需求能帮助Clarifai保持竞争优势。
“谷歌制作互联网气球,自驾车,文字处理器,电子邮件客户端,当然还有搜索和广告产品。拥有如此多的部门,会互相争抢客户数据资源。”如果广告主十分看重他们的专有数据,那么可能就不一定会和谷歌合作,将数据发送到云端中了。同样,亚马逊也可以从其他零售商的数据中学习,并直接与他们竞争。
“Twilio是独立通信公司;Stripe是独立支付公司;Spotify是独立音乐公司。我们相信,Clarifai也将成为独立的视效公司,”Zeiler总结道。