270万骑手撑起一个美股IPO,市值超12亿美元
270万骑手撑起一个美股IPO,市值超12亿美元
创业板最牛新股来了!首日大涨1700%,市值245亿
创业板最牛新股来了!首日大涨1700%,市值245亿
经纬投出一个厨具IPO,开盘大涨64%
经纬投出一个厨具IPO,开盘大涨64%
疯狂的新车:9月共54款,油电比例2:3,Model Y成标靶
疯狂的新车:9月共54款,油电比例2:3,Model Y成标靶
立即打开APP
都保杰
私信
12

全栈3D视觉交互技术,Untouch赋予智能设备与人、与场景的视觉交互能力

2017-07-10
早期项目
3D手势识别、3D人脸识别、运动跟踪SLAM、场景重构。

【猎云网(微信:ilieyun)北京】7月10日报道(文/都保杰)

人机交互方式经过半个多世纪的技术迭代,越来越朝着人性化的方向发展,业界普遍认同的观点是继键盘、鼠标和触控操作之后,在人工智能时代,AI语音交互将会成为新一代主流人机交互方式,人们正在通过各种技术手段力图让身边的智能设备越来越像人。

现阶段,语音交互技术已经成为全球热潮,智能设备逐渐具备了听和说的能力,然而语音技术应用场景毕竟有限,如何让设备看见并认知这个更立体的世界呢?Untouch(未动科技)通过自主研发的3D视觉AI交互技术让这一步成为可能。

插图1

Untouch(未动科技)创始人兼CEO孙铮说:“为什么我们选择做这个项目呢?其实这是早在2010年就看到的技术趋势,当时无论是学术界还是工业界都有一个预判就是未来的智能化会体现在“云和端”,在“端”侧会有两个重要技术方向——视觉和语音。现在终端手机、机器人、无人机等所谓的智能化,就是设备能像人一样感知这个世界,人工智能虽然还没达到人们的预期,但起码在和人的交互上能够更便捷,人有耳朵有眼睛,我们考虑更多的是眼睛。”

Untouch(未动科技)成立于2014年,是一家toB的技术型公司,公司的定位是基于智能视觉交互技术,赋予新型消费级智能设备与人、与场景的视觉交互能力,日前,Untouch刚发布了旗下4款3D视觉交互产品:黎曼平台—3D手势识别,欧拉平台­——3D人脸识别,笛卡尔平台——运动跟踪SLAM,及高斯平台——场景重建。

黎曼平台—3D手势识别

黎曼平台基于深度图,可实现高效精准的3D手势交互功能,可以为智能手机、机器人/无人机、AR/VR等设备提供手部23个关节点识别与26自由度追踪,最大帧率90fps,支持安卓、Linux、Windows等操作系统,通过手势完成人机互动。

与传统的手势识别技术相比,黎曼平台采用了深度学习算法LSTM(Long Short-Term Memory),把手势动作当做一个时间序列来处理,大幅提高了识别精度与运算效率,延迟小,抗自遮挡,支持预定义手势,可定制化。另外,传统手势识别产品基于PC,而黎曼平台经过深度算法裁剪与工程优化,使得3D手势识别可以流畅精准地运行在手机等移动设备上,小型化、嵌入式是一大亮点。

插图3

据悉,全球著名的ToF深度传感器厂商PMD日前宣布选择Untouch(未动科技)的黎曼平台作为中间件为客户提供非接触式的交互方案,双方合作推出了完整的手势识别软硬件一体方案。PMD公司是全球唯一将深度传感器成功植入手机的ToF技术提供商,也是Google Tango项目3D传感模块的主供应商。

欧拉平台:3D人脸识别

欧拉平台可实现人脸的实时建模与3D特征识别,对人脸3D表情进行实时追踪、识别与分析,识别准确度高,防欺骗性强。除了身份识别验证与表情分析,欧拉平台还可以让用户建立自己的头像,体验更有趣、好玩的社交体验。

插图4

这项技术有什么应用场景?孙铮举例说:“据外媒消息透露,苹果的iPhone8将配备3D深度摄像头,除了进一步升级移动端的交互方式,3D人脸识别在加密技术方面相对更安全,3D需要建一个跟人脸精准匹配的模型才能通过分析测试。此外,3D人脸识别技术在手机拍照、图像美化等方面也都有很大用途。”

笛卡尔平台:运动跟踪(SLAM)

笛卡尔平台可实现空间计算与位置追踪功能,可以为智能手机、机器人/无人机、AR/VR等提供6 DoF inside-out位置追踪、路径规划软硬件解决方案,拥有厘米级别精度、低延迟、低功耗的特点。视觉技术与激光定位导航相比哪个更具有优势?孙铮表示视觉导航技术算法比较复杂,但是更便宜一点,而激光雷达成本十分昂贵,两项技术各有优缺点可以优势互补,比如说自动驾驶汽车就需要集成几十个sensors,不仅包括视觉和激光的定位导航,可能还需要超声波、红外线等等,优劣势还是需要根据产品的具体需求而论。

插图5

高斯平台:场景重构

高斯平台基于深度摄像头与RGB摄像头,可实现实时的空间计算,重建与渲染出真实的物理场景结构,从而实现障碍物躲避、AR追踪、三维重建等功能,为计算设备的判断与决策提供可靠的三维场景信息。比方说,机器人在室内要拿起桌子上的一个水杯,机器人首先需要知道桌子在哪儿?水杯是什么?而不是有障碍物只做规避动作,高斯平台可以让机器人通过视觉技术扫描出整个房间的3D模型,赋予机器人看见感知空间环境的能力。

插图5

随着人工智能时代的演进,语音交互跟视觉交互那个应用前景更好一点?孙铮认为:“终端的智能化在未来5到10年会发生颠覆性的变化,只能说两项技术的市场空间和前景都非常巨大,就好比人的眼睛和耳朵一样我们不能说那一方面更好,两项技术之间其实更多的是合作需求。”

据了解,Untouch(未动科技)创始人兼CEO孙铮早年曾是全国数学奥林匹克竞赛获奖者,保送北大数学系,在数学领域做了多年学术研究,其发现的数学定理被国际数学权威著作命名为“孙氏定理”。 后离开学术界去工业界发展,拥有17年跨国高科技企业工作经验,历任爱立信瑞典高级系统工程师,中兴西欧区副总经理、中兴芬兰分公司总经理、微软中国移动事业部总经理。CTO吴昊来自于微软亚洲研究院,是机器视觉方面的专家,研究方向覆盖多目视觉,计算摄影学等。COO柳莎莎拥有超过10年的高科技企业工作经验,曾任职微软全球消费者产品集团运营商渠道部总监,对产业链及商业运作认知深刻。团队成员多来自于微软、中科院、清华、北大等。

Untouch(未动科技)成立于2014年,2015年完成数百万人民币天使轮融资,由英诺资本及大河资本领投,2016年底完成数百万美元Pre-A轮融资,汉能创投独家投资。

 

产品:黎曼平台、欧拉平台、笛卡尔平台、高斯平台
公司:北京未动科技有限公司
网址:http://www.untouch-tech.com

猎云网APP阅读全文

体验更加

猎云网

微信扫码关注猎云网

  1. 猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权;
  2. 转载时须在文章头部明确注明出处、保留官方微信、作者和原文链接,如:转自猎云网(微信号: lieyunjingxuan )字样;
  3. 猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
  4. 联系猎云,请加微信号:jinjilei
猜你喜欢
长按图片可以分享给好友
×