对人类来说,不仅可以用眼睛“看”周围环境中的事物,而且可以“认识和理解”这些事物,对这些事物形成“认识和决策”。现在,国辰科技的技术人员正试图让AI也这样做。从人类三维视觉出发,三维视觉智能已经成为人工智能研究和应用的一个热点领域
说到机器视觉,我们对许多基于人类多种感官的人工智能技术并不陌生。其中,视觉感知是一个非常重要的部分。机器视觉中的许多技术已经在工业上得到了很好的应用,随着应用的深入,越来越多的机器视觉技术进入了“三维视觉智能”阶段。我们的眼睛不仅要看的清楚,知道的东西,而且要走进场景,真实地感受三维世界中的场景,就像我们在场景中一样。这就需要三维空间感知和认知能力的智能,即三维视觉智能。三维视觉智能将计算机图形学、计算机视觉等领域的技术与传统的人工智能、学习、大数据等相结合
让机器人不仅能看到,还能理解,机器人安装LMI(利用结构光获取三维模型信息的主动传感器)扫描螺杆,可以获得目标物体的全方位三维数据。机器人规划自己的扫描路径,直到最终获得完整的三维模型。
不仅要获得场景的完整三维数据,而且还要认识每个物体到底是什么,要去理解场景里的每个物体,获取物体的语义信息。同样的道理,认知的过程必须形成一个闭环,机器人的实时决策能不能根据现有的三维数据对这个物体进行识别。如果不可以,就要走到新的角度去获取数据。
让机器人具备决策和执行力,替人类完成更多工作
通过三维视觉与人工智能技术的结合,我们让机器人更加智能化与功能化,让机器人做更多人在现实生活中能够做的事。机器人具备现场自主决策和执行的能力,比如在工业流水线上可以帮助组装配件,物流场景中搬箱子等。这样的应用,涉及到非常精细化的技术,比如准确高效的运动规划,还有各种各样的控制,智能的执行等。