机器视觉的发展前景
1.3D重构 (Stereo image或是Depth map): 目前最吸引眼球的或许是基于深度感应器的微软Kinect fusion。其他还有基于SfM (Structure from Motion) 的应用,比如说Google地图或是一些通过视频重构物体的应用。其余相关的还有虚拟现实技术(Augmented Reality),很多手机或是掌机(3DS)的游戏都引入了一些作为卖点(据微软Youtube官方放出视频,Xbox720很有可能结合Kinect对整个房间环境全局投影获得最大视觉效果)。
2.识别(图像类别识别、场景识别、人脸等):个人感觉图像识别应该是计算机视觉一直以来的主流方向,机器视觉学习的理论和算法也在此得到最大应用。图像识别系统在生活中也算是屡见不鲜,就先不做阐述了。视频方面的运动识别近年来也得到挺大的发展,也归功于光流或是其他运动检测算法的提升。无论从导航还是监视系统都深受其益,应该也是比较有趣的话题。手势或是姿势识别最近也有很多应用,当然主要来源还是微软,近期传言还会推出一种'跨时代'的手势识别系统(Leap Motion),看起来是个很强大灵敏的手势感应设备?。
其他能想到的还有追踪(Tracking),影像纠正和全景图(Image rectification),图像分割(Image Segmentation)?。曾经更多是属于图像处理,但这些技术近几年引入机器学习算法因此得到了效率和准确率上的大幅提升。
对机器视觉学习本身有兴趣的人或许可以从简单的分类器(Nearest Neighbour, Naive Bayes)到现有比较热的SVM,Random Forest等学习,了解最优化(Optimisation)相关的理论对理解整个机器视觉学习也至关重要。