上海市智能信息处理重点实验室
  Shanghai Key Laboratory of Intelligent Information Processing


计算视觉 English


    视觉是人类获取信息的重要途径。我们中国人的成语“百闻不如一见”和西方人常说的“One picture is worth ten thousand words”表达的就是这个思想。计算视觉的研究成果使机器具备了人类视觉的某些能力,同时也使人类在机器的协助下看得更清楚、更准确。国内外有很多高校、研究所、企业都在开展这方面的研究。本研究组致力于研究和探索光学成像、图像分析与理解、可视化与视觉心理学领域的富有意义的、富有挑战性的、有趣的问题。

三维重构
    我们生活在一个三维的世界里。人类的双眼具有立体视觉。从平面图像中获取物体的三维几何信息是计算视觉的一个重要研究方向,称作三维重构。
    本研究组2007年的一项研究成果运用特征点的 极线几何意义下的运动约束,完成双目图像中的特征点轨迹的匹配,实现三维重构。该方法可以对游弋个体群和动态形变表面进行三维重构。

 

图像纹理分析
    图像区域中像素值不均匀分布所产生的视觉效应通常称为图像纹理。纹理展示了被拍摄物体表面不均匀的光学特性。不同材质的表面通常具有不同的纹理。纹理分析是模式识别和计算视觉的一个重要研究方向。
    本研究组2006年的研究成果 统计地形特征 具有优异的纹理分辨能力,在Brodatz纹理全集上的正确分类率达到了94%。该方法首先把图像的灰度值看成图像平面上的高度,在图像平面 与灰度轴所构成的三维空间中即为曲面,然后用一个可变高度的平面去裁截该曲面,得到上下两组山形体。通过对山形体的几何特征的统计,得到图像纹理特征。
    1995年提出的 统计几何特征 (完成于英国南安普敦大学)在多个领域得到了应用。

 

形状分析
    几何外形是物体的重要特征。 不同物体通常具有不同的外形。形状分析是模式识别和计算视觉的一个重要研究方向。
    本研究组2008年提出一种新颖的形状特征——雷顿组合特征,首先对表示为二值图像的形状进行雷顿(Radon)变换,然后通过付利叶变换等提取形状特征。该方法具有内在的旋转、缩放、平移不变性,对噪声干扰具有很高的鲁棒性。在大规模复杂形状集上的检索分类性能显著高于当时最好的方法。
    2007年提出用等边多边形逼近平面形状,然后用 等边多边形的内角链码 作为描述。该方法具有平移、缩放和旋转不变的优点。

 

模式分类
    识别是智能的基础。同类事物的共性和异类事物的差异使识别成为可能。模式分类是模式识别的一个重要研究方向。
    本研究组2007年提出 最近特征线段, 首先用线段两两连接同类样本点,得到每类的特征线段子空间。待分类点的类别由离该点最近的线段的类别决定。所得到的特征线段可以对照异类样本占据的地域进行删除优化。 该方法等效增加了样本点的数量,同时具有使样本分布趋于中心的功能。
    2006年提出 凸轮加权距离, 根据待分类点附近的样本点的分布自适应性地决定距离函数,能够充分发挥有效样本点的贡献同时抑制干扰样本点的作用。
    1994年提出的 生成收缩算法 (完成于英国南安普敦大学)是一个构建性的人工神经网络学习算法,具有保证的收敛性。通过一个参数的调节,可以实现等距离泛化和等角度泛化。

 

三维分形动画
    数学和艺术相关吗?答案是肯定的。分形几何给我们带来了地球上难以找到的美景。
    1997年研制的软件FractMovie(完成于新加坡南洋理工大学)可以实时渲染采用三维叠代函数系统生成的分形群所构建的景观。分形小镇(The Fractal Town,完成于新加坡南洋理工大学)是用该软件制作的一个作品。

 

                                       计算视觉研究组
                                          2009年6月