上海市智能信息处理重点实验室
  Shanghai Key Laboratory of Intelligent Information Processing


计算视觉 English


    视觉是人类获取信息的重要途径。我们中国人的成语“百闻不如一见”和西方人常说的“One picture is worth ten thousand words”表达的就是这个思想。计算视觉的研究成果使机器具备了人类视觉的某些能力,同时也使人类在机器的协助下看得更清楚、更准确。国内外有很多高校、研究所、企业都在开展这方面的研究。本研究组致力于研究和探索光学成像、图像分析与理解、可视化与视觉心理学领域的富有意义的、富有挑战性的、有趣的问题。

三维重构
    我们生活在一个三维的世界里。人类的双眼具有立体视觉。从平面图像中获取物体的三维几何信息是计算视觉的一个重要研究方向,称作三维重构。
    本研究组2007年的一项研究成果运用特征点的 极线几何意义下的运动,完成双目图像中的特征点轨迹的匹配,实现三维重构。该方法可以对游弋个体群和动态形变表面进行三维重构。

 

图像纹理分析
    图像区域中像素值不均匀分布所产生的视觉效应通常称为图像纹理。纹理展示了被拍摄物体表面不均匀的光学特性。不同材质的表面通常具有不同的纹理。纹理分析是模式识别和计算视觉的一个重要研究方向。
    本研究组2006年的研究成果 统计地形特征 具有优异的纹理分辨能力,在Brodatz纹理全集上的正确分类率达到了94%。该方法首先把图像的灰度值看成图像平面上的高度,在图像平面 与灰度轴所构成的三维空间中即为曲面,然后用一个可变高度的平面去裁截该曲面,得到上下两组山形体。通过对山形体的几何特征的统计,得到图像纹理特征。
    1995年提出的 统计几何特征 (完成于英国南安普敦大学)在多个领域得到了应用。

 

形状分析
    几何外形是物体的重要特征。 不同物体通常具有不同的外形。形状分析是模式识别和计算视觉的一个重要研究方向。
    本研究组2007年提出用等边多边形逼近平面形状,然后用 等边多边形的内角链码 作为描述。该方法具有平移、缩放和旋转不变的优点。
    2004年提出 相连等长线段 作为平面曲线的表示,实现具有平移、缩放和旋转不变的描述和匹配。

 

模式分类
    识别是智能的基础。同类事物的共性和异类事物的差异使识别成为可能。模式分类是模式识别的一个重要研究方向。
    本研究组2007年提出 最近特征线段, 首先用线段两两连接同类样本点,得到每类的特征线段子空间。待分类点的类别由离该点最近的线段的类别决定。所得到的特征线段可以对照异类样本占据的地域进行删除优化。 该方法等效增加了样本点的数量,同时具有使样本分布趋于中心的功能。
    2006年提出 凸轮加权距离, 根据待分类点附近的样本点的分布自适应性地决定距离函数,能够充分发挥有效样本点的贡献同时抑制干扰样本点的作用。
    1994年提出的 生成收缩算法 PDF(完成于英国南安普敦大学)是一个构建性的人工神经网络学习算法,具有保证的收敛性。通过一个参数的调节,可以实现等距离泛化和等角度泛化。

 

人工生命
    什么是生命?这个问题吸引了古今中外无数优秀的大脑。人工生命的成果有益于探索生命现象的本质,同时也为从生物世界中寻找有益的启示架设了桥梁。
    本研究组2005年研究成功 人工爬虫群。 它们生活在图像平面上以像素灰度值为高度的三维地形上。人工爬虫群的演化特性反映的图像纹理的特征。人工爬虫群通过简单个体之间以及与环境的互动涌现出复杂的智能行为。

 

三维分形动画
    数学和艺术相关吗?答案是肯定的。分形几何给我们带来了地球上难以找到的美景。
    1997年研制的软件FractMovie(完成于新加坡南洋理工大学)可以实时渲染采用三维叠代函数系统生成的分形群所构建的景观。分形小镇(The Fractal Town,完成于新加坡南洋理工大学)是用该软件制作的一个作品。

 

                                       计算视觉研究组
                                          2008年1月