项目介绍

计算机视觉是一门研究如何使机器“看”的学科，更进一步的说，是指用摄像机和电脑代替人眼对目标进行识别、跟踪和测量等，并进一步做图形处理，用电脑处理成为更适合人眼观察或送给仪器检测的图像。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界，具有自主适应环境的能力。

面向图像的多元化理解是计算机视觉学科中的重要研究内容，主要解决目标跟踪、目标检测、语义分割以及实例分割等计算机视觉相关问题，其中，目标跟踪是追踪某个特定物体位置信息；目标检测是判定一组图像数据中是否包含某个特定的物体，图像特征或运动状态；语义分割试图在语义上理解图像中每个像素的角色（比如，识别它是汽车、摩托车还是其他的类别；实例分割则将不同类型的实例进行分类，比如用 5 种不同颜色来标记 5 辆汽车。

面向图像的多元化理解在制造业、工业检验、文档分析、医疗诊断、军事目标跟踪、智能驾驶等领域具有广泛的应用。