AI简介
这是一本深度探索计算机视觉领域中图像场景内容理解的重要著作。本书从图像场景的语义理解、图像空间的几何理解、对象级场景解析三个方面进行详细阐述,旨在让计算机能够像人类一样理解图像场景中的内容,包括识别图像中的对象、理解对象的属性以及它们之间的空间几何结构关系。
书中首先介绍了图像场景内容理解的国际前沿研究热点,并明确了图像场景内容理解的目标是让计算机具有理解图像场景的能力,能够像人类一样理解图像场景中的内容。接着,作者深入探讨了如何快速准确地获得图像场景的语义分割结果,以及如何让方法更好地适应种类繁多的语义类别数据。
此外,本书还详细阐述了图像场景层次结构与遮挡关系,以及图像层次化表示方法,这些方法对于理解场景的三维结构具有重要的意义。作者还介绍了前/后背景划分方法,以及图像空间几何理解方法探索,这些方法对于处理图像层次化表示和推断出三维空间的结构和关系具有重要作用。
在对象级场景解析方面,本书讨论了对象级场景解析的难点,包括图像内容的“对象级”语义标记、根据“对象”分布规律迁移场景布局,以及图像场景的空间布局信息估计等。最后,本书概述了新一代人工智能将在智能制造、智能医疗、智慧城