人的眼睛有600万到700万个锥体细胞,其中包含三种被称为视蛋白的对颜色敏感的蛋白质之一。当光子击中这些视蛋白时,它们会更改形状,引发级联反应,产生电信号,进而将信息内容内容内容传递给大脑进行解读。 整个过程是一个非常复杂的现象,并且使机器在人类层面上解释这一点一直是一个挑战。现代机器视觉系统背后的的关键动机在于模拟人类视觉,用于识别图案,面部及其将将2D图像转化为3D模型等。在概念层面,图像处理和计算机视觉之间存在许多重叠,并且经常被误解的术语可以互换使用。在这里,我们简要概述了这些技术,并解释了它们在基础层面上的不同之处。 数字图像处理技术于20世纪60年代末在美国国家航空航天局喷气推进实验室(Jet Propulsion Laboratory)首创,通过计算机增强,将Ranger航天器的模拟信号转换为数字图像。现在,数字成像有着广泛的应用,尤其是在医学上。众所周知的应用包括计算机辅助断层扫描(CAT)和超声波。 图像处理主要与数学函数和图像转换的使用和应用有关,而不考虑对图像本身进行任何智能推理。它仅仅意味着算法对图像进行一些转换,如平滑、锐化、对比度、拉伸。对于计算机来说,图像是一个二维信号,由像素的行和列构成。一种形式的输入有时可以转换成另一种形式。例如,磁共振成像(MRI),记录下离子的激发并将其转换成视觉图像。 图像处理是计算机视觉的一个子集。计算机视觉系统利用图像处理算法对人体视觉进行仿真。例如,要是目标是增强图像以便以后使用,那么这可以称为图像处理。要是目标是识别物体、汽车自动驾驶,那么它可以被称为计算机视觉。