第12章 图像着色
五光十色是大自然展露的微笑。
——利·亨特(Leigh Hunt)
19世纪40年代之前,照片的颜色都是黑白的。1908年,Gabriel Lippmann获得诺贝尔物理学奖,自此开启了色彩捕捉的时代。1935年,Eastman Kodak公司推出了一款名为Kodachrome的三合一彩色胶卷,用于拍摄彩色照片。
彩色图像不仅能体现美学,还能比黑白图像捕捉到更多的信息。颜色是现实世界物体的一个重要属性,它为我们感知周围世界增加了另一个维度。色彩是如此重要,以至于在历史上有许多为历史艺术作品和摄影作品着色的项目。随着Adobe Photoshop和GIMP等工具的出现,人们开始尝试将老照片转变为彩色照片。reddit网站的r/Colorization子群组是一个在线社区,人们在这里分享他们将黑白图像转换为彩色图像的经验。
到目前为止,本书已经在不同的领域和场景中展示了迁移学习的强大之处。在本章中,我们将介绍使用深度学习对图像着色的概念,并利用迁移学习对结果进行改进。本章涵盖以下主题:
- 问题陈述;
- 理解图像着色;
- 彩色图像;
- 构建基于深度神经网络的着色网络;
- 挑战;
- 进一步改进。
下面我们将使用黑白、单色和灰度这3个术语来表示没有任何颜色信息的图像。
12.1 问题陈述
照片不仅能帮助我们重温回忆,还能让我们洞察过去发生的重要事件。在彩色摄影成为主流之前,我们的摄影作品大多是黑白的。图像着色的任务是将给定的灰度图像转换为合理可信的彩色图像。
图像着色的任务可以从不同的角度进行。手动着色的过程非常耗时并且需要高超的技巧(详情参见reddit网站的r/Colorization子板块)。计算机视觉和深度学习领域的研究人员一直在研究将该过程自动化的不同方法。本章将介绍如何利用深度神经网络来完成这样的任务。我们还将尝试利用迁移学习的力量来对结果进行改善。 ...
Get Python迁移学习 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.