本节书摘来自华章计算机《计算机视觉:模型、学习和推理》一书中的第1部分,作者:(英)普林斯(Prince,J. D.)著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
第1部分 概率
本书第一部分(第2~5章)致力于简要回顾概率和概率分布。几乎所有的计算机视觉模型可以在概率范围内解释,本书将在概率论的基础上呈现计算机视觉。概率解释最初看起来可能比较复杂,但它有一个很大的优势:它提供全书使用的通用符号,阐明复杂模型之间的关系。
为什么概率是适合描述计算机视觉问题的语言?在照相机里,三维世界投影到光学器件表面从而形成图像:一个关于测量参数的二维集合。我们的目标是获得这些测量参数并使用它们组建创建它们的世界的特性。然而,存在两个问题。首先,测量过程有噪声干扰。我们所观察到的不是进入传感器的光线量,而是其总量的噪声估计。我们必须描述这些数据中的噪声,为此我们需要利用概率。其次,现实世界和测量参数之间的关系一般是多对一的:现实世界的许多配置可能有相同的测量参数。每一个可能世界的存在概率也是用概率表示的。
第一部分的结构如下:第2章介绍使用概率分布的基本规则,包括条件概率、边缘概率和贝叶斯规则,还介绍更多的高级工具,如独立性和期望。
第3章讨论8种具体的概率分布的特性。以四个概率分布为一个集合,我们将其分为两个集合。第一个集合用来描述所观察到的数据或者真实世界的状态。第二个集合的分布为第一组集合的参数建模。结合两者,我们可以拟合一个概率模型并提供有关拟合程度的信息。
第4章讨论拟合观测数据的概率分布方法,还讨论在拟合模型下如何评估新数据点的概率以及如何考虑拟合模型的不确定性。最后,第5章详细探讨多元正态分布的性质。这种分布在视觉应用中是无处不在的,并有许多有用性质经常在机器视觉开发中使用。
对概率模型和贝叶斯理论非常熟悉的读者可以跳过这部分,直接进入第二部分。