图形学——Viewing

Posted on 2018-11-14 Edited on 2018-11-21 In 图形学

上次图形学的博客中介绍了转换，所以我们可以从世界坐标转换到相机坐标了。不过虽然我们学的是三维模型，不过我们看到的都是二维的。近大远小是小学生都明白的道理，而一个物品的距离等等都会影响它在我们眼中,以及拍摄出来照片的样子。因此这次讲得内容是观察（Viewing）。

正交投影（Orthographic Projection）

正交投影是最简单的一个投影方式。它实际上就是三维坐标中的点丢弃一个坐标轴，如我们需要将物体投影到xy平面上，我们就需要丢弃掉z轴。

它的特点：原来平行的线保持平行。这个特点使得它在很多工程制图中非常有用。

这个博客会介绍OpenGL中的正交投影（gluOrtho）实现。

在OpenGL中，gluOrtho做的实际上是将物体转换到一个中心位于坐标轴中心的正方体上。物体原来是个长方体，所以gluOrtho需要提供的是left,right;up,bottom;near,far.

为什么要这么做？这个是三维pipeline的一步，先映射到正方体上，最后方便投影到真正的屏幕上，也就是映射到平面像素上。

而映射到中心正方体的边长是2,左右（上下前后）坐标分别为-1,1. 因此如何映射？

假如提供的left，right;up，bottom;near,far分别值为l,r;u,b;n,f;既然要映射到正方体上，那么需要两部：一个平移，一个缩放。

首先是平移，平移向量很容易：
$$
t = \begin{bmatrix}
-\frac{l+r}{2}\
-\frac{u+b}{2}\
-\frac{n+f}{2}
\end{bmatrix}
$$

再一个是缩放。既然要缩放，比如左右距离的缩放，是从$r - l$缩放到2.因此缩放比例为：$\frac{2}{r-l}$.

同样的道理，我们可以得到缩放矩阵：
$$
S = \begin{bmatrix}
\frac{2}{r - l}&0&0\
0&\frac{2}{u-b}&0\
0&0&\frac{2}{f - n}
\end{bmatrix}
$$

需要注意的是缩放的这些值都是正值。

然后通过齐次坐标将上面两个结合起来得到转换矩阵：
$$
M = \begin{bmatrix}
\frac{2}{r - l}&0&0&-\frac{r+l}{r-l}\
0&\frac{2}{u-b}&0&-\frac{u+b}{u-b}\
0&0&\frac{2}{f - n}&-\frac{f+n}{f-n}\
0&0&0&1
\end{bmatrix}
$$

不过事情还没完。要知道，在OpenGL中，规定我们观察的方向是Z轴的负向（也就是在视点坐标中，x,y的坐标都是有正有负的，但是我们往前看到的东西的z坐标都一定是负的）。所以上面的式子就要有点变化了，我们仍然希望远的投影到+1,而近的投影到-1,这就要求实际上不光要平移到原点，在缩放时候还要将远近两个面颠倒。这时候平移大小变为：$\frac{f+n}{2}$(因为实际坐标是-f,-n),而为了让远的投影到1,而近的投影到-1,这个缩放尺度就要变成负数，使得位置颠倒，因此缩放尺度变为：$-\frac{2}{f-n}$，最后乘进去后，变化的只有一小部分：
$$
M = \begin{bmatrix}
\frac{2}{r - l}&0&0&-\frac{r+l}{r-l}\
0&\frac{2}{u-b}&0&-\frac{u+b}{u-b}\
0&0&-\frac{2}{f - n}&-\frac{f+n}{f-n}\
0&0&0&1
\end{bmatrix}
$$

也就是，实际上，只有一项变化了。需要注意的是这里的f和n都是正值。

透射投影（Perspective Projection）

透射投影中，远处的景色总是更近一点。实际上这就是透射投影。

下面说的这个东西和SLAM中说的针孔模型很相似：假如有一个点坐标为$X,Y,Z$，而面前有一个屏幕，到针孔的距离为d（d>0），那么在屏幕上这一点的投影为：
$$
X’ = -d\frac X Z\
Y’ = -d\frac Y Z
$$

这里负号的存在，还是因为z坐标都是负的。

而我实际上我们可以将透射投影转换写成这样：
$$
P = \begin{bmatrix}
1&0&0&0\
0&1&0&0\
0&0&1&0\
0&0&-\frac {1}{d}&0
\end{bmatrix}
$$

这个矩阵乘起来之后之前的坐标都没有改变，除了最后一项1变成了$-\frac Z d$. 而齐次坐标如果将最后一个转化为1,则之前的X，Y，Z变成了：$-d\frac X Z, -d\frac Y Z,-d$.这是个很巧妙的转换。

而OpenGL中的透投影函数会更复杂一点。我们还是通过说明gluPerspective，来理解透射映射。

首先我们需要定义一个新的名词，叫做Viewing Frustum(视锥体)。一个视锥体如下图：

任何近裁面近的点或者比远裁面远的点都会被遮挡。

gluPerspective的参数需要：fovy，aspect,zNear,zFar(zNear,zFar>0,后文简写为$Z_n,Z_f$). fovy为视野，可以理解为眼睛睁得大小程度，而aspect定义了视锥的高宽比。

gluPerspective依然是将这个视锥体的投影结果转换到坐标轴的中心正方体（边长为2），使得近截面的z坐标为1,远截面的z坐标为-1.

而zNear和zFar代表了我们需要透射投影的最近距离和最远距离。

投影到的”屏幕”由下图确定，（其中投影屏幕高为两个单位）：

因为要映射到最后的中心正方体（变长为2），所以这个“屏幕”的高已经已经确定了，所以d的距离由$\theta$确定，而$\theta = \frac {fovy}2，d = \cot \theta$.另一方面，高确定为2, 因此aspect实际上改变最终投影的宽窄，由之前的基础，我们先这样写下这个式子：
$$
P = \begin{bmatrix}
\frac 1 {aspect}&0&0&0\
0&1&0&0\
0&0&1&0\
0&0&-\frac {1}{d}&0
\end{bmatrix}
$$

既然齐次坐标最终最后一项要转化为1，也就是同时乘以某个数不会影响齐次坐标的大小，我们可以将上面个的矩阵写成：
$$
P = \begin{bmatrix}
\frac d {aspect}&0&0&0\
0&1&0&0\
0&0&A&B\
0&0&-1&0
\end{bmatrix}
$$

因为我们最后要影响Z坐标，所以需要改变的值是A和B的位置，而不能让他们为0.从上式求得坐标：
$$
p’ = \begin{bmatrix}
\frac d {aspect}&0&0&0\
0&d&0&0\
0&0&A&B\
0&0&-1&0
\end{bmatrix} \begin{bmatrix}
x\
y\
z\
1
\end{bmatrix} = \begin{bmatrix}
\frac {dx}{aspect} \
dy\
Az+B\
-z
\end{bmatrix} = \begin{bmatrix}
-\frac {xd}{aspect*z} \
-\frac{yd}{z}\
-A-\frac B z\
1
\end{bmatrix}
$$

因为我们要让远裁剪面在-1，近裁剪面在+1，因此：
$$
\left { \begin{matrix}
-A-\frac B {-Z_f} = 1\
-A - \frac B {-Z_n} = =-1
\end{matrix}
\right .
$$

得到：
$$
A =-\frac{Z_f+Z_n}{Z_f-Z_n} \
B = -\frac{2 Z_n Z_f}{Z_f - Z_n}
$$

因此将A，B带入后就是最后gluPerspective得到的矩阵。

Note

在这里我们不能将$Znear$设置为0,如果那样的话，会导致深度信息无法解析。
fovy视野越大，我们看到的对象变得越小，这是因为屏幕大小是固定的。
我不明白为什么openGL要将这个映射到立方体上做的这么复杂，更远的地方（z值更小）映射到1。不过gluPerspective只是一部分，除了透射投影以外，还要得到得到平面坐标，然后映射到屏幕上。
传入函数的near，far，计算的到的d等都是距离，也就是都是正值，但是为了处理负的坐标值，多了很多麻烦。