图像处理

图像处理

第二章 数字图像基础

人类的视觉感知系统

  • 视觉是人类最高级的感知器官

  • 然而人类感知只限于电磁波谱的视觉波段,成像机器则可以覆盖几乎全部电磁波谱

  • 研究图像处理首先要了解人类的视觉感知系统

人的视觉过程

光刺激——视网膜接收——视网膜神经处理——视觉通道——大脑皮层处理(存储参考图像、信息处理、特征提取、决策、描述)并响应

图像感知和获取

传感器类型:

  • 单个传感器

    优点:精度高、成本低

    缺点:速度慢

  • 带状传感器

    优点:可获得物体截面图像、成本较低

    缺点:速度慢

  • 传感器阵列

    各类图像都是由“照射”源和形成图像的“场景”元素对光能的反射或吸收相结合而产生的。

简单的图像形成模型

当用数学方法描述图像信息时,通常着重考虑它的点的性质。例如一副图像可以被看作是空间各个坐标点的结合。它的最普通的数学表达式为:

其中,$(x,y,z)$是空间坐标,$\lambda$是波长,$t$是时间,$I$是图像强度。这样一个表达式可以代表一副活动的、彩色的、立体的图像。

当研究的是静止图像时,上式与时间$t$无关;当研究的是单色图像时,显然与波长$\lambda$无关;对于平面图像则与坐标$z$无关。因此,对于静止的、平面的、单色的图像来说其数学表达式可简化为:

人们所感受到的图像一般都是由物体反射的光组成。函数$f(x,y)$可由两个分量来表示:

  1. 入射到观察场景的光源总量$i(x,y)$

  2. 场景中物体反射光的总量$r(x,y)$

$i(x,y)$的性质取决于照射源,而$r(x,y)$取决于成像物体的特性。反射分量$r(x,y)$限制在0(全吸收)和1(全反射)之间。

$i(x,y)$的某些典型值:在晴朗的白天,太阳在地球表面产生的照度超过90000lm/m2。在有云的情况下,这个数值下降到1000lm/m2。在晴朗的夜晚,满月情况下大约为0.1lm/m2的照度。

$r(x,y)$的某些典型值:黑天鹅绒为0.01,不锈钢为0.65,白色墙为0.80

Intrinsic image decomposition 本征图像分解

图像的数字化

大多数传感器的输出是连续电影波形。为了产生一副数字图像,需要把连续的感知数据转换为数字形式。所谓的图像数字化是指将模拟图像经过离散化之后,得到用数字表示的图像。

  • 取样:

    将在空间上连续分布的图像转换成离散的取样点(即像素)集的操作。由于图像是二维分布的信息,所以取样是在x轴和y轴两个方向上进行。

    取样时注意:取样间隔的选取。取样间隔取得不合适除了画面出现马赛克之外,还会发生频率的混合现象。

  • 量化:

    将各个像素所含的明暗信息离散化后用数字来表示,称为图像的量化。一般的量化值用整数表示。充分考虑到人眼的识别能力后,目前非特殊用途的图像均为8 bit量化,即用0~255描述“黑~白”

空间和灰度级分辨率

取样值是决定一副图像空间分辨率的主要参数,空间分辨率是图像中可辨别的最新细节。

  • 在取样时,若横向的像素数(列数)为M ,纵向的像素数(行数)为N,则图像总像素数为 M * N 个像素。 一般来说,采样间隔越大,所得图像像素数越少,空间分辨率低,质量差,严重时出现马赛克效应;采样间隔越小,所得图像像素数越多,空间分辨率高,图像质量好,但数据量大。

灰度级分辨率是指在灰度级别中可分辨的最小变化,由于硬件方面的要求,灰度级数通常是2的整数幂

  • 量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大

  • 量化等级越少,会出现假轮廓现象,图像质量变差,但数据量小

像素之间的邻域关系

4邻域:

  • 像素$p(x,y)$的4邻域是$(x+1,y),(x-1,y),(x,y+1),(x,y-1)$

  • 用$N_4(p)$表示像素p的4邻域

D邻域:

  • 像素$p(x,y)$的D邻域是对角上的点$(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1)$

  • 用$N_D(p)$表示像素p的D邻域

8邻域:

  • $N_8(p)=N_4(p)+N_D(p)$

图像的放大与缩小

  • 最近邻

    设i+u, j+v(i, j为正整数, u, v为大于零小于1的小数,下同)为待求像素坐标,则待求像素灰度的值 f(i+u, j+v)。

    如果(i+u, j+v)落在A区,即u<0.5, v<0.5,则将左上角像素的灰度值赋给待求像素,同理,落在B区则赋予右上角的像素灰度值,落在C区则赋予左下角像素的灰度值,落在D区则赋予右下角像素的灰度值。

    avatar

    最邻近元法计算量较小,但可能会造成插值生成的图像灰度上的不连续,在灰度变化的地方可能出现明显的锯齿状

  • 双线性插值

    简明版

彩色图像表示

光学原理解释色彩的形成:

可视光区的波长在400nm~780nm,当光谱采样限制到三个人类视觉系统敏感的红、绿、蓝光波段时,对这三个光谱带的光能量进行采样,就可以得到一副彩色图像。

彩色视觉是人眼对射入的可见光光谱的强弱及波长成分的一种感觉。

彩色模型

颜色的描述是通过建立彩色模型来实现的,不同的彩色模型对应于不同的处理目的。

各种不同的颜色模型之间可以通过数学方法转换。

CIE(国际照明委员会)在进行大量的色彩测试实验的基础上提出了一系列的颜色模型:

  • RGB模型:红、绿、蓝 三基色混合

  • HSI模型:色度(H, Hue)、饱和度(S, Saturation)、亮度(I, Intensity)

    HSI彩色模型比较适合于人用色调、饱和度、亮度描述被观察物体颜色的解释,对于开发基于彩色描述的图像处理方法是一个理性的工具。

    avatar

    • H表示色调,用 角度 表示。 反映了该颜色最接近什么样的光谱波长。 0度为红色,逆时针120度为绿色,顺时针120度为蓝色。

    • S表示饱和度,饱和度参数是色环的原点到彩色点的半径长度。在环的外围圆周是纯的或饱和的颜色,其饱和度值为1。在中心是中性(灰)色,即饱和度为0。

    • I表示光照强度或亮度,它确定了像素的整体亮度,而不管其颜色是什么。

  • YUV模型:亮度(Y)、色度(UV)

  • YCbCr模型:亮度(Y)、色度(CbCr)

CMYK色系:用于印刷行业,是一种减色系统,将从白光中滤出三种原色之后获得的颜色作为表色系的三原色CMY

C (cyan):青色/蓝绿色,从白色中滤去红色。

M (magenta):品红,从白色中滤去绿色。

Y (yellow):黄色,从白色中滤去蓝色。

彩色图像转变为灰度图像的处理称为彩色图像的灰度化处理。方法主要包括:最大值法、平均值法、加权平均值法。

  • 最大值法:将输入图像中的每个像素的R、G、B分量值的最大者赋给输出图像中对应像素的R、G、B分量的方法。用公式可表示为:

    $g_R(x,y)=g_G(x,y)=g_B(x,y)=max(f_R(x,y),f_G(x,y),f_B(x,y))$

  • 平均值法:将输入图像中的每个像素的R、G、B分量的算术平均值赋给输出图像中对应像素的R、G、B分量的方法。用公式可表示为:

    $g_R(x,y)=g_G(x,y)=g_B(x,y)=(f_R(x,y)+f_G(x,y)+f_B(x,y))/3$

  • 加权平均值法:人眼对绿光的亮度感觉仅次于白光,是三基色中最亮的,红光次之,蓝光最低。相关研究表明,当$\omega_G$=0.587、$\omega_R$=0.299、$\omega_B$=0.114时,得到的灰度化图像较合理,此时灰度化公式就变为:

    $g_R(x,y)=g_G(x,y)=g_B(x,y)=0.299\cdot f_R(x,y)+0.587\cdot f_G(x,y)+0.114\cdot f_B(x,y)$

算法

数论

1. 一个关于完全平方数的简单结论

都已经想到了是求出所有的完全平方数,但是最后还是做复杂了,其实一步就可以解决的。我没想到这个结论:

1, 2, …, n 中完全平方数的个数就是$ \lfloor \sqrt{n} \rfloor$.

题目链接

由这道题可以得出两个结论:

  1. 除了完全平方数外,任何正整数都有偶数个因子。
  2. 1, 2, …, n 中完全平方数的个数就是 $\lfloor \sqrt{n} \rfloor$.
  3. 由于 $\lfloor \sqrt{n} \rfloor$ 涉及到浮点数运算,为了保证不出现精度问题,我们可以计算 $\lfloor \sqrt{n+\frac{1}{2}} \rfloor$,这样可以保证计算出来的结果向下取整在 32 位整数范围内一定正确。
Read more

软件工程复习

软件工程

  • 软件的概念

    软件是计算机系统的重要组成部分

    软件是逻辑产品,需要计算机硬件和系统软件的支撑

    软件是计算机控制系统的指挥中枢

    软件是信息转换器,它能对信息进行加工、处理或变换

    软件是工具,在人们的生活、工作、休闲,在社会的经济、军事、政治、文化、科学技术、教育中发挥巨大作用

  • 软件的特点

    软件是能够完成预定功能和性能,并对相应数据进行加工的程序和描述程序及其操作的文档。

    软件=程序+数据+文档

    程序=算法+数据结构

    文档:自然语言,结构化英语,图表

    数据:用程序设计语言要求的数据结构表示

Read more

计算理论复习

Q1

Find the error in the following proof that all horses are the same color. Claim: In any set of h horses, all horses are the same color.
Proof: By induction on h.
Basis: For h = 1. In any set containing just one horse, all horses clearly are the same color.
Induction step: For k ≥ 1, assume that the claim is true for h = k and provethatitistrueforh=k+1. TakeanysetH ofk+1horses. We show that all the horses in this set are the same color. Remove one horse from this set to obtain the set H1 with just k horses. By the induction hypothesis, all the horses in H1 are the same color. Now replace the removed horse and remove a different one to obtain the set H2. By the same argument, all the horses in H2 are the same color. Therefore, all the horses in H must be the same color, and the proof is complete.

Answer

编译原理复习

编译器的概念模型

字位码、机器语言、汇编语言属于低级语言,而面向用户、面向问题的语言则是高级语言。

低级语言与特定的机器有关,功效高,但是使用复杂、繁琐、易出错。

高级语言不依赖具体机器,移植性好、对用户要求低、易使用、易维护。

用高级语言写的程序,计算机不能立即执行,必须通过一个“翻译程序”加工,转化为与其等价的机器语言程序。这个翻译程序此时就是“编译程序”。

源程序:用汇编语言或高级语言编写的程序。

翻译程序:将源程序转化为目标程序的程序。

目标程序:用目标语言所表示的程序。

Read more

CFG

非上下文无关语言

若A是CFL,则存在数p(pumping length),使得A中任何一个长度不小于p的字符串s都能被划分为5段 $s=uvxyz$ 且满足下述条件:

  • 对于每一个 $i\geq 0$,$u v^i x y^i z \in A$
  • $|vy| > 0$ (保证v或y不是空串,否则定理自动成立,和正则语言的泵引理一样了)
  • $|vxy| \leq p$

能使用正则语言写出来或者DFA判别的就是正则语言
能使用上下文无关语言写出来或者PDA判别的就是上下文无关语言
剩下的都是其他语言
正则语言和上下文无关语言可以使用泵引理判假,即所有正则语言、上下文无关均符合他们的泵引理,但是不是所有符合泵引理的都是CFG或者CFL

正则语言包含上下文无关语言

Read more

NLP复习

HMM

  • 用 $q_t$ 表示 t 时刻的状态

  • 状态集合:$S = {S_1, …, S_N}$

  • 输出符号集合:$O = {O_1, …, O_M}$
  • 状态转移矩阵:$A = a_{ij} = P(q_{t+1} = S_j | q_t = S_i)$,对 j 从 1 到 N 求和,结果为 1,因为从 i 出发总会到达 1~N 中的一个状态的
  • 可观察符号的概率分布矩阵:$B = b_j(k)$,表示在状态 j 时输出符号 $v_k$ 的概率。$b_j(k) = P(O_t = v_k | q_t = S_j)$,对 k 从 1~M求和的结果为 1,因为一个状态总有一个输出符号。
  • 初始状态概率:$\pi_i = P(q_1 = S_i)$
Read more

网络空间安全复习题(天津大学)

网络安全基础复习提纲 (T · J · U)

一共 22 道简答题。

1. 什么是网络嗅探?为什么能实现网络嗅探?

网络嗅探是指利用计算机的网络接口截获其它计算机的数据报文的一种手段。

因为大部分硬件网络访问控制器使用目标地址来区分网络上的哪个数据包是可读取的,即使用目标地址过滤不是给自己的数据包。但是网络嗅探器会将网络适配卡置为杂乱模式,使得网卡能够接收传输在网络上的每一个数据包。

2. 以太网最常见的基于流量的攻击是什么?为什么?采用什么设备和方法可以避免这种攻击?

以太网最常见的基于流量的攻击是流量嗅探。

因为大多数以太网硬件控制器可以设置为混杂模式,使得它们能够读取与硬件地址无关的所有流量,因此发起这种攻击很容易。

减灾方法:

  • 采用交换式网络环境,即同一个端口上只有一台设备(一般来说,每个端口一台设备)可以减少嗅探。
Read more
You need to set client_id and slot_id to show this AD unit. Please set it in _config.yml.