周志7.18-8.1
周志7.18-8.1

周志7.18-8.1

第一周

方向计划完成情况
CV二维离散傅里叶变换,频率域图像处理的基本实现思路,基于频率域的噪声消除、图像增强,带阻滤波和带通滤波器完成
编程离散傅里叶变换,高斯低通滤波器,高斯高通滤波器重新规划
数学傅里叶变换,积分变换,张量算法重新规划

学习过程

原计划是数学理论基础-计算机视觉理论-编程实践

数学太多太难了,张量变换==半本书;傅里叶==半本书

数学的学习过程

首先通过3Blue1Brown学习傅里叶的本质,再去知乎看了一些解析,解释了为什么要在CV中使用傅里叶变换。

傅里叶对我说,让我去找欧拉,然后我去学欧拉公式了。学欧拉时,3B1B给我讲了一堆群论相关的知识

单位冲激函数,卷积与卷积定理。然后发现卷积定理和卷积神经网络CNN貌似没啥联系(可能是对卷积定理的理解不到位)

感觉拉普拉斯变换和傅里叶等结合的很紧密,尝试学习,学习了一会儿发现太难,同时没有找到合适的教程,果断放弃。

感觉人学傻了…这么多东西和我所学的计算机视觉有啥关系?而且感觉没学懂

转换学习方式

工科思维:从CV理论开始学习,不深入探究其数学本质,用到啥就学啥。傅里叶等数学知识的学习以CV方向所需深度为准。

CV学习过程

本来是按照清华大学出版的《数字图像处理》进行系统的学习,课后题啥的都没问题

但学完之后还是一脸懵逼,不知道学了啥,比如,一张图,使用高斯低通滤波器处理,为什么会变模糊?

又回去学了半天数学

换书!

阅读了冈萨雷斯的《数字图像处理》,不得不说老外写的书确实很不错,讲的很详细,从底层的复数到滤波器,可惜内容太多,跳着读完了这部分(大部分公式未自己推导)

目前的学习情况,仍然看不懂代码,这份代码写的很不错,但仍有不懂的地方

迷茫中,不知道学习的深度,换言之,深度优先or广度优先?

本周学了很久,但学到了啥?下周开始,改变学习计划,采用广度优先的学习方式,最快速度学习《数字图像处理》,辅以对应的数学知识(明白是什么,怎么用即可)

编程

尝试手撕算法

写了个傅里叶(照葫芦画瓢,调用dft函数)

https://github.com/Sirlanri/cv-practice/blob/813be5f05321033e1a685f3aca47401ee19127bf/cv-practice/dfts.cpp#L35

手写高斯,懵逼….

https://github.com/Sirlanri/cv-practice/blob/813be5f05321033e1a685f3aca47401ee19127bf/cv-practice/dfts.cpp#L99

restart-25

CV

按照计划,会跳过“图像恢复”和“图像压缩编码”这两大章节,但随手一翻,感觉这玩意儿有用啊。

在课本P111,提到了几何失真,我看这桶形失真很眼熟啊,这不是一个小组要解决的需求吗?(游泳馆广角镜头畸变处理)

于是再次修改了旧计划,先学习这两章。

CV具体内容

图像的退化模型,空间域图像的恢复,频率域图像的恢复,匀速直线运动模糊的恢复,图像噪声与被噪声污染图像的恢复,几何失真的校正。

图像压缩编码:DCT变换,数字图像压缩编码的基础,最基本的变长编码(费诺码,霍夫曼),位平面编码,游程编码,变换编码

数学

拉格朗日乘子法,隐函数求导,反常积分,含参积分,曲线积分,曲面积分,格林公式

英语

看新闻,练口语+听力

BBC CNBC CBC

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注