第一周
方向 | 计划 | 完成情况 |
CV | 二维离散傅里叶变换,频率域图像处理的基本实现思路,基于频率域的噪声消除、图像增强,带阻滤波和带通滤波器 | 完成 |
编程 | 离散傅里叶变换,高斯低通滤波器,高斯高通滤波器 | 重新规划 |
数学 | 傅里叶变换,积分变换,张量算法 | 重新规划 |
学习过程
原计划是数学理论基础-计算机视觉理论-编程实践
数学太多太难了,张量变换==半本书;傅里叶==半本书
数学的学习过程
首先通过3Blue1Brown学习傅里叶的本质,再去知乎看了一些解析,解释了为什么要在CV中使用傅里叶变换。
傅里叶对我说,让我去找欧拉,然后我去学欧拉公式了。学欧拉时,3B1B给我讲了一堆群论相关的知识
单位冲激函数,卷积与卷积定理。然后发现卷积定理和卷积神经网络CNN貌似没啥联系(可能是对卷积定理的理解不到位)
感觉拉普拉斯变换和傅里叶等结合的很紧密,尝试学习,学习了一会儿发现太难,同时没有找到合适的教程,果断放弃。
感觉人学傻了…这么多东西和我所学的计算机视觉有啥关系?而且感觉没学懂
转换学习方式
工科思维:从CV理论开始学习,不深入探究其数学本质,用到啥就学啥。傅里叶等数学知识的学习以CV方向所需深度为准。
CV学习过程
本来是按照清华大学出版的《数字图像处理》进行系统的学习,课后题啥的都没问题
但学完之后还是一脸懵逼,不知道学了啥,比如,一张图,使用高斯低通滤波器处理,为什么会变模糊?
又回去学了半天数学
换书!
阅读了冈萨雷斯的《数字图像处理》,不得不说老外写的书确实很不错,讲的很详细,从底层的复数到滤波器,可惜内容太多,跳着读完了这部分(大部分公式未自己推导)
目前的学习情况,仍然看不懂代码,这份代码写的很不错,但仍有不懂的地方
迷茫中,不知道学习的深度,换言之,深度优先or广度优先?
本周学了很久,但学到了啥?下周开始,改变学习计划,采用广度优先的学习方式,最快速度学习《数字图像处理》,辅以对应的数学知识(明白是什么,怎么用即可)
编程
尝试手撕算法
写了个傅里叶(照葫芦画瓢,调用dft函数)
手写高斯,懵逼….
restart-25
CV
按照计划,会跳过“图像恢复”和“图像压缩编码”这两大章节,但随手一翻,感觉这玩意儿有用啊。
在课本P111,提到了几何失真,我看这桶形失真很眼熟啊,这不是一个小组要解决的需求吗?(游泳馆广角镜头畸变处理)
于是再次修改了旧计划,先学习这两章。
CV具体内容
图像的退化模型,空间域图像的恢复,频率域图像的恢复,匀速直线运动模糊的恢复,图像噪声与被噪声污染图像的恢复,几何失真的校正。
图像压缩编码:DCT变换,数字图像压缩编码的基础,最基本的变长编码(费诺码,霍夫曼),位平面编码,游程编码,变换编码
数学
拉格朗日乘子法,隐函数求导,反常积分,含参积分,曲线积分,曲面积分,格林公式
英语
看新闻,练口语+听力
BBC CNBC CBC