大四下-毕设

电子系的毕业设计是大四上学期中选导师和题目,大四下开题、中期然后最终答辩。我大四上的时候要匆忙准备出国事项,对毕设不是特别重视。系里跟CS相关的毕设题目本身就很少,我申了一个开发可视化,还有slam的,都被拒了。我那时心不在焉,反正总会给我个题目,爱咋咋地吧。后来教务给我安排题目,正好沈老师有名额,就把我挂到他那做毕设。

沈老师是我们系非常牛的一位老师,去他那做毕设的都是系里比较优秀的同学,我自然是感到受宠若惊。沈老师看我想做DL相关,给了我两个选题。一个是许师兄做室内定位,因为某些原因我没有选这个题目,而是跟赵师兄做蛋白质无监督分类。我那时还需要考托福GRE写文书这些,开题的要求又不高,所以我大四上就读了几篇文献,没什么进展。

前面文章提到,我寒假萌生了找实习的想法。当时我并没有想那么多,“先斩后奏”了,没有预先和沈老师沟通过,的确很失礼。大四下前两周的组会我都没有参加,同时白天在公司实习,也没去实验室。当然我和赵学长是一直有交流的,毕设也在搞。沈老师发现了这件事,大发雷霆。那时我刚回到学校从其他人那得知这件事,赶忙登入会议,然后还要讲毕设要做什么,我之前完全没有准备,PPT用的是之前给赵学长看的白板PPT,又被臭骂一顿。这应该算是比较黑暗的一个时刻。但经历了大二大三内心的煎熬,我倒也比较坦然,之后给沈老师写了一封邮件解释情况,并说自己的想法。沈老师大人有大量,让我写毕业进展和工作计划,每周组会要来听,汇报进展。当然后面还有很多拷打环节,比如组里其他人题目做的都比我solid,PPT做的比我好,讲的比我好,论文写的比我好,等等等等。但我脸皮已经比较厚了,被批评虚心接受,PPT和论文按照意见去改。

以及,一直到最后我也没有工位,就这么凑合了一学期。不过话说回来,沈老师组里的服务器资源的确很给力。他并不是做DL的,却有几十张3090和四张A100。我有权限跑2*8张3090(理论上是很多人共用这两台8卡服务器,但大部分时间都没人用)。白天在工位可以看wandb,挂校园VPN也能登上服务器跑实验。所以我能水过毕设,算力充足也是原因之一。

但核心的问题是无监督分类蛋白质能否做到。数据集是课题组内部的,没有其他人做过。算法部分特征提取用SimCLR,无监督聚类follow的是DeepDPM。但把这个pipeline用到数据集上面效果很差。前期的很多工作就是对图像做一些处理,然后尝试不同的data augmentation,但提升十分有限。所以还是要改算法。效果差的原因是真实数据集以无监督方式投影到特征空间不同类别间离的还是比较近,可能有一部分混到一起了。然后我就看它merge/split的那个位置,发现它总是满足不了一个条件以至于不能分出更多的类别。我就想,那我可以通过一个参数让它可以分更多类,比如一共10个标签只能分两类,如果我让它能分4类,准确率肯定会上升。所以就照这个思路修改了算法(落实到代码层面其实改动不大)。之后它的subnetwork也被我改成传统算法(当然,我觉得原作者也不至于发现不了传统算法比神经网络强,就是揣着明白装糊涂)。这样的话中期就有所交代了,也觉得能毕业了。

(当然这个改动是有代价的,如果超参调的不好,本身10类它也可能分出20类30类。从这个意义上讲表现比原算法好是因为我大致知道标签的真值范围所以我可以去调超参,当然不改调都没法调。而且也没有给这个改动想出elegant的理论解释。)

本来中期答辩后老实补充实验写论文就行了,但又有些波折。五一假期鼓起勇气去见某人。本以为我已经放下了,但其实并没有。对她的求而不得与这几年的经历产生共鸣,我emo了半个月。每晚躺在床上就胡思乱想,白天也经常恍惚。缓过来一些后,也没太多劲头补实验写论文。然后我电脑还坏了一次。所以最后论文写得比较烂,沈老师说你这写的不行要大改。于是最后一两周我就到华清嘉园的那个自习室不分昼夜地改论文。一边听刘森的歌一边写,《上游的风》、《悲哀藏在现实中》、《废柴》等等,很符合我当时的心境。

华清嘉园离学校很近,却是两个世界。晚上可以看到来酒吧买醉的男男女女,有一次还遇到好久没见的学妹来自习室隔壁买花。写不动了我就到楼下溜圈,如果是白天就从乌烟瘴气的楼道里走下来。改了好几遍,内容还是偏少,沈老师最后高抬贵手让我过了。其实篇幅少除去我本身做的比较水以外,还有一个原因是因为我实验做得不充分,但后面实在没时间了。后来我去找班主任,他就给我讲“沈老师当时对你的毕设很不满意”(他们一个所的)。所以再次感谢沈老师宽宏大量,同时表达歉意:我当时真的没有好好做。

**在五月那件事之前,我没有考虑过以后做学术的选项,就是想找份实习充实简历,毕设水水得了。**沈老师学术造诣很高,但我的选题并不在他的主要领域,他也没有精力管我一个调剂来的本科生的毕设。赵师兄也在申请季、还要写硕士毕业论文,自身难保。而我也不想把太多精力投入到毕设上,找了份一周四天的实习。所以我的本科毕设应该说是略有波折地糊弄过去了。还是要感谢沈老师大人有大量,能够理解我找实习的选择并容忍我对毕设糊弄的态度。当然还要感谢赵学长和后期帮助我修改论文的张学长,以及其他同学(比如杜巨和晨宇巨佬)的帮助。但如果开题时我就想以后会不会读博,我会找一个match的组,认真去做。