非计算机专业,最近做了些AI交叉工作,完成一篇论文
.
总体思路是针对本专业的问题选择合适算法,先去github上找相关最新代码,根据问题特征做一些适当的修改,把故事说明白
.
因为之前完全没经验,频频受挫,不知如何运行,一点就报错,要么缺这个库要么缺那个文件,一天过去了连环境都没配置完
经历无数磨难后,也算总结了些心得,分享给大家
.
首先很多论文代码本身就有问题,又或者加了很多trick却没明说,我在几个代码上废了老大劲,根本跑不通,所以在选择代码的时候千万要注意,尽量选择
❶给了开源代码的论文
❷来源顶刊顶会
❸readme介绍详细
❹有requirement,说清楚要安装什么库和版本
❺star多的
❻提供了数据集可直接复现
	
找到开源代码后,你需要先搞清楚这每个文件的意思,初步理解各模块功能。我会直接把网址丢给GLM4.6让他帮我解释,深度学习说白了就是由这几个部分构成的:
❶数据处理(下载、划分、预处理、载入)
❷网络模型(你可以当作一个黑盒子,把A映射成B)
❸训练(优化器、迭代次数、损失函数、参数输出)
❹测试(计算指标)
.
先把代码的整个框架给给弄懂,这一步你可以用AI来帮忙,我用的是GLM4.6,他在LMArena榜上开源第1,挺好用的,可以直接把Github复制给他帮忙解释,按照这个提问:这个网站是一个关于深度学习的开源代码,请你帮我分析代码构成, 告诉我每个文件分别承担什么功能
.
然后你就可以把代码下载下来,pip install requirement.txt配置环境了,一定要记得先cd到文件夹中,如果卡住了就换清华或者阿里源。建议下载conda配置一个虚拟环境,可以减少很多问题,很容易因为一些库版本冲突导致失败
.
完成后首要任务是先测试代码,一般情况下很难直接跑通,可以打上断点一点点debug,遇到报错就把报错信息复制给GLM4.6,问他咋解决,反复几次就可以了。再不行可以下载一个claude code,然后把GLM4.6接进去,让他直接上手帮忙改,啥不会就问啥,claude太贵课题组不报销用不起,但是
glm最近有限时活动,一杯奶茶钱轻松搞定
.
代码复现报错是家常便饭,很多时候真的是考验耐心,在复现的时候记得养成标注数据形状变化的好习惯,对之后魔改有好处








