非计算机专业如何快速看懂并跑通深度学习代
星瑞涛客
2025-08-08 23:18:04
理工科非计算机专业,没学过深度学习,上次分享经验后投了第一篇交叉论文,花了3个月,分享经验:
.
对非计算机专业而言深度学习是工具,你要做的是针对课题情景,选合适代码实现,最好根据情景特点对代码适应性改进,并解释改进原因
.
首先还是要学一下python、pytorch基本知识,重点推荐3小时超快速入门python、小土堆
.
❶确定研究对象
深度学习常见任务比如分类、回归、聚类、降维,看看能不能和领域结合,有没有数据集可以用,也可以找找更先进方法,以前用RNN,你用transformer;以前用GAN,现在用diffusion
.
❷寻找解决类似问题的论文,选择应满足:
①来源顶刊
②开源且有完备requirement和readme,代码规范(可以在github上搜索合适代码,看readme中信息找论文,也可以上paper with code搜索论文匹配开源代码,推荐插件AI Code Finder,可以在谷歌学术上看到那些论文开源)
③读懂,读之前先确认代码能够跑通,而且效果相当,可以直接把github上的库链接复制给MiniMax AI,让他在沙盒环境中帮你自动测试,省去了配环境和测试的时间,适合新手小白
.
❸下载代码、配置基础环境(Anaconda),安装requirement里面需要的库,可以看【轮椅级教程】pytorch环境配置
.
❹针对性改进代码
根据课题特点对baseline改进
①在你数据集下呈现出某维度上更好效果
②从故事角度说明白改进目的
方法:
①先开debug逐行读懂代码
②整体理解网络结构,知道每一层作用,输入输出shape变化
③固定套路修改,比如模块串并联、A+B+C(ABC论文中取核心模块拼接)注意力机制、特征融合等
④从课题物理现象找解释,比如遥感数据具有时空特征,引入通道空间注意力机制,取个好名字
如果没什么想法也没经验可以把baseline的代码直接复制给MiniMaxAI, 然后告诉他项目,他会自动分析项目背景,在原有baseline基础上自动修改代码,找到到合适模块缝合拼接,给出完整项目文件和消融实验的结果、报告说明和修改理由,还能生成模型图,做成PPT组会汇报,最近还在尝试他的论文复现和代码功能,代码能力差我也可以开发些小程序
.
❺写完一版快速投出去
0
阅读:11