大模型学习路径求大佬指导!

9 天前
 jrlee1204

本人目前情况:从事后端开发工作,工作涉及过一点 Agent 的知识,对于 MCP 、RAG 有一些模糊的认识

希望达到的目标:学习一些关于大模型相关的知识,模型微调(对这个比较感兴趣,需要学习哪些东西?)、部署、大模型应用开发,快速入门到能找到工作的水平

问题:哪些知识是必须的?有没有比较完整的学习路线?对于底层比较原理性的东西是否可以先跳过,工作后再深入学习?

请各位大佬多多指教!

1891 次点击
所在节点    程序员
13 条回复
TimePPT
9 天前
不建议看 fine tuning 相关的内容,这个基本上不属于工程范畴。如果硬学,可以从理解 LORA 开始……
Prompting 相关的可以看这个 https://www.promptingguide.ai/zh
模型部署没啥难的,现在各家云平台基本上很成熟的 pipeline 了,且大厂有自己的 pipeline 技术栈和要求,找几家云服务厂商看下官方部署文档就 ok 了
TimePPT
9 天前
@TimePPT 还有微调要真想玩玩,记得 Azure / Amazon AWS 都有专门的模型微调平台,或者 OpenAI 自己部分模型支持微调,直接后台或者调接口就行。
想上手训模型微调模型,可以试着看看 pytorch / transfermers 的文档,看看能不能看进去,遇到不懂的概念再顺手查?
iOCZS
9 天前
这类书籍多得汗牛充栋了吧
emSaVya
9 天前
不明白后端去做 mlops 会有啥收益吗?你做后端产品做出增量来了 好歹有点 kpi 收益。你做 mlops 有啥收益啊 做得好功劳是模型/策略/算法的 服务挂了 锅是你的。
nayenizhenmei
9 天前
我也一直找不到学习的路径和开源项目,我也知道一些书籍有,但更想看一些网络上的帖子教程
huangyezhufeng
9 天前
“底层比较原理性的东西是否可以先跳过”
个人认为可以的

“模型微调”需要学习的东西
我建议看 Natural Language Processing with Transformers ,Huggingface 工程师写的,可以跟着敲代码,也没那么多底层细节。适合 Learning by doing.

后面想补 LLM 底层原理知识,可以看 Build a Large Language Model (From Scratch)和 Super Study Guide: Transformers & Large Language Models.

如果对深度学习基础不熟,可以先从一些基础的知识学起。比如读一下 Neural Networks and Deep Learning(NNDL)。

https://datahonor.com/blog/2025/02/20/dl_book/ 这里简单写了上面几本书和其他一些相关书籍的书评,也可以参考看下。
jrlee1204
8 天前
@huangyezhufeng 大佬说的很详细,感谢
jrlee1204
8 天前
@TimePPT 好的,感谢大佬,我去看看
sc13
7 天前
我是做 Java 的,这块出了 spring ai ( JavaAI 框架),然后阿里巴巴也出了 spring ai alibaba 。如果你是写 Java 的,可以可以这个项目,阿里内部也在推这个框架了,因为阿里有大量的 Java 程序员可以直接上手,不用切换语言,大厂背书以后发展应该还是可以的。
jrlee1204
7 天前
@sc13 之前做过 Java 后端开发,SpringAI 也听说过,可以研究研究
WithoutSugarMiao
6 天前
https://ex.noerr.eu.org/t/1150043 看看这个帖子呢 哥们
jrlee1204
6 天前
@WithoutSugarMiao 看到了,老哥在那个帖子的回复对我很有帮助,感谢
maximdx
6 天前
Dive into Deep Learning (DIDL)
https://d2l.ai/index.html

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1157387

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX