传统开发程序员转战大模型,一起来做算法工程师

145 天前
 ox180

各位大佬好啊,我在微信公众号上新开了一个合集,名为程序员转战大模型,主要是帮助传统开发者转战到目前正🔥的 AI 领域,用最浅显易懂的话语来讲解。

目前这个合集正在进行中,欢迎各位小伙伴多多捧场和指正。(这里是靠打赏盈利)

后续我会再单独开一个合集,是对当前合集的深入,用 step by step 的方式来 coding ,帮助大家进阶到大模型。(这里打算靠合集盈利)

地址:程序员转战大模型

也可以手动复制: https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzI4MTUzMjc1MA==&action=getalbum&album_id=3983660629700788235#wechat_redirect

1012 次点击
所在节点    推广
9 条回复
ox180
145 天前
后续这个合集会写:
1. 给大模型赋能(引入 RAG 、微调、工具调用、MCP )
2. MLLM: 看得懂文字,也看得懂图片(语音)
3. 强化学习:使模型真正理解语言

将目前大模型在做的和一些较新的技术用最简单的方式讲清楚,让大家有一个历史的发展框和快速上手。
ox180
145 天前
charlestang
144 天前
作为一个目标读者,我觉得目前的文章,思维有点跳跃。“起点和破圈” 完毕,直接就进入到 word2vec 了。

第一,宏观来看,大模型现在有多少种类,分别是什么,在企业的应用情况如何?

第二,很多企业(比如我厂),已经给全员提供了 ChatGPT 和 Claude 和 Google Gemini 等,统计上看,实际的效果如何?一般企业会用在什么地方?他们还有什么样的痛点?

第三,这些痛点的解决方案一般有几种,分别是什么?各有什么优缺点?架构,技术成熟度,实现难度,成本等分别怎么样?

第四,才开始关心各个组件的原理和如何构建。
ox180
144 天前
@charlestang 首先感谢您的关注与指教。关于直接进入到 word2vec ,在写之前有思考过这个问题,1 )一些自然语言的书籍,会从 RNN 、LSTM 介绍起,希望开辟一个能够直接上手的切入口,后续也打算用 torch 来手搓一个 word2vec 。前者也可以作为补充。2 ) word2vec 、bert,算是 NLP 领域比较重大的突破,沿着这个关键点往前或者往后推,可能也会容易一些。

一看您是有 AI 领域相关经验的,至少从产品角度来讲,也是未来技术领域需要突破的或者找合适的 case 来做成产品。针对 ChatGPT 和 Claude 和 Google Gemini 等,代表了最新/高的大模型能力,接入也扩展了产品的丰富度。


针对这个合集,不会针对技术细节做过多讲解。后面会补充一个纯代码的合集,会从简单入深到现在业界动态,我也希望从这个过程里传统开发者和初学者能够感受、融入到这个行业,自身来经历。

针对痛点、优缺点等,这里作为从业者也是有实打实的切身感受的,也非常感谢您的建议,后续也可以作为一期来专门分享给有一定经验的从业者。
ox180
144 天前
今天又新增了一篇文章,讲多模态的历史推演,地址: https://mp.weixin.qq.com/s/wXEGadFnzOjWAiFaswCgpg , 也可以一定程度作为种类的补充~
ox180
143 天前
ox180
143 天前
ox180
142 天前
ox180
137 天前
我又来灌水了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1132690

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX