有没有熟悉大模型开发的, help!

125 天前
 zhh2271

目前研 2 ,来到了国内一家 EDA 公司实习,预计实习半年左右,主管叫我实习期间实现一个大模型,用于公司的软件,之前都没有大模型或者 AI 方面的基础。主管的要求是这个大模型可以回答当前我们软件的一些流程怎么进行,最好可以实现一些 DRC/LVS 规则文件的编写什么的。这样的话兄弟们觉得应该用什么模型和技术好呢。目前调研打算用 DeepSeek + RAG + RAFT 这样来训练。

6031 次点击
所在节点    问与答
74 条回复
zhh2271
125 天前
@coefuqin 好的好的,谢谢哥!
vpsvps
124 天前
开的工资大概多少
才能预计对你这个岗位的真实期望水平
有 20k 一个月吗?
zhh2271
124 天前
@vpsvps 我实习按天算的 260 一天😭
zhh2271
124 天前
@vpsvps 正式工肯定有的
simo
124 天前
楼上说了很多,主要是需求确认清楚,很可能 rag+提示词就能解决,也可能采集大量数据,陷入微调漩涡半生。
zhh2271
124 天前
@simo 我目前是打算先用 rag 来做,快一些,然后做一些 prompt 工程什么的,确实对微调调研了一下,硬件资源消耗高,对数据集也要求高,训练出来还不一定好
zt5b79527
124 天前
@zhh2271 #38 所以最适合你(唯一适合你)的就是 rag ,两周搞定,摸鱼俩月学点自己想学的东西,然后再汇报,提前且高质量完工,美滋滋。
Liftman
124 天前
那你们公司有点扯淡的。让新人做这个。而且还是完全没有经验的。

如果只是回答问题的话,实现很容易,关键是回答质量和效率。

什么叫主管说不能生成脚本。这是什么鬼话。
baiyixueqi
124 天前
6 个月后给他手机装一个腾讯元宝或者 DeepSeek App 就行了
wangyzj
124 天前
你是 ee 还是 cs ?
Adelell
124 天前
不管 3721 ,先申请一套高配 GPU 集群
mumbler
124 天前
朱啸虎:不要花费一分钱在训练模型上
isSamle
124 天前
训练是不可能训练的,不说硬件吃不吃得住,数据就是一个很大的问题。
按我的做法就是,去理解目前人工实现 DRC/LVS 规则文件编写的流程和逻辑,通过将任务工程化拆分,第一步做什么,第二步做什么(因为模型上下文长度有限),然后就是暴力工程流:AI 按 RAG 相关检索资料执行第一步→AI 按 RAG 检索资料评估第一步执行结果→评估不通过 AI 生成修改意见并重新生成→持续评估并修复生成→同理循环遍历执行相关任务,直至最终完成并校验通过
WeaponXu
124 天前
你现在的问题不是技术选型,是硬件设备公司能不能提供 你搞训练起码得接近一千万的硬件投入 GPU 服务器 交换机 光模块,那这个工作交给实习生的公司 我不觉得会在这个项目投入这么多钱

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1134542

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX