有没有熟悉大模型开发的, help!

124 天前
 zhh2271

目前研 2 ,来到了国内一家 EDA 公司实习,预计实习半年左右,主管叫我实习期间实现一个大模型,用于公司的软件,之前都没有大模型或者 AI 方面的基础。主管的要求是这个大模型可以回答当前我们软件的一些流程怎么进行,最好可以实现一些 DRC/LVS 规则文件的编写什么的。这样的话兄弟们觉得应该用什么模型和技术好呢。目前调研打算用 DeepSeek + RAG + RAFT 这样来训练。

6024 次点击
所在节点    问与答
74 条回复
name1991
123 天前
没搞过啊,想搞大模型,那先问下大模型?
zhh2271
123 天前
@name1991 哈哈哈 感觉 gpt 什么的回答的不是很准确
name1991
123 天前
公司肯定不会指望你能搞出啥来,主要是还是让你摸索的
zhh2271
123 天前
@name1991 我也觉得是这样,但是感觉没搞好的话估计也就留不下来了😂,后面毕业还是挺想从事 eda 相关的,这家公司在国内 eda 也算几了
name1991
123 天前
@zhh2271 #44 那就好好搞吧,我估计主要是看你思路了,如果有些小的惊喜给到你的领导,估计就稳了。
SmiteChow
123 天前
drc 和 lvs 都是很窄的领域,有语法标准,用不着数据训练,只需要把标准告诉大模型就可以了。但是你们做 eda 肯定是要做 layout 检查啊,又不是做 pdk 开发,大头还是在 gds 解析和图形运算上,这个大模型不擅长啊,大模型又不是计算器。
zhh2271
123 天前
@SmiteChow 不是做检查的,只是写一下检查 DRC/LVS 的脚本什么的
clemente
123 天前
sft 或者 post train 去看吧 然后找一个开源的模型 + 你们领域的数据集 去做训练

一共就两步
1. 整理数据集
2. 选型大模型 做 post train
lxqxqxq
123 天前
@hefish #3 哥们是在开玩笑的
AllenCai
123 天前
这个一般用微调就行了,微调中数据的重要性占 80%,所以第一步就是要有高质量数据集,没有这个都是扯淡
Clannad0708
123 天前
公司有资源可以本地微调下,没有资源就本地部署个大模型比如 deepseek 。然后挂个 rag 让领导自己玩就行了
JoeDH
123 天前
搞什么都没事,但你要及时跟他同步进度,有关键方案要及时整理文档跟他对齐,让他拍板
别闷头搞
GreenHand
123 天前
建议先评估。在公司内收集一批带 groundtruth 的题目,找几个最好的模型,用盲评评估下结果,看哪些模型最好。可选的就 deepseek 、claude 4 sonnet 、codex (既然提到规则编写,默认就把 coding sota 模型加进来了),其它认为效果不错的模型。这里分两批模型:可落地的模型和 sota 模型。

决定是否训练模型。基于可落地模型和 sota 模型的效果评估和差距,决定是否要训练模型。最好的情况是可落地的模型( deepseek 、qwen3 、doubao-1.5 等)效果就不错了,直接用(不考虑数据泄露)或者买 gpu 自己部署(数据安全)。

如果差距较大且对效果不满意,需要考虑训练模型,确定如何训练,蒸馏、sft 、rft 等。这条路比上面的成本就高多了,需要考虑准备数据、制定评估标准、评估、训练,甚至数据飞轮。你们公司大概率是没有训练平台,需要找一个。整个过程,一个人是搞不定的。

最后模型效果好了,才考虑落地。

建议先评估下 roi ,是否值得做。评估下「大模型可以回答当前我们软件的一些流程怎么进行,最好可以实现一些 DRC/LVS 规则文件的编写什么的」能够带来多大的收益,是否值得投入对应的成本。
Donahue
123 天前
我的理解是 RAG, 至于生成脚本,就是让大模型调用 MCP 服务创建文件罢了
2018yuli
123 天前
我刚开始学大模型,可能帮不了你
mh
123 天前
RAG 用 AnythingLLM ( 1 天)
生成特定规则的文件需要慢慢调提示词,用时因人而异。
不过远没到 6 个月的程度,也不需要涉及训练
coefu
123 天前
靠,实习生真 tm 性价比。钱少还忠诚。
coefu
123 天前
花了点时间想了下,其实就是 2 点:
1 ,知识体系的问答,rag 足矣
2 ,要做事,mcp 这套
zhh2271
123 天前
@coefuqin 没办法,现在工作不好找,找到个坑感觉把自己按住😭,现在 eda 不比以前了,感觉像互联网一样也开始卷了。
coefu
123 天前
@zhh2271 你做这个事情,要一开始就和上级商量好,要么开个小会,一次性把需求说好,形成书面文档,开会你记笔记你确定需求,然后发邮件给上级(搞正式一点,这样让他也知道这个事情是你用心做的),后续不能随便更新需求,要更新也要形成正式的书面文档在邮件体现。这种口头交代的鸟事,最烦每天想没想好就给你来一下需求,那后续就没得做了。需求确定再想办法,如果做的不符合需求是你能力的事,如果符合需求他们不满意,是他们的事。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1134542

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX