V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  rogerer  ›  全部回复第 4 页 / 共 6 页
回复总数  110
1  2  3  4  5  6  
223 天前
回复了 woniuppp 创建的主题 职场话题 今天一句话让我体验到国内外文化差异
@billzhuang 虽然也累不过比国内还是好一些,至少能正常下班
二分,发生在每次定位哪个 commit 改坏了的时候
224 天前
回复了 wgfire 创建的主题 程序员 windsurf 买了 pro ,每天也有调用上限吗
@NGGTI 是的,我 cursor 500 次 3 天用光,现在每次 agent use 的时候还能去上个厕所
224 天前
回复了 wgfire 创建的主题 程序员 windsurf 买了 pro ,每天也有调用上限吗
@NGGTI 没有 用完就没了
因为存储不值钱
228 天前
回复了 886106 创建的主题 Apple Studio M4max 128G 是否合适跑大模型
为了考虑要不要在本地跑 LLM 买设备,不如考虑一下这个钱拿去买 token 会不会更好。开源的模型,deepseek qwen llama ,它们的 api 也都不算贵。
244 天前
回复了 mogutouer 创建的主题 职场话题 用 AI 编程,半夜的我放声大笑
@wyntalgeer 这和轮子没关系,你只需要有足够多的代码就行了,也不分你前后端还是深度学习。后端比较容易的一点是,现在就能做到 function call 去感知服务的变化,前端还没做好和 dev tools 的通信。
因为能明显盈利,LLM 的能力能得到发挥的就是这个领域。ChatBot 的盈利能力一般,不是生产力工具。
@jingyijun 需要找个本科师弟来做这个维护哈哈
245 天前
回复了 fangyex 创建的主题 程序员 Cursor 和 Windsurf,哪个更好?
@alexsz 我看 windsurf 的 credit 是有限的,虽然 cursor 也有 500 条 high speed 的限制,但好歹还能 slow speed 凑活用。这个真正用的时候会影响很大吗?
Cursor, Windsurf 体验最佳。通义灵码这种都是有点玩票性质,就直接用了补全能力。
253 天前
回复了 Suger828 创建的主题 程序员 请教大模型微调
1.全量一般没人调得动,除非你训的是非常小的模型。LoRA 做的事情是在原有模型的旁边搞一条 Pathway ,这样不用动原有模型的参数,也能让模型去适配一些特定的任务,属于是没有办法的办法。
DPN 应该是指强化学习来调整 LLM 相关的技术,这个现在叫 post-training ,用来增强模型的推理能力。

2.function call ,其实应该也能通过微调的技术来做,比如给模型一些模板奖励信号,这样更输出可能会更规整。
嵌入模型是用来检索的。LLM 依赖的 Transformer 架构的时空复杂度是和序列长度 O(N^2)的,所以不太能把知识库所有的语料都放进去。

静态嵌入模型在这里本质上是做语义相似度,把和你要查询的内容相关的文本找出来再喂给 LLM ,因为静态嵌入模型和上下文无关,所以预先计算成向量,然后再和你的查询转换成的计算相似度就可以了。

另一件事情是,LLM 并不是输入越多信息越好,所以用另一个模型帮它做精简。
253 天前
回复了 jlak 创建的主题 程序员 感觉编程辅助工具都在卷 Agent 而不是补全
补全的能力更多依赖 foundation model
254 天前
回复了 voidmnwzp 创建的主题 程序员 ai 这是真要把前端干死吧
@pureGirl 确实没必要分了,以前分前后端是一个人能学的知识有限,现在大家的心智负担小了不少
254 天前
回复了 voidmnwzp 创建的主题 程序员 ai 这是真要把前端干死吧
@mumbler 我最近用 cursor 复现论文,效果非常好。你说推荐系统,一整套系统让 AI 直接来做上很难的,exposure bias 嘛。但如果是学术界用来复现论文或者快速实现 idea ,非常好用,基本上也不需要怎么改。这可比前端用 cursor 要舒服多了。
254 天前
回复了 IAmSimon 创建的主题 程序员 讨论一下 Ai 辅助编程的痛点
建议给 AI 写文档,你要什么功能,具体的定义,期望的表现都给 AI 写好。
270 天前
回复了 Suger828 创建的主题 程序员 如何进行大模型知识蒸馏
@dianso 蒸馏还好,要去训练的模型不是 LLM 的规模。
---
现在大家用 LLM 的结果去蒸馏,蒸馏学习的目的是让更大的模型作为小模型的 supervisor ,这样能让小模型学到大模型的能力,所以直接学输出也是可以的。
@ttgo 2.0 的能力还挺强的
@pureGirl 那就做优先级队列?把耗时长的任务放后面一点,并行处理 xlsx 也没有太多特殊的操作。
1  2  3  4  5  6  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   956 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 42ms · UTC 19:10 · PVG 03:10 · LAX 12:10 · JFK 15:10
♥ Do have faith in what you're doing.