Liftman 最近的时间轴更新
Liftman

Liftman

V2EX 第 493197 号会员,加入于 2020-06-04 17:00:48 +08:00
Liftman 最近回复了
@mfsw 就普通的厂就行啊。搬瓦工啥的。但是协议记得搞对。不然秒封 ip 。换一次 7 美金。
自己租一个 vps 就行了。自己架一下也就五分钟。。不要考虑 peo 。官方的预设提示词,内置的工具是无法比拟的。。。。纯 api 效果很拉跨。
17 天前
回复了 kiritoyui 创建的主题 NAS 优雅访问家里内网服务的方式讨论
我买的懒猫。。。因为我懒。
你不需要微调。其实最简单就是 2 个角度。1 。做成智能体。限制他回答其他通用问题。2 。加个知识库,塞点领域内的文本就行,不要管质量,只要数量。

然后这样吹:“

我们打造了一款面向 XX 行业的垂直领域大模型,它不仅是一个“懂行业”的大语言模型,更是一种对通用智能架构的深度垂直重构。

在数据层,我们整合了 超过 XX 万条高质量行业样本,总规模 XX 亿字的标注语料,覆盖了流程文档、结构化记录、实操指南、用户对话、异常日志等多个维度,形成完整的行业知识图谱与行为链路。

在模型层,我们基于当前主流的 Transformer 架构,引入了动态稀疏激活的 MoE ( Mixture of Experts )机制。通过在推理过程中动态选择不同专家路径,我们实现了模型在不同子任务间的能力分化与局部最优,每次前向仅激活 16%的参数,在显著提升性能的同时,大幅降低推理成本。

不仅如此,我们通过对行业任务进行标签驱动的专家路由学习,将模型专家层显式绑定到业务流程的不同模块,实现了“专人专岗”的智能推理路径。

同时,我们对模型进行了蒸馏与剪枝优化,在保留领域任务强表现的前提下,砍掉了超过 70%的冗余通用权重,使模型体积精简至原始的 40%,同时显著提升了加载速度与边缘部署能力。

更重要的是,在微调阶段,我们全面剥离了原始通用模型中与目标行业无关的知识残留,通过负迁移抑制 + 正则对比学习,显著提升了模型在行业问答、决策辅助、故障推理等核心场景下的稳定性与可解释性。

最终,这款模型在多个真实业务任务上交出了优异答卷:
• 召回率提升 32%
• 行业意图理解精度提升 29.4%
• 推理延迟降低 65%
• 平均部署成本下降 58%
还好我已经十多年不接触女性了。
@sciel ide 不变。claude code 是 clid 。不存在补全。直接完成任务。但是效果比 cursor 高一个大档次的。
因为 cursor 本质上就是二道贩子的角色。。他希望用户不要用太多。。。。现在反正各种策略搞得很不好。。

反正我们公司包括我自己都改 claude code 了。。费用多一点。但是效果好太多了。模型公司自己更懂模型。
30 天前
回复了 v2Donuts 创建的主题 教育 现在大学里本科的人工智能专业是学啥的?
这点其实你就看国外就行了。你看目前主流的 ai 公司哪个团队会有老年人的??但是我们国内的学术主流在什么人群手里。。。。更何况 ai 是目前计算机方向最吃资源的。大部分大学是完全没有条件给学生提供比较好的软硬件资源去实践。更何况大部分大学都没有接触过真正的前沿的东西。。。

反正我目前招聘的情况来看。普通大学的所谓的 ai 专业都是扯淡的。。。他们懂个锤子 ai 。。
你们具体谈恋爱。。谈什么?谈诈骗吗?
@djv 可以啊。我一直这样给同事做的。。他们每个人都有我的写入。。小米华为都没问题。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1156 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 18:01 · PVG 02:01 · LAX 11:01 · JFK 14:01
Developed with CodeLauncher
♥ Do have faith in what you're doing.