23-25 年算不算是 AI 超级军备竞赛的 3 年, 谁能想到才 3 年 LLM 的能力已经非常高了

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

看了 ChatGPT 模型版本史, 感觉 21 世纪 20 年代真算是人工智能普及的时代了, 颇有美苏冷战技术爆炸的感觉, 当时是机械制造和电子计算机, 现在是大语言模型代表的生成式人工智能。

2017 年: Transformer 模型真神降临, All you need 预言成真了
2017-2019: Bert GPT-1 GPT-2 只是初见端倪, 只在 NLP 领域应用, 我当时也只是用来做文本分类和情绪识别这些, 这时候预训练模型已经不是普通人能独立做出来了, 需要大算力支持.
2020: GPT-3 模型更大, 引发关注
2022.11: GPT-3.5 爆火, LLM 第一次被大众熟知, 这时候才引起大语言模型军备竞赛
2023.3: GPT-4 多模态发布.
2025.3: GPT-5 发布.

2023.3: claude 初代发布, 创始人从 2021 openai 离职后创建 Anthropic,
2023.7: claude2 发布 -> 2024.3 claude3 -> 2025.5 claude4

2023.2 谷歌 bard 发布, 之后逐步支持更多语言, 但谷歌当时很保守不看好发展 -> 2024.2 更名 Gemini -> 2024.11 Gemini 2 -> 2025.3 Gemini 2.5 -> 2025.11 gemini 3

2023.2: LLAMA 初代开源, 可以实现自部署私有大模型. -> 2023.7: LLAMA2 -> 2024.4 LLAMA3 -> 2025.4 LLAMA4

2023.11: DeepSeek-LLM 发布-> 2024.1 DeepSeek-MoE -> 2024.5 DeepSeek-V2 -> 2024.12 deepseek V3 -> 2025.1 deepseek R1 deepseek 基本在 24 年开始有人使用, 25 年春节时被大规模报道, 成为国产大模型代表, 因为开源也带来国产化部署的一波热潮

还有 mistral 豆包 kimi qwen minimax 等模型加入竞争, 真是万物竞发生机勃勃

这只是简单的一些列表, 仔细看 22 年底才能算是 LLM 初步发力, 23 年 LLAMA 开源后让更多人能研究和使用 LLM, 24 年开始有各种模型涌现, 25 年的 deepseek 开源模型算是让国产大模型扬眉吐气的一个时间点, 最近 Gemini 3 pro 发布好像也引起了一波讨论. 短短 3 年时间, LLM 的能力已经到这种高度了, 不敢想象未来 5 年会是什么样子.

llm

军备竞赛

2 条回复

NewYear

1 天前

3 年不上班，再上班感觉《恍如隔世》。

paopjian

1 天前

@NewYear 说真的, 现在忙到爆, 回看十一感觉还是昨天的事, 一忙起来就没关注其他事了