V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
paopjian
V2EX  ›  分享发现

23-25 年算不算是 AI 超级军备竞赛的 3 年, 谁能想到才 3 年 LLM 的能力已经非常高了

  •  
  •   paopjian · 2 天前 · 309 次点击
    看了 ChatGPT 模型版本史, 感觉 21 世纪 20 年代真算是人工智能普及的时代了, 颇有美苏冷战技术爆炸的感觉, 当时是机械制造和电子计算机, 现在是大语言模型代表的生成式人工智能。

    2017 年: Transformer 模型真神降临, All you need 预言成真了
    2017-2019: Bert GPT-1 GPT-2 只是初见端倪, 只在 NLP 领域应用, 我当时也只是用来做文本分类和情绪识别这些, 这时候预训练模型已经不是普通人能独立做出来了, 需要大算力支持.
    2020: GPT-3 模型更大, 引发关注
    2022.11: GPT-3.5 爆火, LLM 第一次被大众熟知, 这时候才引起大语言模型军备竞赛
    2023.3: GPT-4 多模态发布.
    2025.3: GPT-5 发布.

    2023.3: claude 初代发布, 创始人从 2021 openai 离职后创建 Anthropic,
    2023.7: claude2 发布 -> 2024.3 claude3 -> 2025.5 claude4

    2023.2 谷歌 bard 发布, 之后逐步支持更多语言, 但谷歌当时很保守不看好发展 -> 2024.2 更名 Gemini -> 2024.11 Gemini 2 -> 2025.3 Gemini 2.5 -> 2025.11 gemini 3

    2023.2: LLAMA 初代开源, 可以实现自部署私有大模型. -> 2023.7: LLAMA2 -> 2024.4 LLAMA3 -> 2025.4 LLAMA4

    2023.11: DeepSeek-LLM 发布-> 2024.1 DeepSeek-MoE -> 2024.5 DeepSeek-V2 -> 2024.12 deepseek V3 -> 2025.1 deepseek R1 deepseek 基本在 24 年开始有人使用, 25 年春节时被大规模报道, 成为国产大模型代表, 因为开源也带来国产化部署的一波热潮

    还有 mistral 豆包 kimi qwen minimax 等模型加入竞争, 真是万物竞发生机勃勃

    这只是简单的一些列表, 仔细看 22 年底才能算是 LLM 初步发力, 23 年 LLAMA 开源后让更多人能研究和使用 LLM, 24 年开始有各种模型涌现, 25 年的 deepseek 开源模型算是让国产大模型扬眉吐气的一个时间点, 最近 Gemini 3 pro 发布好像也引起了一波讨论. 短短 3 年时间, LLM 的能力已经到这种高度了, 不敢想象未来 5 年会是什么样子.
    NewYear
        1
    NewYear  
       1 天前
    3 年不上班,再上班感觉《恍如隔世》。
    paopjian
        2
    paopjian  
    OP
       1 天前
    @NewYear 说真的, 现在忙到爆, 回看十一感觉还是昨天的事, 一忙起来就没关注其他事了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2453 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 05:18 · PVG 13:18 · LAX 21:18 · JFK 00:18
    ♥ Do have faith in what you're doing.