V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
IndexOutOfBounds
V2EX  ›  程序员

[教程] TinyGPT: 在 Mac 本地从头预训练一个 能续写儿童故事的模型

  •  
  •   IndexOutOfBounds · 22 小时 50 分钟前 · 973 次点击

    以前手写操作系统,手写数据库... 是程序员的浪漫

    现在 AI 时代得多加个手写 LLM


    ✨ 特性

    • 完整训练流程: 涵盖从 预训练( DONE )、SFT 到 DPO (WIP)
    • 低门槛: 无需云端 GPU ,同时兼容 Mac M 芯片
    • 为学习而生:
      • 内置 teacher AI,引导式教学
      • 手写模型架构,且不追求性能和效果,仅使用经典算法做入门实现
      • 有类型注释,懂的都懂 🤷🏻‍♀️...

    🚀 开始吧!

    每个章节相互独立,可任意开始

    也可直接让老师带你,比如:

    # 在 Cursor ,Claude Code 或任何带 Bash Tool 的环境中:
    @teacher 带我预训练
    

    291adacc23c91ab1520bc90d81e698ed.png

    • 预训练: 手搓 10M 的超小模型(比 Qwen3-0.6B 还要小 60 倍)
    • SFT (WIP): Qwen3-0.6B 版加法器
    • DPO (WIP): 反向安全对齐,Qwen3-0.6B 越狱破限

    https://github.com/glidea/tinygpt

    2 条回复    2025-11-10 11:15:58 +08:00
    LeegoYih
        1
    LeegoYih  
       22 小时 4 分钟前   ❤️ 1
    收藏
    IndexOutOfBounds
        2
    IndexOutOfBounds  
    OP
       20 小时 32 分钟前

    微调暂定了这两个案例,大家有更实用的案例就更好了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1268 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 18ms · UTC 23:48 · PVG 07:48 · LAX 15:48 · JFK 18:48
    ♥ Do have faith in what you're doing.