V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Dlad
V2EX  ›  程序员

cursor pro 额度嗖一下就用完了,本地模型特别傻,现在怎么办?买 CC 吗

  •  
  •   Dlad · 11 天前 · 4077 次点击

    我看了下 cursor 后台调用,很多近 200 万 tokens 的请求,有点烧不起:P 要是能本地部署 claude 就好了。

    42 条回复    2025-07-16 19:10:32 +08:00
    humbass
        1
    humbass  
       11 天前 via Android
    本地部署一台聪明的,100 万起跳
    mooyo
        2
    mooyo  
       11 天前
    cc 或者 GitHub copilot 吧
    Dlad
        3
    Dlad  
    OP
       11 天前
    @humbass 美好愿望罢了。
    确实强,拖了好多年的项目,嗖嗖嗖就搞定了。
    慢慢发展,生成慢点儿也行。
    Dlad
        4
    Dlad  
    OP
       11 天前
    @mooyo
    cc 这个额度,也是快速用完。
    主要是会话不能场景缓存,已有项目初始化沟通每次都要消耗大量 token 。

    copilot 也有 agent 模式吗?用了多年 tab ,感觉没啥大用。
    mooyo
        5
    mooyo  
       11 天前
    @Dlad #4 有,copilot 现在一次会话算一条额度,更耐用一点
    mooyo
        6
    mooyo  
       11 天前
    @mooyo #5 但是 copilot 的 tab 贼难用
    JoeDH
        7
    JoeDH  
       11 天前
    用一下亚马逊最新出的 kiro
    Dlad
        8
    Dlad  
    OP
       11 天前
    @JoeDH 在薅了在薅了
    czxcanvas
        9
    czxcanvas  
       11 天前 via Android
    copilot 最近已经有 agent 模式了
    lneoi
        10
    lneoi  
       11 天前
    我今天也用完了,想找个编辑器能接 gemini 的,内置普通 tab 就行。
    只有 trae 能接入,但用的效果不如 cursor ,挺奇怪。
    mumbler
        11
    mumbler  
       11 天前
    18 个月后本地小模型就有现在 claude 的水平了,现在 7B ,8B 模型相当于 24 年初最顶尖的 gpt4o 的水平
    streamrx
        12
    streamrx  
       11 天前 via iPhone
    cc 现在也降额。200 的 max 每 5 小时的量起码比之前少了一半
    Dlad
        13
    Dlad  
    OP
       11 天前
    希望大家都能做显卡的时代来的再快一点。
    世界欣欣向荣,可我快挂了啊[捂脸]
    codingforfreedom
        14
    codingforfreedom  
       11 天前 via iPhone
    我的 pro 账号基本都没怎么用,上个 v2er 上个月租完这个月不续租了,继续按月租赁,base64: dGfvvJpjb2Rpbmdmb3JmcmVlZG9t
    cat
        15
    cat  
       11 天前
    玩了两天 agent 模式,消耗了 6411 万 claude-4-sonnet-thinking tokens
    现在提示我照这个频率过两天就达到限额了,但还没超,哈哈哈
    MonikaCeng
        16
    MonikaCeng  
       11 天前 via iPhone
    cc 照道理可以调出会话历史吧,看看命令行,这不是技术难点,它没道理不做这功能
    Dlad
        17
    Dlad  
    OP
       11 天前
    @MonikaCeng
    1 、最开始用 chatgpt 的时候,所谓“会话”是每次把迄今聊天记录整个丢给 AI——考虑模型对外提供推理服务,不应被用户访问“训练”,不应有记忆。
    2 、现在可能有好转即出现“短期记忆”,但保留“记忆”需要成本,不能长久保存。首次读项目需要百万 token ,每次记忆消失,都需要这么多 token 。
    3 、类似推理可以用 cursor 请求记录引证。

    不是“会话历史”功能这么简单。
    pike0002
        18
    pike0002  
       11 天前
    augment code
    micean
        19
    micean  
       11 天前
    aws 的 kiro 刚出来,试试看?
    XTTX
        20
    XTTX  
       11 天前
    我用了一个月的 Cursor ultra 。 刚开始全是用的 Opus thinking, 10 天不到就 CD 了。政策不停地改,几天后只能用 Sonnet. 换了 CC Max 200 美金的额度, 全部 Opus ,会自动提醒, 没有 CD 焦虑。 爽 yy.

    我建议如果有项目要冲,高强度可以上 100 美金的 CC 。 我认为还是且用且珍惜,Cursor 只用了大半个月从神坛迭下来,最后还是败在 token cost 上。CC 估计也会跟着涨。
    wink
        21
    wink  
       11 天前
    @XTTX 老哥 CC 咋付费的
    leaveeel
        22
    leaveeel  
       11 天前
    @lneoi vsc 不是有 gemini assist 插件吗,这个有没有用过
    XTTX
        23
    XTTX  
       11 天前
    @XTTX 我有张国外的卡
    yuan925
        24
    yuan925  
       11 天前
    如果你之前是每月 500 次请求订阅,现在按 token 计费,可以尝试写封邮件申请更改回来。
    我的已经申请回之前的 500 次请求了。
    XTTX
        25
    XTTX  
       11 天前
    @yuan925 用 Sonnet 请求只有 225 ,用 auto 才是 500. 我用一天半 CC, 体验是终于吃上细糠了。Cursor 用的 thinking, 反应慢,啰嗦。CC 一下子就弄完了, 水管粗还是强啊。Cursor 生成的那些 TOC 我根本从来不看。
    litchinn
        26
    litchinn  
       11 天前
    我现在在用,Claude code router + gemini ,gemini 创建多个项目,每个项目一个 key ,一个 key 额度满了换一个
    yuan925
        27
    yuan925  
       11 天前
    @XTTX 最新的订阅计费高级模型(比如 claude-4-sonnet)按 20$ 计量扣减的,大概是 225 左右,用完了就提示 limit ,账账单另外付费,auto 可以无限用。如果是之前计费方式,是按请求次数算,有 500 ,差别太大了。
    https://docs.cursor.com/account/pricing
    yuan925
        28
    yuan925  
       11 天前
    @XTTX CC 其实也挺慢的,不一定比 cusor 快,效果略好,不过修复小的 bug 之类的,体验比较差,cursor 反应快很多,大多数情况用 thinking 其实效果并不好。
    subpo
        29
    subpo  
    PRO
       11 天前
    怎么看限额啊?我开 agent 模式感觉 token 用起来也是嗖嗖的,但是没看到哪里有限额啊
    jonsmith
        30
    jonsmith  
       11 天前 via Android
    怎么能一下子用完的,500 次够我一个月用,可能我代码量不大
    mmm159357456
        31
    mmm159357456  
       11 天前
    当然是用 claude code+kimi-k2 啦,fuclaude
    ShaunSS
        32
    ShaunSS  
       11 天前
    cursor 已卸载, 目前 claude code 配 kimi k2 api 再结合 copilot 体验良好.
    kakki
        33
    kakki  
       11 天前
    ...500 次你们是什么都问吗?我天天 996 也问不出这么多问题.月底还剩一半.
    oudioppa
        34
    oudioppa  
       11 天前
    @ShaunSS 你感觉 kimi k2 api 能媲美 Sonnet 4 了吗
    NeroKim
        35
    NeroKim  
       11 天前
    @oudioppa 太能了
    lneoi
        36
    lneoi  
       11 天前
    @leaveeel 简单的尝试过,不知道为什么反应非常慢,功能上感觉也没 ide 的上下文支持那么强。
    xmdbb
        37
    xmdbb  
       11 天前
    @kakki 让他创建 UI ,写组件....重构......
    XTTX
        38
    XTTX  
       11 天前
    @kakki https://streamable.com/trv1k3 写两个动态效果, 简单调试一下, 30-50 个就没了
    zcljy
        39
    zcljy  
       11 天前
    看了看后台 半个月用了 90 个 claude4 请求 不是 thinking 好奇限额是怎么做到的
    sampeng
        40
    sampeng  
       11 天前 via iPhone
    @Dlad 100 刀的 max ,一天肯定够用
    Dlad
        41
    Dlad  
    OP
       11 天前 via iPhone
    @sampeng
    有点麻烦。要不还是把英伟达买了,挟天子以令不服。[doge]
    ShaunSS
        42
    ShaunSS  
       11 天前
    @oudioppa 不能, 目前体感上差不多有 3.7 九成的功力.
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2551 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 11:15 · PVG 19:15 · LAX 04:15 · JFK 07:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.