V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
kxg3030
V2EX  ›  程序员

请教大模型微调相关的问题

  •  
  •   kxg3030 · 1 天前 · 792 次点击

    1.我的需求:

    每天我会收集一些和股票相关的新闻,这些新闻有些是重要的(比如:xx 公司开发了新药),其他大部分都没什么价值,由于新闻太多了,看不过来,而这个又比较依赖人工的判断,不能简单的通过关键字去匹配,所以想通过微调大模型来实现,得出类似这样的结构:

    { keyword:"创新药", analysis:"新药可以带动市场情绪", label:"对股票利好" }

    2.我的问题:

    针对上面的问题,应该是属于哪一类任务呢,简单的文本分类不太满足,我对大模型不是很熟悉,但是常见的微调,rag,agent 都简单的玩过,请教各位大佬使用哪个模型,哪种数据结构来微调比较好(我咨询过阿里的社区,建议是使用问答来做,而不是分类,有点迷惑了),有这方面实际操作的建议吗

    10 条回复    2025-08-19 17:54:25 +08:00
    fatyu
        1
    fatyu  
       1 天前
    可以批量采集数据, 如果文本过多可以使用支持长上下文的大模型进行推理。
    fatyu
        2
    fatyu  
       1 天前
    设定提示词, 角色、任务、抽取数据规则、结果格式。
    fatyu
        3
    fatyu  
       1 天前
    ## 角色设定
    你是一名资深股票分析师,需从新闻中提取投资信号。

    ## 任务步骤
    1. **提取关键词**:找出核心实体(公司/技术/政策)。
    2. **影响分析**:分三部分:
    - 短期情绪影响
    - 中长期基本面影响
    - 产业链扩散效应
    3. **标签分类**:按 5 级体系标注( S/A/B/C/D 级或利空)。

    ## 输出格式(强制 JSON )
    {
    "keyword": str,
    "analysis": str, # 限 100 字内
    "label": "S 级利好" | "A 级利好" | ... | "利空"
    }

    ## 示例参考
    新闻:”国务院印发《低空经济发展规划》”
    输出:{"keyword":"低空经济","analysis":"国家级战略驱动,基建+运营企业优先受益","label":"S 级利好"}--------------------------------一下是文章内容,xxxxxxxxxxxxxxxxxx----------------------------帮我按照上面要求输出结果。
    litchinn
        4
    litchinn  
       1 天前
    微调不就是要数据集吗,https://modelscope.cn/datasets
    这上面找找,或者自己做,自己做有点难
    coefu
        5
    coefu  
       1 天前
    这就想把最难的问题空手套白狼啊?😀
    op351
        6
    op351  
       1 天前
    借楼问问,微调( Fine-tuning )有啥入门的教程或者例子吗?想动手做一做。
    kxg3030
        7
    kxg3030  
    OP
       1 天前
    @op351 如果你不会的话 可以不回答的
    kxg3030
        8
    kxg3030  
    OP
       1 天前
    @fatyu 这个很接近我之前参考的一个提示词 意思微调是不考虑吗
    hdqzzz
        9
    hdqzzz  
       10 小时 48 分钟前
    这个任务提示词就能搞定了
    liant
        10
    liant  
       7 小时 43 分钟前
    帮我分析一下京东还能不能涨了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1368 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 17:37 · PVG 01:37 · LAX 10:37 · JFK 13:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.