请教大模型微调相关的问题

1 天前
 kxg3030

1.我的需求:

每天我会收集一些和股票相关的新闻,这些新闻有些是重要的(比如:xx 公司开发了新药),其他大部分都没什么价值,由于新闻太多了,看不过来,而这个又比较依赖人工的判断,不能简单的通过关键字去匹配,所以想通过微调大模型来实现,得出类似这样的结构:

{ keyword:"创新药", analysis:"新药可以带动市场情绪", label:"对股票利好" }

2.我的问题:

针对上面的问题,应该是属于哪一类任务呢,简单的文本分类不太满足,我对大模型不是很熟悉,但是常见的微调,rag,agent 都简单的玩过,请教各位大佬使用哪个模型,哪种数据结构来微调比较好(我咨询过阿里的社区,建议是使用问答来做,而不是分类,有点迷惑了),有这方面实际操作的建议吗

828 次点击
所在节点    程序员
10 条回复
fatyu
1 天前
可以批量采集数据, 如果文本过多可以使用支持长上下文的大模型进行推理。
fatyu
1 天前
设定提示词, 角色、任务、抽取数据规则、结果格式。
fatyu
1 天前
## 角色设定
你是一名资深股票分析师,需从新闻中提取投资信号。

## 任务步骤
1. **提取关键词**:找出核心实体(公司/技术/政策)。
2. **影响分析**:分三部分:
- 短期情绪影响
- 中长期基本面影响
- 产业链扩散效应
3. **标签分类**:按 5 级体系标注( S/A/B/C/D 级或利空)。

## 输出格式(强制 JSON )
{
"keyword": str,
"analysis": str, # 限 100 字内
"label": "S 级利好" | "A 级利好" | ... | "利空"
}

## 示例参考
新闻:”国务院印发《低空经济发展规划》”
输出:{"keyword":"低空经济","analysis":"国家级战略驱动,基建+运营企业优先受益","label":"S 级利好"}--------------------------------一下是文章内容,xxxxxxxxxxxxxxxxxx----------------------------帮我按照上面要求输出结果。
litchinn
1 天前
微调不就是要数据集吗,https://modelscope.cn/datasets
这上面找找,或者自己做,自己做有点难
coefu
1 天前
这就想把最难的问题空手套白狼啊?😀
op351
1 天前
借楼问问,微调( Fine-tuning )有啥入门的教程或者例子吗?想动手做一做。
kxg3030
1 天前
@op351 如果你不会的话 可以不回答的
kxg3030
1 天前
@fatyu 这个很接近我之前参考的一个提示词 意思微调是不考虑吗
hdqzzz
17 小时 53 分钟前
这个任务提示词就能搞定了
liant
14 小时 48 分钟前
帮我分析一下京东还能不能涨了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1153172

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX