1
yanyao233 2024-03-18 19:36:13 +08:00 via Android
直接把原文扔数据库应该是成本最低的方式吧,也是现在大部分 rag 的惯用方式,可以先试一下,看看效果怎么样
|
2
allplay 2024-03-18 21:42:26 +08:00
有意思,要干什么?哈哈
批量生产 D 八股 |
![]() |
3
sullevy 2024-03-19 09:53:04 +08:00
基本就是 RAG 的思路了,同时看你用的架构
可能需要要一点的 Embedding 和 ReRank 模型,基础的 LLMs 也不成差。 如果可以 这个牛克思的数据最好也处理下,方便召回 |
![]() |
4
necat OP @yanyao233 问题是这样,这个牛克思因为是自己刚刚总结的思考,几乎没有任何外部的相关数据和讨论,如果依赖大量的数据只有他自己编写了。如果只能是这样,大概需要多少数据量呢。
|