想基于一些本专业相关电子书构建知识库,并在大模型辅助下撰写一份近百页篇幅的英文材料,输入资料无保密要求,个人无任何 LM 基础,且编程底子弱、没空折腾
通过 V2EX 了解到 Dify 等低代码平台似乎满足需求,如
https://ex.noerr.eu.org/t/1111695
看了小一周的视频教程/Reddit 论坛/官方文档,初步摸索了知识库傻瓜式搭建流程和模型选择
目前,基于 一份 6000 字的英文资料 + 父子分块 + Qwen3 Embeddind & Reranker 4B ,测得召回 score 还可以,试了下问答似乎没啥大问题,但还没有大量喂资料和优化调参(如对比 Jina/Cohere )
水平低,问题傻,请大佬们不吝赐教!感谢!
![]() |
1
3297269 2 天前 ![]() 长上下文我觉得 Gemini 2.5 Pro 表现最好,要不先试试上传文档结合 deepResearch ,让它搭个框架?
|
2
jamesjammy061 1 天前 ![]() 整篇超长文(硕士毕业论文*10 那种),而且还要上下文一致性,感觉有点难办啊,越写后面记性越差。2.5 pro 一次性的 DeepResearch 还行,但是没法把多次结果连贯起来
|