Text2SQL(NL2SQL, 大模型问数据库)有什么成熟、准确率高的解决方案?

60 天前
 NothingExist

https://ex.noerr.eu.org/t/1124121?p=1#reply78

领导让我针对公司的某个数据库做一个 AI 问数平台,给上级领导和业务人员使用,开始上手之后,我发现这个事情第一部简单,但要保证输出的 SQL 与预想中的一样极难,对输出的内容也非常不自信。

#问题: 核心问题:数据不涉及多表查询,但是数据的维度很大,有六个维度,这六个维度唯一确定一条记录,指标也有 14 个之多。

当维度比较少的时候,比如一个时间维度+两个其他维度,这个时候输出的内容勉强可以接受,但是当维度进一步放大,比如一个时间维度+三个其他维度(比如产品类型、渠道类型、销售地区),此时,输出的 SQL 就很容易遗漏某个维度。

其他问题:不了解用户会问什么问题,我调制的 prompt 只对我设想的问题工作,但其他人随便想一个问题,这些 prompt 就不起作用了;或者一些小词换一个问法,就出不了结果。

#尝试过的技术方案:

  1. DIFY Workflow 2.SuperSonic (目前在用)

#目前想到的解决方案: 1.精简数据表,把原来的六七个维度,精简到一个三个(一个时间维度+两个其他维度) 2.进一步寻找解决方案

1900 次点击
所在节点    程序员
23 条回复
NothingExist
56 天前
@yshan 也是个好主意 有什么好的工具推荐吗
NothingExist
56 天前
@sssjjjjj 表太宽,导致输出的时候 经常会遗漏信息
silyboy
50 天前
@NothingExist 我用的 fastmcp, 把公司已有的金融数据 api 接口的 openapi 文档,转为 mcp 工具. 这样问 ai 股票信息, 就可以获取最新的数据.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1142776

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX