Suinn 最近的时间轴更新
Suinn

Suinn

V2EX 第 481792 号会员,加入于 2020-04-05 17:57:27 +08:00
今日活跃度排名 6148
这样是否可以保证 OCR 识别率接近百分之 100
程序员  •  Suinn  •  1 天前  •  最后回复来自 Suinn
48
百万数据下的大模型校验应用
程序员  •  Suinn  •  147 天前  •  最后回复来自 Suinn
4
关于 Rag 本地知识库落地的问题求助
  •  2   
    问与答  •  Suinn  •  147 天前  •  最后回复来自 Suinn
    9
    前辈们, Java 程序员转嵌入式有可操作性吗
    程序员  •  Suinn  •  2020-07-16 17:38:31 PM  •  最后回复来自 Suinn
    9
    Suinn 最近回复了
    @kuanat 感谢分享,我图像处理和 vlm 学的还行,但确实没从事过真正生产端的 ocr 开发,你提到的需求场景几乎都采用人工复核的方式,我思考的点正是源自于是否能提供另一种模式,仅在服务不提供输出时再进行人工复核,对于输出部分的内容可以百分百信任
    @showonder 其实还是不太一样,说到底 ocr 本质基本是特征提取+分类,但 vlm 是有语义空间的,这种融合的说服力其实比单纯 ocr 的叠加要强上不少
    @retrocode o(* ̄▽ ̄*)ブ感谢分享,这个思路确实很新颖
    @billbob 目前这个方案虽然无限降低了召回率,但几乎也过滤了所有假阳性的情况,现在比较头疼的点确实在于没法论证能达到百分百的准确率,直觉上来说总感觉就是无限逼近 100%😂
    @InkAndBanner 感谢分享,vlm 这块你们有试过 InternVL 或者 glmVL 吗,看最近的分数都挺高但是不知道实际能力和 qwen 比如何
    @gbw1992 一般主要是体现在出现了大量的 False Rejection 吗,其实这个方案只有能保证识别出来的没问题,我觉得就 ok 了
    @paopjian 对,因为主要是账单的数字识别,文本上不会有太多
    @gpt5 是的,主要还是预设业务场景属于要么不识别,要么尽量百分百识别的那种。所以想请各位大佬看看这个方案是否存在大的问题
    @RotkPPP 对,主要就是如果单纯只用 ocr 识别,光看置信度不能保证出来的一定准,这种做法相当于用 VLM 加了一层校验
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3274 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 14ms · UTC 10:39 · PVG 18:39 · LAX 03:39 · JFK 06:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.