V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
fenglirookie
V2EX  ›  开源软件

本地化的 OCR 提取(中文)库有哪些?

  •  
  •   fenglirookie · 67 天前 · 2650 次点击
    这是一个创建于 67 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如题,我想在 android 上运行一个本地提取图片内文字的库,现在用的是 com.google.mlkit:text-recognition 但是问题很多,经常识别文字错误,且错误很多,只有 数字识别比较准,就是想了解一下 v 友们还知道哪些能够本地识别图片内文字的 android 库?或者是免费调用的在线 api 也可以。我试了一下 百度的 Paddle 但是好像要注册公司还是啥 没有成功

    28 条回复    2025-07-18 16:50:20 +08:00
    leewaytown
        1
    leewaytown  
       67 天前
    之前有老哥把微信的 OCR 扒出来了
    https://github.com/golangboy/wxocr
    fenglirookie
        2
    fenglirookie  
    OP
       67 天前
    @leewaytown 没有代码了
    equationl
        3
    equationl  
       67 天前
    fenglirookie
        4
    fenglirookie  
    OP
       67 天前
    @equationl 这个的识别准确度是不是要比 com.google.mlkit:text-recognition 高很多哦
    wnpllrzodiac
        5
    wnpllrzodiac  
       67 天前 via Android
    paddle 但是官方的不好用,有个提取出来的没有依赖
    fenglirookie
        6
    fenglirookie  
    OP
       67 天前
    @wnpllrzodiac android 那个吗?
    fenglirookie
        8
    fenglirookie  
    OP
       67 天前
    @fish2050 这个好像只能识别 ,没有计算文字所在坐标的
    fish2050
        9
    fish2050  
       67 天前
    @fenglirookie 仔细阅读 readme
    iMusic
        10
    iMusic  
       67 天前
    https://github.com/RapidAI/RapidOCR 试了几个这个最好
    iMusic
        11
    iMusic  
       67 天前
    @fenglirookie #2 不挺多 fork 的嘛
    bubble21
        12
    bubble21  
       67 天前
    @fenglirookie #2 forks 里面还能查找到
    wangxiaoer
        13
    wangxiaoer  
       67 天前 via iPhone
    @fenglirookie fork 是个好东西😄
    fenglirookie
        14
    fenglirookie  
    OP
       67 天前
    @iMusic 这个没有 android 的吧?
    yangg
        15
    yangg  
       67 天前
    @iMusic 试了经常出现英文没有空格,不知道是为啥
    youyouzi
        16
    youyouzi  
       67 天前
    @fenglirookie #2 从 fork 里面找,还有 docker 版本的。很好用
    fenglirookie
        17
    fenglirookie  
    OP
       67 天前
    @youyouzi 嗯 我在找 客户端部署的
    fenglirookie
        18
    fenglirookie  
    OP
       67 天前
    @youyouzi 好像没有客户端的 ,都是 docker 版本的
    cat
        19
    cat  
       67 天前
    @leewaytown #1 怎么变成 nothing 了,之前我还 star 了
    ShiJh
        20
    ShiJh  
       67 天前
    @fenglirookie 1.5k 的 fork ,随便找
    fenglirookie
        21
    fenglirookie  
    OP
       67 天前
    @youyouzi 你们用的哪个? golangboyme 那个吗?我用了一个 识别不出来。。。。。
    surfwave
        22
    surfwave  
       67 天前
    RapidOCR 不错,可以试试
    fenglirookie
        23
    fenglirookie  
    OP
       67 天前
    @leewaytown 这个 返回空的[] 是啥情况
    fenglirookie
        24
    fenglirookie  
    OP
       67 天前
    @leewaytown 哦 找到了
    maocat
        25
    maocat  
       67 天前
    @leewaytown #1 给一楼补一个链接,这个仓库只是被 force push 之前的 commit 其实还是在的
    https://github.com/golangboy/wxocr/tree/3909467809c4ca4bf33f9e97aa2855d92d9b6f5b
    fenglirookie
        26
    fenglirookie  
    OP
       67 天前
    @leewaytown 试了一下 感觉也一般 效果不咋行 ,只能说能识别 ,但是准确度还是差
    fenglirookie
        28
    fenglirookie  
    OP
       14 天前
    @lpdswing 谢谢
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1123 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 18:03 · PVG 02:03 · LAX 11:03 · JFK 14:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.