V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  cvooc  ›  全部回复第 1 页 / 共 56 页
回复总数  1116
1  2  3  4  5  6  7  8  9  10 ... 56  
@Ming5Ming 是的, 我找了下当时的代码, 核心那段方法是这样的. 90 多个 case, 涵盖 0-9 和小数点还有-号. 因为最后已经把图片处理的高度一致了,二值化后把所有独立的白色像素按块全部切出来, 本意是缩小图片在能识别出来的同时加速 ocr 速度, 最后单数字尺寸都极小了, 索性从上到下从左到右直接数连续的白色像素了, 跑了两天把遗漏的 case 加进去, 效果还算不错反正是解决问题了.
```java
public static String isNumber(StringBuffer tempStr) {
switch (tempStr.toString()) {
case "11111":
case "111111":
return "-";
case "11111161111116":
return "-0";
case "2":
return ".";
case "11":
case "22":
return ":";
case "61111116":
case "51111117":
case "52211117":
case "71111115":
case "71111117":
case "72211227":
return "0";
case "1181":
case "129":
case "1229":
case "1299":
case "2299":
return "1";
case "2211111111121":
case "22312112141":
case "111311111131":
case "112212112141":
case "121312112131":
case "122413113141":
case "121312112141":
return "2";
...
...
...
case "42221111117":
case "411111111117":
case "411221112227":
case "412221111117":
return "9";
case "1210111021":
return "↑";
case "132121911132121911":
case "132131911132131911":
return "44";
case "4141111111141132121911":
case "4141111111141132131911":
return "54";
case "4141111111141132121911132121911":
return "544";
default:
int err = 1 / 0;
return "";
}
}

```
很久之前研究过 ocr, 然后自己训练. 是个金融项目反爬很厉害, 让 OCR 识别, 只识别数字然后导入到"老板自己的秘密算法"里出结果, 结果 OCR 不是很理想正确率 97/98 左右速度也慢, 完了老板还是不满意, 因为金融项目数字很多人工校对很麻烦, 折腾了快三月, 图片二值化,图在切碎些全全搞了, 最后切成了一个数字一张几 B 的图片.

在看之前编写的一堆规则把图片都切的细碎了, 一咬牙一跺脚,把所有图片的数字像素转成了字符串硬编码(类似 X 黑 X 白 X 黑 X 白这种字符串), 然后花了两天跑了下数据看有没有遗漏的没记下的像素组成, 结果识别率 100%(因为没走 OCR 直接比字符串). 速度还快以前转 OCR 一张小图 2~3 秒,现在 30 张图 2~3 秒.

这应该也算"要么识别准"的一种方案了,不过只适合固定来源的数字识别.
5 天前
回复了 lpffernando 创建的主题 Android 安卓主力机推荐
要我肯定推荐小米十来年用出感情了, 小爱同学和米家生态基本没有平替.
@retrocode 没事了 看错地方了 用户名旁边没有修改按钮, 但是右侧菜单栏有
我余额够 5000 了为啥没有修改按钮, 还有其他限制吗
9 天前
回复了 cKnight 创建的主题 Rust 太快了! Rust 太快了!
前排求一份系统些的 rust 手册, 一直想学, 但是最多写了写 wasm, 直接上 web 开发老是担心后续用的组件不好找, 例如 office 文件生成, PDF 这些比较基础的功能.
我还有 244 天而立, 现在是每天累死累活搞钱, 车房有了没对象, 不知道自己为了什么要这么累. 7 月份开始减肥健身,准备大战 300 天迎接那天. 7 月份的时候体重 82,现在 72. 用各种事情把自己填满省的夜深人静一个人寂寞. 0.0
讲道理在初出茅庐的时候, 我对程序员或者至少技术人员的印象, 是大胆试错用于追新的, 至少当时我接触的同行是这样.
直到来到了 V 站, 发现大家都一样, 人到中年思维固化对新事物存在抵抗情绪.

现在我是一般建议不用在意, 尊重祝福加速.
目前调研下来, doubao1.6 和 deepSeekV3.1 的效果最好, 生成的文本非常完美.

doubao1.6-flash 就比较抽风部分满足需求, 提示词还得单独调教. 但是百万 token 下价格只有 doubao1.6 的八分之一.
10 天前
回复了 MIND222 创建的主题 健康 30 多岁的中年人,真诚的发问。
我不管(撒泼打滚)!我就是青年!!
12 天前
回复了 ymrzny 创建的主题 生活 今晚求婚!
祝你幸福!
12 天前
回复了 midsolo 创建的主题 深圳 来聊一聊上下班堵车的问题吧
@sevenyangcc #28 地铁可以睡觉休息呀,开车尤其高峰期还要一直注意车况等红绿灯这些,相对更累吧
@cmdOptionKana 我相过一个律师,那是真的厉害,审问型人格,闲聊喜欢刨根问底一直问为什么.第一次见面慈眉善目的就把我信息问完了.遇到我不想说的人还鼓励我呢!说"没事就咱俩知道,大家都成年人了别局促."🤡
打印田字格这种吧, 属于典型伪需求... 如果是给孩子练字, 于情于理直接买个字帖更便宜省事~~
@lessMonologue 著名的: 外包+手握资源的转包+被转包忽悠搞钱的冤大头甲方+要完经费上线完成就没人用的产品 组合
19 天前
回复了 lyxxxh2 创建的主题 程序员 如何让 ai 更好的理解 uniapp?
可以考虑更换 uni-app x, 有官方出的 AI Rules, 可以提升一些效果, 你图里的这些感觉是生成内容全部用的 px 导致的, 你得让 ai 按 rpx 输出尺寸

https://doc.dcloud.net.cn/uni-app-x/tutorial/rules_mcp.html
SVG + CSS 最好
很健康了, 比大多数老哥好太多了, 我背着房贷还月光来着
提一个"老板们"最好自己提前了解下项目开发时间, 我这些年遇到的不管是众包还是别人介绍的私活, 都想着挣快钱, 开始时间要求基本都是一个月, 有一部分是两个月, 往上的几乎没有, 你给说时间, 人家说这不要了那个往后退尽量快些, 结果这不要那不要, 最后全他妈死命往回加,
"咱们都上线了, 客户等着用呢, 你加把劲" 我了去你的吧

最近接个私活要做一个 AI 小项目抄一个竞品, 我说这里面牵扯东西比较多, 耗时比较大我先回去调研做一下技术选型, 下一周跟我说拿要抄袭的东西给客户看了, 客户很满意, 做出来就有路子推, 问我 9 月 20 能上线不?????????

他娘的
1  2  3  4  5  6  7  8  9  10 ... 56  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   867 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 46ms · UTC 22:03 · PVG 06:03 · LAX 15:03 · JFK 18:03
Developed with CodeLauncher
♥ Do have faith in what you're doing.