V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  cvooc  ›  全部回复第 1 页 / 共 56 页
回复总数  1116
1  2  3  4  5  6  7  8  9  10 ... 56  
@Ming5Ming 是的, 我找了下当时的代码, 核心那段方法是这样的. 90 多个 case, 涵盖 0-9 和小数点还有-号. 因为最后已经把图片处理的高度一致了,二值化后把所有独立的白色像素按块全部切出来, 本意是缩小图片在能识别出来的同时加速 ocr 速度, 最后单数字尺寸都极小了, 索性从上到下从左到右直接数连续的白色像素了, 跑了两天把遗漏的 case 加进去, 效果还算不错反正是解决问题了.
```java
public static String isNumber(StringBuffer tempStr) {
switch (tempStr.toString()) {
case "11111":
case "111111":
return "-";
case "11111161111116":
return "-0";
case "2":
return ".";
case "11":
case "22":
return ":";
case "61111116":
case "51111117":
case "52211117":
case "71111115":
case "71111117":
case "72211227":
return "0";
case "1181":
case "129":
case "1229":
case "1299":
case "2299":
return "1";
case "2211111111121":
case "22312112141":
case "111311111131":
case "112212112141":
case "121312112131":
case "122413113141":
case "121312112141":
return "2";
...
...
...
case "42221111117":
case "411111111117":
case "411221112227":
case "412221111117":
return "9";
case "1210111021":
return "↑";
case "132121911132121911":
case "132131911132131911":
return "44";
case "4141111111141132121911":
case "4141111111141132131911":
return "54";
case "4141111111141132121911132121911":
return "544";
default:
int err = 1 / 0;
return "";
}
}

```
很久之前研究过 ocr, 然后自己训练. 是个金融项目反爬很厉害, 让 OCR 识别, 只识别数字然后导入到"老板自己的秘密算法"里出结果, 结果 OCR 不是很理想正确率 97/98 左右速度也慢, 完了老板还是不满意, 因为金融项目数字很多人工校对很麻烦, 折腾了快三月, 图片二值化,图在切碎些全全搞了, 最后切成了一个数字一张几 B 的图片.

在看之前编写的一堆规则把图片都切的细碎了, 一咬牙一跺脚,把所有图片的数字像素转成了字符串硬编码(类似 X 黑 X 白 X 黑 X 白这种字符串), 然后花了两天跑了下数据看有没有遗漏的没记下的像素组成, 结果识别率 100%(因为没走 OCR 直接比字符串). 速度还快以前转 OCR 一张小图 2~3 秒,现在 30 张图 2~3 秒.

这应该也算"要么识别准"的一种方案了,不过只适合固定来源的数字识别.
4 天前
回复了 lpffernando 创建的主题 Android 安卓主力机推荐
要我肯定推荐小米十来年用出感情了, 小爱同学和米家生态基本没有平替.
@retrocode 没事了 看错地方了 用户名旁边没有修改按钮, 但是右侧菜单栏有
我余额够 5000 了为啥没有修改按钮, 还有其他限制吗
8 天前
回复了 cKnight 创建的主题 Rust 太快了! Rust 太快了!
前排求一份系统些的 rust 手册, 一直想学, 但是最多写了写 wasm, 直接上 web 开发老是担心后续用的组件不好找, 例如 office 文件生成, PDF 这些比较基础的功能.
我还有 244 天而立, 现在是每天累死累活搞钱, 车房有了没对象, 不知道自己为了什么要这么累. 7 月份开始减肥健身,准备大战 300 天迎接那天. 7 月份的时候体重 82,现在 72. 用各种事情把自己填满省的夜深人静一个人寂寞. 0.0
讲道理在初出茅庐的时候, 我对程序员或者至少技术人员的印象, 是大胆试错用于追新的, 至少当时我接触的同行是这样.
直到来到了 V 站, 发现大家都一样, 人到中年思维固化对新事物存在抵抗情绪.

现在我是一般建议不用在意, 尊重祝福加速.
目前调研下来, doubao1.6 和 deepSeekV3.1 的效果最好, 生成的文本非常完美.

doubao1.6-flash 就比较抽风部分满足需求, 提示词还得单独调教. 但是百万 token 下价格只有 doubao1.6 的八分之一.
9 天前
回复了 MIND222 创建的主题 健康 30 多岁的中年人,真诚的发问。
我不管(撒泼打滚)!我就是青年!!
11 天前
回复了 ymrzny 创建的主题 生活 今晚求婚!
祝你幸福!
11 天前
回复了 midsolo 创建的主题 深圳 来聊一聊上下班堵车的问题吧
@sevenyangcc #28 地铁可以睡觉休息呀,开车尤其高峰期还要一直注意车况等红绿灯这些,相对更累吧
@cmdOptionKana 我相过一个律师,那是真的厉害,审问型人格,闲聊喜欢刨根问底一直问为什么.第一次见面慈眉善目的就把我信息问完了.遇到我不想说的人还鼓励我呢!说"没事就咱俩知道,大家都成年人了别局促."🤡
打印田字格这种吧, 属于典型伪需求... 如果是给孩子练字, 于情于理直接买个字帖更便宜省事~~
@lessMonologue 著名的: 外包+手握资源的转包+被转包忽悠搞钱的冤大头甲方+要完经费上线完成就没人用的产品 组合
18 天前
回复了 lyxxxh2 创建的主题 程序员 如何让 ai 更好的理解 uniapp?
可以考虑更换 uni-app x, 有官方出的 AI Rules, 可以提升一些效果, 你图里的这些感觉是生成内容全部用的 px 导致的, 你得让 ai 按 rpx 输出尺寸

https://doc.dcloud.net.cn/uni-app-x/tutorial/rules_mcp.html
SVG + CSS 最好
很健康了, 比大多数老哥好太多了, 我背着房贷还月光来着
提一个"老板们"最好自己提前了解下项目开发时间, 我这些年遇到的不管是众包还是别人介绍的私活, 都想着挣快钱, 开始时间要求基本都是一个月, 有一部分是两个月, 往上的几乎没有, 你给说时间, 人家说这不要了那个往后退尽量快些, 结果这不要那不要, 最后全他妈死命往回加,
"咱们都上线了, 客户等着用呢, 你加把劲" 我了去你的吧

最近接个私活要做一个 AI 小项目抄一个竞品, 我说这里面牵扯东西比较多, 耗时比较大我先回去调研做一下技术选型, 下一周跟我说拿要抄袭的东西给客户看了, 客户很满意, 做出来就有路子推, 问我 9 月 20 能上线不?????????

他娘的
1  2  3  4  5  6  7  8  9  10 ... 56  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   898 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 354ms · UTC 20:10 · PVG 04:10 · LAX 13:10 · JFK 16:10
Developed with CodeLauncher
♥ Do have faith in what you're doing.