macOS 系统自带 ocr 识别库,是被效果还不错,之前看有将手机构建成 ocr api 集群的。效果确实好。今天花费些时间 vibe code 一个本机的 ocr 识别服务。 使用 brew services 部署。 代码已开源 支持 base64 访问 支持 表单提交 二进制数据访问 耗时较多的地方时,brew 服务的构建和测试。
http://localhost:7321/api/v1/ocr
{
"image": "data:image/png;base64,iVBORw0KGgxxx",
"language": "zh-CN",
"confidence": 0.9
}
设备集群版已经更新。集群版地址。 小工具类的软件,在大模型时代,似乎失去了意义。