大概需求是客户上传点餐菜单的图片,然后系统去识别其中信息。 还涉及一些特殊的逻辑,比如用户可以画一个框,只识别其中部分内容。 详细需求可以加我发: https://ruilian-test.oss-cn-beijing.aliyuncs.com/%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_20241213100913.jpg 涉及技术栈:图像文字识别、图像分析与对象检测、文字组合与结构分析、字体大小、定位与属性分析、模型训练
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.