兼职: 小软件,自动化处理中国发票 PDF 文件的 Windows 软件

273 天前
 dengjunwen

用 chatAi 生成了需求,大概就是这样。代码也给我生成了,我太懒了太忙了,来找有时间的小伙伴。

酬劳:500 元
项目周期:尽快完成
优先语言:Java (其他语言亦可考虑)

项目描述

我需要开发一款 Windows 应用程序,用于自动处理存放在指定文件夹中的中国高速费发票( PDF 格式)。该软件将实现文件识别、重命名、分类整理以及每日通行费总金额的统计,从而简化每月报销流程,节省时间。

主要功能需求

  1. 文件处理

    • 输入文件夹:用户指定一个包含发票 PDF 文件的文件夹。
    • 文件识别
      • 识别每个 PDF 文件中的“通行日期”。
      • 提取每个 PDF 文件中的“通行费”金额。
  2. 文件重命名与分类

    • 重命名:将每个 PDF 文件重命名为其识别出的“通行日期”(格式如 YYYY-MM-DD.pdf)。
    • 分类存放
      • 根据“通行日期”将 PDF 文件分类存放到对应的子文件夹中(如 2024-04-25 文件夹)。
      • 处理同一天多张发票的情况,自动在文件名中添加序号(如 2024-04-25_1.pdf)。
  3. 数据汇总

    • 每日通行费总金额计算:统计每个“通行日期”对应的所有发票中的“通行费”总金额。
    • 汇总输出:将统计结果导出为 Excel 或 CSV 文件,方便查看和上传到公司系统。
  4. 用户界面(可选)

    • 提供图形用户界面( GUI ),用户可以:
      • 选择输入和输出文件夹。
      • 查看处理进度和日志。
      • 启动处理任务。
  5. 错误处理与日志记录

    • 记录无法识别或处理的文件,便于后续手动检查。
    • 提供错误提示,帮助用户理解处理过程中出现的问题。

技术要求

交付内容

2197 次点击
所在节点    外包
79 条回复
dengjunwen
273 天前
@dbskcnc 挺好的,不过刚刚找到卖家做了。这里的大爷大多眼光比较高,看不上这点小钱,我就直接淘宝了,谢谢
dengjunwen
273 天前
@tidaizhe 挺好的,谢谢经验分享
dengjunwen
273 天前
@kbs10000 不好意思,刚刚找了卖家了,这里的大爷冷嘲热讽的比较多,都懒得看消息了,抱歉
dengjunwen
273 天前
@ddddd0 谢谢
dengjunwen
273 天前
@iseki 是的,我赞同你,所以找这种还是要去某宝
JCNo1
273 天前
淘宝中介收 30%,做的人到手只有 350 ,这个数大学生都可能看不上,看得上的又能做什么出来
z1WhpL268TWE173O
272 天前
这里的人看到 OP 只花 500 就做到了想要的功能,破防了。。。
iseki
272 天前
@dengjunwen 毕竟心态不一样,去淘宝开店接单那是赚钱去的,考虑的只有划算不划算。来这水帖子的,就算嘴上说着想赚钱,心里想的都是天上掉大馅饼,小了还不想捡。
z1829909
272 天前
提醒一句, 淘宝 30%的抽成, 接单的只能拿到 350. 接这种单子的除非你运气好, 遇到比较空闲有经验的. 不然交付的质量堪忧 + 你要维护的时候他不管你. 然后你得自己改代码或者花钱再找一个人.
这个单子 500 确实少了, 你懂代码可以自己写写看, 即使不用 ocr, 算坐标找到对应的字段(处理各种异常场景)就挺麻烦的.
z1829909
272 天前
好久没接单, 刚才去看了下, 经济形势不好, 已经抽成 40%了...
Meteora626
272 天前
@dengjunwen 你自己需求写的“对于扫描件 PDF ,集成 OCR 工具进行文字识别(如 Tess4J )。”。如果是非扫描件,正常的 PDF 文件,直接 python 库转文本正则提取就行了,500 当然有人做了
msn00100
272 天前
现在有很多 ofd 格式了,而且总局提倡用 xml
如果 xml 一统天下就很简单了,否则 ocr 识别率总是有问题的。
shadowyue
272 天前
哪家淘宝店,我收藏下
mbooyn
272 天前
求店铺名
sarakeal
272 天前
是不需要 AI 呀,用 python 是对的,python 用我说得那几个库直接提取 pdf 文本再匹配处理一下就行了。因为你的是原件这样处理最准确,这块要不了几行代码就能搞定,如果是扫描件的话只能用 ocr 了。他们把这个想复杂了,你这个不是通用的发票扫描需求,发票类型很固定而且只读取特定的部分文本,限制条件已经很多了,难度低了很多。
seedhk
272 天前
淘宝 500 能给你大概率是因为他有现成的模板代码,稍微改改甚至都不用改就直接给给你了。他那套模板都不知道卖了多少套了,所以很便宜。重新开发的话,一天不一定能完成。
dengjunwen
272 天前
@seedhk 完成了就好了
dengjunwen
272 天前
@sarakeal 用 ai 更加快,代码都不用怎么写,不管你们有没有用,反正我用极大提高了效率
dengjunwen
272 天前
@mbooyn 神机阁软件
dengjunwen
272 天前
@shadowyue 神机阁软件, 等我试用几天,一切都好过现在

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1077899

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX