兼职: 小软件,自动化处理中国发票 PDF 文件的 Windows 软件

273 天前
 dengjunwen

用 chatAi 生成了需求,大概就是这样。代码也给我生成了,我太懒了太忙了,来找有时间的小伙伴。

酬劳:500 元
项目周期:尽快完成
优先语言:Java (其他语言亦可考虑)

项目描述

我需要开发一款 Windows 应用程序,用于自动处理存放在指定文件夹中的中国高速费发票( PDF 格式)。该软件将实现文件识别、重命名、分类整理以及每日通行费总金额的统计,从而简化每月报销流程,节省时间。

主要功能需求

  1. 文件处理

    • 输入文件夹:用户指定一个包含发票 PDF 文件的文件夹。
    • 文件识别
      • 识别每个 PDF 文件中的“通行日期”。
      • 提取每个 PDF 文件中的“通行费”金额。
  2. 文件重命名与分类

    • 重命名:将每个 PDF 文件重命名为其识别出的“通行日期”(格式如 YYYY-MM-DD.pdf)。
    • 分类存放
      • 根据“通行日期”将 PDF 文件分类存放到对应的子文件夹中(如 2024-04-25 文件夹)。
      • 处理同一天多张发票的情况,自动在文件名中添加序号(如 2024-04-25_1.pdf)。
  3. 数据汇总

    • 每日通行费总金额计算:统计每个“通行日期”对应的所有发票中的“通行费”总金额。
    • 汇总输出:将统计结果导出为 Excel 或 CSV 文件,方便查看和上传到公司系统。
  4. 用户界面(可选)

    • 提供图形用户界面( GUI ),用户可以:
      • 选择输入和输出文件夹。
      • 查看处理进度和日志。
      • 启动处理任务。
  5. 错误处理与日志记录

    • 记录无法识别或处理的文件,便于后续手动检查。
    • 提供错误提示,帮助用户理解处理过程中出现的问题。

技术要求

交付内容

2197 次点击
所在节点    外包
79 条回复
R4rvZ6agNVWr56V0
272 天前
500 元,只是很多全职码农朋友的半天(或大半天)薪水。 如果从 0 开干,时间划不来,自然就觉得你出价很低了。
用不着破防啊。而且,软件工程 not 脚本,后续还有很多 Bug 修复、维护、咨询的售后工作,几百块钱一个思维正常且有些许责任心的码农自然没人干。
vtgoal
272 天前
你也没必要玻璃心,因为这里大部分是程序员思维,考虑到 pdf 文件的解析其实并不简单,认为你想花小钱办大事是很正常的。

如果你处理的文件能保持固定格式,解决起来确实不难,但现实中今天说简单,明天需求就变的情况太多了,尤其你的需求里包括了 OCR 识别扫描件。你的问题解决了最好,没必要回来较真。
jayin
272 天前
这软件是自用,还是给公司用的?咋有这需求
realpg
272 天前
我想知道, 楼上一大堆什么淘宝提成 30%的这个信息是怎么家里编出来的...

一大堆人自己在淘宝开店接各种杂七杂八活的 不走信用卡基本就是 0 损耗

这年头的高收入群体脱离群众脱离现实真的这么严重吗

小外包公司的经理都会利用自己家闲置码农开店揽活的 啥成本没有 除了需要点开店经验

基本简单功能软件 500 这个行价都多少年了

就这么简单个需求 又是 BUG 管理又是后续维护的

这不是可以摸鱼的大厂 你交付时候有问题 不是你回去返工了就行的反正工资按月算的 你写出来的有问题 你压根就是 0 收入
esee
271 天前
有的人想吃一道菜,以为成本要算上修建厨房安装燃气灶买锅买盘买菜学炒菜培训最后加人工的钱,但是其实叫外卖直接点一道也可以吃。这种需求明确的不用大改的,对于熟练的人真就是一会的事情,500 块钱也差不多,为啥反应这么大
weiqipeng
271 天前
@tidaizhe 老哥你可真 6 羊毛大师了属于是
forgottencoast
271 天前
@Livid
#35 ,#24 ,#11
不会好好说话。
weiqipeng
271 天前
@neoblackcap 老哥 如果需要解析的 PDF 需要提取的字段都有统一的标识符或者标志 这样会不会容易些
liuliuliuliu
271 天前
@realpg 你比楼上一大堆都不如,你以为淘宝上都是程序员自己开店吗?都是中介开店,你程序员开个 0 成交记录的新店能接到单?中介基本都是 30-40%的提成。
500 这个价这个功能只能说只有大学生或者刚毕业的才会接啊,拿自己的时薪算一下就知道了
dengjunwen
271 天前
@jayin 自己用
dengjunwen
271 天前
@GeekGao 对呀,这是买卖,合适就干,不合适就不干呗,没必要破防呀。我能找到好用的为啥要花大价钱。这里只是其中一个途径而已
dengjunwen
271 天前
@vtgoal 告诉大家一个结果,闭环,有人需要也可以借鉴经验,帮助大家节约成本不好吗?并没有你说的玻璃心吧
dengjunwen
271 天前
@jayin 纯粹是犯懒,自己也能做,也能开发。但是不想折腾
dengjunwen
271 天前
@realpg 这个信息我也不知道真假,只知道有抽成,反正他们能活,我们低价买服务就行了
dengjunwen
271 天前
@esee 差不多就是这样。
dengjunwen
271 天前
@forgottencoast 必定不好好说话,别人都这么说了,我可不能示弱
dengjunwen
271 天前
@vtgoal 另外我回复的是那些说话很冲的大爷,阴阳我的大爷。不要对号入座
zcybupt2016
271 天前
我记得发票上的二维码里什么信息都有吧,应该只是做了个二维码识别?
neoblackcap
271 天前
@weiqipeng 会容易一些。其实飞桨 OCR 的识别率很高了,文字识别出来应该不难,特别是 PDF 转的图片。关键是各个位置,毕竟光学识别又不会帮你把位置标记出来。
如果发票都是电子发票,并且是 PDF 格式的话,调一下应该还是能做到相当高识别率。
如果是用第三方 PDF 解决方案那就更好了,那就是 100%的准确率,关键是这个库的成本算谁的。
如果发票还有机打的(照片),那就真的头疼了,不是那么好做了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1077899

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX