今天使用 YOLO 第一次训练视觉模型,真的好强大。

3 天前
 jiayouzl

之前一直有听说 YOLO 非常牛逼,但一直没项目用到也就没特别关注过,最近有东西要做问了 AI 解决思路推荐用视觉大模型。立马 clone 了 YOLO V8 仓库,标注,训练,测试。感觉发现新大陆一样,真的好强大!可以说超出了认知范围,因为如果按没有大模型年代的思路想完成真的是个好庞大的工程。

5656 次点击
所在节点    程序员
45 条回复
Tink
3 天前
@jackenliu #6 不是一个东西,你这个比法,相当于潜水艇比飞机
listen2wind
3 天前
想问下 yolo 可以做比如建筑垃圾、河道垃圾、违章建筑之类的一些识别区分吗?
capric
3 天前
@listen2wind 当然可以
okampfer
3 天前
@jiayouzl #10 转格式是转成 ONNX 吗?
nayenizhenmei
2 天前
@jiayouzl 我硕士就是搞 cv ,用 yolo 的,一般来说,工程上用 v5v8v11 ,主要是其后面的 u 公司对 yolo 的工程化比较好,也不是说其他的系列不好,对于检测精度来说肯定是越来越高速度也越来越快,但工程化角度看集成度没那么好
magic3584
2 天前
我想做一个截图记账的功能,这个应该可以用吧?
lxxiil
2 天前
现在写游戏脚本 yolo ,opencv ,寻路算法,这些都是是必备技能
hwdq0012
2 天前
@srsman #20 同
hwdq0012
2 天前
去年做了个工具训练 https://github.com/nocanstillbb/label-image

给公司做的更强大,加了一些网络设备的功能,标注多了缩放功能,还有一个 vncviewer 嵌入,从采集到模型部署 一个软件全包了
neroxps
2 天前
我们产品期望用 yolo 做自助餐菜品自动识别
iOCZS
2 天前
@Jakarta 大模型是大规模预训练模型,大语言模型是大规模预训练模型的一种特定类型。
jiayouzl
2 天前
@neroxps 我实战前看了不少文章,其中就有对自助餐盘里菜品识别的文章,搭配好点的摄像头完全没问题的。
565656
2 天前
@jackenliu #6 openai 还真做不了检测, 细分场景不如
someonesnone
2 天前
超市自动识别物品称重那称, 都足够好玩
BruceWooong
2 天前
啊啊啊! YOLO 都已经玩透了,发论文都会遭到嫌弃。难道在工业界还没有普及吗?何止 v8 ,现在 v13 ( https://arxiv.org/pdf/2506.17733 )都有了,而且还有 DETR ( https://arxiv.org/abs/2005.12872 )这种基于 Transformer 的模型更加厉害,第一版是 2020 年出的。你提到的 yolo 第一版是 2015 年提出来的( https://arxiv.org/abs/1506.02640 ),到现在已经 10 年过去了。
roundgis
2 天前
@BruceWooong 我們公司也是最近才開始用

安排我負責研究怎麼用在提高生產管理上

可見一門技術要推廣 並且得到廣泛使用

有漫長的過程
visper
2 天前
yolo 是一个极出色的模型,有兴趣的人都可以去试一下,以后能用到的地方就可以考虑用上。模型小,速度快,标注训练简单。转 onnx 在 java 之类里面跑也很方便。
2en
2 天前
@Belmode #15 说难听点,你这种是作弊,是挂
2en
2 天前
当年还用 yolo v5 做过自瞄,效果好而且封不掉
gsw945
1 天前
之前用 YOLOv5 做过发票识别,200 张图片微调训练的模型,准确率能稳在 95%以上,同发票图的准确率超过 PaddleOCR 官方 demo 。
背景说明: 有纸质发票的扫描件,需要数字化归档,识别出内容,PaddleOCR 识别出来的是很多个识别块,发票是历史发票,表格线很多缺失,也有部分扫描缺角,大部分扫描件都有倾斜,ocr 识别后,将块内容对应到字段很困难,穷尽表格识别各种算法后效果仍不好。后改变思路,参考猫狗识别的例子,以发票固定文字(字段)作为为标注分类,比如"纳税人识别号"等,标注后训练大概 2 小时不到,推理时先 YOLO 识别出各个字段的坐标范围,ocr 识别后,识别块的坐标经过比对,很容易就能对应到字段了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1157495

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX