V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
Fechin
V2EX  ›  分享创造

分享一个超实用的浏览器插件:一键提取网页表格数据

  •  1
     
  •   Fechin ·
    PRO
    · 17 天前 · 5234 次点击

    最近开发了一个浏览器插件 Table Detection & Extraction,专门解决网页表格数据提取的痛点,想和大家分享一下。

    平时工作中经常需要从各种网页上复制表格数据,比如 API 文档、数据统计页面等。传统的复制粘贴要么格式乱掉,要么需要手动整理,特别麻烦。

    插件功能

    • 智能识别:自动检测网页中的表格( 2 行 2 列以上的数据表)
    • 一键提取:鼠标悬停即可看到提取按钮,点击即可获取数据
    • 多格式导出:支持 30+ 种格式转换,包括 JSON 、Excel 、CSV 、Markdown 、SQL 、LaTeX 、HTML 、XML 、PDF 等
    • 跨浏览器:支持 Chrome 、Firefox 、Edge (插件审核中,通过后会在官网展示链接)

    实际使用场景

    就拿咱们 V2EX 来说,大家可以安装后试试这两个页面:

    API 文档页面https://ex.noerr.eu.org/help/api

    可以一键提取 API 接口表格,直接转换成 JSON 或 Markdown 格式用于文档

    一键提取网页表格数据

    IPv4 子网查询页面https://ex.noerr.eu.org/tools/ipv4

    子网信息表格可以直接导出为 Excel 或 CSV ,方便后续分析

    一键提取网页表格数据

    安装方式

    访问 https://tableconvert.com/ 页面,在 Data Source 区域可以看到 Chrome Extension 和 Firefox Add-ons 的下载按钮。

    Table Detection & Extraction Download

    Product Hunt 发布: 插件刚刚在 Product Hunt 上线: https://www.producthunt.com/products/table-detection-extraction 欢迎大家去支持一下,谢谢!

    为什么开发这个插件: 作为程序员,经常需要处理各种数据格式转换。市面上虽然有一些工具,但大多需要手动复制粘贴,效率不高。这个插件的核心理念就是"所见即所得",看到表格就能直接提取,大大提升工作效率。

    适用人群:

    • 数据分析师:快速提取网页数据进行分析
    • 开发者:提取 API 文档、配置表格等
    • 产品经理:收集竞品数据、功能对比表
    • 学生/研究者:整理网上的数据资料

    有兴趣的朋友可以试试,如果觉得好用的话,希望能给个好评支持一下!也欢迎大家提出改进建议。

    第 1 条附言  ·  15 天前
    @isAK47 @willxiang @raycheung @asdblue @eryajf @zoharSoul 感谢各位的建议和反馈:

    已更新到版本:v1.1.7

    - 支持 Element UI 等框架的分离式表头/表体结构
    - 修复滚动表格时的图标位置
    - 改进清理和重新检测机制,确保扩展重新启用时能正确识别表格
    - 优化 AJAX 表格支持
    - 自动移除表格边缘的空行和空列
    - 调整 z-index 值到最高级别,确保转换图标始终显示在最前面
    - 添加用户评价状态跟踪,根据用户是否已评价显示不同的提示信息 [待验证]
    第 2 条附言  ·  14 天前
    @bigbone123 以及发邮件反馈问题的同学,感谢各位的建议和反馈:

    已更新到版本:v1.1.8

    - 移除了对用户表格样式的不必要修改,避免影响页面布局
    - 新增对 iframe 和 frameset 结构的完整支持,解决了三帧结构网站中表格无法识别的问题
    第 3 条附言  ·  1 天前
    Edge Extension 审核终于通过了,期间提交了好几个版本,每个版本都得等几天,吐槽一下微软的审核速度,需要的从这里下载: https://microsoftedge.microsoft.com/addons/detail/table-detection-extract/pckiffffenmnlnmhmbioajfdpoenahkj
    第 4 条附言  ·  1 天前
    @yb2313 感谢建议和反馈:

    Chrome 、Firefox 版本已更新到版本:v1.1.9

    - 点击 icon 的关闭按钮后会隐藏当前页不再显示,直到刷新页面
    66 条回复    2025-08-01 08:58:59 +08:00
    isAK47
        1
    isAK47  
       17 天前   ❤️ 1
    管理后台的表格识别不到吧?
    Fechin
        2
    Fechin  
    OP
    PRO
       17 天前
    @isAK47 如果数据是 <table> 标签渲染的,理论上可以识别到
    isAK47
        3
    isAK47  
       17 天前   ❤️ 1
    @Fechin 刚才测试了自用的几个后端(阿里、百度),是标准的<table>,均未能识别到,前端没问题。
    Fechin
        4
    Fechin  
    OP
    PRO
       17 天前
    插件安装成功后刷新一下页面看看哈,还有确保全局开关打开:
    Fechin
        5
    Fechin  
    OP
    PRO
       17 天前
    @isAK47 哥,忘记 @ 你了。
    NoOneNoBody
        6
    NoOneNoBody  
       17 天前   ❤️ 1
    已经在用一个 table to csv 的 firefox 扩展,基本够用,暂时不试了
    你这个能转 markdown 等更多格式,看上去还不错
    Fechin
        7
    Fechin  
    OP
    PRO
       16 天前
    @NoOneNoBody 建议试一下,这个可以提取表格转换成 30 多种表格格式
    willxiang
        8
    willxiang  
       16 天前   ❤️ 1
    @isAK47 #3
    我试了下,也是没有识别出来
    Fechin
        9
    Fechin  
    OP
    PRO
       16 天前
    @willxiang 方便在 pastebin 贴一下 table 标签 的 innerHTML 吗
    Xi
        10
    Xi  
       16 天前
    还可以,但是不够用,可以做为一个备选
    isAK47
        11
    isAK47  
       16 天前   ❤️ 1
    @Fechin #4 不是这些基础原因导致的,你可以在一些主流平台(阿里、百度、腾讯)注册测试,像后台一些产品订单、账单详情、服务订单等都识别不到。昨天在公司后端尝试服务订单没有效果,今天换浏览器也不行。代码都看了,确实是 <table> 标签渲染的。
    Fechin
        12
    Fechin  
    OP
    PRO
       16 天前
    @Xi 针对这个工具的定位还有哪些地方不够用的,方便说说吗,不胜感激!
    Xi
        13
    Xi  
       16 天前   ❤️ 2
    @Fechin #12 我平时的需求可能和你的插件定有有点不一样,不是简单的复制网页上的表格,而是多页整套表格的表格的摘取,例如我现在用的最多的“Instant Data Scraper”这个插件。
    而你的插件只是看到页面上表格简单数据复制
    raycheung
        14
    raycheung  
       16 天前   ❤️ 1
    1. 插件安装
    2. 识别表格
    3. 点击 ICON 展开
    4. 焦点无法固定是怎么回事 @Fechin
    raycheung
        15
    raycheung  
       16 天前   ❤️ 1
    @raycheung #14 刷新了多次之后可以了,很神奇。
    Fechin
        16
    Fechin  
    OP
    PRO
       16 天前
    @raycheung 感谢反馈,我多测测看
    Fechin
        17
    Fechin  
    OP
    PRO
       16 天前
    @Xi 感谢分享
    @isAK47 我在阿里 DNS 解析列表也没识别出来,把 table 元素整段代码复制出来就可以识别到,看来不是识别的原因,可能被什么机制限制住了
    willxiang
        18
    willxiang  
       16 天前
    dsg001
        19
    dsg001  
       16 天前   ❤️ 1
    用 gemini 生成了一个简单的 tampermonkey 脚本,凑合够用了
    cuixiao603
        20
    cuixiao603  
       16 天前 via Android   ❤️ 1
    需要有互联网吗
    Fechin
        21
    Fechin  
    OP
    PRO
       16 天前
    @willxiang 这个表格被过滤了,目前是只检测超过两行两列以上数据的表格
    Fechin
        22
    Fechin  
    OP
    PRO
       16 天前
    @cuixiao603 需要能访问网页,但都是在浏览器内部运行,数据是安全的
    Fechin
        23
    Fechin  
    OP
    PRO
       16 天前
    @dsg001 适合自己的才是最好的
    asdblue
        24
    asdblue  
       16 天前   ❤️ 1
    试了一下,后台系统的表格没有识别出来,应该是用的 elemnetUI 实现的
    Fechin
        25
    Fechin  
    OP
    PRO
       16 天前
    @asdblue 谢谢分享,提供的信息很有帮助,我测试一下:

    - ant table ,如果有固定列或行识别不出来
    - element table ,都没识别出来

    正在修复中
    jzhm
        26
    jzhm  
       16 天前   ❤️ 1
    不错,很好用
    ha0719
        27
    ha0719  
       16 天前   ❤️ 1
    请问大佬,很多网页是用 div 写的类似表格的样式,这个插件可以识别出来不,我之前用过类似的,效果不好,后来就卸载了
    Fechin
        28
    Fechin  
    OP
    PRO
       16 天前
    @jzhm 感谢
    @ha0719 div 表格目前还没兼容,不过后面会考虑,关键是如何处理噪音,不然体验会更糟糕
    bigbone123
        29
    bigbone123  
       16 天前   ❤️ 1
    通过三帧结构切换 frame 地址中有表格没有出现,直接打开切换的 iframe 地址可以。
    eryajf
        30
    eryajf  
       15 天前   ❤️ 1
    原来这个工具站点是大佬开发的,表示已经用了两三年了,非常牛的网站,在此感谢一下
    eryajf
        31
    eryajf  
       15 天前   ❤️ 1
    @eryajf 提两个小建议:1.已经评论过,希望插件界面中的好评提示支持关闭。2 ,希望支持语言设置,并且页面中点击转换之后,自动跳转到该语言。
    jones2000
        32
    jones2000  
       15 天前   ❤️ 1
    上市公司 pdf 年报, 里面的财务报表可以识别吗?
    asdblue
        33
    asdblue  
       15 天前   ❤️ 1
    @Fechin 期待中,工作中还是有一些从后台系统复制内容出来的工作,有这个插件帮助会很大。
    Fechin
        34
    Fechin  
    OP
    PRO
       15 天前
    @bigbone123 请问三帧结构是这种形式吗?

    <frameset rows="80,*">
    <frame src="top.html"> <!-- 顶部导航 -->
    <frameset cols="200,*">
    <frame src="menu.html"> <!-- 左侧菜单 -->
    <frame src="main.html" name="mainFrame"> <!-- 主内容区 -->
    </frameset>
    </frameset>
    Fechin
        35
    Fechin  
    OP
    PRO
       15 天前
    @eryajf 感谢支持,很好的建议 👍
    Fechin
        36
    Fechin  
    OP
    PRO
       15 天前
    @jones2000 目前还不支持 pdf 的识别
    @asdblue 已经找到问题了,正在准备提交商店审核
    i8k
        37
    i8k  
       15 天前   ❤️ 1
    去年我写了个类似的 [网页表格拷贝器 - V2EX]( https://ex.noerr.eu.org/t/1097311)
    mekingname
        39
    mekingname  
       15 天前   ❤️ 1
    所有号称能提取表格的插件或者 AI Agent ,面对下面这个表格时全部失败。包括楼主的插件。

    https://uniquecapital.feishu.cn/wiki/MzqowR6C9iR1e9kIGxOcGejindg?table=tblum9k3wGjFwTzC&view=vewQ6vZMar
    coolloves
        40
    coolloves  
       15 天前   ❤️ 1
    一直用这个网站转换,感谢 op
    jiezaichan
        41
    jiezaichan  
       15 天前   ❤️ 1
    试了一下 能用
    请您喝一瓶红牛 谢谢
    YAOMFFL
        42
    YAOMFFL  
       15 天前 via Android   ❤️ 1
    雅虎财经可用,感谢
    Sosocould
        43
    Sosocould  
       15 天前   ❤️ 1
    老哥的网站我一直在用,表格转换很好用。

    但这个插件我用了一下,我工作的场景都使用不了,没遇到能识别出来的 T-T……我日常一般用这个: https://chromewebstore.google.com/detail/instant-data-scraper/ofaokhiedipichpaobibbnahnkdoiiah ,这个比较准
    Fechin
        44
    Fechin  
    OP
    PRO
       15 天前
    @i8k 不错,功能类似,按钮可以改成 hover 显示,体验会好点
    @pwelyn Table Detection & Extraction 只是数据来源的一种方式,tableconvert.com 还有更多处理数据的功能,尤其是 Magic ,作为程序员,我经常在用,推荐给你
    Fechin
        45
    Fechin  
    OP
    PRO
       15 天前
    @mekingname 这个表格是 Canvas 画布,要提取里面的数据确实难度很大,不过可以换个思路,复制后直接粘贴到 😄

    https://tableconvert.com/excel-to-sql
    Fechin
        46
    Fechin  
    OP
    PRO
       15 天前
    @coolloves 谢谢支持
    @jiezaichan 多谢老哥,红牛已收到 🤝
    @YAOMFFL 谢谢支持
    Fechin
        47
    Fechin  
    OP
    PRO
       15 天前
    @Sosocould 谢谢,这个插件有点名气,也给 Table Detection & Extraction 提供了新的发展方向
    mekingname
        48
    mekingname  
       15 天前   ❤️ 1
    @Fechin 这个表格不支持复制
    sunulin
        49
    sunulin  
       15 天前   ❤️ 1
    常规的表格还好 刚去汽车之家试了下 配置表不行
    zoharSoul
        50
    zoharSoul  
       15 天前   ❤️ 1
    不行啊 弹不出来按钮
    1. 已确认刷新过页面
    2. 已确认是<table>
    zoharSoul
        51
    zoharSoul  
       15 天前   ❤️ 1
    @i8k #37
    你这个也提取不出来...
    Fechin
        52
    Fechin  
    OP
    PRO
       15 天前
    @sunulin 感谢反馈,方便贴一个链接吗
    @zoharSoul 感谢反馈,方便贴一个链接或者 pastebin 的源码吗
    Donahue
        53
    Donahue  
       15 天前   ❤️ 1
    还没用上,先感谢🙏
    bigbone123
        54
    bigbone123  
       15 天前
    @Fechin 是的,三帧结构。
    Fechin
        55
    Fechin  
    OP
    PRO
       14 天前
    @bigbone123 问题已解决,请升级到 v1.1.8 试一下
    Fxshiny
        56
    Fxshiny  
       14 天前
    https://it365.gitlab.io/zh-cn/table-to-excel/

    有一个这个。感觉比识别表格更方便
    Fechin
        57
    Fechin  
    OP
    PRO
       14 天前
    @Fxshiny 说实话,这个一般般,就比如你把当前帖子的内容复制进去,检测出了 60 几个表格
    bigbone123
        58
    bigbone123  
       14 天前
    @Fechin 赞👍,大神
    aero99
        59
    aero99  
       10 天前
    可惜不支持通用 Userscripts 插件,Safari 没法使用
    haoxuexiaoyao
        60
    haoxuexiaoyao  
       1 天前
    开源么
    eryajf
        61
    eryajf  
       1 天前
    再反馈个问题:貌似点击关闭没有效果。部分表格很小,icon 会遮挡表格的内容,点击关闭也关闭不掉。
    Fechin
        62
    Fechin  
    OP
    PRO
       1 天前
    @eryajf 感谢反馈
    yb2313
        63
    yb2313  
       1 天前
    表格是 canv 的可以识别吗
    Fechin
        64
    Fechin  
    OP
    PRO
       1 天前
    @yb2313 识别不到哦
    31415926535x
        65
    31415926535x  
       1 天前
    原来这个网站也是大佬写的啊,巨好用,平常都是 F12 找到表格元素复制进去转 markdown 来着,前段时间还在想有个插件就好了👍
    greatghoul
        66
    greatghoul  
       12 小时 15 分钟前
    太帅了,最近刚好需要这样一个工具,本来还打算自己写呢。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2555 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 13:14 · PVG 21:14 · LAX 06:14 · JFK 09:14
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.