分享一个超实用的浏览器插件:一键提取网页表格数据

18 天前
 Fechin

最近开发了一个浏览器插件 Table Detection & Extraction,专门解决网页表格数据提取的痛点,想和大家分享一下。

平时工作中经常需要从各种网页上复制表格数据,比如 API 文档、数据统计页面等。传统的复制粘贴要么格式乱掉,要么需要手动整理,特别麻烦。

插件功能

实际使用场景

就拿咱们 V2EX 来说,大家可以安装后试试这两个页面:

API 文档页面https://ex.noerr.eu.org/help/api

可以一键提取 API 接口表格,直接转换成 JSON 或 Markdown 格式用于文档

IPv4 子网查询页面https://ex.noerr.eu.org/tools/ipv4

子网信息表格可以直接导出为 Excel 或 CSV ,方便后续分析

安装方式

访问 https://tableconvert.com/ 页面,在 Data Source 区域可以看到 Chrome Extension 和 Firefox Add-ons 的下载按钮。

Product Hunt 发布: 插件刚刚在 Product Hunt 上线: https://www.producthunt.com/products/table-detection-extraction 欢迎大家去支持一下,谢谢!

为什么开发这个插件: 作为程序员,经常需要处理各种数据格式转换。市面上虽然有一些工具,但大多需要手动复制粘贴,效率不高。这个插件的核心理念就是"所见即所得",看到表格就能直接提取,大大提升工作效率。

适用人群:

有兴趣的朋友可以试试,如果觉得好用的话,希望能给个好评支持一下!也欢迎大家提出改进建议。

5570 次点击
所在节点    分享创造
67 条回复
Fechin
18 天前
@willxiang 这个表格被过滤了,目前是只检测超过两行两列以上数据的表格
Fechin
18 天前
@cuixiao603 需要能访问网页,但都是在浏览器内部运行,数据是安全的
Fechin
18 天前
@dsg001 适合自己的才是最好的
asdblue
18 天前
试了一下,后台系统的表格没有识别出来,应该是用的 elemnetUI 实现的
Fechin
18 天前
@asdblue 谢谢分享,提供的信息很有帮助,我测试一下:

- ant table ,如果有固定列或行识别不出来
- element table ,都没识别出来

正在修复中
jzhm
18 天前
不错,很好用
ha0719
18 天前
请问大佬,很多网页是用 div 写的类似表格的样式,这个插件可以识别出来不,我之前用过类似的,效果不好,后来就卸载了
Fechin
18 天前
@jzhm 感谢
@ha0719 div 表格目前还没兼容,不过后面会考虑,关键是如何处理噪音,不然体验会更糟糕
bigbone123
18 天前
通过三帧结构切换 frame 地址中有表格没有出现,直接打开切换的 iframe 地址可以。
eryajf
17 天前
原来这个工具站点是大佬开发的,表示已经用了两三年了,非常牛的网站,在此感谢一下
eryajf
17 天前
@eryajf 提两个小建议:1.已经评论过,希望插件界面中的好评提示支持关闭。2 ,希望支持语言设置,并且页面中点击转换之后,自动跳转到该语言。
jones2000
17 天前
上市公司 pdf 年报, 里面的财务报表可以识别吗?
asdblue
17 天前
@Fechin 期待中,工作中还是有一些从后台系统复制内容出来的工作,有这个插件帮助会很大。
Fechin
17 天前
@bigbone123 请问三帧结构是这种形式吗?

<frameset rows="80,*">
<frame src="top.html"> <!-- 顶部导航 -->
<frameset cols="200,*">
<frame src="menu.html"> <!-- 左侧菜单 -->
<frame src="main.html" name="mainFrame"> <!-- 主内容区 -->
</frameset>
</frameset>
Fechin
17 天前
@eryajf 感谢支持,很好的建议 👍
Fechin
17 天前
@jones2000 目前还不支持 pdf 的识别
@asdblue 已经找到问题了,正在准备提交商店审核
i8k
17 天前
去年我写了个类似的 [网页表格拷贝器 - V2EX]( https://ex.noerr.eu.org/t/1097311)
pwelyn
17 天前
mekingname
17 天前
所有号称能提取表格的插件或者 AI Agent ,面对下面这个表格时全部失败。包括楼主的插件。

https://uniquecapital.feishu.cn/wiki/MzqowR6C9iR1e9kIGxOcGejindg?table=tblum9k3wGjFwTzC&view=vewQ6vZMar
coolloves
17 天前
一直用这个网站转换,感谢 op

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1145378

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX