我做了一个「浏览器增强工具」,它用 AI 帮你把网页操作「自动化」

13 天前
 MaskerPRC

我叫 Loopsaaage 佳恒,现在在做一个「 1 年做 100 个 AI 小产品」的个人挑战。最近正折腾的这个东西,可能对每天在浏览器里打转的打工人有点用,就来 V 站跟大家汇报一下,也想听听大家真实的吐槽。

先简单交代一下背景。我之前在华为、腾讯待过,做过游戏开发,也做过 AI 相关的系统。平时也喜欢折腾各种电子设备和新模型。这两年最直观的感觉是:模型确实越来越厉害,但真要落到「提高日常电脑办公效率」上,其实还没到那个爽点。大部分人用 AI ,还停留在「问点问题」「写点文案」「改改句子」这种层面。可是真正消耗人精力的,往往是浏览器里的那些重复步骤:打开好几个网站、来回切标签、复制粘贴、点一堆按钮、填一堆一样的表单。

所以我现在做的这个产品,叫「全视界( Tab Hive )」。它想解决的核心问题只有一个:把你在多个网站之间的一整套固定操作,用可视化的方式串起来,然后让引擎和 AI 自动帮你跑完。

如果用一句话来形容这个东西:把每一个网页当成可以连线的「节点」,数据可以在这些节点之间流动,而点击、输入这些操作也可以像搭积木一样编排起来。

目前已经做了几块比较核心的功能:

1. 多站点同屏展示

这个是最直观的部分。你可以在一块无限画布上,同时摆 2×2 、3×3 ,甚至更多个网页。每个网页都是活的,可以正常操作。

这对几类人比较有用:

因为桌面端是用 Electron 做的,没有浏览器里常见的 CORS 限制,所以大部分网站都能塞进来,银行、社交媒体、各种后台都可以正常打开和操作。

2. 会话隔离 + 代理隔离

每个小窗都有独立的 Session ,Cookie 互不影响。实际用起来,它就变成了一个「多账号浏览器」。同一个网站,你可以在一块画布上同时登录多个账号,各自互不干扰。

再加上每个网页可以单独挂代理,你就可以做到:

这个对电商卖家、运营、需要多地区访问和管理多账号的人来说,应该会挺刚需。

上面两点其实还只是「多窗口浏览器」。真正有意思的是第三块。

3. AI 驱动的多网页工作流编排

在这个工具里,每个网页不只是一个普通的窗口,而是一个「有配置的节点」。

你可以在某个网页上,用可视化的方式框选元素:鼠标移动上去会高亮,点击可以自动生成选择器。你可以给这些元素起名字,比如「价格」「活动信息」「提交按钮」「搜索框」之类。然后对每个元素定义两类东西:

在这个基础上,我设计了三种节点类型:

节点之间有两种连线:

整体看上去有点像简化版的 Node-RED ,只不过它作用在真实网页上,而不是纯接口。

用几个具体一点的例子来说明能干啥:

例子 1:电商价格监控

你平时只要看这个看板页面,就能知道每个平台当前的实际到手价,而不用每天手动打开一堆标签一点点比。

例子 2:多站点表单批量填写

你只需要前面配置一次,后面要上新网站,只要把对应的输入框标记出来,拖拖线,流程就能直接复用。

例子 3:多账号批量操作

比你一个账号一个账号地登录、切浏览器、来回点,要轻松得多。

4. 执行引擎和调试体验

执行这一块,现在已经有一整套比较顺的流程:

对平时喜欢搭工作流、玩自动化的人来说,这一套应该比较好上手,至少调试不会太痛苦。

5. 和 AI 相关的部分(目前的规划)

现在 AI 这块主要是把底层接口和空间预留出来,具体的能力准备先从两个方向做:

6. 挑战记录和后续

我自己「 1 年 100 个产品」的进度和过程,都放在这个站点上:
https://100.agitao.net
「全视界 / Tab Hive 」是里面相对比较重的一个项目,我会长期迭代,不是玩票性质的 demo 。

如果你平时的工作里,有这种「每天都在几个固定的网站之间,重复做几乎一样的事情」的场景,或者你已经在用 AutoHotkey 、Playwright 、Selenium 之类的工具,但又不太想写脚本、写代码,欢迎在评论里跟我说一下你真实的场景:

我这边会优先把这些高频、痛点明确的场景做成内置模板,方便大家直接拿来用,也能帮我验证一下,这个方向到底值不值得继续重仓做下去。

1646 次点击
所在节点    分享创造
11 条回复
ajan
13 天前
已收藏
lingyired
13 天前
https://100.agitao.net 这个网站用的是什么 UI 框架和主题? 感觉很有意思
leyoumake1997
13 天前
牛的牛的。求 ui 主题
ns2250225
13 天前
@lingyired #2 应该是用了 Neo Brutalism 新粗野/新野獸風格
510908220
13 天前
厉害,楼主朝气蓬勃,以后很有前途
Peiiii
13 天前
很有趣,有过相关的想法。当时的考虑是做成浏览器插件,AI 生成自动化脚本,提供快捷操作。没考虑到把多个网站串到一个流程中。
MaskerPRC
13 天前
项目完全开源,感兴趣的可以直达下载最新版本: https://github.com/MaskerPRC/tab-hive/releases/latest
MaskerPRC
13 天前
@510908220 感谢
bigShrimp8577
13 天前
对我这种,好像没啥用
ricwangcom
10 天前
现居地:山西 / 西安
unco020511
10 天前
这个如果做好了,我感觉会很有用,你这个想法还是比较牛的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1179917

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX