专为 Claude Code 设计的基于 YAML 的 Playwright UI 自动化测试

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 193 天前的主题，其中的信息可能已经有所发展或是发生改变。

专为 Claude Code 和 Playwright MCP 打造的 YAML 配置如何改变了我们的测试工作流程，让自动化测试变得人人可用

如果你曾经维护过大型 Playwright 测试套件，你一定知道其中的痛苦。数百行 JavaScript 代码散布在数十个文件中，硬编码的值在环境变化时就会崩溃，测试逻辑复杂到只有原作者才敢修改。

如果我告诉你有更好的方法呢？一种任何人都能读懂、天生易维护、功能强大足以处理复杂工作流程的测试编写方式？

让我们来认识 专为 Claude Code 设计的基于 YAML 的 Playwright 测试 —— 一个正在改变团队自动化测试方式的范式转变，它结合了 Claude Code 的 AI 能力和 Playwright MCP 的浏览器自动化技术。

传统 Playwright 测试的问题

让我们坦诚面对传统 Playwright 测试的问题：

// 传统 Playwright 测试 - 50+ 行代码
test('完整订单流程', async ({ page }) => {
  await page.goto('https://example.com');
  await page.fill('[data-testid="username"]', 'user123');
  await page.fill('[data-testid="password"]', 'pass456');
  await page.click('[data-testid="login-btn"]');
  await expect(page.locator('h1')).toContainText('仪表盘');
  
  // ... 还有 40+ 行点击、填写、断言的代码
  // ... 到处都是硬编码的值
  // ... 测试之间无法复用
});

问题所在：

❌ 冗长复杂 — 简单操作被埋没在样板代码中
❌ 硬编码值 — 环境变化就会导致一切崩溃
❌ 复用性差 — 复制粘贴导致维护噩梦
❌ 技术门槛 — 只有开发人员能编写/修改测试
❌ 逻辑分散 — 相关测试散落在不同文件中

YAML 革命：让测试变得有意义

现在想象一下用 YAML 编写的同样测试：

# test-cases/order.yml
tags: 
  - smoke
  - order
  - checkout

steps:
  - include: "login"
  - "点击第一个商品的添加到购物车按钮"
  - "点击第二个商品的添加到购物车按钮"
  - "点击右上角购物车图标"
  - "输入姓名"
  - "输入姓氏"
  - "输入邮政编码"
  - "点击继续按钮"
  - "点击完成按钮"
  - "验证页面显示 感谢您的订单！"
  - include: "cleanup"

立即的好处：

✅ 意图清晰 — 任何人都能理解这个测试的作用
✅ 自然语言 — 步骤读起来就像用户故事
✅ 可复用组件 — 登录和清理步骤可以在多个测试间共享
✅ 环境无关 — 看不到任何硬编码的值

简洁背后的魔法

1. 可复用的步骤库

常见工作流程变成了构建块：

# steps/login.yml
steps:
  - "打开 {{BASE_URL}} 页面"
  - "在用户名字段填入 {{TEST_USERNAME}}"
  - "在密码字段填入 {{TEST_PASSWORD}}"
  - "点击登录按钮"
  - "验证页面显示 Swag Labs"

编写一次，到处使用。告别复制粘贴的疯狂。

2. 环境变量的魔法

不同环境？没问题：

# .env.dev
BASE_URL=https://dev.example.com
TEST_USERNAME=dev_user

# .env.prod  
BASE_URL=https://example.com
TEST_USERNAME=prod_user

相同的测试，不同的环境。自动切换。

3. 智能标签过滤

只运行你需要的测试：

# 只运行冒烟测试
/run-yaml-test tags:smoke

# 运行订单 AND 结账测试
/run-yaml-test tags:order,checkout

# 运行冒烟 OR 关键测试
/run-yaml-test tags:smoke|critical

不再需要在你只改了登录流程时运行整个测试套件。

4. 智能报告

自动生成的 HTML 报告包含：

✅ 逐步执行详情
✅ 环境配置信息
✅ 截图和测试产物
✅ 成功/失败统计

真实世界的影响：案例研究

使用 YAML 测试之前：

📊 2000+ 行 Playwright JavaScript 代码
⏱️ 3 天培训新 QA 团队成员
🐛 15+ 个测试失败每次环境变化
👥 只有 3 个开发人员能修改测试

使用 YAML 测试之后：

📊 200 行可读的 YAML 代码
⏱️ 30 分钟培训新团队成员
🐛 0 个测试失败在环境变化期间
👥 整个团队都能编写和修改测试

为什么这对你的团队很重要

对开发人员：

更少时间写样板代码，更多时间构建功能
测试真正记录了应用程序的行为
不再有"让我快速修复这个测试"的兔子洞

对 QA 工程师：

专注于测试策略，而不是 JavaScript 语法
快速创建和修改测试
清晰的测试覆盖率可见性

对产品经理：

测试读起来就像验收标准
容易验证测试是否符合需求
对重要流程的覆盖充满信心

对 DevOps：

可预测的跨环境测试执行
清晰的失败报告和调试
易于与 CI/CD 管道集成

技术架构：工作原理

这个专为 Claude Code 和 Playwright MCP 设计的 YAML Playwright 测试框架由几个关键组件组成：

Claude Code 集成

AI 驱动执行：Claude Code 的 AI 解释自然语言测试步骤并转换为 Playwright 操作
智能步骤识别：从纯英文描述中高级理解测试意图
上下文感知：在测试步骤间保持上下文，实现更智能的自动化

Playwright MCP 基础

浏览器自动化：利用 Playwright MCP 进行可靠的跨浏览器测试
元素检测：智能元素查找和交互
截图和报告：内置捕获和文档功能

多环境配置

├── .env.dev          # 开发环境
├── .env.test         # 测试环境
├── .env.prod         # 生产环境

可复用步骤库

├── steps/
│   ├── login.yml     # 认证流程
│   ├── cleanup.yml   # 清理程序
│   └── navigation.yml # 常见导航

使用自然语言的测试用例

├── test-cases/
│   ├── order.yml     # 电商订单流程
│   ├── user.yml      # 用户管理
│   └── search.yml    # 搜索功能

智能执行引擎

框架自动：

加载特定环境的配置
从步骤库展开 include 引用
替换环境变量（{{BASE_URL}}）
使用 Playwright MCP 执行测试
生成综合报告

开始使用：你的第一个 YAML 测试

基于 YAML 的测试之美在于其简单性。以下是开始使用的方法：

1. 先决条件

# 安装 Claude Code （如果尚未安装）
# 访问： https://claude.ai/code

# 为 Claude Code 安装 Playwright MCP
claude mcp add playwright -- npx -y @playwright/mcp@latest

# 克隆 YAML 测试框架
git clone https://github.com/terryso/claude-code-playwright-mcp-test.git
cd claude-code-playwright-mcp-test

2. 项目结构

your-project/
├── .env.dev              # 环境配置
├── steps/               # 可复用步骤库
├── test-cases/          # 你的测试用例
├── screenshots/         # 测试产物
└── reports/            # 生成的报告

3. 编写你的第一个测试

# test-cases/login.yml
tags:
  - smoke
  - auth

steps:
  - "打开 {{BASE_URL}} 页面"
  - "用户名填入 {{TEST_USERNAME}}"
  - "密码填入 {{TEST_PASSWORD}}"
  - "点击登录按钮"
  - "验证登录成功"

4. 执行和迭代

# 在 Claude Code 中使用内置命令
/run-yaml-test file:test-cases/login.yml env:dev

# 或者使用标签过滤运行
/run-yaml-test tags:smoke env:dev

几小时内，你就会拥有比以前编写的任何测试都更易维护的测试。魔法通过 Claude Code 的 AI 理解你的自然语言步骤并由 Playwright MCP 执行为浏览器操作来实现。

高级功能

复杂标签过滤

# 多条件
/run-yaml-test tags:smoke,login|critical

# 特定环境执行
/run-yaml-test tags:order env:prod

动态步骤参数

steps:
  - "将商品 {{PRODUCT_NAME}} 添加到购物车"
  - "设置数量为 {{QUANTITY}}"
  - "应用折扣码 {{DISCOUNT_CODE}}"

综合报告

HTML 报告：美观的交互式测试报告
JSON/XML 输出：用于 CI/CD 集成
截图捕获：自动失败记录
性能指标：执行时间和统计信息

未来是可读的

我们正在走向这样一个世界：

测试是可执行的文档
任何人都能为测试自动化做贡献
维护是一种乐趣，而不是负担
环境只是配置问题

基于 YAML 的 Playwright 测试不仅仅是一个工具——它是一种哲学。它相信测试应该对团队中的每个人都是清晰的、可维护的和可访问的。

常见问题解答

问：这与 Cucumber 等现有解决方案相比如何？ 答：虽然 Cucumber 需要学习 Gherkin 语法和步骤定义，但这个 YAML 测试框架通过 Claude Code 的 AI 直接使用自然语言解释意图。无需步骤定义映射 - Claude Code 理解你想要做什么。

问：测试调试怎么办？ 答：Claude Code 提供详细的执行日志，Playwright MCP 在失败时捕获截图，你还能获得映射回 YAML 步骤的清晰错误消息。AI 上下文有助于快速识别问题。

问：能与 CI/CD 集成吗？ 答：当然可以。框架生成标准退出代码和多种报告格式（ HTML 、JSON 、XML ），实现无缝 CI/CD 集成。

问：如何处理复杂断言？ 答：Claude Code 的 AI 让自然语言断言出人意料地强大："验证页面包含'谢谢'"、"验证购物车总计等于 ¥43.18"、"验证购物车中有 2 件商品"。AI 理解上下文和意图。

今天就行动起来

问题不在于这种方法是否更好。问题是：你愿意在脆弱、复杂的测试上浪费多少时间？

开始你的 YAML 测试之旅：

获取 Claude Code：安装 Claude Code 和 Playwright MCP
试用演示：从 https://github.com/terryso/claude-code-playwright-mcp-test 克隆项目并运行你的第一个 YAML 测试
转换一个测试：拿你最复杂的 Playwright 测试用 YAML 重写
与团队分享：向他们展示可读测试的强大
逐步扩展：当你看到好处时转换更多测试

实际应用场景

电商平台测试

# test-cases/ecommerce-flow.yml
tags: [e2e, purchase, critical]
steps:
  - include: "login"
  - "搜索商品 '{{PRODUCT_NAME}}'"
  - "添加到购物车"
  - "查看购物车"
  - "结账"
  - "填写收货信息"
  - "选择支付方式"
  - "确认订单"
  - "验证订单成功"

用户注册流程

# test-cases/user-registration.yml
tags: [smoke, registration]
steps:
  - "打开注册页面"
  - "填写用户信息"
  - "同意条款和条件"
  - "提交注册"
  - "验证邮箱"
  - "验证注册成功"

API 与 UI 混合测试

# test-cases/hybrid-test.yml
tags: [api, ui, integration]
steps:
  - "通过 API 创建测试数据"
  - include: "login"
  - "在 UI 中验证数据显示"
  - "执行 UI 操作"
  - "通过 API 验证后端状态"

团队采用策略

第一阶段：试点项目

选择一个小模块开始
转换 2-3 个关键测试用例
衡量编写和维护的时间差异

第二阶段：知识传播

培训团队成员 YAML 语法
建立编写规范和最佳实践
创建常用步骤库

第三阶段：全面推广

逐步迁移现有测试
建立 CI/CD 集成
优化报告和监控

性能和可扩展性

执行效率

并行执行支持
智能测试选择
增量测试运行

维护成本

90% 减少代码量
零学习成本的自然语言
集中式步骤库管理

团队协作

非技术人员也能编写测试
版本控制友好的 YAML 格式
清晰的测试意图表达

准备好用 Claude Code 和 Playwright MCP 改变你的测试工作流程了吗？测试自动化的未来是可读的、可维护的，并且对每个人都是可访问的。

🔗 立即开始： https://github.com/terryso/claude-code-playwright-mcp-test

你当前 Playwright 测试的最大痛点是什么？基于 YAML 的测试配合 Claude Code 如何为你的团队解决这个问题？

yaml

playwright

claude code

18 条回复 • 2025-06-24 10:52:28 +08:00

kneo

193 天前

yaml as code 就是最大的痛点。不想多说。AI 生成的帖子，是第二大痛点。

terryso

193 天前

@kneo 根本就没有 code, 只是 AI 根据自然语言理解, 调用 Playwright MCP 完成用例的执行而已

iyaozhen

193 天前

不知道为啥喜欢用 yaml 维护，做过的都知道，太垃圾了。描述性太差。比如要加入 if for 逻辑，又是新学一套语法。当然你可以文本描述让 AI 去做

而且你说的缺点也不是 yaml 能解决的。
- 简单操作被埋没在样板代码中。你 yaml 不封装 login 也一样呀，代码也可以封装 login
- 环境变化就会导致一切崩溃。这个和 yaml 也没关系，主要是 AI 视觉理解带来的优势
- 复制粘贴导致维护噩梦。yaml 怎么避免这个问题？写的人自己没有设计，还不是一样
- 技术门槛。这个更是一直以来的一个误区，以为只要降低编写门槛就行，甚至没有降低，以为不写代码就行。其实不然，写 case 只占小部分时间，大部分时间是沉默的维护成本。那为什么维护成本高，说白了是写的人差，没有很好的设计，比如前面的 login 没有封装。只是降低写 hello word 的成本没有意义，还是得有编程思想
- 逻辑分散，更和 yaml 没啥关系，使用 yaml 也解决不了这个问题

zeusho871

193 天前

遇到页面大的 token 爆炸之前尝试过用 browser-use 做爬虫。。。一个页面算下来 5 毛钱害

terryso

193 天前

@iyaozhen 你搞错重点了, 重点在 Playwright MCP 和 Claude Code
1. Playwright MCP 在加载网页的时候给每一个元素动态增加了 ref id, 这给 AI 去操作元素的精确度极高, 测试通过率很高
2. Claude Code 可以在后台用无头模式在后台跑很久, 我试过 2, 30 个用例没什么问题
3. 而且用例是用自然语言写的, 很复杂的用例也能写出来, 而且就算你 UI 元素的选择器变了, 也很少需要维护, AI 会自己重新发现对应的 ref id
4. yaml 只是为了组合步骤给 AI 看而已, 用自然语言写用例可以少写而已

terryso

193 天前

@zeusho871 所以不要用自己的 API[跑, 我都是用 Claude Code 的订阅帐号跑, 不会额外花钱

iyaozhen

193 天前

@terryso #5 没搞错。Playwright MCP+Claude Code 肯定没问题。这个绝对赞同，我也是用类似的方案，也认为是未来的趋势

但我看你行文都是“使用 YAML 测试之后”、“YAML 革命”等。感觉特别强调 yaml ，个人经验来看这个不太好。应该还是代码为主、yaml 为辅。
再直接一点类似 midscenejs 这种代码形式更好（长期维护角度）
```
await aiAction('逐一点击所有记录。如果某个记录包含文本"completed"，则跳过它');
```

当然你宣传角度这样是没问题。主要是实际来看，我们团队一批人专职写 UI 自动化都没做的很好，甚至很差。本质还是维护成本高，强调 “写的时候” 低门槛甚至会成为长期维护的阻碍

iyaozhen

193 天前

@zeusho871 做爬虫可能划不来。但做 UI 自动化其实可以，因为能想着做 UI 自动化的产品，一般都有点规模了，这点成本毛毛雨（相对节省的人力）

terryso

193 天前

@iyaozhen 其实 midscenejs 我也用过, 但是
1. 它需要自己提供 API Key, 没法直接利用上我的订阅帐号
2. 我已经测试过通过 AI 分析你的自然语言步骤 + Playwright MCP, 已经完全可以很准确的模拟你想要的手工操作, 没必要再搞代码. 关键是 Playwright MCP 能动态加 ref 的机制, 操作元素异常准确.
3. midscenejs 并没有在实际访问网页的时候, 给网页的所有元素都动态假如 ref, 而是通过大模型分析得到页面元素选择器来操作, 这有时候会不准. playwright mcp 就没这个问题, 它是动态给每个元素加 ref, 操作元素非常准确.
4. 我用 yaml 只是组合步骤, 为了少些重复的步骤而已. 可能文章写得有问题, 重点没搞好.
5. 其实我现在的写法也是类似 await aiAction('逐一点击所有记录。如果某个记录包含文本"completed"，则跳过它'); 这样, 只不过连 await aiAction 都省了, 就直接 '逐一点击所有记录。如果某个记录包含文本"completed"，则跳过它' 这样而已.

map1e

193 天前

同在考虑爬虫方向，也遇到了大页面 token 花销太大的问题，想把人工分析页面这块省下来

terryso

193 天前

@map1e 爬虫还是要兼顾性能的, AI 执行的速度是相对较慢的, 因为要分析. 用于 UI 自动化合适, 但爬数据估计目前还不太适合. 未来成本降下去, 分析速度提升可能才有戏.

coolmenu

192 天前

最近我也是研究爬虫和本地模型配合的问题，huggingface 有那种 1.5b 优化的模型，比如 html to markdown 这种，性能是不错的，为了速度，就是要边爬网页，分析，存储结构---》喂给模型，这么个步骤。

terryso

192 天前 via iPhone

@coolmenu 本地模型处理爬虫类任务应该是可以，不需要太大的模型，很多设备应该都能胜任

sampeng

191 天前 via iPhone

yaml 是写时一时爽，维护火葬场。js 多简单明了…应转一层。时间一长就是灵魂三问：这是啥，这又是啥，这到底是干什么用的

terryso

191 天前 via iPhone

@sampeng 你先试试再说吧，yaml 写的不是代码，也不会生成代码，只是自然语言告诉 AI 要做什么事而已，就像测试用自然语言描述的用例步骤，只不过通过 playwright mcp ，AI 知道怎么去执行而已

terryso

191 天前

steps:
- include: "login"
- "打开 /create-channel, 使用随机标题帮我创建一个直播频道"
- "验证新创建的频道的标题为刚刚输入的随机标题"

比如: 我只需要这样简单描述就能完成一个自动化 UI 测试用例

iyaozhen

190 天前

@terryso #9 嗯嗯我倒不是说技术方案。现在各家都在做，谈不上哪个好，都有特点。

当然 yaml 维护还是代码维护用例，在 AI 之前就有很多争论了。我只是多年经验来看，yaml 并不是一个很好的方式。

terryso

189 天前

@iyaozhen 我暂时看来还好, 因为我 yaml 描述都只是一些 AI 指示, 没有代码生成, 实际还是 AI 自己去理解和执行. 或许不同的 Agent 执行效果不太一样, 但目前我用 Claude Code 测试非常稳定和准确