mirror of https://github.com/lobehub/lobehub.git synced 2026-03-26 13:19:34 +07:00

Files

Arvin Xu df1710bbed ✅ test: add page e2e testing (#11423 )

* add page e2e

* move

* add more e2e for page

* update

* fix keyboard

* update

2026-01-12 15:41:02 +08:00

11 KiB

Raw Blame History

E2E Testing Guide for Claude

本文档记录了在 LobeHub E2E 测试开发中的经验和最佳实践。

Related: LOBE-2417

测试策略：体验驱动的 E2E 测试

核心理念

建立完整的用户体验链路 E2E 测试，作为未来变更和重构的体验基准线。

目的：

确保核心用户体验在代码变更后不会退化
为重构提供安全网，敢于大胆改进代码
从用户视角验证功能完整性

产品架构覆盖

模块	子功能	优先级	状态
Agent	Builder, 对话，Task	P0	🚧
Agent Group	Builder, 群聊	P0	⏳
Page（文稿）	侧边栏 CRUD ✅，文档编辑，Copilot	P0	🚧
知识库	创建，上传，RAG 对话	P1	⏳
记忆	查看，编辑，关联	P2	⏳

标签系统

@journey      # 用户旅程测试（体验基准线）
@smoke        # 冒烟测试（快速验证）
@regression   # 回归测试

@P0           # 最高优先级（CI 必跑）
@P1           # 高优先级（Nightly）
@P2           # 中优先级（发版前）

@agent        # Agent 模块
@agent-group  # Agent Group 模块
@page         # Page 文稿模块
@knowledge    # 知识库模块
@memory       # 记忆模块

执行策略

# CI - P0 冒烟测试（每次 PR）
pnpm exec cucumber-js --config cucumber.config.js --tags "@smoke and @P0"

# Nightly - 所有用户旅程
pnpm exec cucumber-js --config cucumber.config.js --tags "@journey"

# 发版前 - 完整回归
pnpm exec cucumber-js --config cucumber.config.js --tags "@P0 or @P1"

# 完整测试
pnpm exec cucumber-js --config cucumber.config.js

测试设计原则

按 CRUD + 核心交互覆盖：每个模块覆盖创建、读取、更新、删除及核心交互流程
LLM 响应必须 Mock：保证测试稳定性和可重复性
中文描述场景：Feature 文件使用中文，贴近产品需求
优先级分层：合理分配 P0/P1/P2，控制 CI 执行时间

目录结构

e2e/
├── src/
│   ├── features/                    # Cucumber feature 文件
│   │   ├── journeys/                # 用户旅程（体验基准线）
│   │   │   ├── agent/
│   │   │   │   ├── agent-builder.feature
│   │   │   │   ├── agent-conversation.feature  ✅
│   │   │   │   └── agent-task.feature
│   │   │   ├── agent-group/
│   │   │   │   ├── group-builder.feature
│   │   │   │   └── group-chat.feature
│   │   │   ├── page/
│   │   │   │   └── page-crud.feature  ✅
│   │   │   ├── knowledge/
│   │   │   │   └── knowledge-rag.feature
│   │   │   └── memory/
│   │   │       └── memory-crud.feature
│   │   ├── smoke/                   # 冒烟测试
│   │   │   └── discover/
│   │   └── regression/              # 回归测试
│   ├── steps/                       # Step definitions
│   │   ├── agent/                   # Agent 相关 steps
│   │   ├── page/                    # Page 相关 steps
│   │   ├── common/                  # 通用 steps (auth, navigation)
│   │   └── hooks.ts                 # Before/After hooks
│   ├── mocks/                       # Mock 框架
│   │   └── llm/                     # LLM Mock (拦截 AI 请求) ✅
│   └── support/                     # 测试支持文件
│       └── world.ts                 # CustomWorld 定义
├── screenshots/                     # 失败截图
├── reports/                         # 测试报告
├── cucumber.config.js               # Cucumber 配置
└── CLAUDE.md                        # 本文档

本地环境启动

详细流程参考 e2e/docs/local-setup.md

一键启动（推荐）

使用 TypeScript 脚本自动完成环境设置：

# 在项目根目录运行

# 仅设置数据库（启动 PostgreSQL + 运行迁移）
bun e2e/scripts/setup.ts

# 设置数据库并启动服务器
bun e2e/scripts/setup.ts --start

# 完整设置（数据库 + 构建 + 启动服务器）
bun e2e/scripts/setup.ts --build --start

# 清理环境
bun e2e/scripts/setup.ts --clean

脚本选项

选项	说明
`--clean`	清理现有容器和进程
`--skip-db`	跳过数据库设置（使用已有的）
`--skip-migrate`	跳过数据库迁移
`--build`	启动前构建应用
`--start`	设置完成后启动服务器
`--port <port>`	服务器端口（默认 3006）

重要提示:

必须使用 paradedb/paradedb:latest 镜像（支持 pgvector 扩展）
服务器必须在项目根目录启动，不能在 e2e 目录
S3 环境变量是必需的，即使不测试文件上传（脚本已自动处理）

运行测试

# 从 e2e 目录运行
cd e2e

# 运行特定标签的测试
BASE_URL=http://localhost:3006 \
  DATABASE_URL=postgresql://postgres:postgres@localhost:5433/postgres \
  pnpm exec cucumber-js --config cucumber.config.js --tags "@AGENT-CHAT-001"

# 调试模式（显示浏览器）
HEADLESS=false BASE_URL=http://localhost:3006 \
  DATABASE_URL=postgresql://postgres:postgres@localhost:5433/postgres \
  pnpm exec cucumber-js --config cucumber.config.js --tags "@conversation"

# 运行所有测试
BASE_URL=http://localhost:3006 \
  DATABASE_URL=postgresql://postgres:postgres@localhost:5433/postgres \
  pnpm exec cucumber-js --config cucumber.config.js

重要: 必须显式指定 --config cucumber.config.js，否则配置不会被正确加载。

LLM Mock 实现

核心原理

LLM Mock 通过 Playwright 的 page.route() 拦截对 /webapi/chat/openai 的请求，返回预设的 SSE 流式响应。

SSE 响应格式

LobeHub 使用特定的 SSE 格式，必须严格匹配：

// 1. 初始 data 事件
id: msg_xxx
event: data
data: {"id":"msg_xxx","model":"gpt-4o-mini","role":"assistant","type":"message",...}

// 2. 文本内容分块（text 事件）
id: msg_xxx
event: text
data: "Hello"

id: msg_xxx
event: text
data: "! I am"

// 3. 停止事件
id: msg_xxx
event: stop
data: "end_turn"

// 4. 使用量统计
id: msg_xxx
event: usage
data: {"totalTokens":100,...}

// 5. 最终停止
id: msg_xxx
event: stop
data: "message_stop"

使用示例

import { llmMockManager, presetResponses } from '../../mocks/llm';

// 在测试步骤中设置 mock
llmMockManager.setResponse('hello', presetResponses.greeting);
await llmMockManager.setup(this.page);

添加自定义响应

// 为特定用户消息设置响应
llmMockManager.setResponse('你好', '你好！我是 Lobe AI，有什么可以帮助你的？');

// 清除所有自定义响应
llmMockManager.clearResponses();

页面元素定位技巧

富文本编辑器 (contenteditable) 输入

LobeHub 使用 @lobehub/editor 作为聊天输入框，是一个 contenteditable 的富文本编辑器。

关键点:

不能直接用 locator.fill() - 对 contenteditable 不生效
需要先 click 容器让编辑器获得焦点
使用 keyboard.type() 输入文本

// 正确的输入方式
await chatInputContainer.click();
await this.page.waitForTimeout(500); // 等待焦点
await this.page.keyboard.type(message, { delay: 30 });
await this.page.keyboard.press('Enter'); // 发送

添加 data-testid

为了更可靠的元素定位，可以在组件上添加 data-testid：

// src/features/ChatInput/Desktop/index.tsx
<ChatInput
  data-testid="chat-input"
  ...
/>

调试技巧

添加步骤日志

在每个关键步骤添加 console.log，帮助定位问题：

Given('用户进入页面', async function (this: CustomWorld) {
  console.log('   📍 Step: 导航到首页...');
  await this.page.goto('/');

  console.log('   📍 Step: 查找元素...');
  const element = this.page.locator('...');

  console.log('   ✅ 步骤完成');
});

查看失败截图

测试失败时会自动保存截图到 e2e/screenshots/ 目录。

非 headless 模式

设置 HEADLESS=false 可以看到浏览器操作：

HEADLESS=false pnpm exec cucumber-js --config cucumber.config.js --tags "@smoke"

环境变量

运行测试需要以下环境变量：

BASE_URL=http://localhost:3010   # 测试服务器地址
DATABASE_URL=postgresql://...    # 数据库连接
DATABASE_DRIVER=node             # 数据库驱动
KEY_VAULTS_SECRET=...            # 密钥
BETTER_AUTH_SECRET=...           # Auth 密钥
NEXT_PUBLIC_ENABLE_BETTER_AUTH=1 # 启用 Better Auth

# 可选：S3 相关（如果测试涉及文件上传）
S3_ACCESS_KEY_ID=e2e-mock-access-key
S3_SECRET_ACCESS_KEY=e2e-mock-secret-key
S3_BUCKET=e2e-mock-bucket
S3_ENDPOINT=https://e2e-mock-s3.localhost

清理环境

测试完成后或需要重置环境时：

# 一键清理（推荐）
bun e2e/scripts/setup.ts --clean

或手动清理：

# 停止并删除 PostgreSQL 容器
docker stop postgres-e2e && docker rm postgres-e2e

# 清理端口占用
lsof -ti:3006 | xargs kill -9
lsof -ti:5433 | xargs kill -9

常见问题

1. 测试超时 (function timed out)

原因: 元素定位失败或等待时间不足

解决:

检查选择器是否正确
增加 timeout 参数
添加显式等待 waitForTimeout()

2. strict mode violation (多个元素匹配)

原因: 选择器匹配到多个元素（如 desktop/mobile 双组件）

解决:

使用 .first() 或 .nth(n)
使用 boundingBox() 过滤可见元素

3. LLM Mock 未生效

原因: 路由拦截设置在页面导航之后

解决: 确保在 page.goto() 之前调用 llmMockManager.setup(page)

4. 输入框内容为空

原因: contenteditable 编辑器的特殊性

解决:

先 click 容器确保焦点
使用 keyboard.type() 而非 fill()
添加适当的等待时间

编写新测试的流程

创建 Feature 文件 (src/features/xxx/xxx.feature)
- 使用中文描述场景
- 添加适当的标签 (@journey, @P0, @smoke 等)
创建 Step Definitions (src/steps/xxx/xxx.steps.ts)
- 导入必要的 mock 和工具
- 每个步骤添加日志
- 处理元素定位的边界情况
设置 Mock（如需要）
- 在 src/mocks/ 下创建对应的 mock
- 在步骤中初始化 mock
调试和验证
- 先用 HEADLESS=false 运行观察
- 检查失败截图
- 确保稳定通过后再提交

11 KiB Raw Blame History Unescape Escape