未来测试圈新范式：不懂Skills的测试人，正在被AI悄悄淘汰

汉通达 2026-04-10 752

描述

最近，在测试圈和AI圈，"Skills"这个概念的热度高居不下，成为行业热议的焦点话题。

不少测试工程师和AI爱好者都在询问我：Skills到底是什么？它和刚推出的MCP（Model Control Platform）有什么关系？作为测试人员有必要学习这项技术吗？如果是零基础该如何快速上手？

其实，作为测试从业者，我们学习Skills的核心目的极其朴素且实用：用最低的学习成本，实现最高效的自动化，解决日常工作中的重复劳动问题。具体来说，通过Skills我们可以实现：

自动生成标准格式的测试用例
直接操作Excel文件进行数据处理
自动生成JMeter(JMX)性能测试脚本
批量处理测试报告和日志文件
自动化测试环境配置

这些功能都能帮助我们摆脱手动调整格式、编写重复代码的繁琐工作。以一个典型的应用场景为例：过去需要3小时手动编写的100个测试用例，现在通过Skills可以在5分钟内自动生成，且格式规范统一。

今天，我将为你送上一份测试人专属的Skills自学指南。这份指南特别值得关注的是，就在2026年3月11日，Anthropic公司刚刚发布了Skills 2.0的重磅更新，这次更新带来了三大突破性改进：

可视化开发界面，降低学习曲线
预置了200+测试专用模板
支持一键部署到CI/CD流水线

这些更新让Skill的开发从"手工作坊"式的编码模式，真正迈向了"工业化"的生产模式。本文将结合这些最新技术动态，帮助你站在自动化测试技术发展的最前沿。

一、先搞懂：Skills 到底是什么？

一句话讲清：
如果把之前的普通Prompt（提示词）比作一本“种菜的说明书”，那么Skills就是“说明书+农具+机械臂”的组合包。

详细说明：

普通Prompt的局限性

传统Prompt就像一本静态的说明书，只能告诉AI“如何理解任务”（比如种菜的步骤），但无法赋予AI实际操作的能力。
例如：你让AI“分析PDF里的数据”，它只能输出文字建议，但无法直接打开文件或提取表格。

Skills的升级能力

说明书（增强的Prompt）Skills包含更精准的指令，比如“按章节解析PDF，提取关键词并生成摘要”。
农具（封装脚本）通过内置Python/JS脚本，AI能调用工具（如PDF解析库、Excel处理模块）。
机械臂（自动化执行）AI可直接操作本地文件，比如从你电脑的PDF中提取表格，或自动整理Excel数据。

应用场景示例：

财务处理上传一份发票PDF，AI不仅能识别金额和日期，还能自动填入Excel模板并生成报表。
研究分析输入一篇论文PDF，AI直接提取参考文献列表，并用Python脚本整理成标准格式。

核心差异：Skills让AI从“顾问”升级为“助手”，既能提供方案，又能动手完成。

1. Skills 与 MCP 的区别

很多人会把Skills和MCP搞混，这里用一个比喻讲清：

MCP（协议层）好比是“USB-C接口协议”。它规定了设备怎么连接、数据怎么传输，解决的是“AI如何调用外部工具”的通信标准问题。
Skills（应用层）好比是“集成了芯片的扩展坞”。它不仅遵守USB-C协议，还内置了驱动程序和应用逻辑，告诉AI“去执行什么任务、按什么步骤”。

简单来说：MCP是“路”，让AI能走到工具旁边；Skills是“导航+驾驶动作”，让AI知道怎么把车开到目的地。

2. Skills 的内部结构

要会用甚至定制Skills，必须看懂它的“内脏”。一个标准的Pdf-skill结构如下（这是目前业内通用的标准结构）：

SKILL.md这是必须有的“大脑”。前半部分是元数据（告诉AI这个技能叫啥、啥时候用），后半部分是指令（详细的提示词，指导AI如何调用后面的脚本）。
/scripts文件夹这是“手脚”。存放具体的Python或JS代码，比如操作Excel的库、生成PDF的脚本。
其他（REFERENCE.md）这是“参考书”。当接口很复杂时，单独给AI提供查阅资料。

3. github上一些热门Skills

anthropics：（https://github.com/anthropics/skills）
awesome-claude-Skills：

（https://github.com/ComposioHQ/awesome-claude-Skills/）
skillsmp：（https://skillsmp.com/zh）
平台内置了超过50,000种skills供选择，但需要注意甄别：部分不安全的skills可能存在盗取token的风险。建议优先选择star数量多、可信度高的skills，或者自行开发更安全可靠。

二、 3步快速上手：先会用，再优化

对测试人而言，上手Skills的核心原则是“先解决实际问题，再逐步深化”。不要一上来就啃代码，跟着下面三步走：

第一步：明确需求，选对工具

定位高频场景测试人常见的痛点通常集中在这几块：

用例生成根据需求文档生成Excel/Xmind格式的用例。
脚本开发自动生成Postman的JSON导入文件或JMeter的JMX脚本。
测试数据批量生成脱敏的SQL数据或模拟报文。
报告输出将Bug汇总自动转为周报。

工具选择新手建议从 Trae 或 Cursor 或Kiro入手。这类IDE天然支持Skill的加载和调用，配置简单，开箱即用。

第二步：上手使用现成 Skills，熟悉逻辑

不要重复造轮子，先去GitHub上“捡”现成的Skill用。

下载：在GitHub搜索“awesome-skills”或直接找Anthropic官方提供的Skills仓库。

导入：将下载的Skill文件夹（如 excel-skill/）放入Kiro项目的 .kiro/skills/ 目录下。

实战案例：假设你安装了 xlsx skills，以前KIro没法直接写Excel，但现在你可以直接在对话框输入：

“使用 xlsx skills 生成20条关于‘登录功能’的测试用例，保存到‘登录测试用例.xlsx’。”

后台发生了什么？

生成的Excel里，应该已经整整齐齐列好了“用例编号、模块、前置条件、步骤、预期结果”等列，这就是Skill自动化的魅力。

读取指令大模型读取 xlsx-skill/SKILL.md，明白自己现在有操作Excel的能力。
编写脚本模型根据指令，动态生成一段操作xlsx库的Python脚本。
执行与清理在本地沙箱环境执行脚本生成Excel文件，任务结束后自动删除临时脚本。

第三步：按需优化/自定义，适配测试场景

当现成的Skill不符合公司规范（比如用例格式必须包含“风险等级”字段）时，就可以动手改了。

简单优化（无需代码）
直接修改 SKILL.md 里的指令部分。例如在指令末尾加上：“注意：输出的Excel表格必须额外增加‘风险等级’列，并根据接口重要性自动填入高/中/低。”
自定义开发（需基础前置知识）

核心规范Skill的名称要直观（如 api-testcase-to-jmeter），描述要精准（如“适用于将Swagger接口定义转为JMeter脚本”）。
文件编写复用Anthropic官方模板编写 SKILL.md 。如果你有代码能力，在 /scripts 下放一个处理复杂逻辑的Python脚本，然后在 SKILL.md 里告诉AI“遇到XXX情况，请调用 scripts/generate_jmx.py 处理”。

三、可能会踩的坑

不少同学试了两下觉得不好用，多半是踩了这坑：
初入三坑：

追求全能，忽略场景适配
坑：想用一个Skill解决“生成用例+执行测试+发邮件报告”所有事，结果提示词复杂到AI都理解不了，输出质量极差。
避坑：单一职责原则。一个Skill就干一件事，比如“Excel格式化输出”，把它做到极致。

过度依赖，不做校验
坑：AI生成的JMeter脚本里，线程组配置错了，没检查就直接拿去压测，结果测了个寂寞。
避坑：人机协同。把Skills当成一个“效率极高的实习生”，它干完活，你作为导师必须做Code Review或结果校验。

上来就开发，不先复用
坑：新手花两周自己写了个“生成测试数据”的Skill，结果发现GitHub上开源的 faker-skill 比自己写的好用一百倍。
避坑：先尝后买。先复用现成的，摸清门道了，再根据公司的特定中间件（如自研的配置中心）开发私有Skill。

进阶三坑：

4. 上下文污染，Skill之间互相打架

坑：在同一个对话窗口里，既加载了“Excel用例生成Skill”，又加载了“Xmind脑图生成Skill”。当你输入“帮我生成登录用例”时，AI懵了：它可能同时读取了两个Skill的指令，结果输出既不是标准的Excel，也不是完整的Xmind，而是四不像。这叫上下文污染。
避坑：隔离环境，专事专办。养成好习惯：一个对话窗口只专注处理一类任务。如果要切换任务，开启新对话，或者明确在Prompt中指定“请忽略其他Skill，只使用XXXSkill”。

5. 环境依赖缺失，Skill运行报错

坑：从GitHub下载了一个看起来很牛的“PDF解析Skill”，导入后运行报错。一查发现，这个Skill的 /scripts 文件夹里用到了 pypdf2 库，但你的本地Python环境根本没装。AI尝试执行时报错，新手直接懵了。
避坑：环境即代码，清单化管理。下载Skill后，先看有没有 requirements.txt 或类似文件。在Cursor/Trae这类工具中，通常需要在终端手动安装依赖。建议Skill作者在 SKILL.md 里明确写明依赖，使用者养成“先装依赖，再跑Skill”的习惯。

6. 指令模糊，AI猜不透你的真实意图

坑：你输入“用Excel Skill生成用例”。AI确实用了，但生成的Excel里只有三列（步骤、预期、结果），而你们公司规范要求七列（用例编号、模块、优先级、前置条件、步骤、预期结果、实际结果）。你觉得AI不行，AI觉得你没说清楚。
避坑：指令工程，精确传达。好的Prompt是成功的一半。你可以优化输入：“用Excel Skill生成登录模块的测试用例，严格按照公司规范模板输出：包含用例编号_TC001、模块_登录、优先级_P0、前置条件、测试步骤、预期结果六列，表头加粗并自动适配列宽。” 把规范“喂”给AI，它才能吐出你想要的东西。

四、最新动态：Anthropic 刚刚更新了什么？

就在前天，AI界发生了一件大事，直接关系到我们怎么学Skills ：

Anthropic 发布了 Skills 的两大工业化更新：

《Skills编写完整指南》一份长达33页的官方规范。这意味着Skill的开发不再是野路子，有了标准化的“说明书”。测试团队在编写自己的私有Skill时，有了权威的参考依据。（https://github.com/anthropics/skills/blob/main/skills/skill-creator/SKILL.md）
“技能生成器”新增评估功能以前我们不知道写的Skill好不好，现在官方工具可以量化技能质量、优化触发准确率。简单说，AI能自己测试这个Skill好不好用了，这对于我们后续构建企业级的Skill库是个重大利好。

这标志着AI智能体生态正在走向工业化，测试人现在上车，正是时候。

五、 kiro安装 Skills教程

配置 Kiro Skill 其实就是把一系列特定的工作流程指令“教”给 Kiro，让它能在对话中自动调用。整个过程主要分为创建和导入两种方式。

你可以把 Skill 理解为一个封装好的“函数”，只要在对话中触发关键词，它就会自动执行预设好的步骤。

Skill 的存放位置

在开始之前，你需要了解 Skill 可以存放在哪。这决定了它的生效范围：

存放位置	作用范围	适用场景
.kiro/skills/ (项目目录下)	当前项目/工作区	团队共享的代码规范、项目的特定部署流程等。
~/.kiro/skills/ (用户根目录下)	全局，所有项目	个人常用的工作流，比如日志分析、文档生成等。

特别注意：Kiro 识别的是 [技能名称]/SKILL.md 这样的文件夹结构。如果把 Markdown 文件直接放在 skills 文件夹下，它是不会被识别的。

方法一：手动创建你的第一个 Skill

这是最核心的方法，让你能根据自己的需求定制 Skill。

创建文件夹：在上述任意一个 skills 目录下，为你的新技能创建一个文件夹。文件夹名就是技能的名字，建议使用小写字母、数字和连字符，比如 pr-review。

创建核心文件：在刚才创建的文件夹里，新建一个名为 SKILL.md 的文件。这是技能的“大脑”，Kiro 通过读取这个文件来理解你的技能。

编写 SKILL.md：这个文件有固定的格式，最上面是 YAML 格式的 Frontmatter，后面跟着 Markdown 格式的指令。

---
# 技能的唯一标识符，必须和文件夹名一致
name: pr-review
# 技能的描述，非常重要！Kiro 通过匹配这段话来决定是否激活技能
description: 负责审查 Pull Request 的代码质量、安全问题和测试覆盖率。当用户提到“审查PR”或“准备代码审查”时使用。
---

## PR 审查清单

当你被要求审查一个 Pull Request 时，请遵循以下步骤：

1. **安全检查**：检查代码中是否存在安全漏洞，如 SQL 注入风险、硬编码的密钥或暴露的凭证。
2. **错误处理**：验证是否妥善处理了各种边界情况和可能的失败模式。
3. **测试覆盖**：确认新添加的代码有对应的单元测试或集成测试。
4. **代码风格**：确保变量和函数命名清晰易懂，符合项目规范。
5. **遗留问题**：提醒移除开发过程中留下的调试代码，如 `console.log` 或 `print` 语句。

## 需要特别留意的问题

* 硬编码的凭据或 API 密钥。
* 缺少必要的输入验证。
* 未捕获的 Promise 异常。
* 在代码中引入不必要的复杂性。

name 和 description 是必填项。description 写得越精准，Skill 被正确激活的概率就越高。

(可选) 添加参考资料：如果你的技能需要依赖很多文档，可以在技能文件夹下创建一个 references/ 目录，把详细的操作手册、配置指南等放进去。然后在 SKILL.md 里通过相对路径引用它们。

方法二：直接导入现成的 Skill

如果你不想从头开始，可以直接从 GitHub 等地方导入别人分享的 Skill。Kiro 的图形化界面让这件事变得很简单。

在 Kiro IDE 的左侧菜单栏点击 Kiro 图标。
找到 “AGENT STEERING & SKILLS” 选项，点击它右侧的 “+” 号。
在弹出的菜单中，你可以选择：

从 URL 导入粘贴一个 GitHub 上公开 Skill 的仓库地址。
从本地选择选择你电脑上已经下载好的 Skill 文件夹。

接着选择要导入的位置（当前工作区还是全局），Kiro 就会自动帮你下载并放置好。

推荐资源：你可以试试从 https://github.com/anthropics/skills.git 这个仓库获取一些现成的 Skill 来体验。

使用skill

使用excel-test-case-generator skill 需求为#prod.md

实战一下：Skill 是如何工作的？

一个 Skill 可以做的远不止是提供文本建议。比如，有人创建了一个性能测试分析 Skill，当你对它说“分析 test_result.json”时，它会自动执行以下操作：

解析数据调用内置的 analyze.js 脚本，分析原始的 JSON 测试数据。
计算指标自动计算出 P95 响应时间、吞吐量等关键性能指标。
生成报告调用 generate-html-report.js 脚本，生成一份精美的 HTML 可视化报告。
整个过程完全自动化，你只需要发出一条指令即可。

几个小建议

精准描述花点心思写好 description，这是 Skill 能被正确调用的关键。
迭代构建不必追求一步到位。可以先让 Skill 完成核心功能，再慢慢增加输出形式和美化效果。
版本控制建议把项目下的 .kiro/skills/ 目录提交到 Git 仓库，这样整个团队就能共享同一套工作流了。

五、测试人学 Skills，到底有什么用？

测试人的核心竞争力，是高效保障质量，而不是机械地敲键盘。日常大量的重复工作（格式转换、数据填充、脚本录制）占用了我们分析业务、探索性测试的时间。

Skills能让我们从“劳动者”变成“工具的定义者”。

目前，结合我遇到的测试痛点，已经梳理了几个测试实用Skill的开发思路，分享给你参考：

1、测试数据智能管理类

Skill思路	核心价值	适用场景
Excel用例Skill	告别手动合并单元格、调格式，AI根据需求描述直接输出规范格式的Excel测试用例文件。	手工测试用例设计、测试评审会准备。
Xmind用例Skill	输入一句话需求或功能点，AI自动生成结构清晰的思维导图（Xmind格式），评审会可直接投屏讲解。	需求分析、测试设计 brainstorm、评审演示。
API测试用例Skill	根据Swagger/OpenAPI文档，自动提取接口参数、枚举值、必填项，生成Postman可导入的JSON集合，包含正向、异常场景。	接口测试准备、CI/CD流水线集成。
JMeter脚本Skill	根据接口定义文档，自动生成标准JMeter脚本（.jmx文件），配置好线程组、HTTP请求、监听器，导入即可进行压测。	性能测试脚本准备、快速压测验证。
测试数据脱敏生成器	输入生产库表结构，自动识别身份证、手机号等敏感字段，生成符合业务逻辑（如地域分布、年龄分布）的脱敏SQL/CSV数据。	开发本地调试、性能测试环境数据准备。
测试数据质量校验Skill	对现有测试数据集进行扫描，自动发现数据分布偏差（如年龄全集中在20-30岁）、业务约束失效（如订单金额为负数）等问题，并输出优化建议。	大促前数据健康度巡检、自动化测试前置检查。
Mock数据智能生成器	根据API的Schema定义（如OpenAPI规范），自动生成各种边界值、异常值、组合场景的Mock响应报文。	前端联调、异常场景模拟。

2、缺陷分析与复盘类

Skill思路	核心价值	适用场景
线上问题快速定位Skill	输入报错信息或日志片段，Skill按预设规则执行：先查依赖服务健康度 → 再查错误码表 → 最后关联历史相似缺陷，输出问题类型和责任模块建议。	线上Oncall值班，快速响应。
缺陷报告智能优化Skill	将开发或测试提交的原始缺陷描述，自动补全：环境信息、复现步骤、预期结果、日志截图建议，甚至自动生成最小化复现用例。	提升缺陷单质量，减少沟通成本。
事故复盘分析Skill	输入事故描述，自动从测试视角复盘：判断缺陷本应在哪个阶段发现（需求/设计/编码/测试）？缺失的是用例、数据还是断言？并给出流程改进建议。	质量回溯、持续改进。

3、文档与代码协同类

Skill思路	核心价值	适用场景
需求文档转测试点Skill	输入产品需求PRD文档（Word/在线文档链接），利用NLP解析业务规则，自动输出标准化的测试点列表（按功能模块、优先级分组）。	需求评审前准备，快速生成测试思路。
代码变更影响范围分析Skill	输入Git提交记录或Diff代码，自动识别变更的类/方法，关联调用链和业务模块，输出“建议回归的测试用例列表”和“高风险模块预警”。	精准测试、CI/CD门禁。
自动化脚本智能修复Skill	当UI自动化用例因元素定位失效时，输入错误截图和DOM结构，Skill自动分析并推荐新的XPath/CSS定位符，甚至直接生成修复后的代码。	降低UI自动化维护成本。

4、环境与配置管理类

Skill思路	核心价值	适用场景
测试环境自愈Skill	定期巡检测试环境服务状态，发现服务宕机或端口无响应时，自动执行预设的恢复脚本（如重启Docker容器、清理磁盘空间）并通知相关人员。	7x24小时无人值守环境保障。
配置比对校验Skill	输入两套环境（如预发 vs 生产）的配置中心地址，自动拉取关键配置项进行比对，输出差异报告，并高亮可能引发问题的配置项。	发布前配置检查、故障排查。
测试数据快照与回滚Skill	在执行复杂测试前，自动对数据库关键表或Redis缓存进行快照；测试结束后，可根据快照一键回滚数据，保证环境整洁。	自动化测试数据清理、反复测试。

5、AI与专项测试融合

Skill思路	核心价值	适用场景
AI模型鲁棒性测试Skill	输入图像识别/自然语言处理模型的API，自动生成对抗样本（如给图片加轻微噪点、文本同义词替换）进行攻击，评估模型在极端情况下的准确率下降程度。	金融风控模型、人脸识别门禁系统测试。
提示词注入攻击测试Skill	针对集成大模型的应用，自动生成各种提示词注入（Prompt Injection）Payload，测试应用的安全防护能力，防止越狱或敏感信息泄露。	AIGC应用上线前安全测试。
智能体协作流程校验Skill	针对由多个AI智能体（如规划Agent+执行Agent）组成的复杂系统，输入一个端到端任务，自动追踪和验证每个Agent的决策和执行是否符合预期。	测试企业级智能体平台（如Dify、Coze应用）。

最后想对测试同仁说：Skills不难学，它本质上是对我们测试经验的“代码化封装”。能解决工作痛点、把我们从重复劳动中解放出来的工具，就是好工具。
最后奉上一首skill使用七言打油诗（避坑口诀），朗朗上口，方便记忆：

《Skills 六忌歌》

一忌全能贪大功
单一职责记心中

二忌偷懒不检查
复核一分钟不差

三忌闭门造新车
先搜现成不迷途

四忌多 Skill 同框聊
专事专办才可靠

五忌依赖缺环境
装好依赖再运行

六忌指令说不清
规范喂给 AI 听

打开APP阅读更多精彩内容