最近,在测试圈和AI圈,"Skills"这个概念的热度高居不下,成为行业热议的焦点话题。
不少测试工程师和AI爱好者都在询问我:Skills到底是什么?它和刚推出的MCP(Model Control Platform)有什么关系?作为测试人员有必要学习这项技术吗?如果是零基础该如何快速上手?
其实,作为测试从业者,我们学习Skills的核心目的极其朴素且实用:用最低的学习成本,实现最高效的自动化,解决日常工作中的重复劳动问题。具体来说,通过Skills我们可以实现:
这些功能都能帮助我们摆脱手动调整格式、编写重复代码的繁琐工作。以一个典型的应用场景为例:过去需要3小时手动编写的100个测试用例,现在通过Skills可以在5分钟内自动生成,且格式规范统一。
今天,我将为你送上一份测试人专属的Skills自学指南。这份指南特别值得关注的是,就在2026年3月11日,Anthropic公司刚刚发布了Skills 2.0的重磅更新,这次更新带来了三大突破性改进:
这些更新让Skill的开发从"手工作坊"式的编码模式,真正迈向了"工业化"的生产模式。本文将结合这些最新技术动态,帮助你站在自动化测试技术发展的最前沿。
一句话讲清:
如果把之前的普通Prompt(提示词)比作一本“种菜的说明书”,那么Skills就是“说明书+农具+机械臂”的组合包。
详细说明:
普通Prompt的局限性
Skills的升级能力
应用场景示例:
核心差异:Skills让AI从“顾问”升级为“助手”,既能提供方案,又能动手完成。
很多人会把Skills和MCP搞混,这里用一个比喻讲清:
简单来说:MCP是“路”,让AI能走到工具旁边;Skills是“导航+驾驶动作”,让AI知道怎么把车开到目的地。
要会用甚至定制Skills,必须看懂它的“内脏”。一个标准的Pdf-skill结构如下(这是目前业内通用的标准结构):


anthropics:(https://github.com/anthropics/skills)
awesome-claude-Skills:
(https://github.com/ComposioHQ/awesome-claude-Skills/)
skillsmp:(https://skillsmp.com/zh)
平台内置了超过50,000种skills供选择,但需要注意甄别:部分不安全的skills可能存在盗取token的风险。建议优先选择star数量多、可信度高的skills,或者自行开发更安全可靠。
对测试人而言,上手Skills的核心原则是“先解决实际问题,再逐步深化”。不要一上来就啃代码,跟着下面三步走:
不要重复造轮子,先去GitHub上“捡”现成的Skill用。
下载:在GitHub搜索“awesome-skills”或直接找Anthropic官方提供的Skills仓库。
导入:将下载的Skill文件夹(如 excel-skill/)放入Kiro项目的 .kiro/skills/ 目录下。
实战案例:假设你安装了 xlsx skills,以前KIro没法直接写Excel,但现在你可以直接在对话框输入:
“使用 xlsx skills 生成20条关于‘登录功能’的测试用例,保存到‘登录测试用例.xlsx’。”
后台发生了什么?
生成的Excel里,应该已经整整齐齐列好了“用例编号、模块、前置条件、步骤、预期结果”等列,这就是Skill自动化的魅力。
当现成的Skill不符合公司规范(比如用例格式必须包含“风险等级”字段)时,就可以动手改了。
不少同学试了两下觉得不好用,多半是踩了这坑:
初入三坑:
追求全能,忽略场景适配
坑:想用一个Skill解决“生成用例+执行测试+发邮件报告”所有事,结果提示词复杂到AI都理解不了,输出质量极差。
避坑:单一职责原则。一个Skill就干一件事,比如“Excel格式化输出”,把它做到极致。
过度依赖,不做校验
坑:AI生成的JMeter脚本里,线程组配置错了,没检查就直接拿去压测,结果测了个寂寞。
避坑:人机协同。把Skills当成一个“效率极高的实习生”,它干完活,你作为导师必须做Code Review或结果校验。
上来就开发,不先复用
坑:新手花两周自己写了个“生成测试数据”的Skill,结果发现GitHub上开源的 faker-skill 比自己写的好用一百倍。
避坑:先尝后买。先复用现成的,摸清门道了,再根据公司的特定中间件(如自研的配置中心)开发私有Skill。
进阶三坑:
坑:在同一个对话窗口里,既加载了“Excel用例生成Skill”,又加载了“Xmind脑图生成Skill”。当你输入“帮我生成登录用例”时,AI懵了:它可能同时读取了两个Skill的指令,结果输出既不是标准的Excel,也不是完整的Xmind,而是四不像。这叫上下文污染。
避坑:隔离环境,专事专办。养成好习惯:一个对话窗口只专注处理一类任务。如果要切换任务,开启新对话,或者明确在Prompt中指定“请忽略其他Skill,只使用XXXSkill”。
坑:从GitHub下载了一个看起来很牛的“PDF解析Skill”,导入后运行报错。一查发现,这个Skill的 /scripts 文件夹里用到了 pypdf2 库,但你的本地Python环境根本没装。AI尝试执行时报错,新手直接懵了。
避坑:环境即代码,清单化管理。下载Skill后,先看有没有 requirements.txt 或类似文件。在Cursor/Trae这类工具中,通常需要在终端手动安装依赖。建议Skill作者在 SKILL.md 里明确写明依赖,使用者养成“先装依赖,再跑Skill”的习惯。
坑:你输入“用Excel Skill生成用例”。AI确实用了,但生成的Excel里只有三列(步骤、预期、结果),而你们公司规范要求七列(用例编号、模块、优先级、前置条件、步骤、预期结果、实际结果)。你觉得AI不行,AI觉得你没说清楚。
避坑:指令工程,精确传达。好的Prompt是成功的一半。你可以优化输入:“用Excel Skill生成登录模块的测试用例,严格按照公司规范模板输出:包含用例编号_TC001、模块_登录、优先级_P0、前置条件、测试步骤、预期结果六列,表头加粗并自动适配列宽。” 把规范“喂”给AI,它才能吐出你想要的东西。
就在前天,AI界发生了一件大事,直接关系到我们怎么学Skills :
Anthropic 发布了 Skills 的两大工业化更新:
这标志着AI智能体生态正在走向工业化,测试人现在上车,正是时候。
配置 Kiro Skill 其实就是把一系列特定的工作流程指令“教”给 Kiro,让它能在对话中自动调用。整个过程主要分为创建和导入两种方式。
你可以把 Skill 理解为一个封装好的“函数”,只要在对话中触发关键词,它就会自动执行预设好的步骤。
在开始之前,你需要了解 Skill 可以存放在哪。这决定了它的生效范围:
存放位置 | 作用范围 | 适用场景 |
|---|---|---|
.kiro/skills/ (项目目录下) | 当前项目/工作区 | 团队共享的代码规范、项目的特定部署流程等。 |
~/.kiro/skills/ (用户根目录下) | 全局,所有项目 | 个人常用的工作流,比如日志分析、文档生成等。 |
特别注意:Kiro 识别的是 [技能名称]/SKILL.md 这样的文件夹结构。如果把 Markdown 文件直接放在 skills 文件夹下,它是不会被识别的。
这是最核心的方法,让你能根据自己的需求定制 Skill。
创建文件夹:在上述任意一个 skills 目录下,为你的新技能创建一个文件夹。文件夹名就是技能的名字,建议使用小写字母、数字和连字符,比如 pr-review。
创建核心文件:在刚才创建的文件夹里,新建一个名为 SKILL.md 的文件。这是技能的“大脑”,Kiro 通过读取这个文件来理解你的技能。
编写 SKILL.md:这个文件有固定的格式,最上面是 YAML 格式的 Frontmatter,后面跟着 Markdown 格式的指令。
---
# 技能的唯一标识符,必须和文件夹名一致
name: pr-review
# 技能的描述,非常重要!Kiro 通过匹配这段话来决定是否激活技能
description: 负责审查 Pull Request 的代码质量、安全问题和测试覆盖率。当用户提到“审查PR”或“准备代码审查”时使用。
---
## PR 审查清单
当你被要求审查一个 Pull Request 时,请遵循以下步骤:
1. **安全检查**:检查代码中是否存在安全漏洞,如 SQL 注入风险、硬编码的密钥或暴露的凭证。
2. **错误处理**:验证是否妥善处理了各种边界情况和可能的失败模式。
3. **测试覆盖**:确认新添加的代码有对应的单元测试或集成测试。
4. **代码风格**:确保变量和函数命名清晰易懂,符合项目规范。
5. **遗留问题**:提醒移除开发过程中留下的调试代码,如 `console.log` 或 `print` 语句。
## 需要特别留意的问题
* 硬编码的凭据或 API 密钥。
* 缺少必要的输入验证。
* 未捕获的 Promise 异常。
* 在代码中引入不必要的复杂性。
(可选) 添加参考资料:如果你的技能需要依赖很多文档,可以在技能文件夹下创建一个 references/ 目录,把详细的操作手册、配置指南等放进去。然后在 SKILL.md 里通过相对路径引用它们。
如果你不想从头开始,可以直接从 GitHub 等地方导入别人分享的 Skill。Kiro 的图形化界面让这件事变得很简单。
推荐资源:你可以试试从 https://github.com/anthropics/skills.git 这个仓库获取一些现成的 Skill 来体验。
使用excel-test-case-generator skill 需求为#prod.md

一个 Skill 可以做的远不止是提供文本建议。比如,有人创建了一个性能测试分析 Skill,当你对它说“分析 test_result.json”时,它会自动执行以下操作:
测试人的核心竞争力,是高效保障质量,而不是机械地敲键盘。日常大量的重复工作(格式转换、数据填充、脚本录制)占用了我们分析业务、探索性测试的时间。
Skills能让我们从“劳动者”变成“工具的定义者”。
目前,结合我遇到的测试痛点,已经梳理了几个测试实用Skill的开发思路,分享给你参考:
Skill思路 | 核心价值 | 适用场景 |
|---|---|---|
Excel用例Skill | 告别手动合并单元格、调格式,AI根据需求描述直接输出规范格式的Excel测试用例文件。 | 手工测试用例设计、测试评审会准备。 |
Xmind用例Skill | 输入一句话需求或功能点,AI自动生成结构清晰的思维导图(Xmind格式),评审会可直接投屏讲解。 | 需求分析、测试设计 brainstorm、评审演示。 |
API测试用例Skill | 根据Swagger/OpenAPI文档,自动提取接口参数、枚举值、必填项,生成Postman可导入的JSON集合,包含正向、异常场景。 | 接口测试准备、CI/CD流水线集成。 |
JMeter脚本Skill | 根据接口定义文档,自动生成标准JMeter脚本(.jmx文件),配置好线程组、HTTP请求、监听器,导入即可进行压测。 | 性能测试脚本准备、快速压测验证。 |
测试数据脱敏生成器 | 输入生产库表结构,自动识别身份证、手机号等敏感字段,生成符合业务逻辑(如地域分布、年龄分布)的脱敏SQL/CSV数据。 | 开发本地调试、性能测试环境数据准备。 |
测试数据质量校验Skill | 对现有测试数据集进行扫描,自动发现数据分布偏差(如年龄全集中在20-30岁)、业务约束失效(如订单金额为负数)等问题,并输出优化建议。 | 大促前数据健康度巡检、自动化测试前置检查。 |
Mock数据智能生成器 | 根据API的Schema定义(如OpenAPI规范),自动生成各种边界值、异常值、组合场景的Mock响应报文。 | 前端联调、异常场景模拟。 |
Skill思路 | 核心价值 | 适用场景 |
|---|---|---|
线上问题快速定位Skill | 输入报错信息或日志片段,Skill按预设规则执行:先查依赖服务健康度 → 再查错误码表 → 最后关联历史相似缺陷,输出问题类型和责任模块建议。 | 线上Oncall值班,快速响应。 |
缺陷报告智能优化Skill | 将开发或测试提交的原始缺陷描述,自动补全:环境信息、复现步骤、预期结果、日志截图建议,甚至自动生成最小化复现用例。 | 提升缺陷单质量,减少沟通成本。 |
事故复盘分析Skill | 输入事故描述,自动从测试视角复盘:判断缺陷本应在哪个阶段发现(需求/设计/编码/测试)?缺失的是用例、数据还是断言?并给出流程改进建议。 | 质量回溯、持续改进。 |
Skill思路 | 核心价值 | 适用场景 |
|---|---|---|
需求文档转测试点Skill | 输入产品需求PRD文档(Word/在线文档链接),利用NLP解析业务规则,自动输出标准化的测试点列表(按功能模块、优先级分组)。 | 需求评审前准备,快速生成测试思路。 |
代码变更影响范围分析Skill | 输入Git提交记录或Diff代码,自动识别变更的类/方法,关联调用链和业务模块,输出“建议回归的测试用例列表”和“高风险模块预警”。 | 精准测试、CI/CD门禁。 |
自动化脚本智能修复Skill | 当UI自动化用例因元素定位失效时,输入错误截图和DOM结构,Skill自动分析并推荐新的XPath/CSS定位符,甚至直接生成修复后的代码。 | 降低UI自动化维护成本。 |
Skill思路 | 核心价值 | 适用场景 |
|---|---|---|
测试环境自愈Skill | 定期巡检测试环境服务状态,发现服务宕机或端口无响应时,自动执行预设的恢复脚本(如重启Docker容器、清理磁盘空间)并通知相关人员。 | 7x24小时无人值守环境保障。 |
配置比对校验Skill | 输入两套环境(如预发 vs 生产)的配置中心地址,自动拉取关键配置项进行比对,输出差异报告,并高亮可能引发问题的配置项。 | 发布前配置检查、故障排查。 |
测试数据快照与回滚Skill | 在执行复杂测试前,自动对数据库关键表或Redis缓存进行快照;测试结束后,可根据快照一键回滚数据,保证环境整洁。 | 自动化测试数据清理、反复测试。 |
Skill思路 | 核心价值 | 适用场景 |
|---|---|---|
AI模型鲁棒性测试Skill | 输入图像识别/自然语言处理模型的API,自动生成对抗样本(如给图片加轻微噪点、文本同义词替换)进行攻击,评估模型在极端情况下的准确率下降程度。 | 金融风控模型、人脸识别门禁系统测试。 |
提示词注入攻击测试Skill | 针对集成大模型的应用,自动生成各种提示词注入(Prompt Injection)Payload,测试应用的安全防护能力,防止越狱或敏感信息泄露。 | AIGC应用上线前安全测试。 |
智能体协作流程校验Skill | 针对由多个AI智能体(如规划Agent+执行Agent)组成的复杂系统,输入一个端到端任务,自动追踪和验证每个Agent的决策和执行是否符合预期。 | 测试企业级智能体平台(如Dify、Coze应用)。 |
最后想对测试同仁说:Skills不难学,它本质上是对我们测试经验的“代码化封装”。能解决工作痛点、把我们从重复劳动中解放出来的工具,就是好工具。
最后奉上一首skill使用七言打油诗(避坑口诀),朗朗上口,方便记忆:
一忌全能贪大功
单一职责记心中
二忌偷懒不检查
复核一分钟不差
三忌闭门造新车
先搜现成不迷途
四忌多 Skill 同框聊
专事专办才可靠
五忌依赖缺环境
装好依赖再运行
六忌指令说不清
规范喂给 AI 听
全部0条评论
快来发表一下你的评论吧 !