Skills 真的可以帮我干活了：把工单分析变成一个可复用的 Skill

Skills真的可以帮我干活了！本文介绍如何把工单分析变成一个可复用的Skill，通过agent-browser和Copy as fetch技术，解决企业内网环境下的数据获取问题，实现自动化工单分析，输出结构化分析报告，为不同角色提供定制化分析视角。

2026-03-04 AIGC

分析报告工单分析可复用企业内网数据获取自动化 agent-browser Skills SOP

Anthropic 刚推出 Skills [1]时，我非常兴奋。官方的态度也很明确：不要再执着于开发复杂 Agent，而是把精力放在 Skills 上。

但在认真研究了一圈官方和社区的 Skills 示例[2]后，我很快冷静下来—— 几乎没有一个 Skills 能直接在真实环境中跑起来。当时我的判断是：这就是个玩具。

直到最近，Claude Code 2.1.3 版本[3]发布，将 commands 和 skills 进行了合并，解决了之前触发困难等问题。

特别是最近我关注的一位 AI 博主在介绍他的新项目时提到：他最近最主要的工作就是帮企业把日常 SOP 沉淀成 Skills，一个 Skills 的收费高达五位数。

让我意识到 Skills 价值已经逐步在被证明。

一句话总结我接下来做的事情：我把一个需要登录内网、手动筛选、导出、分析的工单 SOP，固化成了一个可复用、易扩展、稳定运行的 Skills。

问题背景：为什么工单分析一直是痛点

最近一段时间，团队的产品的升级工单量明显上涨。问题不在于"工单多"，而在于工单分析的复杂度。

工单分析有三个非常典型、也非常现实的特征：

1. 数据在内网必须登录，且有严格的权限控制，无法通过公开 API 拉取。

2. 高频重复每个产品、每个版本、每周都要重新做一遍。

3. 每个角色的关注点不一样研发关心具体的技术问题，PD 关心提炼共性问题，产品化机会，TL 关心跨产品的横向对比。同一份数据，不同人要看不同的切面。

这恰好是 AI 非常擅长的事情，但前提是：你得先把数据稳定地拿出来，还要能灵活适配不同角色的分析诉求。

注意：以下方案只讨论技术实现，不涉及任何数据安全或权限绕过问题。

传统思路的局限

无论是 Skills、Agent 还是 Workflow，本质都一样：拿到数据 → 交给模型分析。

真正的难点只有一个：如何在企业内网、强登录态的情况下，稳定、低成本地获取数据。

最自然的想法，是让 AI 帮我"操作浏览器"。但我很快发现这条路走不通。

Playwright / playwright-mcp 的问题

我最早尝试的是 playwright-mcp[4]，但很快遇到了几个致命问题：

1. Token 消耗极高 Playwright 需要生成大量页面 snapshot。

2. 稳定性差页面中大量动态 DOM（例如时间选择器），元素定位极不稳定。

agent-browser：

更适合 Agent，但问题依旧存在

最近 vercel-labs 推出的 agent-browser [5]很火，5 天 7k star。 Rust CLI + 原生二进制，对 snapshot 做了大量优化，Token 消耗最多可降低 93%。

agent-browser open

但在实际使用中，我发现一个问题始终无法绕开：

只要是"让 AI 去操作页面"，行为就一定不稳定。

退回到"固定 selector + 脚本"的方式当然稳定，但代价是：

编写成本高
UI 变更后维护成本极高

const browser = await chromium.launch();

于是问题变成了：

能不能既稳定，又不需要维护复杂 UI 脚本？

关键观察：SPA 页面本质上只是接口渲染

现在绝大多数企业后台系统都是 SPA 架构。页面上的数据，本质都来自接口请求。

比如一次简单的搜索操作，就会触发 Ajax 请求：

我们做一个实验

在 Chrome DevTools 的 Network 面板中，对某个请求执行 Copy as fetch
将代码粘贴到 Console 中直接执行

Network 面板可以看到，请求被完整复现：

关键结论

只要页面能正常渲染，就意味着对应接口在当前登录态下一定可复现。与其让 AI 学会"怎么点页面"，不如让 AI 直接执行已经被验证过的请求。

新的解决方案：

Copy as fetch + agent-browser eval

最终方案非常克制，也非常工程化：

使用 agent-browser open 打开目标页面（登录问题由用户自行解决）；
在 DevTools Network 面板中 Copy as fetch，提前构造请求脚本；
使用 agent-browser eval 执行该脚本，获取 JSON 数据；
将数据交给大模型分析；

流程图

Skills 实现

细节请查看源码 order-analysis-skill[6]

目录结构

order-analysis-skill/

Skills 的关键价值

这个 Skills 的核心不在于"分析工单"，而在于：

它把"人类在 DevTools 里的隐性操作"，变成了 AI 可以稳定执行的显性 SOP。

SKILL.md 核心内容

---

打开工单系统页面

agent-browser --cdp 9222 open "https://inner.example.com"

准备输出目录

创建以时间命名的输出目录（格式：YYYYMMDD-HHMMSS）：

OUTPUT_DIR=".output/order-analysis/$(date +%Y%m%d-%H%M%S)"

获取订单数据

在浏览器中打开页面后，在同一 shell 会话中执行以下命令获取订单的所有JSON数据：

agent-browser --cdp 9222 eval "$(cat scripts/order-analysis.js)" > "$OUTPUT_DIR/order.json"

分析数据

针对获取的订单数据，识别共性问题并提出产品改进建议，并将分析结果保存到 $OUTPUT_DIR/order_report.md

agent-browser 使用方法

使用 agent-browser 进行网页自动化操作。运行 agent-browser --help 查看所有命令。

注意：所有 agent-browser 命令应加上 --cdp 9222 参数，例如 agent-browser --cdp 9222 open https://www.baidu.com/\

用法:

1. agent-browser --cdp 9222 open - 访问指定页面

2. agent-browser --cdp 9222 snapshot -i - 获取可交互元素及其引用 (@e1, @e2)

3. agent-browser --cdp 9222 click @e1 / fill @e2 "text" - 通过引用与页面元素交互

页面变化后重新执行 snapshot

对于分析结果的不同诉求

拿到数据后，不同角色对于数据的关注点不一样，比如我作为前端，更关注的是哪些工单是体验问题的；PD 更关注的是有哪些共性的问题，需要通过产品化来解决，只需要修改 SKILL.md 中的分析提示词即可。

总结

通过这个 Skills，原本需要：

打开内网系统
多次筛选、导出
人工分析

现在变成了：

一条命令触发 Skills
AI 自动完成数据采集与分析
输出结构化分析报告

Skills 真正替换的不是"工作"，而是那些每次都要重新搭一遍的 SOP 脑力成本。

源码地址：order-analysis-skill

https://github.com/heimanba/order-analysis-skill

[1]https://platform.claude.com/docs/en/agents-and-tools/agent-skills/overview

[2]https://github.com/anthropics/skills

[3]https://github.com/anthropics/claude-code/releases/tag/v2.1.3

[4]https://github.com/microsoft/playwright-mcp

[5]https://github.com/vercel-labs/agent-browser

[6]https://github.com/heimanba/order-analysis-skill

版权声明

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符，请点击举报进行投诉反馈！

版权声明

推荐阅读