深入理解 AI Skills：赋予大模型"行动"的能力

发布日期: 2026-01-12

更新日期: 2026-01-12

文章字数: 1.1k

阅读次数:

序言

随着大语言模型（LLM）的迅速发展，我们正在从 “Chatbot”（聊天机器人）时代迈向 “Agent”（智能体）时代。单纯的文本生成已无法满足复杂的业务需求，我们需要 AI 能够”做事”。而 Skill（技能），正是赋予 AI 这种行动能力的关键组件。

🎯 什么是 AI Skill？

在 AI Agent 的语境下，Skill（也被称为 Tool、Plugin 或 Function）是指一段封装好的、可供 LLM 调用的逻辑单元。它本质上是代码能力与语义描述的结合体。

一个标准的 Skill 通常包含三个要素：

能力实现（Implementation）：实际执行任务的代码（如查询数据库、调用 API、计算公式）。
语义描述（Schema/Description）：告诉 LLM “我是什么”、“我能做什么” 以及 “怎么使用我”。
参数定义（Parameters）：明确输入输出的数据格式。

简而言之，Skill 让大模型拥有了”手”和”眼”，打破了模型训练数据的时效性限制和纯文本交互的边界。

💡 核心使用场景

Skill 的引入极大地扩展了 AI 的应用边界，以下是几个典型的核心场景：

1. 知识增强与实时信息获取 (RAG & Web Search)

大模型的知识是静态的，而 Skill 可以连接外部动态数据源。

场景：用户问”今天上海的天气怎么样？”
Skill：get_weather(city: str)
流程：LLM 识别意图 -> 调用天气 API -> 获取数据 -> LLM 组织语言回答。

2. 办公自动化与工作流 (Workflow Automation)

将复杂的业务流程拆解为多个 Skill，由 AI 编排执行。

场景：自动处理周报并发送邮件。
Skills：
- fetch_jira_issues(sprint_id: str)
- summarize_text(content: str)
- send_email(to: str, subject: str, body: str)
价值：实现跨应用（Jira -> LLM -> Outlook）的自动化。

3. 系统交互与控制 (System Control)

让 AI 成为系统的自然语言接口。

场景：通过对话查询运维日志或重启服务。
Skill：query_logs(service: str, time_range: str)、restart_container(container_id: str)
价值：降低普通用户使用复杂系统的门槛（DevOps Copilot）。

4. 数据分析与计算 (Code Interpreter)

弥补 LLM 数学计算和逻辑推理不严谨的短板。

场景：分析 Excel 表格并画图。
Skill：execute_python_code(code: str)
价值：AI 编写 Python 代码处理数据，准确率远超直接生成结果。

🛠 实现方式与技术架构

目前主流的 AI 开发框架（如 Semantic Kernel, LangChain, OpenAI Assistant）对 Skill 的实现逻辑大同小异，核心机制主要基于 Function Calling。

1. 架构流程

注册 (Registration)：开发者将 Skill（函数定义 + 描述）注入到 AI 上下文中。
感知 (Reasoning)：用户提问，LLM 判断是否需要使用 Skill，如果需要，输出要调用的函数名和参数（JSON 格式）。
执行 (Execution)：宿主程序（Host）捕获 LLM 的请求，在本地或远程执行对应的代码。
反馈 (Response)：将执行结果作为新的上下文（Context）回传给 LLM。
生成 (Generation)：LLM 根据执行结果生成最终回复。

2. 代码示例 (伪代码)

以 Semantic Kernel 风格为例：

# 定义一个 Skill
class MathSkill:
    @kernel_function(description="Add two numbers")
    def add(self, a: int, b: int) -> int:
        return a + b

# 注册 Skill
kernel.import_plugin_from_object(MathSkill(), "Math")

# 调用
result = await kernel.invoke_prompt("What is 5 plus 3?")
# LLM 内部会自动决定调用 Math.add(5, 3)

3. 不同的命名体系

虽然概念一致，但各家术语略有不同，开发时需注意：

OpenAI: Function Calling / Tools
Semantic Kernel: Skills (旧版) / Plugins (新版)
LangChain: Tools
Anthropic: Tool Use

🔮 未来展望：MCP (Model Context Protocol)

当前的痛点是 Skill 生态割裂，为一个模型写的 Tool 很难直接复用到另一个系统。

Anthropic 最近提出的 MCP (Model Context Protocol) 试图解决这个问题。它定义了一种标准协议，让数据源和工具能够以统一的方式暴露给 AI。如果 MCP 成为行业标准，未来我们只需开发一次 Skill，就能在 Claude、ChatGPT 或本地 LLM 中从容使用，这将是 AI Skills 生态的一次巨大爆发。