MCP Introduction

less than 1 minute read

我做了一个能“听懂人话”的浏览器 Agent！它利用 MCP 协议连接了 LLM 和 Playwright。最大的收获是理解了 MCP 的解耦思想——工具运行在独立的服务端，不再硬编码在客户端里，这让整个系统变得更加安全和灵活。

这篇博客还将介绍有关MCP的基础知识。

什么是MCP

MCP（Model Context Protocol, 模型上下文协议），是Anthropic公司在2024年11月推出的开放标准协议，目的是规范LLM与外部工具、系统和数据源之间交互的方式。它提供了一种统一的接口，用于读取文件、执行函数和处理上下文提示。（wikipedia）目前，基本上所有的主流模型都支持MCP。

这张图示可以更清晰理解MCP的概念：

图 1：MCP 架构示意图

MCP架构和组件

MCP架构由三部分组成：

MCP宿主（MCP Host） MCP宿主代表提供交互环境的AI应用程序，宿主充当运行MCP客户端的环境，并提供用户与AI进行交互的界面。
MCP客户端（MCP Client） MCP客户端在宿主机上运行，负责协调与MCP服务器的通信。其职责包括：
- 与MCP服务器建立连接
- 发送请求
- 接收响应
MCP服务器（MCP Server）主要对外提供三种能力：
- 工具（Tools）：使大模型可以执行操作（如搜索数据库、调用API等）
- 资源（Resources）：可供大模型访问的数据和内容（如文档、结构化数据等）
- 提示词（Prompts）：用于生成特定类型的工作流或可重用模板

MCP的工作原理：通信协议

MCP定义了客户端与服务器之间通信的标准化流程，该流程涉及几个关键阶段：

能力交换
- 请求：客户端询问服务器具备哪些能力
- 响应：服务端提供有关工具、资源和提示词的详细信息
- 通知：客户端确认连接成功
消息交换
- 客户端处理用户问题，选择特定工具，向服务器发送请求
- 服务器处理请求，生成响应并发送给客户端
- 根据响应，客户端可以选择继续发送请求，或结束交互

图 2：MCP 通信协议

MCP的优势

MCP的优势其实也要看应用场景，我个人觉得我还在开发中，目前只接触了最简单的MCP应用场景，但是体验到其最大的优势是提供了更通用的接口，通过MCP，开发的工具可以被各种应用使用，并且这种隔离式的架构保障了主程序的安全

下面是一个交互动图：

图 3：MCP 作用及优势

这篇有点长了，关于MCP应用的介绍，我会在下一个博客中详细介绍。

Cln_Nagisa

MCP Introduction

什么是MCP

MCP架构和组件

MCP的工作原理：通信协议

MCP的优势

You May Also Enjoy

Dissociation: Chapter 1

实战：搭建基于 MCP 的浏览器 Agent

Agent Using Search Tool

一些想法