为何选择 MCP-first

传统软件开发首先从界面出发：客户列表、项目页面、上传按钮、发票表单、日历视图。对人类而言这很合理。对 AI 智能体、自动化系统和外部系统而言，这是错误的抽象模型。

智能体不应该需要知道按钮在哪个页面上。

核心问题

智能体真正需要什么

智能体不导航界面，它调用能力。相关问题是：

UI-first 软件无法回答这些问题。MCP-first 软件能全部回答。

Klassisch

MCP-first

人类会点击、滚动、阅读和理解。智能体需要可以直接、安全调用的结构化能力。

第二种方式是确定性的、类型化的、权限验证的且可审计的。第一种方式产生脆弱的浏览器自动化，每次 UI 更新都会崩溃。

示例：安排跟进

过去，UI 是访问软件的主要入口。未来将有多个同等地位的访问渠道，全部访问同一个能力层：

先构建 Web 应用再追加其余部分，意味着重复构建同一个 Action 层—— 每次略有不同，每次有各自的权限逻辑。

如果软件只能通过界面运行，必然会产生脆弱的变通方案：

这些变通方案在 UI 变更时会崩溃，无法扩展，也无法审计。 MCP-first 从根本上消除了它们存在的理由，因为系统从一开始就具备结构化的可控性。

许多任务是对话式的、情境化的、基于工作流的——它们不再需要一个页面：

“生成所有未结交易的摘要。"
"我今天应该联系哪些客户？"
"检查该员工是否缺少文件。"
"生成所有存在风险的项目报告。"
"比较最近两次薪资运行的结果。”

对于这些任务，一个可以访问能力层的对话式智能体比任何带过滤器和表格的页面都更高效。前提是：能力经过清晰建模、类型化并标注了风险等级。

Low 生成摘要 — Medium 创建文档 — Critical 薪资导出——系统必须了解这些区别。

当一个功能首先作为 Action 构建时，每个客户端都可以使用相同的 Action—— 无需重复实现：

create_project(name, templateId, ownerId, tenantId)

这一个 Action 可被以下所有端使用：

这不仅减少了工作量——它消除了客户端之间随时间积累的不一致性。

MCP-first 构建方式自然会带来更清晰的建模。每项能力都需要：

这迫使在编写任何一行 UI 代码之前，就明确分配业务职责。

示例：每项能力必须描述的内容

API-first 是为开发者而生的。MCP-first 是为智能体而生的。

API-first 是为开发者而生的。

首先作为完整描述、权限验证和可审计的能力系统构建的软件，对人类更好，对智能体更好，对介于两者之间的一切也更好。