揭秘 Cloudflare 内部 AI 工程栈:如何实现 93% 的研发采用率与开发效能飞跃
在过去的 11 个月里,Cloudflare 内部进行了一场深刻的研发变革。通过组建名为 iMARS(内部 MCP 代理/服务器推广小组)的特别行动队,Cloudflare 成功将 AI 工具集成到了工程师的日常工作流中。目前,Cloudflare 研发部门中 93% 的员工都在使用基于自身平台构建的 AI 编码工具。
这不仅仅是安装了一个插件,而是一套完整的、运行在 Cloudflare 自身产品上的 AI 工程栈 (AI Engineering Stack)。以下是这场变革背后的技术细节与实践路径。

令人瞩目的效能数据
在最近的 30 天内,这套系统展现了惊人的吞吐量和影响力:
- 活跃用户数:3,683 名内部用户(占全公司的 60%,研发部门的 93%)。
- 请求总量:4,795 万次 AI 请求。
- 令牌处理:AI Gateway 路由了 2413.7 亿个 Token。
- 开发速率:每周合并请求(Merge Requests)从 5,600 次攀升至最高 10,952 次,几乎翻了一番。
架构概览:三层驱动模型
Cloudflare 的 AI 工程栈由三层组成,每一层都直接映射到其对外提供的商业产品:

第一幕:平台层 (The Platform Layer)
平台层负责解决最基础的身份验证、路由和推理问题。
- AI Gateway 与安全控制:所有 LLM 请求都通过 Cloudflare AI Gateway 路由。这为公司提供了一个中心化的控制点,用于管理 API 密钥、跟踪成本,并强制执行“零数据保留 (Zero Data Retention)”策略。通过 Proxy Worker 模式,工程师无需在本地存储任何 API 密钥,所有认证通过 Cloudflare Access 完成。
- Workers AI 的崛起:虽然 91% 的复杂任务仍由前沿模型(如 OpenAI、Anthropic)处理,但 Workers AI 处理了约 9% 的负载。特别是 Kimi K2.5 等开源模型的引入,使得安全审计等高吞吐量任务的成本降低了 77%。
- MCP Server Portal:利用模型上下文协议 (Model Context Protocol),Cloudflare 构建了一个统一的门户,聚合了 13 个生产级 MCP 服务器。这意味着 AI Agent 可以直接调用 Jira、GitLab、Sentry 等 182 多个内部工具。
第二幕:知识层 (The Knowledge Layer)
AI Agent 如果不了解系统的上下文,其生成的代码往往是“看起来对但实际无法运行”的。为了解决这个问题,Cloudflare 引入了两个核心组件:
- Backstage 服务图谱:Cloudflare 使用 Backstage 追踪了 2000 多个服务、1300 多个数据库和 375 个团队的所有权关系。通过 Backstage MCP 服务器,AI Agent 可以瞬间获知某个服务的所有者、其依赖的 API 以及相关的技术文档。
- AGENTS.md:受开源社区启发,Cloudflare 为数千个代码仓库自动生成了
AGENTS.md文件。这个结构化的 Markdown 文件告诉 AI Agent 该仓库的测试命令是什么、有哪些特定的编码规范以及哪些目录是禁止修改的。
第三幕:执行层 (The Enforcement Layer)
如何确保 AI 生成的内容符合高质量标准?这就是执行层的作用。
AI Code Reviewer
现在,Cloudflare 的每一个合并请求都会接受 AI 的“洗礼”。AI 代码评审员被集成在 GitLab CI 流水线中,它会根据风险等级将评审任务分配给不同的专门 Agent(安全、代码质量、性能等)。它不仅指出问题,还会引用内部的 Engineering Codex(工程准则)作为依据。
Engineering Codex
这是 Cloudflare 的“法律条文”,所有的工程标准都被转化为 AI 可识别的技能。例如,当工程师询问“如何在 Rust 服务中处理错误”时,AI 会直接调用 Codex 技能,提供符合公司标准的最佳实践。
迈向未来:后台自主 Agent
Cloudflare 的下一步是开发“后台 Agent”。这些 Agent 利用 Durable Objects 和 Sandbox SDK,可以在云端独立的沙箱环境中克隆仓库、安装依赖、运行完整的测试套件,并最终自主提交 MR。这意味着工程师只需下达高层指令,剩下的繁琐环节将由 Agent 在后台异步完成。
结语
Cloudflare 的实践证明,AI 在工程领域的成功不仅仅取决于模型的能力,更取决于如何将 AI 深度织入现有的基础设施和流程中。通过“在自己构建的平台上开发工具”,Cloudflare 不仅提升了自身效率,也验证了其开发者平台在 AI 时代的强大竞争力。
如果你也想开启 AI 转型之旅,可以从 npx create-cloudflare@latest --template cloudflare/agents-starter 开始探索。