Portkey AI
免费
Portkey AI 是面向生产级 Gen AI 团队的 AI Gateway 与 LLMOps 平台,覆盖统一模型 API、路由、fallback、可观测、Guardrails、Prompt Management、预算与治理能力,适合需要把多模型调用纳入正式运维体系的工程与平台团队。
Portkey AI 的核心参数与统计
Portkey AI 的产品定位是生产级 Gen AI 应用的控制平面:一侧连接 OpenAI、Anthropic、Gemini、Azure OpenAI、开源模型与私有模型,另一侧给团队提供 AI Gateway、Observability、Guardrails、Prompt Management、预算、速率限制与治理能力。官网把它概括为 “Production Stack for Gen AI Builders”,说明 Portkey 不是单一模型供应商,而是多模型应用进入生产后的基础设施层。
| 项目 | 公开信息 |
|---|---|
| 官方定位 | Production Stack for Gen AI Builders |
| 核心模块 | AI Gateway、Observability、Guardrails、Governance、Prompt Management |
| 开源仓库 | github.com/Portkey-AI/gateway |
| 开源许可证 | MIT License |
| 模型覆盖 | 官方仓库描述支持 1,600+ LLMs |
| Guardrails 覆盖 | 官方仓库描述 50+ AI Guardrails |
| 性能表述 | 官方仓库描述为 <1ms 延迟、122kb 包体 |
| 生产规模信号 | 官方仓库 README 展示 10B tokens/day、99.99% uptime、SOC2/HIPAA/GDPR/CCPA |
| GitHub 社区规模 | 12,110 stars、1,136 forks(2026-06-18 本地核验) |
| 商业状态 | Palo Alto Networks 于 2026-06 完成收购 |
产品边界:Portkey AI 解决的是 LLM 调用进入生产后的路由、监控、安全与治理问题,不是模型训练平台,也不替代向量数据库、数据标注系统或业务应用本身。它的价值通常在“已有或计划接入多个 LLM/Agent 工作负载”的团队里更明显。
参数含义:1,600+ 模型与 50+ Guardrails 说明 Portkey 主要承担“统一接入与统一控制”角色;<1ms 与 122kb 这类指标强调网关层不应成为明显性能瓶颈;SOC2、HIPAA、GDPR、CCPA 等合规信号则更偏企业采购与安全团队关注。
Portkey AI 的用户与市场认可
Portkey AI 的市场信号来自三类公开证据:官网展示的 GenAI 团队采用规模、开源仓库的开发者关注度,以及 Palo Alto Networks 的正式收购。官网首页公开写有 “Powering 3000+ GenAI teams”,文档 Feature Comparison 页面还展示 650+ global orgs、2.5 trillion+ LLM tokens processed 与 99.9% uptime SLA 等商业化指标。
开源认可:Portkey-AI/gateway 仓库在 2026-06-18 本地核验为 12,110 stars、1,136 forks,说明它不是只存在于商业官网里的封闭 SaaS,而是有开发者可检查、可部署、可二次集成的开源核心。
企业信号:Palo Alto Networks 官方新闻稿宣布完成对 Portkey 的收购,收购逻辑聚焦 AI Agent 安全、治理与企业控制。这一变化提升了 Portkey 在安全采购语境中的可信度,但也意味着后续产品路线、商业条款与生态整合节奏需要以 Palo Alto Networks 后续披露为准。
未公开项:Portkey 未公开稳定的付费客户数、ARR、净留存率、行业分布细项与中国区可用性承诺;涉及长期采购时,仍需在商务阶段补齐数据驻留、服务等级、支持边界与合规证明文件。
成本优势:用统一网关压低多模型运维的隐性损耗
Portkey AI 的成本优势不等于“模型单价最低”,而是把多模型接入、日志、重试、Fallback、预算、缓存和 Guardrails 放到同一层,减少每条业务线重复接入供应商、重复做日志埋点和重复建设治理能力的成本。
C 端/个人:Portkey 不是面向个人聊天的 C 端助手。Developer 免费方案更适合开发者、PoC 或企业早期验证,官网定价页公开 10k recorded logs/month、日志保留 3 天、指标保留 30 天,并注明不适合生产工作负载。
开发者/API:Production 方案公开价格为 $49/month,包含 100k recorded logs/month,额外 100k requests overage 为 $9,并提供 30 天日志、90 天指标、Alerts、LLM/Partner Guardrails、RBAC 与 Service Account API Keys。对已经有真实调用量的团队,这类分层让成本随日志规模和团队治理需求递增。
企业/私有化:Enterprise 为 Custom Pricing,公开覆盖 10M+ recorded logs/month、自定义日志与指标保留周期、Custom Guardrail Hooks、Advanced Evaluation Templates、SSO、预算/速率限制、Private Cloud Deployment 等。真实成本取决于日志量、保留期、部署形态、合规支持和 SLA,必须以官方实时报价与合同条款为准。
隐性成本:Portkey 引入后仍会产生迁移、SDK/API 调整、日志字段标准化、策略配置、告警值班和内部安全评审成本。若团队只是低频调用单一模型,这些治理能力可能超过实际收益;若团队有多业务线、多模型和上线压力,统一网关带来的排障与治理效率才更容易体现。
Portkey AI 的主要功能
- AI Gateway:用一个 OpenAI-compatible API 统一接入多个模型供应商,支持路由、Fallback、Retries、Load Balancing、缓存与密钥管理,适合把模型选择从业务代码中抽离出来。
- Observability:记录 Logs、Traces、Feedback、Metadata、Filters 与 Alerts,帮助团队按请求、模型、用户、项目或成本维度排查异常。
- Guardrails:支持 PII Redaction、规则检查、Partner Guardrails、自定义 Hooks 与请求拒绝策略,把安全和合规控制前置到模型调用路径。
- Prompt Management:提供 Prompt Templates、Playground、API Endpoints、Versioning 与 Variables,让 Prompt 从“代码里的字符串”变成可版本化资产。
- Governance:企业层覆盖 RBAC、SSO、Service Account API Keys、Granular Budget、Rate Limits 与团队级管理,适合跨部门共享统一 AI 平台。
- Model Catalog / Agent Gateway:文档导航中展示 Model Catalog、MCP Gateway 与 Agent Gateway,说明 Portkey 正在从 LLM 网关扩展到 Agent 与工具调用治理。
这些功能的关键不是单点是否存在,而是能否在同一条请求路径上联动:一次请求可以先通过预算与速率限制,再进入路由与重试,随后被日志追踪、Guardrails 评估和成本归因。对生产系统而言,这比单独拼接多个脚本或监控页面更容易形成可审计的闭环。
Portkey AI 的模型与版本演进
Portkey AI 以在线平台和开源 Gateway 双线迭代为主,暂无统一公开语义化版本号。对采购和上线评估来说,更适合按“公开里程碑 + 开源仓库更新 + 文档能力”判断版本脉络。
当前主线
Portkey Online Platform(~2026-06):官网与文档展示 AI Gateway、Observability、Guardrails、Prompt Management、Model Catalog、MCP Gateway、Agent Gateway、Coding Agents 和企业部署能力。当前主线的重点已经从“统一 LLM API”扩展到“AI Agent 治理与企业安全”。
关键里程碑
Palo Alto Networks 完成收购(~2026-06):官方新闻稿宣布完成对 Portkey 的收购,后续产品路线预计会与 AI 安全、Agent 安全和企业治理能力更紧密结合。
Portkey AI Gateway 开源(2025-02-21):Portkey 官方博客宣布开源 AI Gateway;GitHub 仓库描述强调 1,600+ LLMs、50+ Guardrails、统一 API 与快速网关能力。
早期平台化阶段(~2023-2024):GitHub 组织创建于 2023-04,gateway 仓库创建于 2023-08;这一阶段公开信息显示 Portkey 从 Gen AI 应用控制平面逐步发展到生产级网关与治理平台。
版本评估建议
由于 Portkey 的商业云服务不是传统本地软件包,生产环境应重点看能力稳定性、部署形态、变更公告、开源 gateway 的提交活跃度、企业 SLA 与后向兼容策略,而不是只看版本号本身。
Portkey AI 的技术优势
机制:统一网关抽象。Portkey 将供应商 API、私有模型、Fallback、Retries、Load Balancing 与缓存放在统一入口层。效果是业务代码减少对单一模型供应商的耦合,切换模型或设置降级策略时不需要在每个业务服务里重复改造。适用场景是多模型接入、供应商冗余和按业务线分流。
机制:请求级可观测。Portkey 在网关层记录日志、Trace、反馈、元数据、延迟、错误与成本。效果是排障从“猜模型/猜 Prompt/猜用户输入”变成按请求链路回放,尤其适合有线上事故、质量回归或成本异常的团队。
机制:Guardrails 前置。Portkey 把 PII、内容安全、输出规则、自定义 Hooks 与 Partner Guardrails 放到请求路径上。效果是风险控制从事后审计前移到调用前后,适合金融、医疗、客服、企业知识库和 Agent 工具调用等高风险场景。
机制:治理与预算中心化。通过 RBAC、SSO、Service Account API Keys、Rate Limits 与 Budget Controls,平台团队可以把权限、额度和审计标准统一下发。效果是降低多团队各自保存密钥、各自接入模型和各自记账带来的安全风险。
这些优势的代价是平台层治理复杂度上升。团队需要定义日志字段、成本归因口径、Guardrails 命中后的降级策略和上线审批流程,否则网关只会变成又一层中转服务,无法真正改善生产质量。
如何使用 Portkey AI
| 使用入口 | 典型步骤 | 适配对象 |
|---|---|---|
| Portkey Cloud | 注册账号 -> 创建项目 -> 配置 API Key / Virtual Key -> 将应用请求切到 Portkey Gateway -> 查看日志与指标 | PoC、开发团队、生产初期团队 |
| Open Source Gateway | 从 GitHub 获取 gateway -> 本地或云端部署 -> 配置模型供应商与 Guardrails -> 接入业务服务 | 需要自托管、私有网络或代码可审计的工程团队 |
| Enterprise / Private Cloud | 与官方确认 SSO、数据驻留、日志保留、SLA、合规与部署拓扑 -> 试点 -> 扩展到多业务线 | 中大型企业、平台团队、安全团队 |
典型落地可以分三步:先把一条低风险但高频的 LLM 调用链路接入 Portkey,验证日志完整性、延迟变化和成本归因;再启用 Fallback、Retries、缓存和 Guardrails,观察线上质量与失败率;最后把预算、RBAC、SSO、速率限制和告警纳入企业治理流程。
验收关注点:试点时应量化 P95/P99 延迟、错误率、Fallback 命中率、Guardrails 命中率、每千次请求成本、日志检索效率和事故定位时间。若这些指标没有改善,说明问题可能不在网关层,而在模型选择、Prompt 设计或业务流程定义。
Portkey AI 的产品定价
| 方案 | 公开价格 | 公开配额/能力 | 适用边界 |
|---|---|---|---|
| Developer | Free Forever | 10k recorded logs/month;3 天日志、30 天指标;AI Gateway、Observability、3 Prompt Templates、Simple Caching、Deterministic Guardrails | 原型、测试、企业 PoC;官网注明不适合生产工作负载 |
| Production | $49/month | 100k recorded logs/month;额外 100k requests 为 $9;30 天日志、90 天指标;Alerts、LLM & Partner Guardrails、RBAC、Service Account API Keys | 准备上线生产的团队 |
| Enterprise | Custom Pricing | 10M+ recorded logs/month;自定义保留期;Custom Guardrail Hooks;SSO;Granular Budget & Rate Limits;Private Cloud Deployment | 高合规、高流量、多团队治理场景 |
C 端/个人:Portkey 没有面向普通消费者的聊天订阅,个人开发者可用 Developer 免费层验证接入。
开发者/API:Production 的显性成本由月费、记录日志量、额外请求和模型供应商自身费用共同组成。Portkey 的价格不替代模型供应商账单,团队需要同时核算 OpenAI、Anthropic、Gemini、Azure、私有模型等底层成本。
企业/私有化:Enterprise 的合同价格、数据驻留、私有云、支持 SLA、合规文档和日志保留策略以官方商务报价为准。对受监管行业,采购前应确认是否需要 VPC、Air-gapped、FIPS-compliant images、Prometheus metrics 或自定义审计导出。
Portkey AI 的应用场景
- 多模型生产路由:在一个应用内根据成本、延迟、质量和可用性切换不同模型供应商,核心验收点是 Fallback 成功率、延迟增量和供应商故障时的业务可用性。
- LLM 成本与质量监控:把不同团队、项目、用户和模型的调用成本归因到同一看板,核心验收点是成本异常发现时间、日志字段完整率和预算超限处理策略。
- 企业 Agent 治理:对 Agent 的工具调用、MCP 接入、模型请求和输出安全做统一控制,核心验收点是越权调用拦截率、敏感信息处理效果和人工审计链路。
- Prompt 与版本管理:将 Prompt 模板、变量、版本和 Playground 纳入发布流程,核心验收点是 Prompt 回归测试覆盖率和线上版本回滚效率。
- 合规行业 AI 接入:金融、医疗、客服、法务、企业知识库等场景需要 PII redaction、日志留存、RBAC、SSO 和审计能力,Portkey 更适合放在模型调用入口层作为控制点。
这些场景的共性是“AI 调用已经成为线上业务的一部分”。如果团队仍处于一次性 Demo 阶段,直接接入模型供应商 API 可能更轻;当模型调用影响 SLA、合规、安全或财务预算时,Portkey 的平台价值才更充分。
Portkey AI 的适用人群
- AI 平台工程团队:需要统一管理模型供应商、Fallback、重试、预算、日志和密钥,Portkey 可以作为内部 AI 平台的网关层。
- LLM 应用研发团队:需要把 Prompt、模型切换、日志追踪和质量反馈纳入开发流程,减少线上问题定位成本。
- 安全与合规团队:关注 PII、内容安全、权限、审计、数据保留和私有部署,Portkey 的 Guardrails 与治理能力更贴近审查需求。
- 产品与业务负责人:需要理解 AI 功能上线后的成本、稳定性和用户体验波动,Observability 能帮助他们从实际请求数据看质量。
不太适合的情况包括:只做个人聊天、只调用单一模型且流量很低、没有生产上线计划、没有日志治理要求,或团队完全不愿在模型调用路径上增加任何中间层。这些场景下,Portkey 的治理能力可能转化为不必要的学习和配置成本。
Portkey AI 的总结与展望
Portkey AI 的核心价值是把 Gen AI 从“能调模型”推进到“可上线、可观察、可治理、可审计”。它在 AI Gateway、Observability、Guardrails、Prompt Management 和 Governance 上形成了较完整的生产栈,尤其适合多模型、多团队、多业务线和高合规要求的组织。
当前限制也很清楚:企业价格未公开、收购后的产品路线仍需观察、不同部署形态的责任边界需要商务确认,官方并未公开所有客户、留存和行业渗透数据。开源 gateway 虽有 MIT 许可证和活跃社区,但云端商业能力、私有部署能力与 Palo Alto Networks 安全产品的整合深度仍要以最新官方文档和合同为准。
落地建议集中在渐进试点:先选 1 条高频 LLM 链路接入 Portkey,量化延迟、错误率、成本归因、日志检索效率和 Guardrails 命中情况;指标改善后再扩展到多模型路由、Prompt 管理和企业治理。企业采购前应重点核验数据驻留、日志保留、SSO/RBAC、SLA、私有云或气隙部署、合规证明和收购后长期产品支持条款。
版本信息
- Portkey AI Gateway Open Source :Portkey 官方博客发布开源 AI Gateway,定位为轻量、快速、面向多模型路由与 Guardrails 的网关基础设施。
- Portkey Online Platform :官方以在线平台持续迭代为主,暂无统一语义化版本号;2026-06 官网与文档展示 Agent Gateway、AI Gateway、Observability、Guardrails、Prompt Management 与企业治理能力。
- Palo Alto Networks completes acquisition of Portkey :Palo Alto Networks 官方宣布完成对 Portkey 的收购,Portkey 从独立 AI Gateway 平台进入企业安全厂商生态。
用户评价