AI训练模型
-
DeepEval Confident AI
面向 LLM 应用、RAG 与 Agent 的开源评测框架,用 Pytest 风格把评测纳入研发流程
-
Replicate Replicate
一行代码调用数千个开源 AI 模型的云端 API 平台,支持自定义模型部署
-
Comet ML Comet
面向机器学习团队的实验追踪、模型管理、数据集版本与生产监控平台
-
Predibase Predibase
面向企业的开源大模型微调与推理基础设施,覆盖适配器训练、部署监控和 Rubrik Agent Cloud 能力底座
-
Cohere AIStartMap
Cohere 面向业务与内容场景提供 AI 能力,强调可落地效率与可持续迭代
-
Patronus AI Patronus AI
面向企业 AI 团队的模型与 Agent 评测优化平台,覆盖实验、日志、追踪、评测模型和安全护栏
-
CMMLU CMMLU
综合性中文大模型评估基准,覆盖多领域知识,衡量模型在中文语境下的知识与推理
-
OpenRouter AIStartMap
OpenRouter 面向业务与内容场景提供 AI 能力,强调可落地效率与可持续迭代
-
OpenPipe OpenPipe
面向开发者的 LLM 微调、评估与 Agent 强化学习平台
-
Cerebras Inference Cerebras
面向开发者和企业的超高速大模型推理 API 与专属端点服务
-
C-Eval C-Eval
面向中文大模型的多层次多学科评估套件,含 13948 道题、覆盖 52 个学科
-
OpenCompass OpenCompass
上海人工智能实验室推出的开源大模型评测体系











