Gemini
Gemini 是 Google 推出的 AI聊天助手,由 Google DeepMind 开发的 Gemini 模型家族驱动,提供原生多模态、长上下文、Deep Research 与 Agent 能力,覆盖 Web、移动 App、Google Workspace 与开发者 API。当前主力模型包括 Gemini 3 Pro、Gemini 2.5 Pro 与 Gemini 2.5 Flash。
核心参数与统计
Gemini 是 Google 面向用户的 AI 助手产品入口,背后由 Google DeepMind 的 Gemini 模型家族驱动,覆盖 Gemini App、AI Studio、Vertex AI、Google Search AI Mode、Google Workspace、Android、NotebookLM 等多个产品线。
| 维度 | 关键事实 |
|---|---|
| 当前旗舰模型 | Gemini 3 Pro(2025-11-18 发布) |
| 主力生产模型 | Gemini 2.5 Pro、Gemini 2.5 Flash、Gemini 2.5 Flash-Lite |
| 多模态模型 | Nano Banana Pro(图像)、Veo 3.1(视频)、Imagen 4、Lyria 2(音乐) |
| 上下文窗口 | Gemini 2.5 / 3 Pro:最高 1M token;2.5 Pro 历史支持 2M token |
| 产品入口 | Gemini App(Web / iOS / Android)、AI Studio、Vertex AI、Search AI Mode、Workspace、NotebookLM、Antigravity |
| 开发者平台 | Google AI Studio(ai.studio)、Vertex AI、Gemini API、Firebase AI Logic |
| Agent 能力 | Deep Research、Canvas、Gems、Agent Mode、Computer Use(preview) |
| 周边产品 | Antigravity(IDE)、Jules(异步编码 Agent)、NotebookLM、AI Mode in Search |
| 适用人群 | 个人用户、专业用户、开发者、企业、教育与公共部门 |
| 公开信息状态 | 模型、定价、产品矩阵在官方 deepmind.google 与 ai.google.dev 公开 |
解读:Gemini 不是单一产品或单一模型,而是「消费级 App + 开发者平台 + 行业方案 + 模型家族」的组合。判断它的实际能力,需要同时看具体 Gemini 模型版本、订阅套餐、API 调用价格、AI Studio / Vertex AI 接入方式,以及在 Search、Workspace、Android 等场景下的功能差异。
用户与市场认可
Gemini 已是 Google 在生成式 AI 方向的核心产品矩阵,并通过 Search、Android、Workspace、Chrome、Pixel 等既有渠道实现广泛分发。
个人与日常用户
- 官方可验证信息:Gemini App 在 Web、iOS、Android 三端公开提供,并在 Pixel、Samsung Galaxy 等 Android 设备深度集成
- 说明:Gemini 已在多个国家和地区作为默认 AI 助手取代 Google Assistant
开发者与工程团队
- 官方可验证信息:Google AI Studio(ai.studio)、Gemini API、Vertex AI 提供模型调用,Antigravity 与 Jules 提供 IDE 与异步编码 Agent
- 说明:Gemini 模型在 AI Studio 中可免费试用,进入 Vertex AI 后提供企业级 SLA、合规与区域选项
企业级采用
- 官方可验证信息:Google Cloud 公开案例包括 Mercedes-Benz、Wendy's、Verizon、HSBC、Deutsche Bank、Wayfair、Toyota 等行业头部企业的 Gemini / Vertex AI 部署
- 说明:覆盖汽车、零售、电信、金融、消费品、出行等多个赛道
生态分发与合作
- 官方可验证信息:Gemini 内嵌于 Google Workspace(Docs / Sheets / Gmail / Meet)、Google Search(AI Mode / AI Overviews)、Android 系统、Chrome、NotebookLM 等
- 说明:依托 Google 自有产品矩阵,Gemini 获得超大规模分发与场景覆盖
第三方采用信号
- 官方可验证信息:Gemini 模型在 Cursor、Vercel v0、Replit、Anthropic Claude Code(作为可选模型)、各类 AI 工程框架(LangChain、LlamaIndex 等)中作为公开可选模型出现
- 说明:在开发者工具、SaaS、AI 工程生态中作为主流模型之一被广泛接入
注意:以上信息基于 Google / Google Cloud 官方页面与 Google DeepMind 公开材料整理,具体规模与商务条款以对应公告为准。
成本优势
Gemini 的成本结构分为「消费级订阅」与「开发者 API / 云平台调用」两条路径。
消费级与团队订阅(Google AI Plans)
- 官方公开对象:Free、Google AI Plus、Google AI Pro、Google AI Ultra
- 关键事实:
- Free:免费,包含 Gemini 2.5 Flash、基础 Deep Research、Gemini in Apps、有限的图像与视频生成
- Google AI Plus:约 19.99 美元/月,包含更多 Gemini 3 Pro 与 2.5 Pro 配额、扩展 Deep Research、Veo 3.1 视频额度、Workspace AI 功能、2TB 云存储
- Google AI Pro:约 19.99 美元/月(亚太与部分地区为主推),提供 Gemini 3 Pro、Veo / Imagen 高配额、NotebookLM Plus、Workspace 集成、Whisk / Flow 等
- Google AI Ultra:约 249.99 美元/月,提供 Gemini 3 Pro / Deep Think 最高配额、Veo 3.1 旗舰额度、Project Mariner 等前沿能力优先访问
- 公开信息状态:以 https://one.google.com/about/google-ai-plans/ 与各地区落地页公布的定价为准
API 与 Vertex AI 调用价格(按每百万 token 计,文本)
- 官方公开对象:Gemini 3 Pro、Gemini 2.5 Pro、Gemini 2.5 Flash、Gemini 2.5 Flash-Lite
- 关键事实:
- Gemini 3 Pro:输入约 2 美元(≤200K token)/ 4 美元(>200K token);输出约 12 美元 / 18 美元
- Gemini 2.5 Pro:输入 1.25 美元(≤200K token)/ 2.5 美元(>200K token);输出 10 美元 / 15 美元
- Gemini 2.5 Flash:输入 0.30 美元;输出 2.50 美元
- Gemini 2.5 Flash-Lite:输入 0.10 美元;输出 0.40 美元
- 通用优惠:Context Caching 可显著降低长上下文重复调用成本;Batch API 提供约 50% 折扣
- 公开信息状态:上述价格以 https://ai.google.dev/pricing 与 Vertex AI 定价页为准,可能随地区与版本变化
成本结构解读
- Flash-Lite / Flash 把单位 token 成本压到极低区间,是规模化生产、嵌入式与高吞吐场景的默认选择。
- 3 Pro 与 2.5 Pro 的价差结合 1M 上下文窗口,使「Flash 主力 + Pro 难题」的混合调用策略成为常见做法。
- Context Caching 与 Batch 折扣对长 Prompt、RAG、批量分析等场景的实际单位成本有显著影响。
主要功能
对话与日常 AI 助手
- 适用任务:日常对话、写作、翻译、研究、学习、计划与提醒
- 使用价值:Gemini App 在 Web / iOS / Android 与 Android 系统中提供统一入口,覆盖语音、文本与图像输入
Deep Research 与长任务
- 适用任务:行业研究、市场调研、竞品分析、文献综述
- 使用价值:Deep Research 调度 Gemini 模型进行多步检索、阅读、整理并输出带引用的研究报告
原生多模态生成
- 适用任务:图像生成与编辑(Nano Banana Pro)、视频生成(Veo 3.1)、音乐生成(Lyria)、Whisk / Flow 创意流
- 使用价值:在同一 App 内完成多模态生成与编辑,无需切换工具
编码与 IDE 体验
- 适用任务:代码生成、跨文件编辑、自动化重构、异步任务
- 使用价值:Antigravity(Google 推出的 AI 编辑器)与 Jules(异步编码 Agent)配合 Gemini 3 Pro / 2.5 Pro 提供从交互到后台执行的完整链路
Agent 与 Computer Use
- 适用任务:浏览器自动化、采购流程、信息抽取、跨系统操作
- 使用价值:Gemini API 提供工具调用、Function Calling、Live API(实时多模态),并通过 Project Mariner 等探索 Agent 能力
Google Workspace 集成
- 适用任务:Gmail、Docs、Sheets、Slides、Meet 内的写作、整理、翻译、会议总结
- 使用价值:Gemini 内嵌于主流 Workspace 应用,按订阅档位提供差异化能力
Search AI Mode 与 AI Overviews
- 适用任务:复杂搜索意图、行程规划、对比与决策
- 使用价值:在 Google Search 中以 AI Mode 提供多轮对话与生成式答案,覆盖海量自然搜索流量
NotebookLM
- 适用任务:基于来源材料的笔记整理、问答、音频摘要(Audio Overview)
- 使用价值:以「来源驱动」的方式约束模型输出在用户上传材料范围内
模型与版本演进
Gemini 3 Pro(旗舰)
- 发布日期:2025-11-18
- 定位:Gemini 3 系列旗舰,前沿推理、原生多模态、长上下文与 Agent 能力
- 关键能力:高难度数学/科学、生产级代码、多模态理解、长任务规划
- 官方资料:https://deepmind.google/models/gemini/
Gemini 2.5 Pro / Flash / Flash-Lite(主力家族)
- 发布日期:2025 年中上线并多次迭代
- 定位:Pro 主打高质量推理与长上下文;Flash 主打高性价比生产工作负载;Flash-Lite 主打成本与延迟极致
- 关键能力:思考模式、长上下文、原生工具调用、Live API(实时多模态)
- 官方资料:https://ai.google.dev/
多模态家族
- Nano Banana Pro(2025-11-20):Gemini 3 时代图像生成与编辑模型,文字渲染、风格一致性显著增强
- Veo 3.1(2025-10-15):带原声音频的视频生成模型,集成于 Gemini App / Vertex AI
- Imagen 4 / Lyria 2 / Chirp:图像、音乐、语音方向的专项模型
- 官方资料:https://deepmind.google/models/
主要历史节点
- Gemini 2.0 Flash(2024-12):原生工具调用与 Live API,开启 Gemini Agent 时代
- Gemini 1.5 Pro(2024-02):1M / 2M token 长上下文里程碑
- Gemini 1.0 Ultra / Pro / Nano(2023-12):Gemini 模型家族首发,正式取代 Bard / PaLM 2 作为 Google 旗舰生成式 AI 矩阵
注:上述日期与版本说明均来自 Google DeepMind 与 Google AI 官方页面公开信息。
技术优势
原生多模态架构
- Gemini 自首发版本起即设计为原生多模态模型,文本、图像、音频、视频共享同一模型表示,多模态推理与生成天然一体。
长上下文窗口
- Gemini 2.5 Pro / 3 Pro 提供最高 1M token 上下文窗口(2.5 Pro 历史支持 2M token),适合长文档、代码库、长时对话与多源 RAG 场景。
Deep Think 与思考模式
- 旗舰模型支持「Deep Think」/ 延展思考模式,在复杂数学、科学、规划类问题上给出更高质量答案,开发者可对思考强度进行控制。
Agent 与 Live API
- Gemini API 提供原生工具调用、Function Calling、Live API(双向实时多模态流),是 Google Agent 体系(Project Mariner、Antigravity、Jules、Agent Mode)的统一底座。
Google 自研基础设施(TPU)
- Gemini 系列模型主要在 Google TPU 集群上训练与服务,具备稳定的容量供给与较低的边际服务成本。
与 Google 产品矩阵深度集成
- 通过 Search、Workspace、Android、Chrome、Pixel、Maps、YouTube 等产品线,Gemini 获得自然分发与场景闭环,是少数同时覆盖搜索、办公、移动操作系统与开发者平台的 AI 产品矩阵之一。
如何使用
网页与 App
- 入口:gemini.google.com(Web)、iOS、Android、Android 系统集成
- 适合:个人用户、轻量编码、研究、创作、日常 AI 助手
- 备注:在 Android 设备上可作为系统级 AI 助手调用
Google AI Studio(开发者快速体验)
- 入口:https://ai.studio/
- 适合:开发者快速体验模型、调试 Prompt、生成代码片段、试用图像 / 视频生成
- 备注:AI Studio 即可获取免费层 Gemini API Key
Gemini API
- 入口:https://ai.google.dev/gemini-api/docs
- 调用方式:直接调用
gemini-3-pro、gemini-2.5-pro、gemini-2.5-flash、gemini-2.5-flash-lite等模型 ID - 适合:自建产品、Agent 服务、移动 / Web 应用
Vertex AI(企业平台)
- 入口:https://cloud.google.com/vertex-ai
- 适合:企业级部署、合规与区域驻留、私有数据微调、与 Google Cloud 其他服务整合
- 备注:提供更细的访问控制、配额管理、审计与 SLA
Google Workspace 与 Search
- 入口:Workspace 应用内的 Gemini 侧边栏、Google Search AI Mode
- 适合:日常办公、协作、检索与决策
典型调用步骤(API)
- 在 https://ai.studio/ 注册 Google 账号并获取 Gemini API Key
- 选择模型 ID(如
gemini-2.5-flash)并按官方 SDK / HTTP 协议调用 - 按需启用 Context Caching、Batch API、Function Calling、Live API、多模态输入等能力以优化成本与功能
可用地区与中文用户使用限制
- Gemini App 与 Google AI Plans 在大量国家和地区公开提供,但在部分地区(含中国大陆)当前未直接提供消费级订阅与 Gemini App 入口,最终可用地区以 Google 官方支持地区页面为准。
- 中文用户的常见合规路径:
- 通过 Google Cloud Vertex AI 在合规区域调用 Gemini API
- 通过企业 Google Workspace 账号、海外注册账号或合规第三方平台接入
- 中文输出能力:Gemini 在中文对话、写作与多模态理解上的可用性较成熟,具体可用性、合规与计费仍以官方支持地区与对应渠道条款为准。
产品定价
消费级 / 团队(Google AI Plans)
- Free:0 美元,含 Gemini 2.5 Flash、基础 Deep Research、Gemini in Apps、有限图像 / 视频生成额度
- Google AI Plus:约 19.99 美元/月,提供更多 Gemini 3 Pro / 2.5 Pro 配额、扩展 Deep Research、Veo 3.1 额度、Workspace AI、2TB 云存储
- Google AI Pro:约 19.99 美元/月,提供 Gemini 3 Pro、NotebookLM Plus、Veo / Imagen 高配额、Workspace 集成
- Google AI Ultra:约 249.99 美元/月,提供 Gemini 3 Pro / Deep Think 最高配额、Veo 3.1 旗舰额度、Project Mariner 等前沿能力
API 调用价格(按每百万 token 计,文本)
| 模型 | 输入 | 输出 |
|---|---|---|
| Gemini 3 Pro | 2 美元 / 4 美元 (>200K) | 12 美元 / 18 美元 (>200K) |
| Gemini 2.5 Pro | 1.25 美元 / 2.50 美元 (>200K) | 10 美元 / 15 美元 (>200K) |
| Gemini 2.5 Flash | 0.30 美元 | 2.50 美元 |
| Gemini 2.5 Flash-Lite | 0.10 美元 | 0.40 美元 |
通用优惠:Context Caching、Batch API(约 50% 折扣)。
计费维度
- 文本 / 多模态推理:按输入与输出 token 计费
- 图像 / 视频 / 音频生成:按生成数量与时长计费
- 工具调用 / Function Calling:通常并入主模型调用计费
- 企业版(Vertex AI):按用量、合规与部署模式协商
注意:以上价格为撰写本文时官方页面公布的数值,最终价格与套餐内容以 https://ai.google.dev/pricing、https://cloud.google.com/vertex-ai/generative-ai/pricing 与 https://one.google.com/about/google-ai-plans/ 为准。
应用场景
个人 AI 助手与学习
- 任务类型:日常对话、写作、翻译、学习、生活规划
- 实际收益:Gemini App 多端覆盖,免费层即可使用主力模型与 Deep Research 基础能力
研究与决策支持
- 任务类型:行业研究、文献综述、市场调研、竞品分析
- 实际收益:Deep Research 自动化多步研究流程并输出带引用报告
多模态创作
- 任务类型:图像生成与编辑、视频生成、音乐与音频创作
- 实际收益:Nano Banana Pro、Veo 3.1、Lyria 在同一 App 内联动,适合内容创作者与营销团队
软件工程与代码协作
- 任务类型:代码生成、跨文件编辑、自动化重构、异步任务
- 实际收益:Antigravity、Jules、Gemini API 覆盖 IDE、后台 Agent 与自定义编码工作流
企业知识工作与协作
- 任务类型:邮件撰写、文档总结、会议记录、表格分析
- 实际收益:Gemini 内嵌 Workspace 应用与 NotebookLM,构建企业级知识沉淀
Search 与决策
- 任务类型:复杂搜索、行程规划、产品对比
- 实际收益:Search AI Mode 在主搜索流量内提供生成式答案
适用人群
个人用户
- 适配价值:免费层即可使用 Gemini 2.5 Flash 与基础 Deep Research,并通过 Android 系统集成成为日常 AI 助手
- 注意事项:高级模型与多模态生成额度需订阅 Google AI Plus / Pro / Ultra
开发者
- 适配价值:AI Studio 一键获取 API Key,Gemini API + Vertex AI 覆盖从原型到企业部署的全栈开发
- 注意事项:根据数据驻留与合规要求选择 AI Studio、Vertex AI 或区域化部署
团队与企业
- 适配价值:Vertex AI 提供 SLA、合规、配额、审计与多区域部署;Workspace 提供办公协作 AI
- 注意事项:企业级 SLA 与合规能力主要通过 Vertex AI 与 Workspace Enterprise 套餐提供
内容与创作者
- 适配价值:Nano Banana Pro、Veo 3.1、Imagen 4、Whisk、Flow 提供完整的多模态生成与编辑工具链
- 注意事项:商用授权与水印策略以官方页面为准
非适配或需要额外条件
- 当前位于 Gemini App 未覆盖地区的个人用户,需借助 Vertex AI 或第三方合规渠道
- 对深度本地化部署有强需求的场景,需结合 Vertex AI 私有部署或 Google Cloud 解决方案评估
总结与展望
核心竞争力
- 围绕 Gemini 3 Pro / 2.5 Pro / 2.5 Flash / Flash-Lite 形成清晰的能力—成本—延迟分层
- 原生多模态 + 1M 长上下文 + Deep Think + Agent / Live API 构成完整技术底座
- 借助 Google Search、Workspace、Android、Chrome 等既有产品获得超大规模分发
- 通过 AI Studio 与 Vertex AI 同时覆盖开发者与企业,并配套 Antigravity、Jules、NotebookLM 等周边产品
当前局限
- 直接面向消费者的 Gemini App 与 Google AI Plans 在部分地区不可用,中文用户主要通过 Vertex AI 与合规渠道使用
- 高复杂度任务与多模态高级能力主要集中在 Pro / Ultra 套餐与高价 API 调用,规模化生产仍需精细的模型分级策略
- Agent 与 Computer Use 等能力多处于早期或预览阶段,需评估稳定性与合规边界
后续观察点
- Gemini 3 Pro 之后的 Pro / Flash / Flash-Lite 节奏与基准刷新
- Nano Banana Pro、Veo 3.1 等多模态模型在创作者与企业内容工作流的渗透
- Antigravity、Jules、Project Mariner 等 Agent 与 IDE 产品的成熟度与第三方集成
- Google AI Plus / Pro / Ultra 套餐结构与各地区落地节奏
版本信息
- Nano Banana Pro (Gemini 3 Pro Image) :Gemini 3 时代的图像生成与编辑模型,原生支持多轮编辑、文字渲染、风格一致性,集成在 Gemini App 与 AI Studio。
- Gemini 3 Pro :Gemini 3 系列旗舰模型,主打前沿推理、原生多模态、Agent 与长上下文,刷新数学、科学、编码等多项基准;面向 Gemini App、AI Studio、Vertex AI 与 AI Mode 等产品同步上线。
- Veo 3.1 :Google 视频生成模型,支持带原声音频的高保真视频生成与编辑,集成于 Gemini App 与 Vertex AI Studio。
- Gemini 2.5 Flash-Lite :最具成本与延迟优势的轻量版本,面向高吞吐、嵌入式与边缘场景。
- Gemini 2.5 Pro :思考型主力模型,长上下文、推理与代码能力前沿,长期作为 AI Studio 与 Vertex AI 中的高质量默认选项。
- Gemini 2.5 Flash :高性价比主力模型,面向规模化生产工作负载,支持思考模式与多模态输入。
- Gemini 2.0 Flash :Gemini 2.0 系列首发的高性价比模型,引入原生工具调用、实时多模态 API(Live API),开启 Agent 时代。
- Gemini 1.5 Pro :首批支持 1M / 2M token 长上下文的主力模型,推动长文档与代码库级理解的工程实践。
用户评价