Gemini

-

Gemini 是 Google 推出的 AI聊天助手,由 Google DeepMind 开发的 Gemini 模型家族驱动,提供原生多模态、长上下文、Deep Research 与 Agent 能力,覆盖 Web、移动 App、Google Workspace 与开发者 API。当前主力模型包括 Gemini 3 Pro、Gemini 2.5 Pro 与 Gemini 2.5 Flash。

Gemini 产品界面

核心参数与统计

Gemini 是 Google 面向用户的 AI 助手产品入口,背后由 Google DeepMind 的 Gemini 模型家族驱动,覆盖 Gemini App、AI Studio、Vertex AI、Google Search AI Mode、Google Workspace、Android、NotebookLM 等多个产品线。

维度 关键事实
当前旗舰模型 Gemini 3 Pro(2025-11-18 发布)
主力生产模型 Gemini 2.5 Pro、Gemini 2.5 Flash、Gemini 2.5 Flash-Lite
多模态模型 Nano Banana Pro(图像)、Veo 3.1(视频)、Imagen 4、Lyria 2(音乐)
上下文窗口 Gemini 2.5 / 3 Pro:最高 1M token;2.5 Pro 历史支持 2M token
产品入口 Gemini App(Web / iOS / Android)、AI Studio、Vertex AI、Search AI Mode、Workspace、NotebookLM、Antigravity
开发者平台 Google AI Studio(ai.studio)、Vertex AI、Gemini API、Firebase AI Logic
Agent 能力 Deep Research、Canvas、Gems、Agent Mode、Computer Use(preview)
周边产品 Antigravity(IDE)、Jules(异步编码 Agent)、NotebookLM、AI Mode in Search
适用人群 个人用户、专业用户、开发者、企业、教育与公共部门
公开信息状态 模型、定价、产品矩阵在官方 deepmind.google 与 ai.google.dev 公开

解读:Gemini 不是单一产品或单一模型,而是「消费级 App + 开发者平台 + 行业方案 + 模型家族」的组合。判断它的实际能力,需要同时看具体 Gemini 模型版本、订阅套餐、API 调用价格、AI Studio / Vertex AI 接入方式,以及在 Search、Workspace、Android 等场景下的功能差异。

用户与市场认可

Gemini 已是 Google 在生成式 AI 方向的核心产品矩阵,并通过 Search、Android、Workspace、Chrome、Pixel 等既有渠道实现广泛分发。

个人与日常用户

  • 官方可验证信息:Gemini App 在 Web、iOS、Android 三端公开提供,并在 Pixel、Samsung Galaxy 等 Android 设备深度集成
  • 说明:Gemini 已在多个国家和地区作为默认 AI 助手取代 Google Assistant

开发者与工程团队

  • 官方可验证信息:Google AI Studio(ai.studio)、Gemini API、Vertex AI 提供模型调用,Antigravity 与 Jules 提供 IDE 与异步编码 Agent
  • 说明:Gemini 模型在 AI Studio 中可免费试用,进入 Vertex AI 后提供企业级 SLA、合规与区域选项

企业级采用

  • 官方可验证信息:Google Cloud 公开案例包括 Mercedes-Benz、Wendy's、Verizon、HSBC、Deutsche Bank、Wayfair、Toyota 等行业头部企业的 Gemini / Vertex AI 部署
  • 说明:覆盖汽车、零售、电信、金融、消费品、出行等多个赛道

生态分发与合作

  • 官方可验证信息:Gemini 内嵌于 Google Workspace(Docs / Sheets / Gmail / Meet)、Google Search(AI Mode / AI Overviews)、Android 系统、Chrome、NotebookLM 等
  • 说明:依托 Google 自有产品矩阵,Gemini 获得超大规模分发与场景覆盖

第三方采用信号

  • 官方可验证信息:Gemini 模型在 Cursor、Vercel v0、Replit、Anthropic Claude Code(作为可选模型)、各类 AI 工程框架(LangChain、LlamaIndex 等)中作为公开可选模型出现
  • 说明:在开发者工具、SaaS、AI 工程生态中作为主流模型之一被广泛接入

注意:以上信息基于 Google / Google Cloud 官方页面与 Google DeepMind 公开材料整理,具体规模与商务条款以对应公告为准。

成本优势

Gemini 的成本结构分为「消费级订阅」与「开发者 API / 云平台调用」两条路径。

消费级与团队订阅(Google AI Plans)

  • 官方公开对象:Free、Google AI Plus、Google AI Pro、Google AI Ultra
  • 关键事实:
    • Free:免费,包含 Gemini 2.5 Flash、基础 Deep Research、Gemini in Apps、有限的图像与视频生成
    • Google AI Plus:约 19.99 美元/月,包含更多 Gemini 3 Pro 与 2.5 Pro 配额、扩展 Deep Research、Veo 3.1 视频额度、Workspace AI 功能、2TB 云存储
    • Google AI Pro:约 19.99 美元/月(亚太与部分地区为主推),提供 Gemini 3 Pro、Veo / Imagen 高配额、NotebookLM Plus、Workspace 集成、Whisk / Flow 等
    • Google AI Ultra:约 249.99 美元/月,提供 Gemini 3 Pro / Deep Think 最高配额、Veo 3.1 旗舰额度、Project Mariner 等前沿能力优先访问
  • 公开信息状态:以 https://one.google.com/about/google-ai-plans/ 与各地区落地页公布的定价为准

API 与 Vertex AI 调用价格(按每百万 token 计,文本)

  • 官方公开对象:Gemini 3 Pro、Gemini 2.5 Pro、Gemini 2.5 Flash、Gemini 2.5 Flash-Lite
  • 关键事实:
    • Gemini 3 Pro:输入约 2 美元(≤200K token)/ 4 美元(>200K token);输出约 12 美元 / 18 美元
    • Gemini 2.5 Pro:输入 1.25 美元(≤200K token)/ 2.5 美元(>200K token);输出 10 美元 / 15 美元
    • Gemini 2.5 Flash:输入 0.30 美元;输出 2.50 美元
    • Gemini 2.5 Flash-Lite:输入 0.10 美元;输出 0.40 美元
    • 通用优惠:Context Caching 可显著降低长上下文重复调用成本;Batch API 提供约 50% 折扣
  • 公开信息状态:上述价格以 https://ai.google.dev/pricing 与 Vertex AI 定价页为准,可能随地区与版本变化

成本结构解读

  • Flash-Lite / Flash 把单位 token 成本压到极低区间,是规模化生产、嵌入式与高吞吐场景的默认选择。
  • 3 Pro 与 2.5 Pro 的价差结合 1M 上下文窗口,使「Flash 主力 + Pro 难题」的混合调用策略成为常见做法。
  • Context Caching 与 Batch 折扣对长 Prompt、RAG、批量分析等场景的实际单位成本有显著影响。

主要功能

对话与日常 AI 助手

  • 适用任务:日常对话、写作、翻译、研究、学习、计划与提醒
  • 使用价值:Gemini App 在 Web / iOS / Android 与 Android 系统中提供统一入口,覆盖语音、文本与图像输入

Deep Research 与长任务

  • 适用任务:行业研究、市场调研、竞品分析、文献综述
  • 使用价值:Deep Research 调度 Gemini 模型进行多步检索、阅读、整理并输出带引用的研究报告

原生多模态生成

  • 适用任务:图像生成与编辑(Nano Banana Pro)、视频生成(Veo 3.1)、音乐生成(Lyria)、Whisk / Flow 创意流
  • 使用价值:在同一 App 内完成多模态生成与编辑,无需切换工具

编码与 IDE 体验

  • 适用任务:代码生成、跨文件编辑、自动化重构、异步任务
  • 使用价值:Antigravity(Google 推出的 AI 编辑器)与 Jules(异步编码 Agent)配合 Gemini 3 Pro / 2.5 Pro 提供从交互到后台执行的完整链路

Agent 与 Computer Use

  • 适用任务:浏览器自动化、采购流程、信息抽取、跨系统操作
  • 使用价值:Gemini API 提供工具调用、Function Calling、Live API(实时多模态),并通过 Project Mariner 等探索 Agent 能力

Google Workspace 集成

  • 适用任务:Gmail、Docs、Sheets、Slides、Meet 内的写作、整理、翻译、会议总结
  • 使用价值:Gemini 内嵌于主流 Workspace 应用,按订阅档位提供差异化能力

Search AI Mode 与 AI Overviews

  • 适用任务:复杂搜索意图、行程规划、对比与决策
  • 使用价值:在 Google Search 中以 AI Mode 提供多轮对话与生成式答案,覆盖海量自然搜索流量

NotebookLM

  • 适用任务:基于来源材料的笔记整理、问答、音频摘要(Audio Overview)
  • 使用价值:以「来源驱动」的方式约束模型输出在用户上传材料范围内

模型与版本演进

Gemini 3 Pro(旗舰)

  • 发布日期:2025-11-18
  • 定位:Gemini 3 系列旗舰,前沿推理、原生多模态、长上下文与 Agent 能力
  • 关键能力:高难度数学/科学、生产级代码、多模态理解、长任务规划
  • 官方资料:https://deepmind.google/models/gemini/

Gemini 2.5 Pro / Flash / Flash-Lite(主力家族)

  • 发布日期:2025 年中上线并多次迭代
  • 定位:Pro 主打高质量推理与长上下文;Flash 主打高性价比生产工作负载;Flash-Lite 主打成本与延迟极致
  • 关键能力:思考模式、长上下文、原生工具调用、Live API(实时多模态)
  • 官方资料:https://ai.google.dev/

多模态家族

  • Nano Banana Pro(2025-11-20):Gemini 3 时代图像生成与编辑模型,文字渲染、风格一致性显著增强
  • Veo 3.1(2025-10-15):带原声音频的视频生成模型,集成于 Gemini App / Vertex AI
  • Imagen 4 / Lyria 2 / Chirp:图像、音乐、语音方向的专项模型
  • 官方资料:https://deepmind.google/models/

主要历史节点

  • Gemini 2.0 Flash(2024-12):原生工具调用与 Live API,开启 Gemini Agent 时代
  • Gemini 1.5 Pro(2024-02):1M / 2M token 长上下文里程碑
  • Gemini 1.0 Ultra / Pro / Nano(2023-12):Gemini 模型家族首发,正式取代 Bard / PaLM 2 作为 Google 旗舰生成式 AI 矩阵

注:上述日期与版本说明均来自 Google DeepMind 与 Google AI 官方页面公开信息。

技术优势

原生多模态架构

  • Gemini 自首发版本起即设计为原生多模态模型,文本、图像、音频、视频共享同一模型表示,多模态推理与生成天然一体。

长上下文窗口

  • Gemini 2.5 Pro / 3 Pro 提供最高 1M token 上下文窗口(2.5 Pro 历史支持 2M token),适合长文档、代码库、长时对话与多源 RAG 场景。

Deep Think 与思考模式

  • 旗舰模型支持「Deep Think」/ 延展思考模式,在复杂数学、科学、规划类问题上给出更高质量答案,开发者可对思考强度进行控制。

Agent 与 Live API

  • Gemini API 提供原生工具调用、Function Calling、Live API(双向实时多模态流),是 Google Agent 体系(Project Mariner、Antigravity、Jules、Agent Mode)的统一底座。

Google 自研基础设施(TPU)

  • Gemini 系列模型主要在 Google TPU 集群上训练与服务,具备稳定的容量供给与较低的边际服务成本。

与 Google 产品矩阵深度集成

  • 通过 Search、Workspace、Android、Chrome、Pixel、Maps、YouTube 等产品线,Gemini 获得自然分发与场景闭环,是少数同时覆盖搜索、办公、移动操作系统与开发者平台的 AI 产品矩阵之一。

如何使用

网页与 App

  • 入口:gemini.google.com(Web)、iOS、Android、Android 系统集成
  • 适合:个人用户、轻量编码、研究、创作、日常 AI 助手
  • 备注:在 Android 设备上可作为系统级 AI 助手调用

Google AI Studio(开发者快速体验)

  • 入口:https://ai.studio/
  • 适合:开发者快速体验模型、调试 Prompt、生成代码片段、试用图像 / 视频生成
  • 备注:AI Studio 即可获取免费层 Gemini API Key

Gemini API

  • 入口:https://ai.google.dev/gemini-api/docs
  • 调用方式:直接调用 gemini-3-progemini-2.5-progemini-2.5-flashgemini-2.5-flash-lite 等模型 ID
  • 适合:自建产品、Agent 服务、移动 / Web 应用

Vertex AI(企业平台)

  • 入口:https://cloud.google.com/vertex-ai
  • 适合:企业级部署、合规与区域驻留、私有数据微调、与 Google Cloud 其他服务整合
  • 备注:提供更细的访问控制、配额管理、审计与 SLA

Google Workspace 与 Search

  • 入口:Workspace 应用内的 Gemini 侧边栏、Google Search AI Mode
  • 适合:日常办公、协作、检索与决策

典型调用步骤(API)

  • https://ai.studio/ 注册 Google 账号并获取 Gemini API Key
  • 选择模型 ID(如 gemini-2.5-flash)并按官方 SDK / HTTP 协议调用
  • 按需启用 Context Caching、Batch API、Function Calling、Live API、多模态输入等能力以优化成本与功能

可用地区与中文用户使用限制

  • Gemini App 与 Google AI Plans 在大量国家和地区公开提供,但在部分地区(含中国大陆)当前未直接提供消费级订阅与 Gemini App 入口,最终可用地区以 Google 官方支持地区页面为准。
  • 中文用户的常见合规路径:
    • 通过 Google Cloud Vertex AI 在合规区域调用 Gemini API
    • 通过企业 Google Workspace 账号、海外注册账号或合规第三方平台接入
  • 中文输出能力:Gemini 在中文对话、写作与多模态理解上的可用性较成熟,具体可用性、合规与计费仍以官方支持地区与对应渠道条款为准。

产品定价

消费级 / 团队(Google AI Plans)

  • Free:0 美元,含 Gemini 2.5 Flash、基础 Deep Research、Gemini in Apps、有限图像 / 视频生成额度
  • Google AI Plus:约 19.99 美元/月,提供更多 Gemini 3 Pro / 2.5 Pro 配额、扩展 Deep Research、Veo 3.1 额度、Workspace AI、2TB 云存储
  • Google AI Pro:约 19.99 美元/月,提供 Gemini 3 Pro、NotebookLM Plus、Veo / Imagen 高配额、Workspace 集成
  • Google AI Ultra:约 249.99 美元/月,提供 Gemini 3 Pro / Deep Think 最高配额、Veo 3.1 旗舰额度、Project Mariner 等前沿能力

API 调用价格(按每百万 token 计,文本)

模型 输入 输出
Gemini 3 Pro 2 美元 / 4 美元 (>200K) 12 美元 / 18 美元 (>200K)
Gemini 2.5 Pro 1.25 美元 / 2.50 美元 (>200K) 10 美元 / 15 美元 (>200K)
Gemini 2.5 Flash 0.30 美元 2.50 美元
Gemini 2.5 Flash-Lite 0.10 美元 0.40 美元

通用优惠:Context Caching、Batch API(约 50% 折扣)。

计费维度

  • 文本 / 多模态推理:按输入与输出 token 计费
  • 图像 / 视频 / 音频生成:按生成数量与时长计费
  • 工具调用 / Function Calling:通常并入主模型调用计费
  • 企业版(Vertex AI):按用量、合规与部署模式协商

注意:以上价格为撰写本文时官方页面公布的数值,最终价格与套餐内容以 https://ai.google.dev/pricing、https://cloud.google.com/vertex-ai/generative-ai/pricinghttps://one.google.com/about/google-ai-plans/ 为准。

应用场景

个人 AI 助手与学习

  • 任务类型:日常对话、写作、翻译、学习、生活规划
  • 实际收益:Gemini App 多端覆盖,免费层即可使用主力模型与 Deep Research 基础能力

研究与决策支持

  • 任务类型:行业研究、文献综述、市场调研、竞品分析
  • 实际收益:Deep Research 自动化多步研究流程并输出带引用报告

多模态创作

  • 任务类型:图像生成与编辑、视频生成、音乐与音频创作
  • 实际收益:Nano Banana Pro、Veo 3.1、Lyria 在同一 App 内联动,适合内容创作者与营销团队

软件工程与代码协作

  • 任务类型:代码生成、跨文件编辑、自动化重构、异步任务
  • 实际收益:Antigravity、Jules、Gemini API 覆盖 IDE、后台 Agent 与自定义编码工作流

企业知识工作与协作

  • 任务类型:邮件撰写、文档总结、会议记录、表格分析
  • 实际收益:Gemini 内嵌 Workspace 应用与 NotebookLM,构建企业级知识沉淀

Search 与决策

  • 任务类型:复杂搜索、行程规划、产品对比
  • 实际收益:Search AI Mode 在主搜索流量内提供生成式答案

适用人群

个人用户

  • 适配价值:免费层即可使用 Gemini 2.5 Flash 与基础 Deep Research,并通过 Android 系统集成成为日常 AI 助手
  • 注意事项:高级模型与多模态生成额度需订阅 Google AI Plus / Pro / Ultra

开发者

  • 适配价值:AI Studio 一键获取 API Key,Gemini API + Vertex AI 覆盖从原型到企业部署的全栈开发
  • 注意事项:根据数据驻留与合规要求选择 AI Studio、Vertex AI 或区域化部署

团队与企业

  • 适配价值:Vertex AI 提供 SLA、合规、配额、审计与多区域部署;Workspace 提供办公协作 AI
  • 注意事项:企业级 SLA 与合规能力主要通过 Vertex AI 与 Workspace Enterprise 套餐提供

内容与创作者

  • 适配价值:Nano Banana Pro、Veo 3.1、Imagen 4、Whisk、Flow 提供完整的多模态生成与编辑工具链
  • 注意事项:商用授权与水印策略以官方页面为准

非适配或需要额外条件

  • 当前位于 Gemini App 未覆盖地区的个人用户,需借助 Vertex AI 或第三方合规渠道
  • 对深度本地化部署有强需求的场景,需结合 Vertex AI 私有部署或 Google Cloud 解决方案评估

总结与展望

核心竞争力

  • 围绕 Gemini 3 Pro / 2.5 Pro / 2.5 Flash / Flash-Lite 形成清晰的能力—成本—延迟分层
  • 原生多模态 + 1M 长上下文 + Deep Think + Agent / Live API 构成完整技术底座
  • 借助 Google Search、Workspace、Android、Chrome 等既有产品获得超大规模分发
  • 通过 AI Studio 与 Vertex AI 同时覆盖开发者与企业,并配套 Antigravity、Jules、NotebookLM 等周边产品

当前局限

  • 直接面向消费者的 Gemini App 与 Google AI Plans 在部分地区不可用,中文用户主要通过 Vertex AI 与合规渠道使用
  • 高复杂度任务与多模态高级能力主要集中在 Pro / Ultra 套餐与高价 API 调用,规模化生产仍需精细的模型分级策略
  • Agent 与 Computer Use 等能力多处于早期或预览阶段,需评估稳定性与合规边界

后续观察点

  • Gemini 3 Pro 之后的 Pro / Flash / Flash-Lite 节奏与基准刷新
  • Nano Banana Pro、Veo 3.1 等多模态模型在创作者与企业内容工作流的渗透
  • Antigravity、Jules、Project Mariner 等 Agent 与 IDE 产品的成熟度与第三方集成
  • Google AI Plus / Pro / Ultra 套餐结构与各地区落地节奏

版本信息

  • Nano Banana Pro (Gemini 3 Pro Image) :Gemini 3 时代的图像生成与编辑模型,原生支持多轮编辑、文字渲染、风格一致性,集成在 Gemini App 与 AI Studio。
  • Gemini 3 Pro :Gemini 3 系列旗舰模型,主打前沿推理、原生多模态、Agent 与长上下文,刷新数学、科学、编码等多项基准;面向 Gemini App、AI Studio、Vertex AI 与 AI Mode 等产品同步上线。
  • Veo 3.1 :Google 视频生成模型,支持带原声音频的高保真视频生成与编辑,集成于 Gemini App 与 Vertex AI Studio。
  • Gemini 2.5 Flash-Lite :最具成本与延迟优势的轻量版本,面向高吞吐、嵌入式与边缘场景。
  • Gemini 2.5 Pro :思考型主力模型,长上下文、推理与代码能力前沿,长期作为 AI Studio 与 Vertex AI 中的高质量默认选项。
  • Gemini 2.5 Flash :高性价比主力模型,面向规模化生产工作负载,支持思考模式与多模态输入。
  • Gemini 2.0 Flash :Gemini 2.0 系列首发的高性价比模型,引入原生工具调用、实时多模态 API(Live API),开启 Agent 时代。
  • Gemini 1.5 Pro :首批支持 1M / 2M token 长上下文的主力模型,推动长文档与代码库级理解的工程实践。

用户评价

  • 加载评价中...