Superwhisper
免费
Superwhisper 是一款面向写作、沟通、会议和代码工作流的 AI音频 语音输入工具,官方定位为 macOS、Windows 与 iOS 上的 AI voice to text,支持离线和云端转写、100+ 语言、自定义 AI modes、文件转写与快捷键输入。
核心参数与统计
Superwhisper 的官方定位是 “AI powered voice to text for macOS, Windows, and iOS”,核心任务不是做通用聊天机器人,而是把语音输入、转写、改写和自动粘贴嵌入用户已经在使用的应用。官网的产品页与下载页公开写明,它支持 macOS、Windows 与 iOS,提供离线与云端语音识别、100+ 语言和自定义 AI modes;下载页同时给出 macOS 2.16.1、Windows v1.4.13,以及 iOS 18 或更高版本要求。
| 项目 | 公开信息 |
|---|---|
| 官方定位 | AI powered voice to text for macOS, Windows, and iOS |
| 主要形态 | 桌面/移动端语音输入、文件转写、会议记录、自定义 AI modes |
| 支持平台 | macOS、Windows、iOS |
| 系统要求 | macOS 13.3+、Windows 10+、iOS 18+ |
| 当前 macOS 版本 | 2.16.1(2026-06-16,官方 changelog) |
| 当前 Windows 版本 | v1.4.13(官方下载页) |
| 语言覆盖 | 官方称支持 100+ languages & dialects,并可翻译为英文 |
| 定价入口 | Free、Pro、Enterprise;Pro 月付价格公开为 8 美元 |
边界说明:Superwhisper 的强项在“把口语变成可直接发送或可编辑文本”,而不是长音频资产管理、播客后期制作或企业呼叫中心质检。高价值场景通常是 Slack、邮件、代码工具、文档和会议笔记这类高频输入任务。
用户与市场认可
官网公开写明 “hundreds of thousands rely on Superwhisper to save time”,并展示来自 Vercel CEO 等用户背书,说明它已经越过早期小众试用阶段,至少在高频写作、技术团队和桌面效率用户中形成可见传播。该数字仍属于官方口径,未拆分月活、付费用户或企业席位,因此不宜延伸为营收或留存判断。
口碑信号:产品首页把 “Used by those who move fast” 放在核心叙事中,重点面向创业公司、工程团队、创作者和快节奏知识工作者。它的用户认可更偏向“输入效率提升”,而不是语音识别基准排名。
平台信号:Superwhisper 拥有官网直装、App Store 入口、X、Discord、YouTube 和 GitHub 组织链接,说明团队以独立产品和社区渠道运营。App Store 页面在当前区域访问会跳转到地区化页面,具体评分、评价量和地区可用性仍应以 Apple App Store 实时页面为准。
成本优势:用语音替代键盘输入的时间成本
Superwhisper 的成本优势主要体现在个人和团队的输入效率,而不是单纯订阅价最低。官网定价区公开提供 Free、Pro 和 Enterprise;Free 可长期使用基础能力,Pro 提供更完整的云端/本地模型、BYOK、文件转写和翻译能力,Enterprise 面向团队管理和合规。
C 端/个人:Free 方案公开为 0 美元,覆盖 any app voice to text、会议录音和转写、100+ 语言、小型 AI 模型无限使用、自定义 prompt 控制和邮件支持。官网 FAQ 还写明可免费试用 Pro 功能 15 分钟录音,购买后提供 30 天退款承诺。
开发者/API:Superwhisper 不是公开 API 平台;它面向终端用户提供 BYOK(Bring Your Own Key)和自定义模型连接能力。开发者成本主要来自个人订阅、外部模型 API Key、云端模型调用和本地硬件性能,而不是按官方 API 调用量计费。
企业/私有化:Enterprise 公开为 Custom,包含 SOC 2 Type II certified、集中 billing/authentication 和 model access control 等团队能力。合同价格、席位、SSO 细节、数据保留和模型访问策略未公开,企业采购需以官方实时商务页面为准。
| 层级 | 公开价格/形态 | 已公开能力 | 未公开或需确认 |
|---|---|---|---|
| Free | 0 美元 | 跨应用语音转文本、会议转写、100+ 语言、小型 AI 模型、自定义 prompt | 免费额度细节以官网实时页面为准 |
| Pro | 8 美元/月;年付 49 美元;学生 40% off | BYOK、Cloud/Local AI models、任意语言翻译为英文、音视频文件转写、优先支持 | 各模型调用上限与长期价格以官网实时页面为准 |
| Enterprise | Custom | SOC 2 Type II、集中计费与认证、模型访问控制 | 席位、审计、合同、数据条款需商务确认 |
Superwhisper 的主要功能
Superwhisper 的功能不是把语音识别做成孤立窗口,而是围绕“录音、识别、改写、粘贴、复用”形成完整输入链路。
- 跨应用语音输入:官网强调 voice to text works in any app,适合邮件、Slack、Cursor、浏览器和文档编辑器等输入框。
- 离线与云端转写:离线模式保证无网络时仍可转写;云端模型用于更高准确率、更复杂语言或性能受限设备。
- 自定义 AI modes:用户可以按 message、meeting、love letters、screenwriting、poetry 等任务设定语气、格式、语言模型和语音模型,让同一段口述输出不同风格。
- Super Mode:官网描述为会根据屏幕上下文适配输出的 AI-enhanced mode,适合把选中文本、当前应用和语音指令组合成更具体的结果。
- 文件转写:支持上传音频和视频文件生成 transcript,Pro 方案明确包含 “Transcribe audio and video files”。
- Push to Talk 与快捷键:支持按住说话、释放完成,以及自定义快捷键启动、听写和控制。
- 剪贴板集成:转写与编辑后的文本可自动粘贴到当前应用,减少手动复制粘贴。
- 会议助手:官网公开会议录音和自动 notes 能力,适合会议纪要、访谈记录和复盘摘要。
这些能力的实际效果取决于麦克风质量、环境噪声、口音、语言模型选择和输出模式配置。对专业术语密集的团队,词汇表和自定义 prompt 往往比“换更贵模型”更先影响可用性。
Superwhisper 的模型与版本演进
Superwhisper 的版本演进以 macOS 客户端 changelog 最完整,Windows 与 iOS 也在下载页和 changelog 中作为独立平台存在。当前公开主线显示,2026 年上半年产品重心正在从“语音转写工具”扩展到“语音驱动的 AI 工作流入口”。
macOS 主线版本
- 2.16.1(2026-06-16):新增 agent 响应代码片段复制按钮,优化 Coding agent 面板和多个 UI 细节,并修复实时转写开头漏词、窗口漂移与 Claude Code 集成问题。
- 2.16.0(2026-06-09):加入主题控制、新声音效果、S1-Mini 本地模型实验入口和大词汇表处理能力;会议模式的 AI summary 开始尊重语言选择。
- 2.15.0(2026-05-29):提升云端语音模型性能,改进 S1 词汇与时间戳处理、噪声环境静音移除和音频文件转写性能。
- 2.14.0(2026-05-15):加入 BYOK GPT 5.5、历史搜索、词汇 CSV 导入、动态归一化、实时波形门控和 Codex hook 支持。
- 2.13.0(2026-04-24):重设计 Modes,加入 Claude Code 与 Open Code agent 集成,增强 app/site activation UI。
能力路线
模型路线:changelog 出现 S1-Mini local model、Cloud hosted voice models、GPT 5.5 BYOK、Claude Opus/Sonnet、Gemini、Grok、Groq、Parakeet、ElevenLabs Scribe 等节点,说明产品并不押注单一供应商,而是把本地模型、云端语音模型和 BYOK 大语言模型组合成可选层。
稳定性路线:多个版本围绕长录音、静音移除、词汇表、实时连接、剪贴板和窗口位置修复迭代。对生产使用而言,这类细节比单次 demo 准确率更重要,因为语音输入失败往往发生在连续工作流和长会话中。
Superwhisper 的技术优势
Superwhisper 的技术优势来自“输入链路整合”而非单点识别算法宣传。它把本地/云端语音模型、外部 LLM、模式配置、快捷键、剪贴板和当前应用上下文放进一个桌面入口,减少用户从录音工具、转写工具、改写工具到目标应用之间的切换。
本地与云端并行:离线转写让用户在无网络或敏感文本场景下仍可工作;云端模型给 Intel Mac、长录音、复杂语言或高准确率场景提供补充。官网 FAQ 明确提示 Intel Mac 更适合 Cloud models,离线模型在 Apple Silicon Mac 上运行效果更好。
模式化输出:Custom Mode 允许设定格式规则、结构偏好和专用 prompt;同一段口语可以输出成正式邮件、简短消息、法律语气文本或代码代理指令。机制上是“语音识别 + LLM 后处理 + 应用上下文”,效果是降低二次编辑成本。
可替换模型层:BYOK 和 custom models 让高级用户把 OpenAI、Anthropic、Groq、Ollama 等供应商纳入自己的成本、隐私和质量策略。适合需要控制模型供应商或已有企业模型合约的团队。
如何使用 Superwhisper
Superwhisper 的入口以下载安装为主:用户可从 官方下载页 获取 macOS 与 Windows 客户端,iOS 用户通过 App Store 安装。安装后通常需要授权麦克风、辅助功能或输入相关权限,再设置快捷键和默认 mode。
| 使用方式 | 适合人群 | 特点 | 关键前提 |
|---|---|---|---|
| macOS 客户端 | 高频桌面输入、开发者、写作者 | 当前公开版本 2.16.1,支持离线、云端、快捷键、Modes 与 Super Mode | macOS 13.3+;离线模型更适合 Apple Silicon |
| Windows 客户端 | Windows 桌面办公用户 | 下载页公开版本 v1.4.13,支持桌面语音输入 | Windows 10+ |
| iOS App | 移动端听写、临时记录 | 官网公开 iOS 入口和 iOS 18+ 要求 | App Store 地区可用性以实时页面为准 |
| BYOK/自定义模型 | 高级用户、工程团队 | 使用自有模型 Key 或自定义连接控制成本与模型选择 | 需自行管理 API Key、权限和外部模型费用 |
典型流程:选择目标应用和输入框,按快捷键或 push-to-talk 开始说话,Superwhisper 完成转写与 mode 后处理,再把文本自动粘贴到当前应用。会议或文件转写场景则先录制或导入音视频,再生成 transcript 与摘要。
Superwhisper 的产品定价
Superwhisper 的公开定价分为 Free、Pro 和 Enterprise。官网结构化数据写明 Free 为 0 美元,Pro Monthly 为 8 美元;页面定价区还公开年付 49 美元、学生 40% 折扣和 Enterprise Custom。
Free:适合先验证“语音输入是否能替代键盘输入”的个人用户。公开能力包括任意应用语音转文本、会议录音与转写、100+ 语言、小型 AI 模型、自定义 prompt 和邮件支持。
Pro:面向需要更完整工作流的人群,公开包含 BYOK、Cloud/Local AI models、任意语言翻译为英文、音视频文件转写和优先支持。对每天大量写邮件、工单、代码说明或会议纪要的用户,Pro 的价值主要来自减少后期编辑时间。
Enterprise:面向团队管理,公开包含 SOC 2 Type II certified、集中计费与认证、模型访问控制。组织采购前应确认 SSO、审计日志、数据保留、模型供应商边界和企业合同支持范围。
Superwhisper 的应用场景
- 桌面沟通输入:在 Slack、邮件、CRM、Notion 或浏览器输入框中用语音生成可发送文本,价值在于减少长句输入和重复编辑。
- 开发与代码代理:changelog 已出现 Claude Code、Open Code、Codex hook 和 coding agent panel 等节点,适合把语音转为代码修改指令、提交说明或调试思路。
- 会议记录与复盘:会议模式可记录并生成 notes,适合小团队例会、客户访谈和项目复盘;验收重点是说话人分离、摘要可信度和敏感信息处理。
- 跨语言写作:100+ 语言与翻译到英文能力适合非英语母语用户把口语转为英文邮件、社交内容或工作消息。
- 音视频文件转写:Pro 的文件转写适合把录音、采访和短视频素材转成文本草稿;长录音场景需关注模型速度、稳定性和分段质量。
Superwhisper 的适用人群
- 高频写作与沟通用户:邮件、即时消息、文档和销售跟进量大,语音输入能直接减少键盘时间。
- 开发者与技术团队:需要把想法、错误复现、代码审查意见或 agent 指令快速转成结构化文本。
- 创作者与研究者:用语音记录想法、采访内容、草稿和会议纪要,再通过 mode 调整风格与格式。
- 企业知识工作团队:希望统一管理语音输入工具、模型访问和团队账单,可评估 Enterprise。
不适配的边界也很明确:噪声极高、录音合规要求极严、必须完全离线且设备性能不足、需要呼叫中心级质检报表,或需要公开 API 批量处理的场景,不应只用 Superwhisper 解决。此类需求更适合专门的转写 API、会议智能平台或企业录音合规系统。
总结与展望
Superwhisper 的核心竞争力在于把 AI 语音输入做成跨应用的日常入口:用户不需要离开当前应用,就能完成说话、转写、改写和粘贴。它适合以文字沟通为主、但键盘输入成为瓶颈的人群,尤其是开发者、创作者、管理者和销售/客服类知识工作者。
当前限制主要有四类:第一,离线模型体验依赖硬件,官方已提示 Intel Mac 更适合云端模型;第二,云端模型和 BYOK 会引入外部模型费用与数据边界;第三,App Store 地区可用性、企业合同条款和完整数据保留策略需以官方实时页面为准;第四,语音输入质量仍受麦克风、噪声、口音和专业词汇影响。
落地建议是先用 Free 或 Pro 试用在 2 到 3 个固定场景中验证,例如邮件回复、Slack 消息、会议纪要和代码代理指令;若团队扩展到 Enterprise,再重点确认 SOC 2 证明、集中认证、模型访问控制、数据处理协议和 BYOK 管理策略。对个人用户而言,最值得观察的是 macOS changelog 中本地模型、Super Mode、coding agent 和长录音稳定性的持续改进。
版本信息
- Superwhisper macOS 2.16.1 :官方 changelog 公开的 macOS 最新版本,新增 agent 响应代码片段复制按钮,优化 Coding agent 面板、分享卡片、Super picker、顶部栏与录音详情视图,并修复实时转写开头漏词、窗口边缘位置和 Claude Code 集成问题。
- Superwhisper macOS 2.16.0 :官方 changelog 公开的版本,加入明暗/系统主题控制、新声音效果选项、S1-Mini 本地模型实验入口和更大词汇表处理能力。
- Superwhisper macOS 2.15.0 :官方 changelog 公开的版本,新增无麦克风音频警告,提升云端语音模型性能、S1 词汇和时间戳处理、噪声环境静音移除与文件转写性能。
- Superwhisper macOS 2.14.0 :官方 changelog 公开的版本,加入 BYOK GPT 5.5、模型与预设选择器提示、历史视图搜索、词汇 CSV 导入、动态归一化和实时波形门控等改进。
用户评价