什么是 Gemini 3.5 Flash？香港老板的入门指南

Gemini 3.5 Flash 于 2026 年 5 月推出，在编程与代理基准上胜过上代旗舰。一文看清成本、能力，以及香港中小企应如何运用。

实用攻略

2026-06-08

读完这篇文章，你会清楚知道 Gemini 3.5 Flash 是什么、Google 为何在 2026 年 5 月推出它、实际使用成本，以及在经营一家香港中小企的日常工作上，它在哪些位置真正胜过 ChatGPT。没有术语，没有炒作，只有老板本周需要做出明智决定所要的事实。

如果你的团队每日使用 Google Workspace、Gmail 或 Google 搜索，这次升级早已落入你手中。问题只是，你打算如何运用。

什么是 Gemini 3.5 Flash？

Gemini 3.5 Flash 是 Google 在 2026 年 5 月 19 日 Google I/O 上推出、最新的快速兼低成本 AI 模型。它已成为 Gemini 应用、Google AI Studio、Gemini API、Antigravity 2.0 及 Google 搜索 AI 模式的新默认主力模型。Google 宣称它在编程与代理 (agent) 基准上胜过上一代旗舰 Gemini 3.1 Pro，速度却快约四倍。

用浅白的话讲：Google 把便宜、快速的模型，拉到去年旗舰级的智能水平。你能得到更聪明的答案，却不必付旗舰级的价钱。

Google 是怎样快速追上来的？

由 Gemini 3.0 到 3.5 Flash，Google 进行了三项架构调整。第一，新增专为工具使用与代理流程而训练的推理层，让 AI 能调用软件、读取结果，然后决定下一步行动。第二，将上下文窗口扩大至一百万个 token，意味模型能在一次处理过程中阅读数百页文件而不失焦。第三，积极的蒸馏流程把大型模型的知识压缩进一个小巧、快速的模型内，并在 Google 自家芯片上以低成本运行。

基准数据说明问题。在测试模型端到端执行计算机任务的 Terminal-Bench 2.1 上，Gemini 3.5 Flash 取得 76.2%，胜过 Gemini 3.1 Pro。在测试模型通过 Model Context Protocol 使用外部工具的 MCP Atlas 上，它取得 83.6%，于 2026 年 5 月领先同级别。

Gemini 3.5 Flash 的成本是多少？

对大多数香港中小企老板来说，如果你使用 Gemini 应用程序，或 Google Workspace 内的 Gemini，答案就是「按你现有月费」。消费者方案和 Workspace 方案均不另收每条信息费用，新模型已是默认。

对于通过 Gemini API 建立自家工具的企业，Google 公布的价格是每百万输入 token 1.50 美元、每百万输出 token 9.00 美元。约为前代 Gemini 3 Flash (0.50 / 3.00 美元) 的三倍，但执行同一工作仍比 Gemini 3.1 Pro 便宜约 40%。当你重复发送同一份文件作为背景时使用的缓存输入 token，降至每百万 0.15 美元，相当于九折优惠。

实用对照：一百万个 token 约等于 75 万个英文字，或三本小说的全文。中小企的大多数应用场景，每次查询远少于此。

Gemini 3.5 Flash 对业务有什么实际用处？

头条基准分数背后，是三项能改变中小企日常 AI 使用方式的具体能力。每一项都值得对照你现有流程检视。

一、一次过阅读整套文件

一百万个 token 的上下文窗口，意味你可以一次上传整叠供应商合同、一整年的月度损益表，或与某难搞客户的所有 WhatsApp 对话记录，并针对全部资料提出一条问题。过去这种需求要分割文件、分次查询，再人手拼合答案。在 Gemini 3.5 Flash，一条提示处理完整文件集，并能在整套资料中维持准确度。

二、执行多步骤代理任务

76.2% 的 Terminal-Bench 分数，意味模型能可靠地串连动作。在 Antigravity 2.0 内，你可以叫 Gemini「打开上月销售表格，找出销量最差的十项产品，草拟一封回供应商的退货建议邮件，再保存到 Gmail 草稿。」模型会依序处理步骤而不失主线。在此之前，多步骤请求通常在二至三步后便会崩溃。

三、通过 MCP 使用外部工具

MCP (Model Context Protocol) 是让 AI 模型与外部软件对话的标准。Gemini 3.5 Flash 在 MCP Atlas 取得 83.6%，意味它能通过标准协议可靠地调用你的 CRM、会计软件、库存系统等其他工具。对中小企而言，重要在于不再需要为每个工具自行开发整合接口，只要供应商支持 MCP，Gemini 就能对话。

香港中小企：Gemini 3.5 Flash 与 ChatGPT 之争

大多数老板会问同一个问题：应该由 ChatGPT 转用 Gemini 吗？老实的答案是两者并非直接替代，多数企业最终会在不同工作上同时使用两者。

Gemini 3.5 Flash 胜出的场景：

---

需要一次过阅读大量长文件的任务。一百万个 token 的上下文窗口，在处理量上胜过 ChatGPT 的默认上下文。

---

任何资料已存放在 Google Workspace 的场景。Gmail、Drive、Docs、Sheets、日历均能原生整合，无需复制粘贴。

---

对成本敏感的 API 自动化。以每百万输入 / 输出 token 1.50 美元 / 9.00 美元计算，Gemini 3.5 Flash 处理同类工作的成本显著低于顶级 ChatGPT 模型。

ChatGPT 在中小企场景仍占优之处：

---

注重语气和个性的对话式撰写。GPT-5.5 Instant 仍是许多员工撰写邮件和客户文案的首选默认模型。

---

较广泛的第三方插件生态系。ChatGPT 与非 Google 工具的整合历史较长，可能正好对应你团队现有的工具。

---

OpenAI 在 2026 年 6 月初推出的「记忆来源」可审查功能，让你清楚看见哪些过往对话和文件影响了每一次回复。

关于 Gemini 3.5 Flash 的常见误解

误解一：「Flash 代表能力较弱的模型。」

这曾经是事实。在 Google 2026 年前的命名惯例中，Flash 是位于 Pro 与 Ultra 之下的廉价快速选项。但 Gemini 3.5 Flash 打破了这个排序。Flash 现已在 Google 公布的基准上达到或超越上一年的 Pro。Flash 已不再是降级，而是新的默认。

误解二：「我不是开发人员，API 价格与我无关。」

API 价格间接影响你。许多你业务已支付的 AI 功能，由 CRM 智能回复到邮件摘要工具，都是按背后 API 成本来定价的。同一工作量比 Gemini 3.1 Pro 便宜 40%，通常会在下一个续约周期内，反映在供应商收你的价钱上。

误解三：「现在的 Gemini 和 Google 搜索是同一件事。」

两者共用同一个模型，但属于不同产品。Google 搜索在 AI 模式中以 Gemini 3.5 Flash 摘写结果，但搜索仍然免费且由广告支持。Gemini 应用、Workspace 内的 Gemini 与 API 都是各自独立的产品，有自己的权限与收费。

误解四：「Gemini 3.5 Pro 即将推出，我应该等等。」

Google 已示意 Gemini 3.5 Pro 预计于 2026 年 6 月推出，但等待并非没有代价。团队每多用一周旧模型，就是失去一周的生产力提升。实际做法是现在开始用 Flash，待 Pro 推出时，再就「速度与成本不再够用」的工作场景进行评估。

本周如何试行 Gemini 3.5 Flash？

合理的试行只有三步，设置时间少于半日。你不是承诺转换平台，只是测试某个模型在特定工作上是否做得更好。

第一步：选出你目前在 Google Workspace 内已进行的三项工作流程。

例如：摘写一条长邮件串、从 Google Sheet 中抽取数字、用粤语草拟回复，或从 Google Docs 的会议记录中抽出行动项目。

第二步：每个流程分别在 Gemini (Workspace 或 Gemini 应用内) 与你现用的工具各跑一次。

计时两者。为两者准确度评分。记下哪个用起来更顺手，哪个产出可直接由员工发出而不必重写。

第三步：以工作为单位作决定，而非以工具为单位。

你或会发现 Gemini 在文件密集的任务上胜出，而 ChatGPT 在对话撰写上胜出，这是正常结果。两者并用，按工作而不是按供应商来选型。

常见问题：老板关心的 Gemini 3.5 Flash 重点

问：我能免费使用 Gemini 3.5 Flash 吗？

可以。在 gemini.google.com 的免费 Gemini 应用，或 Google 搜索的 AI 模式中，均可免费使用。截至 2026 年 5 月下旬，两者默认使用的就是 Gemini 3.5 Flash。免费用户设有每日用量上限。

问：可以用粤语和繁体中文吗？

可以。Gemini 支持粤语提问并输出繁体中文。在日常草拟、摘写与问答等香港业务情境，品质与英文相当。

问：我的数据会用于训练 Google 的模型吗？

在免费的 Gemini 消费者应用上，对话内容可能会被检阅及用于改进产品，除非你在 Google 账户中关闭「Gemini Apps Activity」。Google Workspace 客户使用 Gemini for Workspace，以及 Gemini API 付费客户，默认输入不会用于模型训练。对任何处理客户个人数据的业务，Workspace 或 API 是较安全的选择。

问：Gemini 3.5 Flash 能否读取我的 Gmail 与日历？

可以，前提是在 Google Workspace 中启用 Gemini for Workspace。模型可摘写邮件、草拟回复、找出日历冲突，亦可在无需人手上传的情况下，从你的 Drive 文件中提取数据。你可在 Workspace 设定中控制 Gemini 可访问哪些 Google 服务。

问：Antigravity 2.0 是什么？我需要吗？

Antigravity 2.0 是 Google 用来建构 AI 代理的开发者平台。如果你的业务只使用 Google Workspace 内的默认 AI 功能，并不需要接触 Antigravity。若你想拥有处理某项多步骤工作的自定 AI 代理，Antigravity 就是它被建构的平台，通常由供应商或内部 IT 团队处理。

问：可以把 Gemini 3.5 Flash 用在高风险工作吗？

请用看待任何 AI 模型的方式去看待它。它的可靠度比上一代有实质提升，但仍会出现幻觉。涉及金钱、法律风险或客户承诺的决定，仍须在发送或签署前由人类审核输出。

结语

Gemini 3.5 Flash 标志著 Flash 级别不再只是「廉价选项」，而是业务工作上的认真默认。如果你的团队已长期在 Google Workspace 内运作，这次升级是免费的、整合是原生的、速度提升是真实的。如果不是，这正是进行同类比较试行的合适一周。

每个月都有新模型出现，要为你的业务挑出最合适的那个并不容易。懂AI，更懂你。UD相伴，AI不冷。

准备把合适的 AI 模型对应到你真正的工作流程？

在 Gemini、ChatGPT 与其他选项之间选择，不是「哪个最强」的问题，而是「哪个最合你团队今天做的工作」。UD 在过去 28 年为香港中小企配对合适技术，我们的 AI Employee Match 团队手把手教你，由简短评估你日常的工作流程，到本月可在你自己业务内试行的方案，全程陪你走每一步。

免费 AI 配对评估

其他人也看了

什么是 GPT-5.5 Instant？香港老板的入门指南用 NotebookLM 建立公司知识库：让 AI 成为最懂你企业的员工提示链接技术：以三步工作流取代单一巨型提示如何建立企业 AI 卓越中心：2026 年中心辐射式架构框架什么是 AI 可观测性？企业级生产部署的关键框架

UD Blog

专业文章及见解，揭示科技领域的一切

什么是 Gemini 3.5 Flash？香港老板的入门指南

Gemini 3.5 Flash 于 2026 年 5 月推出，在编程与代理基准上胜过上代旗舰。一文看清成本、能力，以及香港中小企应如何运用。

什么是 Gemini 3.5 Flash？

Google 是怎样快速追上来的？

Gemini 3.5 Flash 的成本是多少？

Gemini 3.5 Flash 对业务有什么实际用处？

香港中小企：Gemini 3.5 Flash 与 ChatGPT 之争

关于 Gemini 3.5 Flash 的常见误解

本周如何试行 Gemini 3.5 Flash？

常见问题：老板关心的 Gemini 3.5 Flash 重点

结语

准备把合适的 AI 模型对应到你真正的工作流程？

其他人也看了

UD Blockchain 通讯