读完这篇文章,你会清楚知道 Gemini 3.5 Flash 是什么、Google 为何在 2026 年 5 月推出它、实际使用成本,以及在经营一家香港中小企的日常工作上,它在哪些位置真正胜过 ChatGPT。没有术语,没有炒作,只有老板本周需要做出明智决定所要的事实。
如果你的团队每日使用 Google Workspace、Gmail 或 Google 搜索,这次升级早已落入你手中。问题只是,你打算如何运用。
什么是 Gemini 3.5 Flash?
Gemini 3.5 Flash 是 Google 在 2026 年 5 月 19 日 Google I/O 上推出、最新的快速兼低成本 AI 模型。它已成为 Gemini 应用、Google AI Studio、Gemini API、Antigravity 2.0 及 Google 搜索 AI 模式的新默认主力模型。Google 宣称它在编程与代理 (agent) 基准上胜过上一代旗舰 Gemini 3.1 Pro,速度却快约四倍。
用浅白的话讲:Google 把便宜、快速的模型,拉到去年旗舰级的智能水平。你能得到更聪明的答案,却不必付旗舰级的价钱。
Google 是怎样快速追上来的?
由 Gemini 3.0 到 3.5 Flash,Google 进行了三项架构调整。第一,新增专为工具使用与代理流程而训练的推理层,让 AI 能调用软件、读取结果,然后决定下一步行动。第二,将上下文窗口扩大至一百万个 token,意味模型能在一次处理过程中阅读数百页文件而不失焦。第三,积极的蒸馏流程把大型模型的知识压缩进一个小巧、快速的模型内,并在 Google 自家芯片上以低成本运行。
基准数据说明问题。在测试模型端到端执行计算机任务的 Terminal-Bench 2.1 上,Gemini 3.5 Flash 取得 76.2%,胜过 Gemini 3.1 Pro。在测试模型通过 Model Context Protocol 使用外部工具的 MCP Atlas 上,它取得 83.6%,于 2026 年 5 月领先同级别。
Gemini 3.5 Flash 的成本是多少?
对大多数香港中小企老板来说,如果你使用 Gemini 应用程序,或 Google Workspace 内的 Gemini,答案就是「按你现有月费」。消费者方案和 Workspace 方案均不另收每条信息费用,新模型已是默认。
对于通过 Gemini API 建立自家工具的企业,Google 公布的价格是每百万输入 token 1.50 美元、每百万输出 token 9.00 美元。约为前代 Gemini 3 Flash (0.50 / 3.00 美元) 的三倍,但执行同一工作仍比 Gemini 3.1 Pro 便宜约 40%。当你重复发送同一份文件作为背景时使用的缓存输入 token,降至每百万 0.15 美元,相当于九折优惠。
实用对照:一百万个 token 约等于 75 万个英文字,或三本小说的全文。中小企的大多数应用场景,每次查询远少于此。
Gemini 3.5 Flash 对业务有什么实际用处?
头条基准分数背后,是三项能改变中小企日常 AI 使用方式的具体能力。每一项都值得对照你现有流程检视。
一、一次过阅读整套文件
一百万个 token 的上下文窗口,意味你可以一次上传整叠供应商合同、一整年的月度损益表,或与某难搞客户的所有 WhatsApp 对话记录,并针对全部资料提出一条问题。过去这种需求要分割文件、分次查询,再人手拼合答案。在 Gemini 3.5 Flash,一条提示处理完整文件集,并能在整套资料中维持准确度。
二、执行多步骤代理任务
76.2% 的 Terminal-Bench 分数,意味模型能可靠地串连动作。在 Antigravity 2.0 内,你可以叫 Gemini「打开上月销售表格,找出销量最差的十项产品,草拟一封回供应商的退货建议邮件,再保存到 Gmail 草稿。」模型会依序处理步骤而不失主线。在此之前,多步骤请求通常在二至三步后便会崩溃。
三、通过 MCP 使用外部工具
MCP (Model Context Protocol) 是让 AI 模型与外部软件对话的标准。Gemini 3.5 Flash 在 MCP Atlas 取得 83.6%,意味它能通过标准协议可靠地调用你的 CRM、会计软件、库存系统等其他工具。对中小企而言,重要在于不再需要为每个工具自行开发整合接口,只要供应商支持 MCP,Gemini 就能对话。
香港中小企:Gemini 3.5 Flash 与 ChatGPT 之争
大多数老板会问同一个问题:应该由 ChatGPT 转用 Gemini 吗?老实的答案是两者并非直接替代,多数企业最终会在不同工作上同时使用两者。
Gemini 3.5 Flash 胜出的场景:
---
需要一次过阅读大量长文件的任务。一百万个 token 的上下文窗口,在处理量上胜过 ChatGPT 的默认上下文。
---
任何资料已存放在 Google Workspace 的场景。Gmail、Drive、Docs、Sheets、日历均能原生整合,无需复制粘贴。
---
对成本敏感的 API 自动化。以每百万输入 / 输出 token 1.50 美元 / 9.00 美元计算,Gemini 3.5 Flash 处理同类工作的成本显著低于顶级 ChatGPT 模型。
ChatGPT 在中小企场景仍占优之处:
---
注重语气和个性的对话式撰写。GPT-5.5 Instant 仍是许多员工撰写邮件和客户文案的首选默认模型。
---
较广泛的第三方插件生态系。ChatGPT 与非 Google 工具的整合历史较长,可能正好对应你团队现有的工具。
---
OpenAI 在 2026 年 6 月初推出的「记忆来源」可审查功能,让你清楚看见哪些过往对话和文件影响了每一次回复。
关于 Gemini 3.5 Flash 的常见误解
误解一:「Flash 代表能力较弱的模型。」
这曾经是事实。在 Google 2026 年前的命名惯例中,Flash 是位于 Pro 与 Ultra 之下的廉价快速选项。但 Gemini 3.5 Flash 打破了这个排序。Flash 现已在 Google 公布的基准上达到或超越上一年的 Pro。Flash 已不再是降级,而是新的默认。
误解二:「我不是开发人员,API 价格与我无关。」
API 价格间接影响你。许多你业务已支付的 AI 功能,由 CRM 智能回复到邮件摘要工具,都是按背后 API 成本来定价的。同一工作量比 Gemini 3.1 Pro 便宜 40%,通常会在下一个续约周期内,反映在供应商收你的价钱上。
误解三:「现在的 Gemini 和 Google 搜索是同一件事。」
两者共用同一个模型,但属于不同产品。Google 搜索在 AI 模式中以 Gemini 3.5 Flash 摘写结果,但搜索仍然免费且由广告支持。Gemini 应用、Workspace 内的 Gemini 与 API 都是各自独立的产品,有自己的权限与收费。
误解四:「Gemini 3.5 Pro 即将推出,我应该等等。」
Google 已示意 Gemini 3.5 Pro 预计于 2026 年 6 月推出,但等待并非没有代价。团队每多用一周旧模型,就是失去一周的生产力提升。实际做法是现在开始用 Flash,待 Pro 推出时,再就「速度与成本不再够用」的工作场景进行评估。
本周如何试行 Gemini 3.5 Flash?
合理的试行只有三步,设置时间少于半日。你不是承诺转换平台,只是测试某个模型在特定工作上是否做得更好。
第一步:选出你目前在 Google Workspace 内已进行的三项工作流程。
例如:摘写一条长邮件串、从 Google Sheet 中抽取数字、用粤语草拟回复,或从 Google Docs 的会议记录中抽出行动项目。
第二步:每个流程分别在 Gemini (Workspace 或 Gemini 应用内) 与你现用的工具各跑一次。
计时两者。为两者准确度评分。记下哪个用起来更顺手,哪个产出可直接由员工发出而不必重写。
第三步:以工作为单位作决定,而非以工具为单位。
你或会发现 Gemini 在文件密集的任务上胜出,而 ChatGPT 在对话撰写上胜出,这是正常结果。两者并用,按工作而不是按供应商来选型。
常见问题:老板关心的 Gemini 3.5 Flash 重点
问:我能免费使用 Gemini 3.5 Flash 吗?
可以。在 gemini.google.com 的免费 Gemini 应用,或 Google 搜索的 AI 模式中,均可免费使用。截至 2026 年 5 月下旬,两者默认使用的就是 Gemini 3.5 Flash。免费用户设有每日用量上限。
问:可以用粤语和繁体中文吗?
可以。Gemini 支持粤语提问并输出繁体中文。在日常草拟、摘写与问答等香港业务情境,品质与英文相当。
问:我的数据会用于训练 Google 的模型吗?
在免费的 Gemini 消费者应用上,对话内容可能会被检阅及用于改进产品,除非你在 Google 账户中关闭「Gemini Apps Activity」。Google Workspace 客户使用 Gemini for Workspace,以及 Gemini API 付费客户,默认输入不会用于模型训练。对任何处理客户个人数据的业务,Workspace 或 API 是较安全的选择。
问:Gemini 3.5 Flash 能否读取我的 Gmail 与日历?
可以,前提是在 Google Workspace 中启用 Gemini for Workspace。模型可摘写邮件、草拟回复、找出日历冲突,亦可在无需人手上传的情况下,从你的 Drive 文件中提取数据。你可在 Workspace 设定中控制 Gemini 可访问哪些 Google 服务。
问:Antigravity 2.0 是什么?我需要吗?
Antigravity 2.0 是 Google 用来建构 AI 代理的开发者平台。如果你的业务只使用 Google Workspace 内的默认 AI 功能,并不需要接触 Antigravity。若你想拥有处理某项多步骤工作的自定 AI 代理,Antigravity 就是它被建构的平台,通常由供应商或内部 IT 团队处理。
问:可以把 Gemini 3.5 Flash 用在高风险工作吗?
请用看待任何 AI 模型的方式去看待它。它的可靠度比上一代有实质提升,但仍会出现幻觉。涉及金钱、法律风险或客户承诺的决定,仍须在发送或签署前由人类审核输出。
结语
Gemini 3.5 Flash 标志著 Flash 级别不再只是「廉价选项」,而是业务工作上的认真默认。如果你的团队已长期在 Google Workspace 内运作,这次升级是免费的、整合是原生的、速度提升是真实的。如果不是,这正是进行同类比较试行的合适一周。
每个月都有新模型出现,要为你的业务挑出最合适的那个并不容易。懂AI,更懂你。UD相伴,AI不冷。
准备把合适的 AI 模型对应到你真正的工作流程?
在 Gemini、ChatGPT 与其他选项之间选择,不是「哪个最强」的问题,而是「哪个最合你团队今天做的工作」。UD 在过去 28 年为香港中小企配对合适技术,我们的 AI Employee Match 团队手把手教你,由简短评估你日常的工作流程,到本月可在你自己业务内试行的方案,全程陪你走每一步。