5 月,谷歌宣布推出新的Gemini 1.5 Flash 模型,该模型针对速度和效率进行了优化。与其他前沿模型(包括谷歌自己的 Gemini 1.5 Pro)相比,Gemini 1.5 Flash 的定价极具竞争力(每百万输入代币 0.35 美元,每百万输出代币 1.05 美元)。上个月,OpenAI 宣布推出新的GPT-4o Mini 模型,与 Gemini 1.5 Flash 直接竞争,定价低于后者,为每百万输入代币 0.15 美元,每百万输出代币 0.6 美元。
今天,谷歌将 Gemini 1.5 Flash 型号的价格降低了约 80%,该价格将于 2024 年 8 月 12 日生效。新的成本将为每百万输入令牌 0.075 美元,每百万输出令牌 0.3 美元,这使得 Gemini 1.5 Flash 比 OpenAI 的 GPT-4o mini 便宜近 50%。这一降价以及上下文缓存等功能可以显著降低长上下文查询的成本和延迟。批量 API 调用可以进一步降低延迟密集型任务的成本。
在性能方面,Gemini 1.5 Flash 仍然落后于 GPT-4o mini。