Gemini 是什么?Google 旗舰大模型全系列
Gemini 是 Google DeepMind 开发的旗舰大模型系列,于 2023 年 12 月首次发布。它是原生多模态模型——从训练开始就同时处理文本、图片、音频和视频,支持最高 200 万 token 的超长上下文。Gemini 是 Google 对标 GPT 和 Claude 的核心 AI 产品。本文带你了解 Gemini 的全部版本、核心特点,以及如何通过 AI的那些事儿 在国内调用。
发布: 更新:
Gemini 的核心特点
- 原生多模态:不是"文本模型+视觉模块拼接",而是从底层就同时理解文本、图片、音频、视频、代码
- 超长上下文:Gemini 1.5 起支持 100 万 token,2.5 支持 200 万 token(约 150 万字)
- Google 生态集成:深度集成 Search、Gmail、Docs、Android,是 Google 全产品的 AI 底座
- 多档位设计:Pro(旗舰)、Flash(快速低成本)、Nano(端侧设备)
版本演进
Gemini 1.0 (2023.12)
首发版本。Ultra/Pro/Nano 三档。Ultra 在 MMLU 上首次超越人类专家水平(90.0%)。
Gemini 1.5 (2024.2)
突破性升级。100 万 token 上下文(后扩展到 200 万)。MoE 架构,效率大幅提升。
Gemini 2.0 (2024.12)
Agent 时代。原生工具调用、多模态输出(图片+音频生成)、Flash 模型极速推理。
Gemini 2.5 (2025.3)
最新一代。内置推理能力(思维链)、200 万 token、代码和数学能力飞跃。
Gemini vs GPT vs Claude
Gemini 优势
原生多模态(视频理解最强)、超长上下文(200万token)、Google生态集成、免费额度慷慨。
GPT 优势
工具调用生态最丰富、GPTs/插件、实时语音对话、DALL-E 绘图、用户基数最大。
Claude 优势
代码质量最高、安全性最强、指令遵循最精确、Claude Code 开发体验好。
三者能力接近,各有侧重。通过 AI的那些事儿 可在同一接口下使用全部三家模型。
Gemini 的产品形态
Gemini App
面向普通用户的对话产品(原 Bard)。网页版 + Android/iOS App。免费可用。
Gemini Advanced
付费订阅($19.99/月),使用最强模型,更长上下文,集成 Google 全家桶。
Gemini in Google
集成到 Gmail、Docs、Sheets、Android 等 Google 产品中,作为 AI 助手。
实战:调用 Gemini
Python 示例:通过 OpenAI 格式调用
from openai import OpenAI
client = OpenAI(
api_key="你的Key",
base_url="https://api.example.com/v1" # AI的那些事儿中转
)
# Gemini 2.5 Pro — 最新旗舰
r = client.chat.completions.create(
model="gemini-2.5-pro",
messages=[
{"role": "user", "content": "分析 Gemini 相比 GPT-4o 的技术优势和劣势"}
],
max_tokens=1500
)
print(r.choices[0].message.content)
# Gemini 2.5 Flash — 快速低成本
r = client.chat.completions.create(
model="gemini-2.5-flash",
messages=[{"role": "user", "content": "用一句话总结量子计算的核心原理"}],
max_tokens=100
)
print(r.choices[0].message.content)
Node.js 示例:流式输出
import OpenAI from "openai";
const client = new OpenAI({
apiKey: "你的Key",
baseURL: "https://api.example.com/v1",
});
const stream = await client.chat.completions.create({
model: "gemini-2.5-pro",
messages: [{ role: "user", content: "用 Python 实现一个异步爬虫框架" }],
stream: true,
});
for await (const chunk of stream) {
process.stdout.write(chunk.choices[0]?.delta?.content || "");
}
常见问题
Gemini 是什么?
Google DeepMind 的旗舰大模型系列。原生多模态,支持 200 万 token 超长上下文。是 Google 对标 GPT 和 Claude 的核心 AI 产品。
Gemini 有哪些版本?
1.0→1.5→2.0→2.5 四代。每代有 Pro(旗舰)、Flash(快速)、Nano(端侧)等档位。当前最新是 Gemini 2.5 Pro/Flash。
Gemini 和 GPT-4o 哪个好?
Gemini 在多模态(视频)和超长上下文方面领先;GPT-4o 在工具生态和中文方面更强。能力接近,各有侧重。
国内怎么用 Gemini?
通过 AI的那些事儿 直连调用,兼容 OpenAI 格式。model 填 gemini-2.5-pro 等即可。国内免代理。
国内直连 Gemini,200 万 token 上下文
通过 AI的那些事儿调用 Gemini 全系列,OpenAI 格式兼容,代码零改动。