Gemini 是什么?Google 旗舰大模型全系列

GeminiGoogle DeepMind 开发的旗舰大模型系列,于 2023 年 12 月首次发布。它是原生多模态模型——从训练开始就同时处理文本、图片、音频和视频,支持最高 200 万 token 的超长上下文。Gemini 是 Google 对标 GPT 和 Claude 的核心 AI 产品。本文带你了解 Gemini 的全部版本、核心特点,以及如何通过 AI的那些事儿 在国内调用。

阅读时长:约 8 分钟 难度:入门 含实战代码

发布: 更新:

Gemini 的核心特点

  • 原生多模态:不是"文本模型+视觉模块拼接",而是从底层就同时理解文本、图片、音频、视频、代码
  • 超长上下文:Gemini 1.5 起支持 100 万 token,2.5 支持 200 万 token(约 150 万字)
  • Google 生态集成:深度集成 Search、Gmail、Docs、Android,是 Google 全产品的 AI 底座
  • 多档位设计:Pro(旗舰)、Flash(快速低成本)、Nano(端侧设备)

版本演进

Gemini 1.0 (2023.12)

首发版本。Ultra/Pro/Nano 三档。Ultra 在 MMLU 上首次超越人类专家水平(90.0%)。

Gemini 1.5 (2024.2)

突破性升级。100 万 token 上下文(后扩展到 200 万)。MoE 架构,效率大幅提升。

Gemini 2.0 (2024.12)

Agent 时代。原生工具调用、多模态输出(图片+音频生成)、Flash 模型极速推理。

Gemini 2.5 (2025.3)

最新一代。内置推理能力(思维链)、200 万 token、代码和数学能力飞跃。

Gemini vs GPT vs Claude

Gemini 优势

原生多模态(视频理解最强)、超长上下文(200万token)、Google生态集成、免费额度慷慨。

GPT 优势

工具调用生态最丰富、GPTs/插件、实时语音对话、DALL-E 绘图、用户基数最大。

Claude 优势

代码质量最高、安全性最强、指令遵循最精确、Claude Code 开发体验好。

三者能力接近,各有侧重。通过 AI的那些事儿 可在同一接口下使用全部三家模型。

Gemini 的产品形态

Gemini App

面向普通用户的对话产品(原 Bard)。网页版 + Android/iOS App。免费可用。

Gemini Advanced

付费订阅($19.99/月),使用最强模型,更长上下文,集成 Google 全家桶。

Gemini API

开发者接口。通过 AI StudioVertex AI 调用。也可通过 AI的那些事儿中转。

Gemini in Google

集成到 Gmail、Docs、Sheets、Android 等 Google 产品中,作为 AI 助手。

实战:调用 Gemini

Python 示例:通过 OpenAI 格式调用

from openai import OpenAI

client = OpenAI(
    api_key="你的Key",
    base_url="https://api.example.com/v1"  # AI的那些事儿中转
)

# Gemini 2.5 Pro — 最新旗舰
r = client.chat.completions.create(
    model="gemini-2.5-pro",
    messages=[
        {"role": "user", "content": "分析 Gemini 相比 GPT-4o 的技术优势和劣势"}
    ],
    max_tokens=1500
)
print(r.choices[0].message.content)

# Gemini 2.5 Flash — 快速低成本
r = client.chat.completions.create(
    model="gemini-2.5-flash",
    messages=[{"role": "user", "content": "用一句话总结量子计算的核心原理"}],
    max_tokens=100
)
print(r.choices[0].message.content)

Node.js 示例:流式输出

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "你的Key",
  baseURL: "https://api.example.com/v1",
});

const stream = await client.chat.completions.create({
  model: "gemini-2.5-pro",
  messages: [{ role: "user", content: "用 Python 实现一个异步爬虫框架" }],
  stream: true,
});

for await (const chunk of stream) {
  process.stdout.write(chunk.choices[0]?.delta?.content || "");
}

常见问题

Gemini 是什么?

Google DeepMind 的旗舰大模型系列。原生多模态,支持 200 万 token 超长上下文。是 Google 对标 GPT 和 Claude 的核心 AI 产品。

Gemini 有哪些版本?

1.0→1.5→2.0→2.5 四代。每代有 Pro(旗舰)、Flash(快速)、Nano(端侧)等档位。当前最新是 Gemini 2.5 Pro/Flash。

Gemini 和 GPT-4o 哪个好?

Gemini 在多模态(视频)和超长上下文方面领先;GPT-4o 在工具生态和中文方面更强。能力接近,各有侧重。

国内怎么用 Gemini?

通过 AI的那些事儿 直连调用,兼容 OpenAI 格式。model 填 gemini-2.5-pro 等即可。国内免代理。

国内直连 Gemini,200 万 token 上下文

通过 AI的那些事儿调用 Gemini 全系列,OpenAI 格式兼容,代码零改动。