Gemini Pro 是什么?Ultra/Pro/Nano 三档详解

Gemini 1.0 是 Google 于 2023 年 12 月发布的首代 Gemini 大模型,采用三档设计:Ultra(旗舰)、Pro(均衡)、Nano(端侧)。其中 Gemini Ultra 在 MMLU 基准上首次超越人类专家水平(90.0%),标志着 Google 正式进入大模型竞争的第一梯队。本文详解三档模型的能力差异与调用方法。

阅读时长:约 7 分钟 难度:入门 含实战代码

发布: 更新:

三档模型定位

Gemini Ultra

旗舰档。MMLU 90.0% 首超人类专家。适合高复杂度推理、多模态分析、科研任务。后来通过 Gemini Advanced 提供给付费用户。

Gemini Pro

均衡档。性能接近 GPT-3.5 Turbo,成本更低。适合大多数文本生成、对话、代码任务。是开发者最常用的版本。

Gemini Nano

端侧档。分 Nano-1(1.8B)和 Nano-2(3.25B)两个尺寸。可在 Pixel 手机本地运行,支持摘要、智能回复。

核心能力对比

  • 上下文长度:Ultra/Pro 支持 32K token,Nano 支持 4K-8K token
  • 多模态:Ultra/Pro 支持文本+图片输入;Nano 仅文本
  • 推理能力:Ultra > Pro >> Nano;Ultra 在数学、代码、逻辑推理上显著领先
  • 部署方式:Ultra/Pro 通过 API 云端调用;Nano 在设备端本地推理
  • 发布时间:Pro 和 Nano 2023.12 即可用;Ultra 2024.2 才正式开放

Gemini Pro 的技术特点

  • 原生多模态:从训练阶段就融合文本和图像理解,不是后期拼接
  • 高效推理:相比同级别模型,推理速度更快、成本更低
  • 多语言支持:支持数十种语言,中文表现良好
  • 安全对齐:经过 RLHF 和红队测试,内置安全过滤
  • 函数调用:支持 Function Calling,可集成外部工具

Gemini 1.0 的历史意义

Gemini 1.0 是 Google 在大模型竞争中的关键转折点:

  • 标志着 Google 从 PaLM 时代正式过渡到 Gemini 时代
  • Ultra 在 MMLU 上首超人类专家,证明 Google 的技术实力
  • 三档设计(Ultra/Pro/Nano)成为后续版本的标准模式
  • 原生多模态架构为后续 1.5/2.0/2.5 奠定基础
  • Bard 随后升级为 Gemini App,统一品牌

实战:调用 Gemini Pro

Python 示例

from openai import OpenAI

client = OpenAI(
    api_key="你的Key",
    base_url="https://api.example.com/v1"  # AI的那些事儿中转
)

# 调用 Gemini Pro
r = client.chat.completions.create(
    model="gemini-1.0-pro",
    messages=[
        {"role": "user", "content": "解释量子纠缠的基本原理,用通俗语言"}
    ],
    max_tokens=800
)
print(r.choices[0].message.content)

Node.js 示例

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "你的Key",
  baseURL: "https://api.example.com/v1",
});

const r = await client.chat.completions.create({
  model: "gemini-1.0-pro",
  messages: [{ role: "user", content: "写一个 Python 快速排序实现" }],
  max_tokens: 600,
});
console.log(r.choices[0].message.content);

常见问题

Gemini Pro 是什么?

Gemini Pro 是 Google Gemini 1.0 系列的均衡档模型,适合大多数文本和多模态任务。性能接近 GPT-3.5 Turbo,是开发者最常用的 Gemini 版本。

Gemini Ultra 和 Pro 有什么区别?

Ultra 是旗舰档,MMLU 90.0% 首超人类专家,适合复杂推理;Pro 是均衡档,性价比高,适合日常任务。Ultra 后来通过 Gemini Advanced 提供。

Gemini Nano 能做什么?

Nano 专为手机等移动设备设计,可本地运行。支持摘要生成、智能回复、文本补全等轻量任务,无需联网,保护隐私。

Gemini 1.0 Pro 还值得用吗?

如果追求最新能力,建议升级到 Gemini 2.5 系列。但 1.0 Pro 成本极低,对于简单任务仍然是高性价比选择。

国内直连 Gemini 全系列模型

通过 AI的那些事儿调用 Gemini Pro/Ultra 等全部版本,OpenAI 格式兼容,代码零改动。