Gemini Pro 是什么?Ultra/Pro/Nano 三档详解
Gemini 1.0 是 Google 于 2023 年 12 月发布的首代 Gemini 大模型,采用三档设计:Ultra(旗舰)、Pro(均衡)、Nano(端侧)。其中 Gemini Ultra 在 MMLU 基准上首次超越人类专家水平(90.0%),标志着 Google 正式进入大模型竞争的第一梯队。本文详解三档模型的能力差异与调用方法。
发布: 更新:
三档模型定位
Gemini Ultra
旗舰档。MMLU 90.0% 首超人类专家。适合高复杂度推理、多模态分析、科研任务。后来通过 Gemini Advanced 提供给付费用户。
Gemini Pro
均衡档。性能接近 GPT-3.5 Turbo,成本更低。适合大多数文本生成、对话、代码任务。是开发者最常用的版本。
Gemini Nano
端侧档。分 Nano-1(1.8B)和 Nano-2(3.25B)两个尺寸。可在 Pixel 手机本地运行,支持摘要、智能回复。
核心能力对比
- 上下文长度:Ultra/Pro 支持 32K token,Nano 支持 4K-8K token
- 多模态:Ultra/Pro 支持文本+图片输入;Nano 仅文本
- 推理能力:Ultra > Pro >> Nano;Ultra 在数学、代码、逻辑推理上显著领先
- 部署方式:Ultra/Pro 通过 API 云端调用;Nano 在设备端本地推理
- 发布时间:Pro 和 Nano 2023.12 即可用;Ultra 2024.2 才正式开放
Gemini Pro 的技术特点
- 原生多模态:从训练阶段就融合文本和图像理解,不是后期拼接
- 高效推理:相比同级别模型,推理速度更快、成本更低
- 多语言支持:支持数十种语言,中文表现良好
- 安全对齐:经过 RLHF 和红队测试,内置安全过滤
- 函数调用:支持 Function Calling,可集成外部工具
Gemini 1.0 的历史意义
Gemini 1.0 是 Google 在大模型竞争中的关键转折点:
实战:调用 Gemini Pro
Python 示例
from openai import OpenAI
client = OpenAI(
api_key="你的Key",
base_url="https://api.example.com/v1" # AI的那些事儿中转
)
# 调用 Gemini Pro
r = client.chat.completions.create(
model="gemini-1.0-pro",
messages=[
{"role": "user", "content": "解释量子纠缠的基本原理,用通俗语言"}
],
max_tokens=800
)
print(r.choices[0].message.content)
Node.js 示例
import OpenAI from "openai";
const client = new OpenAI({
apiKey: "你的Key",
baseURL: "https://api.example.com/v1",
});
const r = await client.chat.completions.create({
model: "gemini-1.0-pro",
messages: [{ role: "user", content: "写一个 Python 快速排序实现" }],
max_tokens: 600,
});
console.log(r.choices[0].message.content);
常见问题
Gemini Pro 是什么?
Gemini Pro 是 Google Gemini 1.0 系列的均衡档模型,适合大多数文本和多模态任务。性能接近 GPT-3.5 Turbo,是开发者最常用的 Gemini 版本。
Gemini Ultra 和 Pro 有什么区别?
Ultra 是旗舰档,MMLU 90.0% 首超人类专家,适合复杂推理;Pro 是均衡档,性价比高,适合日常任务。Ultra 后来通过 Gemini Advanced 提供。
Gemini Nano 能做什么?
Nano 专为手机等移动设备设计,可本地运行。支持摘要生成、智能回复、文本补全等轻量任务,无需联网,保护隐私。
Gemini 1.0 Pro 还值得用吗?
如果追求最新能力,建议升级到 Gemini 2.5 系列。但 1.0 Pro 成本极低,对于简单任务仍然是高性价比选择。
国内直连 Gemini 全系列模型
通过 AI的那些事儿调用 Gemini Pro/Ultra 等全部版本,OpenAI 格式兼容,代码零改动。