商汤日日新是什么?商汤科技大模型平台详解
商汤日日新(SenseNova)是商汤科技于 2023 年 4 月推出的大模型平台。商汤科技在计算机视觉领域有近十年积累,日日新平台将这一优势延伸到大模型时代,在多模态理解和生成方面表现突出。平台包含语言、视觉、多模态等多个大模型,覆盖文本、图片、视频、3D 等多种模态。本文带你了解日日新的能力矩阵,以及如何通过 AI的那些事儿 调用。
阅读时长:约 6 分钟
难度:入门
含实战代码
发布: 更新:
商汤日日新的核心特点
- 计算机视觉传承:十年视觉 AI 积累,图像理解和生成能力强
- 多模态全覆盖:文本、图片、视频、3D、数字人全模态支持
- 大装置算力:自建 AI 大装置,提供强大算力基础设施
- 企业级方案:在自动驾驶、智慧城市、医疗影像等行业有成熟方案
- 多模型协同:多个专用模型协同工作,覆盖不同场景需求
日日新模型矩阵
商量 SenseChat
语言大模型。通用对话、写作、代码、推理等综合能力。
秒画
文生图模型。高质量图片生成,支持多种风格和精细控制。
如影
数字人模型。虚拟人生成和驱动,支持实时交互。
格物
多模态理解模型。图片、视频内容理解和分析。
商汤 vs 其他国产模型
商汤优势
视觉AI积累深、多模态全覆盖、大装置算力、企业级方案成熟。
通义千问优势
语言能力更强、开源生态好、阿里云集成深。
DeepSeek 优势
推理能力强、完全开源、价格极低、社区活跃。
商汤的行业应用
- 自动驾驶:感知、决策、规划全栈方案,服务多家车企
- 智慧城市:城市管理、交通优化、安防监控等场景
- 医疗影像:辅助诊断、影像分析、病理检测
- 教育:智能批改、个性化学习、虚拟教师
实战:调用商汤模型
Python 示例:通过 OpenAI 格式调用
from openai import OpenAI
client = OpenAI(
api_key="你的Key",
base_url="https://api.example.com/v1" # AI的那些事儿中转
)
# 商量 SenseChat — 语言大模型
r = client.chat.completions.create(
model="sensechat-v4",
messages=[
{"role": "user", "content": "分析计算机视觉技术在自动驾驶中的应用和挑战"}
],
max_tokens=1500
)
print(r.choices[0].message.content)
# 多模态理解
r = client.chat.completions.create(
model="sensechat-v4",
messages=[{"role": "user", "content": "解释多模态大模型如何同时理解文本和图像"}],
max_tokens=1000
)
print(r.choices[0].message.content)
Node.js 示例:流式输出
import OpenAI from "openai";
const client = new OpenAI({
apiKey: "你的Key",
baseURL: "https://api.example.com/v1",
});
const stream = await client.chat.completions.create({
model: "sensechat-v4",
messages: [{ role: "user", content: "设计一个基于视觉AI的智慧零售解决方案" }],
stream: true,
});
for await (const chunk of stream) {
process.stdout.write(chunk.choices[0]?.delta?.content || "");
}
常见问题
商汤日日新是什么?
商汤科技推出的大模型平台,包含语言、视觉、多模态等多个模型,在计算机视觉和多模态方面有深厚积累。
商汤科技的优势是什么?
计算机视觉积累深、多模态能力强、大装置算力、企业级方案成熟,在自动驾驶和智慧城市有广泛应用。
日日新包含哪些模型?
商量(语言)、秒画(文生图)、如影(数字人)、格物(多模态理解)等,覆盖多种模态。
如何调用商汤大模型 API?
通过 AI的那些事儿 使用 OpenAI 兼容格式调用,model 填 sensechat-v4 即可。
统一调用商汤模型,OpenAI 格式兼容
通过 AI的那些事儿调用商汤日日新全系列,多模态能力,代码零改动。