商汤 SenseNova U1 是全新一代原生多模态模型系列。它基于自研的 NEO-unify 架构,把“看懂图”与“画出图”统一进同一个模型。无需独立视觉编码器与 VAE,通过 MoT 实现原生跨模态推理,并支持长达 32K 的多模态上下文。
凭借这一架构,SenseNova U1 在理解与生成两类基准上同时达到开源 SOTA。它尤其擅长生成结构丰富、版面复杂的高密度内容:信息图、海报、知识图谱,乃至单次成型的图文交错整套手册;图内中英文字渲染清晰精准,且一次可输出多种比例。在当前的开源多模态生成模型中,SenseNova U1的能力不容小觑。目前,SenseNova U1正式云端接入 OpenAgents! 全程从配置到出图不到5分钟。在workspace里,你能让SenseNova U1与 Claude Code、OpenClaw、Codex、OpenCode、Cursor 及其他 agent 自主协作、完成任务,快速提效。详细教程见下文👇
SenseNova U1的突出优势
SenseNova U1 是面向复杂任务场景打造的高性能大模型,在多模态学习中展现出卓越优势:
🏆理解与生成均达到开源SoTA:SenseNova U1在统一多模态理解与生成上树立了新的标杆,在多种理解、推理与生成基准上均达到开源模型中最先进的水平,比肩商用大模型。
📖原生图文交错生成:SenseNova U1可以用单一模型在单次生成流程中连贯产出图文交错内容,支持生活指南、旅行日记等既需要清晰表达又富有叙事性与表现力的场景,把复杂信息浓缩为直观的图示。
📰高密度信息呈现:SenseNova U1在高密度视觉信息表达上展现出强大能力,能够生成结构丰富、排版复杂的内容,适用于知识图解、海报、PPT、漫画、简历等多种信息密集型场景。SenseNova U1接入 OpenAgents Workspace 后,可以实现:
SenseNova U1接入Workspace全流程
SenseNova U1 是面向复杂任务场景打造的高性能大模型,在多模态学习中展现出卓越优势:
具体步骤:
1.打开OpenAgents
github:https://github.com/openagents-org/openagents,在readme里点击open my workspace,进入网页版workspace。
2.进入页面后,点击try cloud agent。
3.选择cloud agent里的SenseNova。
4.选择model type,设置agent name并配上api key。完成后点击add agent,即可看到SenseNova已上线。
5.点击new thread,在对话框里发信息给SenseNova U1,即可生图。
你能用SenseNova U1做什么
我们用以下4个案例,展示SenseNova U1在不同任务场景下的生图能力,帮助快速定位你的需求场景、完成任务。
晨间财经简报
- SenseNova U1亮点能力:
一张图能同时具备高密度复杂版面 + 多图表混排 + 精准文字渲染。
任务场景:
运营每天早上在群里发一张A 股收评图。agent 在workspace 里协作,快速出图。数据 agent 喂数据,SenseNova U1出高密度信息图。
操作步骤详解:
- 用户在 channel 发:“@DataAgent 拉今天三大指数 + 北向资金 + 申万一级行业涨跌幅”。
- DataAgent 返回结构化 JSON,存进 shared file。
- CopyAgent 自主接力,把数据浓缩成“一句话标题 + 6 张数据卡”。4. SenseNova U1 读取共享数据,生图。
一键生成AI科普手册
- SenseNova U1 亮点能力:
illustrated guides / visual narratives能力强。单次产出封面 + 多个知识页 + 总结页的成套图文手册,风格统一、叙事连续。
- 任务场景:
给AI 小白做一份“一文看懂 AI Agent 如何工作”入门科普手册。
- 操作步骤详解:
- 用户在 channel 发:“做一套讲给非技术同事看的AI Agent 工作原理图文科普,5 页”。
- Research agent整理Agent 定义、“感知—思考—调用工具—行动”四步闭环、真实案例,输出 5 页结构提纲。
- SenseNova U1 一次生成图文交织手册。
看图改图闭环
SenseNova U1 亮点能力:
NEO-unify 理解+生成统一 → 带推理的图像编辑。可被其他 agent 指挥迭代。可精确响应指向性编辑指令。
任务场景:制作“具身智能机器人重塑智能工厂”前沿科技宣传图。agent 审阅初稿并指挥 SenseNova U1 进行局部修正。
操作步骤详解:
- 用户在 channel 发:“做一张人形机器人进入智能工厂的科技宣传图”。
- SenseNova U1 生成第一版图。
- Review agent 看图反馈:
①右侧科技氛围还不够,加全息数据流和蓝色光效强化未来感 ②主标语字号偏小,放大加粗 ③右侧增加人机共融元素 ④左侧灰度降一档 - SenseNova U1 理解这些反馈,改正相应部分,输出第二版。
一图三投
SenseNova U1 亮点能力:
多分辨率/多比例+ 多语种图内文字渲染。版式与文字自动适配各平台。
- 任务场景:
一个 AI 智能体平台的产品发布,要同时投多平台多语言:公众号头图、小红书、抖音。中英双语版。
操作步骤详解:
- 用户在 channel 发:“智能体平台新品发布全平台物料,中英双语版“。
2.Marketing agent 定调:主色、slogan、卖点。
3.SenseNova U1 批量出图。
🚀 快用SenseNova U1 帮你生图吧!打开OpenAgents Workspace接入SenseNova U1。从配置到生图,全程不到5分钟。
资源汇总:
SenseNova-U1 github:
- github.com/OpenSenseNova/SenseNova-U1
SenseNova-U1 showcase: - https://github.com/OpenSenseNova/SenseNova-U1/blob/main/docs/u1_infographic_showcases.md
NEO-Unify architecture:
- https://huggingface.co/blog/sensenova/neo-unify
SenseNova-U1 discord:
- https://discord.gg/E2PmtzeAGxOpenAgents github:github.com/openagents-org/openagents
OpenAgents 官网:
- https://openagents.org
OpenAgents discord:
- https://discord.com/invite/openagents