为 AI Agent 时代设计一个全新的协作容器——
让 Agent 自主执行工作,让人在关键节点自然介入。
| 角色 | Design Owner · 0-1 主导 |
| 所属公司 | ByteDance · 扣子 Coze |
| 平台 | Web · App |
| 团队规模 | 15 人设计团队 |
| 类型 | 产品设计 AI 体验 设计管理 |
2025 年被视为 AI Agent 元年。AI 产品正从「回答问题」进化为「解决问题」——这不是功能迭代,而是底层交互逻辑的重构。
Coze 已有面向开发者的 Studio,但缺少一个面向泛创作者的低门槛消费端。Coze Space 需要承接这个角色:让不懂 AI 技术的用户,也能调用 Agent 完成复杂任务。
Coze Space 的核心设计命题只有一句话:
设计一个全新的容器——它既能让 Agent 自主执行工作,又能让人在关键节点自然介入。
带着这个命题,我们需要先想清楚一件事——扣子空间在 AI 产品的进化链条里,要站在哪个位置?我们在设计的是什么形态的容器?
我建立了一个分级框架,核心变量是「人和 AI 的主导权分配」,从 L0 到 L4 依次递进。
这个框架建立之后,扣子空间的定位清晰了:我们要做 L3 层级的产品。定位确定之后,用它归类竞品、拆解信息架构——这是下面要讲的。
交互模式定了之后,下一步解决信息架构——对话区和产出物区的关系怎么处理?这是 Agent 产品最核心的布局决策。
我重点拆了当时最成熟的两个 Agent 产品,分别代表不同的设计思路。
| 产品 | 核心做法 | 局限性 |
|---|---|---|
| Devin | 左右分栏:左对话、右编辑器,执行过程同时可见——当时最成熟的方案 | 右侧是 Agent 的工作台(编辑器),不是用户的产物区 |
| Manus | 执行过程可视化:用户能看到 Agent 操作浏览器,解决信任感问题 | 右侧是浏览器画面,用户想浏览最终产出物、对比、下载,体验割裂 |
两款产品的共同局限:右侧都是 Agent 的工作台,不是用户的产物区。对于通用 Agent,用户最终关心的是「给我产出了什么」,而不是「在操作什么工具」。
同样采用左右分栏,但右侧不是纯工作台,而是产物与工作过程的融合——Agent 执行时展示过程,完成后自动切换为产物浏览视图。左侧对话使用分流式设计,让不同任务之间有清晰边界。
我带领团队探索了三个视觉方向。通过对 Gemini、Firefly、OpenAI、Claude 等产品的设计语言分析,我们观察到行业正从「智能感、科技感、未来感」转向「以人为中心」。
秒级瞬间可以强烈,
小时级使用必须安静。
品牌色定义为「有温度的智能色」——从冷静的紫出发,抵达有温度的 AI。
过程透明— 1.0 到 2.0 的关键洞察
≠
把原始数据全部铺开
初始直觉:Agent ≠ Chatbot,需要打破对话框的限制;过程透明是建立信任的第一反应。于是我们设计了一个「分 Tab 工作台」,把所有执行步骤平铺展示。
但用户测试很快暴露了问题:信息密度极低,所有 action 权重相同;用户注意力分裂;Tab 切换率极低,大部分 Tab 形同虚设。
| 产品 | 做法 |
|---|---|
| Claude | 思考过程内联展示,搜索来源可折叠 |
| Gemini | 深度研究生成计划卡片,右侧面板展开详情 |
核心转变:让对话区承载完整的任务生命周期。
思考过程分层展示——默认只展示主题和关键结论,展开后才是结构化的完整过程;Agent 间的内部通信和工具参数对用户完全隐藏。
现有 AI 工具解决的是单点执行,但没有解决持续推进。我们识别出一个更大的设计机会:
| 产品 | 缺失的能力 |
|---|---|
| ChatGPT / Claude | 任务依赖用户主动拆解,Agent 是被动的 |
| Notion AI / WPS AI | 工作流断裂,跨工具无法串联 |
| Manus / Genspark | 做完就结束,没有持续推进能力 |
不是在设计一个更长的任务流程,
而是在设计一个可持续协作的系统。
探索了四种方案后,最终选择「单独分类平铺」——层级清晰、状态可透传、左栏信息节奏自然,降低新心智理解成本。
这个项目让我对「设计管理」有了更清晰的认知。三个层面的沉淀: