示例 2026-03-12 21 次浏览

Nexus Spatial: 完整代理机构发现练习

描述

结果是一份全面的、跨职能的产品计划,可以作为实际开发的基础 —— 由协同工作的AI代理机构在单个会话中生成。

文档内容

# Nexus Spatial: 完整代理机构发现练习

> **练习类型:** 多代理产品发现
> **日期:** 2026年3月5日
> **部署代理:** 8个(并行)
> **持续时间:** 约10分钟实际时间
> **目的:** 演示从机会识别到全面规划的完整代理机构编排

---

## 目录

1. [机会](#1-机会)
2. [市场验证](#2-市场验证)
3. [技术架构](#3-技术架构)
4. [品牌策略](#4-品牌策略)
5. [市场进入与增长](#5-市场进入与增长)
6. [客户支持蓝图](#6-客户支持蓝图)
7. [UX研究与设计方向](#7-ux研究与设计方向)
8. [项目执行计划](#8-项目执行计划)
9. [空间界面架构](#9-空间界面架构)
10. [跨代理综合](#10-跨代理综合)

---

## 1. 机会

### 如何发现

通过多个来源的网络研究确定了三个趋同趋势:

- **AI基础设施/编排**是增长最快的软件类别(AI编排市场2026年估值约135亿美元,复合年增长率22%+)
- **空间计算**(Vision Pro、WebXR)正在成熟但缺乏杀手级企业应用
- 现有的每个AI工作流工具(LangSmith、n8n、Flowise、CrewAI)都是**平面2D仪表板**

### 概念:Nexus Spatial

空间计算中的AI代理指挥中心——一个VisionOS + WebXR应用程序,为编排、监控和与AI代理交互提供沉浸式3D指挥中心。用户将代理管道可视化为3D节点图,在空间面板中监控实时输出,在3D空间中通过拖放构建工作流,并在共享空间环境中协作。

### 为什么这家代理机构具有独特优势

该代理机构拥有深厚的空间计算专业知识(XR开发者、VisionOS工程师、Metal专家、界面架构师),同时拥有完整的工程、设计、营销和运营技术栈——对于既需要空间计算精通又需要企业软件严谨性的产品来说,这是一个罕见的组合。

### 来源

- [2026年盈利SaaS创意(27.3万+评论)](https://bigideasdb.com/profitable-saas-micro-saas-ideas-2026)
- [2026年SaaS和AI革命:20大趋势](https://fungies.io/the-2026-saas-and-ai-revolution-20-top-trends/)
- [2026年21个服务不足的市场](https://mktclarity.com/blogs/news/list-underserved-niches)
- [2026年增长最快的产品 - G2](https://www.g2.com/best-software-companies/fastest-growing)
- [普华永道2026年AI商业预测](https://www.pwc.com/us/en/tech-effect/ai-analytics/ai-predictions.html)

---

## 2. 市场验证

**代理:** 产品趋势研究员

### 结论:有条件进行 —— 2D优先,空间其次

### 市场规模

| 细分市场 | 2026年价值 | 增长率 |
|---------|-----------|--------|
| AI编排工具 | 135亿美元 | 22.3%复合年增长率 |
| 自主AI代理 | 85亿美元 | 45.8%复合年增长率,2030年达503亿美元 |
| 扩展现实 | 106.4亿美元 | 40.95%复合年增长率 |
| 空间计算(广义) | 1700-2200亿美元 | 因定义而异 |

### 竞争格局

**AI代理编排(均为2D):**

| 工具 | 优势 | UX差距 |
|------|----------|--------|
| LangChain/LangSmith | 基于图的编排,39美元/用户/月 | 平面仪表板;复杂图表大规模时难以阅读 |
| CrewAI | 10万+开发者,快速执行 | CLI优先,视觉工具极少 |
| Microsoft代理框架 | 企业集成 | 嵌入Azure门户,无独立UI |
| n8n | 可视化工作流构建器,20-50美元/月 | 2D画布难以处理代理关系 |
| Flowise | 拖放AI流程 | 限于线性流程,无多代理监控 |

**"任务控制"产品(新兴,均为2D):**
- cmd-deck:AI编码代理的看板
- Supervity代理指挥中心:企业可观察性
- OpenClaw指挥中心:代理集群管理
- Mission Control AI:合成工作者管理
- Mission Control HQ:基于小队的协调

**差距:** 产品要么是空间但不专注AI,要么专注AI但是平面2D。没有产品处于交叉点。

### Vision Pro现实检验

- 装机量:全球约100万台(销量较发布时下降95%)
- Apple已将重点转移到轻量级AR眼镜
- 仅存在约3000个VisionOS专用应用
- **启示:** 不要以VisionOS为首。先做Web,添加WebXR,原生VisionOS最后。

### WebXR作为分发解锁

- Safari在2025年底采用了WebXR设备API
- 2026年WebXR采用率增长40%
- WebGPU在浏览器中提供接近原生的渲染
- Android XR支持WebXR和OpenXR标准

### 目标画像和定价

| 层级 | 价格 | 目标 |
|------|-------|--------|
| 探索者 | 免费 | 开发者、独立构建者(3个代理,WebXR查看器) |
| 专业版 | 99美元/用户/月 | 小团队(25个代理,协作) |
| 团队版 | 249美元/用户/月 | 中型市场AI团队(无限代理,分析) |
| 企业版 | 定制(2K-10K/月) | 大型企业(SSO、RBAC、本地部署、SLA) |

### 推荐的分阶段策略

1. **第1-6个月:** 构建具有Three.js 2.5D功能的高级2D Web仪表板。目标:50个付费团队,6万美元月经常性收入。
2. **第6-12个月:** 添加可选的WebXR空间模式(基于浏览器)。目标:200个团队,30万美元月经常性收入。
3. **第12-18个月:** 仅在空间需求得到验证时才开发原生VisionOS应用。目标:500个团队,100万美元+月经常性收入。

### 关键风险

| 风险 | 严重程度 |
|------|----------|
| Vision Pro装机量极小 | 高 |
| "空间解决方案寻找问题"——3D实际上比2D好10倍吗? | 高 |
| 拥挤的"任务控制"定位(已有5+产品) | 中等 |
| 企业空间计算采用仍处于早期阶段 | 中等 |
| 跨AI框架的集成复杂性 | 中等 |

### 来源

- [MarketsandMarkets - AI编排市场](https://www.marketsandmarkets.com/Market-Reports/ai-orchestration-market-148121911.html)
- [德勤 - 2026年AI代理编排预测](https://www.deloitte.com/us/en/insights/industry/technology/technology-media-and-telecom-predictions/2026/ai-agent-orchestration.html)
- [Mordor Intelligence - 扩展现实市场](https://www.mordorintelligence.com/industry-reports/extended-reality-xr-market)
- [Fintool - Vision Pro停产](https://fintool.com/news/apple-vision-pro-production-halt)
- [MadXR - 2026年基于浏览器的WebXR体验](https://www.madxr.io/webxr-browser-immersive-experiences-2026.html)

---

## 3. 技术架构

**代理:** 后端架构师

### 系统概述

8服务架构,具有清晰的职责边界,专为水平扩展和供应商无关的AI集成而设计。

```
+------------------------------------------------------------------+
|                     客户端层                                       |
|  VisionOS原生 (Swift/RealityKit)  |  WebXR (React Three Fiber)    |
+------------------------------------------------------------------+
                              |
+-----------------------------v------------------------------------+
|                      API网关 (Kong / AWS API GW)                  |
|  速率限制 | JWT验证 | WebSocket升级 | TLS                         |
+------------------------------------------------------------------+
                              |
+------------------------------------------------------------------+
|                      服务层                                       |
|  认证 | 工作区 | 工作流 | 编排 (Rust) |                            |
|  协作 (Yjs CRDT) | 流式传输 (WS) | 插件 | 计费                      |
+------------------------------------------------------------------+
                              |
+------------------------------------------------------------------+
|                      数据层                                       |
|  PostgreSQL 16 | Redis 7集群 | S3 | ClickHouse | NATS             |
+------------------------------------------------------------------+
                              |
+------------------------------------------------------------------+
|                    AI供应商层                                      |
|  OpenAI | Anthropic | Google | 本地模型 | 自定义插件                  |
+------------------------------------------------------------------+
```

### 技术栈

| 组件 | 技术 | 理由 |
|-----------|------------|-----------|
| 编排引擎 | **Rust** | 亚毫秒调度、零GC暂停、代理沙箱的内存安全 |
| API服务 | TypeScript / NestJS | CRUD密集型服务的开发者效率 |
| VisionOS客户端 | Swift 6, SwiftUI, RealityKit | 具有Liquid Glass的一流空间计算 |
| WebXR客户端 | TypeScript, React Three Fiber | 具有React组件模型的生产级WebXR |
| 消息代理 | NATS JetStream | 轻量级、精确一次交付、比Kafka简单 |
| 协作 | Yjs (CRDT) + WebRTC | 无冲突的并发3D图编辑 |
| 主数据库 | PostgreSQL 16 | 灵活配置的JSONB、租户隔离的行级安全 |

### 核心数据模型

14个表涵盖:
- **身份与访问:** users、workspaces、team_memberships、api_keys
- **工作流:** workflows、workflow_versions、nodes、edges
- **执行:** executions、execution_steps、step_output_chunks
- **协作:** collaboration_sessions、session_participants
- **凭证:** provider_credentials(AES-256-GCM加密)
- **计费:** subscriptions、usage_records
- **审计:** audit_log(仅追加)

### 节点类型注册表

```
内置节点类型:
  ai_agent          -- 使用提示调用AI提供商
  prompt_template   -- 使用变量渲染模板
  conditional       -- 基于表达式路由
  transform         -- 沙箱代码片段 (JS/Python)
  input / output    -- 工作流入口/出口点
  human_review      -- 暂停等待人工审批
  loop              -- 重复子图
  parallel_split    -- 分发到分支
  parallel_join     -- 等待分支完成
  webhook_trigger   -- 外部HTTP触发器
  delay             -- 定时暂停
```

### WebSocket通道

通过WSS进行实时流式传输:
- 每通道序列号用于排序
- 间隙检测与重放请求
- 落后超过1000个事件时进行快照恢复
- 客户端节流用于低功耗设备

### 安全架构

| 层 | 机制 |
|-------|-----------|
| 用户认证 | OAuth 2.0(GitHub、Google、Apple)+ 邮箱/密码 + 可选TOTP MFA |
| API密钥 | SHA-256哈希、作用域、可选过期 |
| 服务间 | 通过服务网格的mTLS |
| WebSocket认证 | 30秒过期的一次性票据 |
| 凭证存储 | 信封加密(AES-256-GCM + AWS KMS) |
| 代码沙箱 | gVisor/Firecracker微VM(无网络、256MB RAM、30秒CPU) |
| 租户隔离 | PostgreSQL行级安全 + S3 IAM策略 + NATS主题作用域 |

### 扩展目标

| 指标 | 第1年 | 第2年 |
|--------|--------|--------|
| 并发代理执行 | 5,000 | 50,000 |
| WebSocket连接 | 10,000 | 100,000 |
| P95 API延迟 | < 150毫秒 | < 100毫秒 |
| P95 WS事件延迟 | < 80毫秒 | < 50毫秒 |

### MVP阶段

1. **第1-6周:** 2D Web编辑器、顺序执行、OpenAI + Anthropic适配器
2. **第7-12周:** WebXR 3D模式、并行执行、手部追踪、RBAC
3. **第13-20周:** 多用户协作、VisionOS原生、计费
4. **第21-30周:** 企业SSO、插件SDK、SOC 2、规模强化

---

## 4. 品牌策略

**代理:** 品牌守护者

### 定位

**品类创造优于品类竞争。** Nexus Spatial定义了一个新类别——**空间AI运营(SpatialAIOps)**——而不是在拥挤的AI可观察性仪表板空间中争夺位置。

**定位陈述:** 对于管理复杂AI代理工作流的技术团队,Nexus Spatial是沉浸式3D指挥中心,提供代理编排的空间感知,不同于平面2D仪表板,因为空间计算将监控从阅读仪表板转变为身临其境于您的基础设施。

### 名称验证

"Nexus Spatial"已**验证为强有力:**
- "Nexus"连接到NEXUS编排框架(专家网络,策略统一)
- "Nexus"独立意思是"中心连接点"——非常适合指挥中心
- "Spatial"是Apple和行业已标准化的行业描述符
- 语音平衡:三个音节,然后两个
- **需要行动:** 在尼斯分类第9、42和38类中进行商标清查

### 品牌个性:指挥官

| 特质 | 表达 | 避免 |
|-------|------------|--------|
| **权威** | 清晰、直接、技术上精确 | 炒作、最高级、模糊的未来主义 |
| **沉稳** | 简洁的设计、有节制的节奏、留白 | 为紧迫而紧迫、混乱 |
| **开拓** | 低调的骄傲、对新范式的不夸张引用 | "革命性"、"改变游戏规则" |
| **精确** | 确切的规格、真实的指标、诚实的要求 | 模糊的声明、营销流行语 |
| **平易近人** | 自然的交互语言、空间隐喻 | 屈尊俯就、门槛设限 |

### 标语(排名)

1. **"代理时代的任务控制"** —— 推荐首选
2. "在空间中看到您的代理"
3. "在三个维度中编排"
4. "AI运营变得空间化"
5. "指挥中心。在空间中重新构想。"
6. "您的仪表板缺失的维度"
7. "AI代理值得比平面屏幕更多"

### 色彩系统

| 颜色 | 十六进制 | 用途 |
|-------|-----|-------|
| 深空靛蓝 | `#1B1F3B` | 基础深色画布、背景 |
| Nexus蓝 | `#4A7BF7` | 签名品牌、主要操作 |
| 信号青 | `#00D4FF` | 空间高亮、数据连接 |
| 命令绿 | `#00E676` | 健康系统、成功 |
| 警告琥珀 | `#FFB300` | 警告、需要关注 |
| 关键红 | `#FF3D71` | 错误、失败 |

使用比例:深空靛蓝60%、Nexus蓝25%、信号青10%、语义5%。

### 字体

- **主要:** Inter(UI、正文、标签)
- **等宽:** JetBrains Mono(代码、日志、代理输出)
- **展示:** Space Grotesk(仅营销标题)

### Logo概念

三个探索方向:

1. **空间Nexus标志** —— 汇聚线在发光的中心节点相遇,带有微妙的透视深度
2. **维度窗口** —— 风格化的视口,带有透视线创造出看向3D空间的效果
3. **轨道阵列** —— 围绕中心点的轨道环,暗示运动中的协调代理

### 品牌价值观

- **空间真实性** —— 系统状态的诚实表示,无表面平滑
- **运营严肃性** —— 为生产而建,非演示
- **维度慷慨** —— WebXR确保空间价值对每个人都可访问
- **复杂中的从容** —— 系统越复杂,界面越平静

### 设计令牌

```css
:root {
  --nxs-deep-space:       #1B1F3B;
  --nxs-blue:             #4A7BF7;
  --nxs-cyan:             #00D4FF;
  --nxs-green:            #00E676;
  --nxs-amber:            #FFB300;
  --nxs-red:              #FF3D71;
  --nxs-void:             #0A0E1A;
  --nxs-slate-900:        #141829;
  --nxs-slate-700:        #2A2F45;
  --nxs-slate-500:        #4A5068;
  --nxs-slate-300:        #8B92A8;
  --nxs-slate-100:        #C8CCE0;
  --nxs-cloud:            #E8EBF5;
  --nxs-white:            #F8F9FC;
  --nxs-font-primary:     'Inter', sans-serif;
  --nxs-font-mono:        'JetBrains Mono', monospace;
  --nxs-font-display:     'Space Grotesk', sans-serif;
}
```

---

## 5. 市场进入与增长

**代理:** 增长黑客

### 北极星指标

**每周活跃管道(WAP)** —— 过去7天内至少有一次空间交互的唯一代理管道。捕获创建和参与,与价值相关,不可游戏化。

### 定价

| 层级 | 年付 | 月付 | 目标 |
|------|--------|---------|--------|
| 探索者 | 免费 | 免费 | 3个管道,WebXR预览,社区 |
| 专业版 | 29美元/用户/月 | 39美元/用户/月 | 无限管道,VisionOS,30天历史 |
| 团队版 | 59美元/用户/月 | 79美元/用户/月 | 协作,RBAC,SSO,90天历史 |
| 企业版 | 定制(约150美元+) | 定制 | 专用基础设施,SLA,本地选项 |

策略:14天反向试用(专业版功能,然后降级到免费)。目标5-8%免费到付费转化。

### 3阶段GTM

**第1阶段:创始人主导销售(第1-3个月)**
- 目标:使用LangChain/CrewAI并拥有Vision Pro的初创公司个人AI工程师
- 战术:私信200位高知名度AI工程师,每周公开构建帖子,30秒演示片段
- 渠道:X/Twitter、LinkedIn、AI专注的Discord服务器、Reddit

**第2阶段:开发者社区(第4-6个月)**
- Product Hunt发布(为此阶段计时,非第1阶段)
- Hacker News Show HN、Dev.to文章、会议演讲
- 与流行AI框架的集成公告

**第3阶段:企业(第7-12个月)**
- Apple企业推荐管道、LinkedIn ABM活动
- 企业案例研究、分析师简报(Gartner、Forrester)
- 首位企业AE招聘、SOC 2合规

### 增长循环

1. **"惊叹因素"演示循环** —— 空间演示本质上易于分享。一键"分享空间预览"生成WebXR链接或视频。目标K = 0.3-0.5。
2. **模板市场** —— 高级用户发布管道模板,通过搜索可发现,推动新注册。
3. **协作席位扩展** —— 一位工程师采用,与队友分享,团队扩展到付费计划(Slack/Figma剧本)。
4. **集成驱动发现** —— LangChain、n8n、OpenAI/Anthropic合作伙伴目录中的列表。

### 开源策略

**开源(Apache 2.0):**
- `nexus-spatial-sdk` —— 用于连接代理框架的TypeScript/Python SDK
- `nexus-webxr-components` —— 用于3D管道的React Three Fiber组件库
- `nexus-agent-schemas` —— 在3D中表示代理管道的标准化模式

**保持专有:** VisionOS原生应用、协作引擎、企业功能、托管基础设施。

### 收入目标

| 指标 | 第6个月 | 第12个月 |
|--------|---------|----------|
| 月经常性收入 | 8K-15K美元 | 50K-80K美元 |
| 免费账户 | 5,000 | 15,000 |
| 付费席位 | 300 | 1,200 |
| Discord成员 | 2,000 | 5,000 |
| GitHub星标(SDK) | 500 | 2,000 |

### 首个5万美元预算

| 类别 | 金额 | % |
|----------|--------|---|
| 内容制作 | 12,000美元 | 24% |
| 开发者关系 | 10,000美元 | 20% |
| 付费获客测试 | 8,000美元 | 16% |
| 社区与工具 | 5,000美元 | 10% |
| Product Hunt与发布 | 3,000美元 | 6% |
| 开源维护 | 3,000美元 | 6% |
| PR与外联 | 4,000美元 | 8% |
| 合作伙伴 | 2,000美元 | 4% |
| 储备 | 3,000美元 | 6% |

### 关键合作伙伴

- **第1层(关键):** Anthropic、OpenAI —— 一流API集成、合作伙伴计划列表
- **第2层(采用):** LangChain、CrewAI、n8n —— 框架集成、社区交叉传播
- **第3层(平台):** Apple —— Vision Pro开发者套件、App Store推荐、WWDC
- **第4层(生态):** GitHub、Hugging Face、Docker —— 开发者平台集成

### 来源

- [AI编排市场规模 - MarketsandMarkets](https://www.marketsandmarkets.com/Market-Reports/ai-orchestration-market-148121911.html)
- [空间计算市场 - Precedence Research](https://www.precedenceresearch.com/spatial-computing-market)
- [如何为AI产品定价 - Aakash Gupta](https://www.news.aakashg.com/p/how-to-price-ai-products)
- [2026年Product Hunt发布指南](https://calmops.com/indie-hackers/product-hunt-launch-guide/)

---

## 6. 客户支持蓝图

**代理:** 支持响应者

### 支持层级结构

| 属性 | 探索者(免费) | 构建者(专业版) | 命令(企业版) |
|-----------|-----------------|---------------|---------------------|
| 首次响应SLA | 尽力而为(48小时) | 4小时(工作时间) | 30分钟(P1),2小时(P2) |
| 解决SLA | 5个工作日 | 24小时(P1/P2),72小时(P3) | 4小时(P1),12小时(P2) |
| 渠道 | 社区、知识库、AI助手 | + 实时聊天、邮件、视频(2次/月) | + 专用Slack、指定CSE、24/7 |
| 范围 | 一般问题、文档 | 技术故障排除、集成 | 完整集成、自定义设计、合规 |

### 优先级定义

- **P1严重:** 编排宕机、数据丢失风险、安全漏洞
- **P2高:** 主要功能降级、存在变通方法
- **P3中:** 非阻塞问题、小故障
- **P4低:** 功能请求、外观问题

### Nexus指南:产品内AI驱动支持

突出的设计决策:支持代理作为可见节点**存在于用户的空间工作区内**。它完全了解用户的布局、活动代理和最近的错误。

**能力:**
- 关于功能的自然语言问答
- 实时代理诊断("为什么代理X很慢?")
- 配置建议("您的拓扑结构作为网格性能会更好")
- 引导式空间故障排除演练
- 自动附加上下文的工单创建

**自愈:**

| 场景 | 检测 | 自动解决 |
|----------|-----------|-----------------|
| 代理无限循环 | CPU/令牌激增 | 使用上次良好配置杀死并重启 |
| 渲染帧率下降 | FPS低于阈值 | 降低视觉保真度,建议关闭面板 |
| 凭证过期 | API 401响应 | 提示重新认证,优雅暂停代理 |
| 通信超时 | 延迟激增 | 通过备用路径重新路由消息 |

### 入门流程

基于用户画像的自适应入门:

| AI经验 | 空间经验 | 路径 |
|---------------|-------------------|------|
| 低 | 低 | 完整导览(20分钟) |
| 高 | 低 | 空间聚焦(12分钟) |
| 低 | 高 | 代理聚焦(12分钟) |
| 高 | 高 | 快速设置(5分钟) |

关键第一步:在任何产品交互之前进行60秒空间校准(手部追踪、注视、舒适度检查)。

**激活里程碑**(用户"入门"时完成):
- 创建至少一个自定义代理
- 在拓扑中连接两个或更多代理
- 锚定至少一个监控仪表板
- 返回进行第三次会话

### 团队建设

| 阶段 | 人数 | 角色 |
|-------|-----------|-------|
| 第0-6个月 | 4 | CX负责人、2名支持工程师、技术作家 |
| 第6-12个月 | 8 | + 2名支持工程师、CSE、社区经理、运营分析师 |
| 第12-24个月 | 16 | + 4名工程师(24/7)、空间专家、集成专家、知识库经理、工程经理 |

### 社区:Discord优先

```
NEXUS SPATIAL DISCORD
  信息:#公告、#更新日志、#状态
  支持:#帮助-入门、#帮助-代理、#帮助-空间
  讨论:#综合、#展示-工作区、#功能请求
  平台:#visionos、#webxr、#api和sdk
  活动:office-hours(每周语音)、community-demos(每月)
  专业版成员:#专业休息室、#测试版测试
  企业版:按客户的私人频道
```

**冠军计划("Nexus领航员"):** 5-10位初始高级用户,拥有领航员徽章、与产品团队的直接Slack、免费专业版层级、早期功能访问和年度峰会。

---

## 7. UX研究与设计方向

**代理:** UX研究员

### 用户画像

**Maya Chen —— AI平台工程师(32岁,旧金山)**
- 管理15-30个活跃代理工作流,使用n8n + LangSmith
- 花40%的时间通过日志检查调试代理失败
- 对空间计算持怀疑态度:"这真的更快,还是只是更酷?"
- 主要需求:将平均诊断时间从45分钟减少到10分钟以下

**David Okoro —— 技术产品经理(38岁,伦敦)**
- 审查和批准代理工作流设计,向C级高管展示
- 无法有意义地参与工作流审查,因为工具需要代码级理解
- 主要需求:无需阅读代码即可理解和传达代理架构

**Dr. Amara Osei —— 研究科学家(45岁,苏黎世)**
- 设计具有A/B比较的多代理研究工作流
- 有12个相同管道的变体,没有好的比较方法
- 主要需求:在3D空间中并排比较变体管道

**Jordan Rivera —— 创意技术专家(27岁,奥斯汀)**
- Vision Pro日常用户,构建AI驱动的艺术装置
- 想要感觉像乐器而非仪表板的工具
- 主要需求:通过即时空间反馈快速构建代理工作流

### 关键发现:调试是杀手级用例

运行时跟踪在工作流结构上的空间覆盖解决了一个真正的、量化的痛点,没有2D工具能很好地处理。这个工作流应该获得最多的设计和工程投资。

### 关键设计洞察

空间为**结构性**任务(放置、连接、重新排列节点)增加价值,但为**参数**任务(文本输入、配置)制造摩擦。界面必须无缝融合空间和2D模式 —— 锚定到空间位置的2D面板。

### 7项设计原则

1. **空间赢得其位置** —— 如果2D更清晰,使用2D。每次审查都应该问:"这做成平面会更好吗?"
2. **可扫视优于可检查** —— 通过颜色、大小、运动、位置在2秒内感知关键信息
3. **免手是基准** —— 注视+语音覆盖所有阅读/导航操作;手增加精度但非必需
4. **尊重认知重力** —— 扩展2D心智模型(从左到右流动),不要替换它们;z轴增加分层
5. **渐进式空间复杂性** —— 新用户几乎从2D开始;空间能力随信心增长而揭示
6. **物理隐喻,数字能力** —— 节点被"拾起"(物理)但也被复制和版本化(数字)
7. **沉默是功能** —— 健康系统感觉平静;颜色和运动表示偏离正常

### 导航范式:4级语义缩放

| 级别 | 您看到的 |
|-------|-------------|
| 集群视图 | 所有工作流作为抽象形状,按状态颜色编码 |
| 工作流视图 | 带有标签和连接的节点图 |
| 节点视图 | 展开的配置、最近I/O、状态指标 |
| 跟踪视图 | 带有数据检查的完整执行跟踪 |

### 竞争UX摘要

| 能力 | n8n | Flowise | LangSmith | Langflow | Nexus Spatial目标 |
|-----------|-----|---------|-----------|----------|---------------------|
| 可视化工作流构建 | A | B+ | N/A | A | A+(空间) |
| 调试/跟踪 | C+ | C | A | B | A+(空间覆盖) |
| 监控 | B | C | A | B | A(空间集群) |
| 协作 | D | D | C | D | A(空间共存) |
| 大型工作流可扩展性 | C | C | B | C | A(3D空间) |

### 无障碍要求

- 每个交互至少可通过两种模态完成
- 不仅通过颜色传达信息
- 高对比度模式、减少运动模式、深度扁平化模式
- 具有空间元素描述的屏幕阅读器兼容性
- 每20-30分钟的会话长度警告
- 所有核心任务可坐姿、单手、在30度运动锥内完成

### 研究计划(16周)

| 阶段 | 周数 | 研究 |
|-------|-------|---------|
| 基础 | 1-4 | 心智模型访谈(15-20名参与者)、竞争任务分析 |
| 概念验证 | 5-8 | 绿野仙踪式空间原型测试、IA的3D卡片分类 |
| 可用性测试 | 9-14 | 首次使用体验(20名用户)、4周纵向日记研究、配对协作测试 |
| 无障碍审计 | 12-16 | 专家启发式评估、与残障用户的测试 |

---

## 8. 项目执行计划

**代理:** 项目牧羊人

### 时间表:35周(2026年3月9日 - 11月6日)

| 阶段 | 周数 | 持续时间 | 目标 |
|-------|-------|----------|------|
| 发现与研究 | W1-3 | 3周 | 验证可行性、定义范围 |
| 基础 | W4-9 | 6周 | 核心基础设施、两个平台外壳、设计系统 |
| MVP构建 | W10-19 | 10周 | 具有编排的单用户代理指挥中心 |
| 测试版 | W20-27 | 8周 | 协作、打磨、加固、50-100名测试用户 |
| 发布 | W28-31 | 4周 | App Store + Web发布、营销推送 |
| 规模化 | W32-35+ | 持续 | 插件市场、高级功能、增长 |

### 关键里程碑:第12周(5月29日)

**首次端到端工作流执行。** 用户在3D中创建并运行3节点代理工作流。这是产品证明其核心价值主张的时刻。如果这延误,所有下游都会延迟。

### 前6个冲刺(65个工单)

**冲刺1(3月9-20日):** VisionOS SDK审计、WebXR兼容性矩阵、编排引擎可行性、利益相关者访谈、两个平台的一次性原型。

**冲刺2(3月23日 - 4月3日):** 架构决策记录、MoSCoW的MVP范围锁定、PRD v1.0、空间UI模式研究、交互模型定义、设计系统启动。

**冲刺3(4月6-17日):** Monorepo设置、认证服务(OAuth2)、数据库模式、API网关、VisionOS Xcode项目初始化、WebXR项目初始化、CI/CD管道。

**冲刺4(4月20日 - 5月1日):** WebSocket服务器 + 客户端SDK、空间窗口管理、3D组件库、手部追踪输入层、团队CRUD、集成测试。

**冲刺5(5月4-15日):** 编排引擎核心(Rust)、代理状态机、节点图渲染器(两个平台)、插件接口v0、OpenAI提供商插件。

**冲刺6(5月18-29日):** 工作流持久化 + 版本控制、DAG执行、实时执行可视化、Anthropic提供商插件、眼动追踪集成、空间音频。

### 团队分配

5个小队跨阶段运作:

| 小队 | 核心成员 | 活跃阶段 |
|-------|-------------|---------------|
| 核心架构 | 后端架构师、XR界面架构师、高级开发者、VisionOS工程师 | 发现到MVP |
| 空间体验 | XR沉浸式开发者、XR座舱专家、Metal工程师、UX架构师、UI设计师 | 基础到测试版 |
| 编排 | AI工程师、后端架构师、高级开发者、API测试员 | MVP到测试版 |
| 平台交付 | 前端开发者、移动应用构建者、VisionOS工程师、DevOps | MVP到发布 |
| 发布 | 增长黑客、内容创作者、应用商店优化师、视觉故事讲述者、品牌守护者 | 测试版到规模化 |

### 前5大风险

| 风险 | 概率 | 影响 | 缓解 |
|------|------------|--------|------------|
| Apple拒绝VisionOS应用 | 中 | 严重 | 第4周接触Apple开发者关系,第20周前预审 |
| WebXR浏览器碎片化 | 高 | 高 | 第1周浏览器支持矩阵,自动化跨浏览器测试 |
| 多用户同步冲突 | 中 | 高 | 从一开始就使用基于CRDT的同步(Yjs),在基础阶段原型 |
| 编排无法扩展 | 中 | 严重 | 从第一天开始水平扩展,第22周在10倍负载下测试 |
| RealityKit对100+节点的性能 | 中 | 高 | 早期性能分析、实现LOD剔除、实例化渲染 |

### 预算:121,500美元 - 155,500美元(非人员)

| 类别 | 预估成本 |
|----------|---------------|
| 云基础设施(35周) | 35,000 - 45,000美元 |
| 硬件(3台Vision Pro、2台Quest 3、Mac Studio) | 17,500美元 |
| 许可证和服务 | 15,000 - 20,000美元 |
| 外部服务(法律、安全、PR) | 30,000 - 45,000美元 |
| AI API成本(开发/测试) | 8,000美元 |
| 应急储备(15%) | 16,000 - 20,000美元 |

---

## 9. 空间界面架构

**代理:** XR界面架构师

### 指挥剧院

工作区组织为围绕用户的弯曲剧院:

```
                         概览天篷
                      (管道拓扑)
                     ~~~~~~~~~~~~~~~~~~~~~~~~
                    /                        \
                   /     焦点弧 (120度)         \
                  /    主要节点图工作             \
                 /________________________________\
                |                                  |
     左侧       |        用户位置                   |       右侧
     实用       |        (原点 0,0,0)              |       实用
     轨道       |                                  |       轨道
                |__________________________________|
                 \                                /
                  \      架子 (视线以下)          /
                   \   代理状态,快速工具         /
                    \_________________________ /
```

- **焦点弧**(120度,1.2-2.0米):主要节点图工作区
- **概览天篷**(上方,2.5-4.0米):小型管道拓扑 + 健康热图
- **实用轨道**(左/右侧面):代理库、监控、日志
- **架子**(视线以下,0.8-1.0米):运行/停止、撤销/重做、快速工具

### 三层深度系统

| 层 | 深度 | 内容 | 不透明度 |
|-------|-------|---------|---------|
| 前景 | 0.8 - 1.2米 | 活动面板、检查器、模态 | 100% |
| 中景 | 1.2 - 2.5米 | 节点图、连接、工作区 | 100% |
| 背景 | 2.5 - 5.0米 | 概览地图、环境状态 | 40-70% |

### 3D中的节点图

**数据流向用户流动。** 节点按执行顺序沿z轴排列:

```
用户(这里)
   z=0.0米   [输出节点]     -- 结果
   z=0.3米   [转换节点]  -- 处理器
   z=0.6米   [代理节点]      -- LLM调用
   z=0.9米   [检索节点]  -- RAG、API
   z=1.2米   [输入节点]      -- 触发器
```

并行分支水平展开(x轴)。条件分支垂直展开(y轴)。

**节点表示(3个LOD):**
- **LOD-0**(静止,>1.5米):12x8厘米磨砂玻璃矩形,带有类型图标、名称、状态发光
- **LOD-1**(悬停,400毫秒注视):展开到14x10厘米,显示端口、最近运行信息
- **LOD-2**(选中):滑到前景,展开到30x40厘米详情面板,可实时编辑配置

**连接作为发光管道:**
- 静止时4毫米直径,传输数据时8毫米
- 按数据类型颜色编码(白色=文本,青色=结构化,品红=图像,琥珀色=音频,绿色=工具调用)
- 动画粒子显示流动方向和速度
- 当>3个在同层之间并行运行时自动捆绑

### 7种代理状态

| 状态 | 边缘发光 | 内部 | 声音 | 粒子 |
|-------|-----------|----------|-------|-----------|
| 空闲 | 稳定绿色,低 | 静态磨砂玻璃 | 无 | 无 |
| 排队 | 脉动琥珀色,1Hz | 微弱旋转 | 无 | 输入处缓慢漂移 |
| 运行中 | 稳定蓝色,中等 | 动画微光 | 柔和空间嗡嗡声 | 连接上快速流动 |
| 流式传输 | 蓝色 + 输出流 | 微光 + 文本片段 | 嗡嗡声 | 文本片段向前流动 |
| 已完成 | 闪白,然后绿 | 静态 | 完成提示音 | 无 |
| 错误 | 脉动红色,2Hz | 红色调 | 警报音(一次) | 无 |
| 已暂停 | 稳定琥珀色 | 冻结帧 + 暂停图标 | 无 | 原地冻结 |

### 交互模型

| 动作 | VisionOS | WebXR控制器 | 语音 |
|--------|----------|-------------------|-------|
| 选择节点 | 注视 + 捏合 | 指向射线 + 触发器 | "选择[名称]" |
| 移动节点 | 捏合 + 拖动 | 握住 + 移动 | -- |
| 连接端口 | 捏合端口 + 拖动 | 触发器端口 + 拖动 | "将[A]连接到[B]" |
| 平移工作区 | 双手拖动 | 摇杆 | "向左/右平移" |
| 缩放 | 双手展开/捏合 | 摇杆推/拉 | "放大/缩小" |
| 检查节点 | 捏合 + 向自己拉 | 双击触发器 | "检查[名称]" |
| 运行管道 | 点击架子按钮 | 触发器按钮 | "运行管道" |
| 撤销 | 双指双击 | B按钮 | "撤销" |

### 协作存在

每个协作者表示为:
- **头部代理:** 带有头像图片的半透明球体,随头部方向旋转
- **手部代理:** 显示捏合/抓取状态的幽灵手模型
- **注视锥:** 显示他们正在看哪里的微妙10度锥体
- **名称标签:** 广告牌渲染,显示当前动作("编辑节点X")

**冲突解决:** 第一个编辑者获得写锁;第二个看到"被[名称]锁定",可选择请求访问或复制节点。

### 自适应布局

| 环境 | 节点比例 | 最大LOD-2节点 | 图Z展开 |
|-------------|-----------|-----------------|----------------|
| VisionOS窗口 | 4x3厘米 | 5 | 0.05米/层 |
| VisionOS沉浸式 | 12x8厘米 | 15 | 0.3米/层 |
| WebXR桌面 | 120x80像素 | 8(覆盖层) | 透视投影 |
| WebXR沉浸式 | 12x8厘米 | 12 | 0.3米/层 |

### 过渡编排

所有过渡服务于寻路。主要过渡最多600毫秒,次要200毫秒,选择0毫秒。

| 过渡 | 持续时间 | 关键运动 |
|-----------|----------|------------|
| 概览到焦点 | 600毫秒 | 相机漂移到目标,其他区域淡出到30% |
| 焦点到详情 | 500毫秒 | 节点向前滑动,展开,连接高亮 |
| 详情到概览 | 600毫秒 | 面板折叠,节点后退,完整拓扑可见 |
| 区域切换 | 500毫秒 | 当前横向滑出,新区域滑入 |
| 窗口到沉浸式 | 1000毫秒 | 边框溶解,节点展开到完整空间位置 |

### 舒适措施

- 无用户操作时不进行相机启动的运动
- 稳定地平线(水平面从不倾斜)
- 主要交互在0.8-2.5米内,视线+/-15度
- 45分钟后休息提示(环境照明变化,非模态)
| 快速移动期间的外周晕影
| 所有常用控件可在手臂自然下垂时访问(仅手腕/手指)

---

## 10. 跨代理综合

### 所有8个代理的一致点

1. **2D优先,空间其次。** 每个代理独立得出这个结论。先构建一个伟大的Web仪表板,然后逐步添加空间能力。

2. **调试是杀手级用例。** 产品研究员、UX研究员和XR界面架构师都汇聚于此:运行时跟踪在工作流结构上的空间覆盖是3D真正胜过2D的地方。

3. **WebXR优于VisionOS作为初始覆盖。** Vision Pro约100万的装机量无法支撑业务。浏览器中的WebXR是分发解锁。

4. **"作战室"协作场景。** 多个代理强调协作事件响应是最强的空间价值主张 —— 团队进入共享3D空间一起调试失败的管道。

5. **渐进式披露至关重要。** UX研究、空间UI和支持都强调空间复杂性必须逐步揭示,绝不能一次性倾倒给首次用户。

6. **语音作为高级用户加速器。** UX研究员和XR界面架构师都将语音命令识别为"空间计算的命令行" —— 对无障碍和专家效率至关重要。

### 需要解决的关键张力

| 张力 | 位置A | 位置B | 需要解决 |
|---------|-----------|-----------|-------------------|
| **定价** | 增长黑客:29-59美元/用户/月 | 趋势研究员:99-249美元/用户/月 | 测试版中A/B测试 |
| **VisionOS优先级** | 架构:第3阶段(第13周+) | 空间UI:完整规格就绪 | 先构建WebXR,验证后做VisionOS |
| **编排语言** | 架构:Rust | 项目计划:未指定 | Rust对于性能关键的DAG执行是正确的 |
| **MVP范围** | 架构:第1阶段仅2D | 品牌:以空间为首 | 2D优先,但确保每个演示中都有空间 |
| **社区平台** | 支持:Discord优先 | 营销:Discord + 开源 | 两者 —— Discord用于社区,GitHub用于开发者参与 |

### 此练习演示了什么

这份发现文档由8个专业代理并行运行产生,每个都将深厚的领域专业知识带到共同目标。代理独立得出一致的结论,同时产生了任何单一通才难以产生的领域特定洞察:

- **产品趋势研究员**发现了重塑整个策略的清醒Vision Pro销售数据
- **后端架构师**设计了任何以营销为中心的团队都不会考虑的Rust编排引擎
- **品牌守护者**创建了一个类别("SpatialAIOps")而非在现有类别中竞争
- **UX研究员**识别出空间计算为参数任务制造摩擦 —— 一个反直觉的发现
- **XR界面架构师**设计了映射到自然空间认知的"数据向你流动"拓扑
- **项目牧羊人**识别了可能破坏整个时间表的三个关键瓶颈角色
- **增长黑客**设计了特定于空间计算固有可分享性的病毒循环
- **支持响应者**将产品自身的AI能力转化为支持差异化

结果是一份全面的、跨职能的产品计划,可以作为实际开发的基础 —— 由协同工作的AI代理机构在单个会话中生成。

本文内容来自网络,本站仅作收录整理。 查看原文

示例