§ 01 · 核心技术
分布式架构
多 Agents 协作
系统架构
高效协同的分布式智能体架构。融合语音识别、记忆、工具调用与执行闭环,天然适配自动操作、具身智能与多传感器协同 —— 从「对话智能」跃迁至「行动智能」。
输入识别
多模态
理解决策
LLM 编排
执行输出
软硬协同
持久化
闭环沉淀

§ 02 · 闭环架构
输入识别 · 理解决策 · 执行输出 · 记忆反哺
不是分层堆叠 · 是闭环流转 —— 三段流程 + 记忆持续反哺决策,构成 Agents 自演化系统
横向滑动查看完整架构图
输入识别—毫秒级实时识别 · 多语种混合 · 长语音不间断
理解决策—思考-工具-再思考闭环 · 模型主动规划而非被动应答
执行输出—三类通道并行 · 意图 → 真实动作一气呵成
持久化记忆—结构化会话状态落盘 · 每次交互沉淀为下次的经验
§ 03 · 能力突破
三大能力突破
更自然的多模态交互
语音、文本、视觉、传感器输入无缝融合,输出端同步生成 TTS 流、文本回复与动作指令。一次输入触发三路输出,对话节奏接近真人。
更强的工具调用与编排
从单步调用到流程编排,Agents 可以自主串联多个工具完成复杂任务。模型决定「什么时候用哪个工具」,开发者只需声明工具能做什么。
软件自动操作与具身联动
既能操作软件 UI(点击、输入、跳转),也能驱动硬件(舵机、灯光、显示),还能联动多传感器构建空间感知。AI 不再只在云端思考。

