我们做什么
一个能与你共同成长的智能体,而不是一面镜子
市面上的智能穿戴像一面镜子:把心率、步数、睡眠的数字读给你听,但不告诉你"为什么",更不会陪你成长。 云玦在做的事分两层:随身硬件是外置感官系统——替你持续看、持续听、持续量, 不打扰主意识流;云端 AI 是外置前额叶——把感官采集的信号转化为反思、回顾与决策支持, 让智能体真正理解你这个人,并据此自动成长。
技术叙事
三层壁垒,从信号到应用层层叠加
Early Fusion 多模态
不是先各自变文字再拼起来
Self-Evolving Agent
In-Situ 自演化范式 · 5 benchmark 3 项 SOTA / 2 项第二
Zero-Skill 千人千面
每张卡片是一个独立 HTML
每一层都依赖上一层先做对:没有 Early Fusion,自进化拿不到稠密信号;没有自进化,应用层只能做千人一面。 完整解释见 技术页。
从 Early Fusion 到 Human-Centric World Model
现在能做到什么,长期要去哪里
当下已实现 · Early Fusion
主流多模态 AI 走 Late Fusion:音频、心率、视觉先各自变成文字再拼起来, 时序关系与强度细节全部丢失。云玦在原始信号层对齐 7 种模态,结论精确到事件、瞬间、个人。
自陈与体征对齐
你说"挺顺",心率曲线说紧张。文字层面的自述和多模态体征在同一时段对齐,语义层面看不见的差异显示出来。
跨日同活动对比
同样是静坐打字,今天 vs 14 天基线的体征曲线差异显著。"今天 vs 平时"变成可计算的量。
多模态因果链
"心率上升 3 秒后听到那句话"——心率、声纹、视觉在原始信号层精确对齐,文字层面永远抓不到的因果链被构建出来。
长期目标 · Human-Centric World Model
现在我们借用主流多模态模型的对齐能力做 Early Fusion,同时持续积累"奇怪模态 → 人类行为结果"的稠密标注数据。当数据飞轮成熟,云玦的长期目标是训练真正以人为中心的多模态基础模型——把心率、IMU、声音、视觉、对话、画像、关系图谱 在原始信号层对齐,建立一个真正理解"人"的世界模型, 而不是通用互联网知识的压缩版。
路线
三条赛道并行推进
当下 —— 随身硬件 → iOS → 云端的主链路生产稳定,自进化全链路已上线,深度内测中。
近期 —— 把自进化链路从小批量精打磨推进到千人级公测的工业化运转,质量门进入自动化。
中期 —— 自研多模态硬件 v1 上线,随身设备成为真正的外置感官系统;端侧 / 边侧分流方案就绪,原始数据"出不出端"由用户主动选择。
长期 —— 三条赛道并行收束: 自进化智能体实现千人千面的个性化应用层;随身多模态硬件成为外置感官系统; 数据飞轮成熟后自训 Human-Centric World Model,让 AI 真正以人为中心理解世界。