↓ 跳过正文

南巷

具身智能、VLA/机器人操作、多模态感知、轻量化视觉分割

我关注具身智能、多模态感知与轻量化视觉分割。
#

我是南巷，人工智能方向硕士。我的工作主要围绕 VLA / 机器人操作、世界模型、多模态大模型和视觉感知算法展开。

相比单一指标，我更关心模型结构、数据闭环与真实系统联调之间的关系：一个算法不仅要在实验结果中成立，也要能够进入真实任务，面对数据噪声、执行误差和工程约束。

近期我主要在探索 VLA 与世界模型在机器人任务中的应用，同时关注机器人本体设计、运动控制，以及基于 XR 设备的远程操作与人机协同。

项目 · 科研成果 · 比赛 · 博客 · GitHub