요즘 다음 연구 방향으로 VLA 기반 Memory System을 진지하게 고민하고 있다. 최근 들어 관련 벤치마크들이 하나둘 등장하고 있고, 기존 baseline들의 성능도 아직 낮은 수준에 머물러 있다. 이는 곧, 이 분야가 충분히 개척되지 않았고 새로운 접근이 성과로 이어질 가능성이 크다는 의미로 보인다. long-horizon task를 생각해보면, 로봇이 단순히 현재 observation만으로 의사결정을 내리는 것은 근본적인 한계가 있다. 예를 들어, 사람이 먼저 빨래를 개는 시범을 보여주고 이를 로봇이 따라하는 상황을 가정해보면, 현재 시점의 정보만으로는 작업을 수행하기 어렵다. 이러한 문제를 해결하기 위해서는 과거의 상태와 행동을 지속적으로 축적하고 활용할 수 있는 temporal memory..