베이징 휴머노이드 '체화형 브레인' 업계 데이터 엔진 평가 1위 등극

korean.beijing.gov.cn
2026-05-24

VCG.jpg

[사진 출처: VCG]

최근 베이징 휴머노이드 로봇 혁신센터가 개발한 체화 월드모델WoW(World-Omniscient World Model)가 WorldArena Challenge Track 2(Data Engine) 평가에서 1위에 올랐다. 국내외 최고 학부가 참여한 글로벌 AI 실전 평가에서, 베이징 이좡에서 개발된 이 '로봇 브레인'은 '현실 물리 세계를 이해하고 데이터를 생성하는 능력' 분야에서 업계 선도 수준에 도달했다.

WorldArena는 칭화대학교(清华大学), 베이징대학교(北京大学), 상하이교통대학교(上海交通大学), 프린스턴대학교 등 국내외 최고 학부가 공동으로 출시한 세계 최초의 통합형 체화 월드모델 평가 플랫폼으로, 체화 월드모델의 인지 능력과 기능 실용성을 종합적으로 평가한다. WorldArena 챌린지에서 Track 2(Data Engine)의 실전 성능 평가는 모델이 생성한 합성 데이터가 실제로 하위 단계 로봇 전략의 학습 효과를 얼마나 향상시키는지를 핵심 기준으로 삼는다.

WoW 체화 월드모델은 로봇이 물리 법칙을 이해하고 예측할 수 있는 '브레인'을 제공한다. 실제 물리 세계의 법칙을 시뮬레이션할 수 있을 뿐 아니라, 물리 논리에 부합하는 고품질 상호작용 데이터를 자율적으로 생성해 체화지능 산업의 데이터 부족 문제를 해결한다. 이번에 1위를 차지한 모델은 WoW 시리즈 가운데 가장 작은 규모의 1.3B 모델이다. ‘경량급 모델’임에도 불구하고 WoW 1.3B가 보여준 활약은 더 큰 규모의 범용 영상 모델과 특화 체화 모델 다수를 뛰어넘었다.

기술 측면에서 WoW 모델은 세 가지 핵심 난제를 극복했다. 먼저 물리 엔진 수준의 생성 능력을 갖춰 로봇 상호작용 궤적을 학습하고 미래 시나리오를 정밀하게 예측할 수 있다. 또한 독자 개발한 SOPHIA 자기반성 패러다임(Self-reflective Paradigm)을 통해 '자기 진화형' 데이터 폐쇄 루프를 구축해, 소량의 실제 궤적만으로도 수백만 건의 고품질 상호작용 데이터를 파생시킬 수 있다. 아울러 '화면에서 동작까지' 이어지는 폐쇄형 추론을 구현했는데 이는 알고리즘에 현실 세계를 직접 만질 수 있는 '양손'을 장착한 것과 같은 효과를 낸다. WoW가 생성한 데이터는 로봇의 사물 집기와 놓기, 복잡한 장기 작업(Long-horizon tasks) 등 실험에서 국내외 최고 수준의 기준 모델보다 훨씬 뛰어난 성능을 보였다.

원문 출처: 이청스바오(亦城时报)

첨부 파일