본문 바로가기
카테고리 없음

Figure 03 휴머노이드 (Helix 02, 자율주행, 신경망 제어)

by 시나브로시나 2026. 2. 9.

인공지능 기술이 로봇 공학과 결합하며 SF 영화 속 장면이 현실로 다가오고 있습니다. Figure사의 최신 휴머노이드 로봇 Figure 03과 Helix 02 AI 시스템은 식기세척기를 자율적으로 비우는 4분간의 데모를 통해 로봇 공학의 새로운 전환점을 제시했습니다. 이번 시연은 단순한 기술 과시가 아닌, 일상생활에서 실질적으로 활용 가능한 휴머노이드 로봇의 가능성을 보여줍니다.

figure 03

Helix 02 신경망 제어 시스템의 혁신

Figure 03의 핵심은 Helix 02라는 차세대 AI 브레인에 있습니다. 지난해 공개된 Helix 1이 단일 신경망으로 상체만을 제어했던 것과 달리, Helix 02는 로봇의 전신을 하나의 통합된 신경망으로 제어합니다. 이 시스템은 raw pixels, 즉 원시 픽셀 데이터만으로 세상을 인식하고 해석하며, 걷기, 물체 조작, 균형 유지를 하나의 연속적인 시스템으로 처리합니다.

 

가장 주목할 점은 'all sensors in, all actuators out' 방식입니다. 시각 센서로 컵을 인식하고, 촉각 센서로 물체를 느끼며, proprioception(고유수용감각)으로 공간 내 자신의 위치를 파악하는 모든 온보드 센서가 모든 액추에이터와 직접 연결됩니다. 이 모든 과정이 단일 통합 visual motor neural network를 거치기 때문에 별도 시스템 간 핸드오프가 없어 매끄럽고 자연스러운 움직임이 가능합니다. 기존 로봇들이 보여주던 경직되고 덜컹거리는 움직임과는 차원이 다른 유연성입니다.

 

Figure사의 새로운 three system architecture는 로봇 제어의 패러다임을 바꾸었습니다. System Zero는 인간과 유사한 전신 제어를 위한 foundation layer로, 1,000시간 이상의 joint level retargeted human motion data로 훈련되었습니다. 걷기, 회전, 웅크리기, 팔 뻗기 등 각각의 동작에 대해 별도의 보상 함수를 설계하는 대신, 인간의 움직임을 직접 추적하도록 학습합니다. 이 시스템은 200,000개의 병렬 환경에서 시뮬레이션으로만 훈련되었으며, 광범위한 domain randomization 덕분에 실제 로봇으로의 직접 전환과 전체 로봇 fleet에 걸친 일반화가 가능합니다.

구분 Helix 1 Helix 2
제어 범위 상체만 제어 전신 통합 제어
신경망 구조 분절된 시스템 단일 통합 신경망
출력 속도 - 1,000Hz (초당 1,000회)
훈련 데이터 - 1,000시간 인간 동작 데이터

 

기술적 사양을 보면, 이 시스템은 10 million parameter neural network로 구동되며 전신 관절 상태와 기본 동작을 입력으로 받아 joint level actuator commands를 1,000 hertz, 즉 초당 약 1,000번의 속도로 출력합니다. 이는 밀리초 단위의 정밀한 제어를 가능하게 하며, 데모 영상에서 보이는 웅크리기, 몸 기울이기, 런지 동작 등에서 그 유연성이 명확히 드러납니다.

자율주행 수준의 dextrous task 수행 능력

Figure 03이 보여준 61개의 local manipulation actions은 모두 인간의 개입이나 리셋 없이 완전 자율적으로 수행되었습니다. 이는 tele operation이나 원격 제어가 전혀 없는, 순수하게 AI가 구동하는 움직임입니다. 로봇이 주방의 한 지점에서 다른 지점으로 이동하는 모습, 팬트리를 여는 장면, 엉덩이로 서랍을 닫는 장면, 발로 식기세척기 문을 들어 올리는 장면 등은 로봇이 신체 전체를 도구로 활용할 수 있음을 증명합니다.

특히 인상적인 것은 tactile sensing과 palm cameras를 활용한 정밀 조작 능력입니다. 병뚜껑을 여는 작업에서는 병을 안정화시키면서 동시에 지속적이고 제어된 회전력을 가해 뚜껑을 제거해야 하는데, 이는 양손의 협응(bimanual coordination)이 필수적입니다. 양손 모두 안정적인 grip force와 steady torque control을 유지해야 용기를 부수거나 떨어뜨리지 않습니다.

 

약 상자에서 알약 하나를 꺼내는 초정밀 작업(ultraextrous task)도 주목할 만합니다. 이 알약은 occluded, 즉 머리의 카메라 시야에서 가려져 있어 palm level visual feedback과 tactile-guided precision grasping이 필요합니다. 주사기 사용 시연에서는 가변적인 저항과 허용 오차 속에서도 정확한 양을 분배해야 하므로 force controlled actuation과 tactile feedback, 그리고 다중 손가락의 안정화가 조율되어야 합니다. 로봇이 상황을 즉각 판단하고 조정하는 능력이 요구되는 작업입니다.

 

Bot Q 제조 시설에서 촬영된 금속 부품 픽앤플레이스 작업에서는 서로 부분적으로 겹쳐 있고 상호작용 중 위치가 변하는 물체들을 한 컨테이너에서 다른 컨테이너로 옮깁니다. 단순해 보이지만, 이 과정에서 놓친 몇 가지 중요한 디테일이 있습니다. 손이 점유된 상태에서 엉덩이로 서랍을 닫는 장면, 발로 식기세척기 문을 들어 올리는 장면은 로봇이 손뿐 아니라 전신을 도구로 활용한다는 것을 보여줍니다.

 

사용자 비평에서 지적했듯이, '시스템 0, 1, 2'로 나뉜 계층적 아키텍처는 기존 로봇들의 분절된 시스템과는 완전히 다릅니다. 걷기와 물체 집기가 따로 놀지 않고 하나의 통합된 시스템으로 작동하며, 1,000Hz 속도로 전신을 제어하는 이 능력은 로봇이 인간의 움직임을 단순 모사하는 단계를 넘어섰음을 의미합니다. 물체를 들 때 균형이 변하고, 앞으로 발을 내딛을 때 도달 범위가 변하는 복잡한 상호작용을 하나의 신경망이 처리한다는 것은 로봇 공학에서 수십 년간 풀지 못한 난제였습니다.

신경망 제어의 한계와 실용화 과제

Figure 03의 시연은 분명 인상적이지만, 실제 가정 환경으로의 적용에는 여전히 해결해야 할 과제들이 남아 있습니다. 영상에서 제기된 위생 및 교차 오염 문제는 매우 중요한 비판 지점입니다. 식기세척기를 비운 손으로 다른 가사 활동, 예를 들어 터키 샌드위치를 만드는 작업을 수행할 때 손가락 끝의 센서를 어떻게 실시간으로 살균할 것인지는 명확한 답이 없습니다.

 

세제 투입구 근처를 만진 발이 거실 카펫을 오염시킬 가능성도 무시할 수 없습니다. 로봇의 모든 센서와 액추에이터가 직접 연결되어 있다는 것은 기술적 강점이지만, 동시에 위생 관리의 복잡성도 증가시킵니다. 현재의 하드웨어 설계에는 자가 살균 메커니즘이나 오염 방지 시스템에 대한 언급이 부족합니다.

 

또한 1,000시간의 인간 동작 데이터 학습이 '깨끗한 실험실 주방'을 넘어 실제 가정집의 기름기 있고 미끄러운 그릇에도 동일한 성공률을 보일지는 더 많은 검증이 필요합니다. 200,000개의 병렬 시뮬레이션 환경에서 훈련되었다고는 하나, 실제 세계의 예측 불가능한 변수들, 예를 들어 깨진 그릇 조각, 굳은 음식물 찌꺼기, 불규칙한 표면 등에 대한 대응력은 장기간의 실증 테스트를 거쳐야 입증될 것입니다.

 

same neural network가 밀리미터 단위의 손가락 움직임과 방 전체를 가로지르는 걷기 동작을 동시에 생산한다는 것은 네 자릿수 크기의 동적 범위를 포괄한다는 의미입니다. 이는 기술적으로 놀라운 성과이지만, implicit error recovery, 즉 암묵적 오류 복구 능력이 모든 상황에서 완벽하게 작동할지는 의문입니다. 데모에서는 로봇이 작업 상태를 매끄럽게 유지하는 것처럼 보이지만, 예상치 못한 장애물이나 시스템 과부하 상황에서도 동일한 성능을 발휘할지는 미지수입니다.

장점 해결 과제
전신 통합 제어로 자연스러운 움직임 센서 오염 및 교차 오염 방지 메커니즘 부재
61개 연속 작업 무중단 수행 실험실 환경 외 실제 가정집 검증 필요
신체 전체를 도구로 활용 예상치 못한 장애물 대응력 검증 부족
1,000Hz 고속 정밀 제어 장기 운용 시 시스템 안정성 입증 필요

 

마지막으로 영상 말미에 제기된 질문, 즉 완전히 구축된 closed source proprietary 휴머노이드 로봇과 직접 제어 가능하지만 더 많은 노력이 필요한 오픈소스 로봇 중 무엇을 선택할 것인가는 앞으로의 휴머노이드 로봇 시장 방향성을 가늠하는 핵심 질문입니다. Figure 03은 전자의 대표 사례로, 높은 완성도를 자랑하지만 사용자의 커스터마이징 여지는 제한적일 수 있습니다.

 

Figure 03과 Helix 02가 보여준 성과는 휴머노이드 로봇 공학에서 가장 긴 시간 동안 가장 복잡한 작업을 자율적으로 완수한 사례로 평가받고 있습니다. 계층적 아키텍처와 통합 신경망 제어, 전신을 도구로 활용하는 능력은 분명 혁신적입니다. 그러나 위생 관리와 실제 환경에서의 안정성 검증이라는 과제가 남아 있으며, 이는 상용화 전에 반드시 해결되어야 할 부분입니다. 사용자가 지적한 것처럼, 깨끗한 실험실을 벗어난 진짜 일상생활의 복잡성 속에서도 Figure 03이 동일한 성능을 유지할 수 있을지 주목됩니다.

자주 묻는 질문 (FAQ)

Q. Figure 03의 Helix 02 시스템이 기존 로봇과 가장 큰 차이점은 무엇인가요?
A. Helix 02는 단일 통합 신경망으로 로봇의 전신을 제어하며, 걷기와 물체 조작을 분리하지 않고 하나의 연속적인 시스템으로 처리합니다. 또한 1,000Hz의 속도로 액추에이터 명령을 출력하여 밀리미터 단위의 손가락 움직임부터 방 전체를 가로지르는 걷기까지 동시에 제어할 수 있습니다.

 

Q. Figure 03이 식기세척기를 비우는 작업에서 보여준 특별한 능력은 무엇인가요?
A. 로봇은 손뿐 아니라 엉덩이로 서랍을 닫고 발로 식기세척기 문을 들어 올리는 등 신체 전체를 도구로 활용했습니다. 또한 61개의 연속 작업을 인간 개입이나 리셋 없이 완전 자율적으로 수행했으며, 양손 협응과 촉각 센서 기반의 정밀 조작을 동시에 구현했습니다.

 

Q. Figure 03의 실용화를 위해 해결해야 할 주요 과제는 무엇인가요?
A. 가장 시급한 과제는 위생 및 교차 오염 방지입니다. 식기세척기를 비운 손으로 음식을 다루거나 세제 투입구를 만진 발로 거실을 이동할 때 센서를 어떻게 살균할 것인지에 대한 하드웨어적 대안이 필요합니다. 또한 실험실 환경이 아닌 실제 가정집의 기름기 있고 미끄러운 환경에서도 동일한 성능을 발휘하는지 장기 검증이 필요합니다.

 

[출처]
영상 제목/채널명: https://www.youtube.com/watch?v=YdLSBEgP1m8