로봇이 알아서 거실을 정리하고 TV를 끄는 시대, 당신은 준비되어 있습니까? 중국 기업 Figure AI가 공개한 Figure 03의 시연 영상을 보고 솔직히 깜짝 놀랐습니다. 테슬라 옵티머스나 보스턴 다이내믹스 아틀라스가 기술적 선두주자로 알려져 있었는데, 이제는 중국 업체까지 동등한 수준의 기술력을 보여주고 있기 때문입니다. 제가 직접 영상을 세 번이나 돌려봤는데, 이건 CGI가 아니라 실제 로봇이 복잡한 가정 환경에서 자율적으로 움직이는 모습이었습니다.

일상 속으로 들어온 로봇, Figure 03의 충격적인 기술력
Figure 03이 보여준 시연은 단순한 데모 수준을 넘어섰습니다. 로봇이 스프레이를 뿌리고 테이블을 닦고, 쓰레기통을 양손으로 들어올린 뒤 한쪽 팔에 끼워 한 손을 자유롭게 만들고, 소파에서 물건을 집어 정리하는 모습은 정말 놀라웠습니다. 특히 TV 리모컨을 집어 들고 손 안에서 방향을 조정해 TV를 끄는 장면은 미세한 제어 능력(Fine Motor Control)이 얼마나 발전했는지를 보여주는 대목입니다. 여기서 파인 모터 컨트롤이란 손가락과 손목의 정밀한 움직임을 통해 작은 물체를 섬세하게 다루는 능력을 의미합people. 사람도 리모컨 버튼을 누르려면 손목을 돌리고 손가락으로 정확한 위치를 찾아야 하는데, 로봇이 이걸 해낸 겁니다.
이 모든 동작은 Helix 2라는 통합 AI 모델로 제어됩니다. 이 시스템은 3단계 레이어로 구성되어 있는데, 최상위는 추론 레이어(Reasoning Layer)로 주변 환경을 이해하고 무엇을 할지 결정합니다. 추론 레이어란 쉽게 말해 로봇이 눈으로 본 것을 분석해 "이건 쓰레기통이니까 들어야겠다"고 판단하는 두뇌 역할입니다. 중간 레이어는 초당 200회 속도로 전신 동작을 생성하고, 최하위 레이어는 초당 1,000회 속도로 균형과 협응을 관리합니다(출처: Figure AI 공식 발표). 제가 보기에 이 3단계 구조가 Figure 03의 동작을 그렇게 자연스럽게 만든 핵심 비결입니다.
로봇의 손에 내장된 카메라도 눈여겨볼 부분입니다. 손바닥 카메라(Palm Camera) 덕분에 손가락이 물체를 감싸서 메인 카메라 시야를 가려도 계속 물체를 볼 수 있습니다. 여기에 3g의 가벼운 힘까지 감지하는 촉각 센서(Tactile Sensor)가 있어 리모컨을 부수지 않고 적절한 압력으로 집을 수 있습니다. 촉각 센서란 사람 손끝의 감각처럼 로봇이 물체를 만졌을 때 얼마나 세게 누르는지를 느낄 수 있게 해주는 장치입니다.
테슬라 옵티머스와의 경쟁, 누가 시장을 선점할까
현재 휴머노이드 로봇 시장에서 가장 주목받는 경쟁자는 테슬라 옵티머스입니다. 일론 머스크는 옵티머스만으로 테슬라 기업 가치가 25조 달러에 이를 것이라고 공언했습니다. 테슬라의 전략은 대량 생산(Mass Production)입니다. 대량 생산이란 자동차 공장처럼 표준화된 공정으로 제품을 빠르고 저렴하게 찍어내는 방식을 말합니다. 테슬라는 이미 전기차 생산 라인을 갖추고 있기 때문에, 이 인프라를 활용해 로봇을 빠르게 양산하고 가격을 낮출 수 있다는 계산입니다.
반면 Figure AI는 지능(Intelligence)에 집중합니다. Helix 2 통합 AI 모델, 손바닥 카메라, 고감도 촉각 센서 등 소프트웨어와 센서 기술에 투자를 쏟아붓고 있습니다. 제가 두 회사의 전략을 비교해보니, 테슬라는 '빠르고 싸게'를 목표로 하고 Figure AI는 '더 똑똑하게'를 목표로 한다는 느낌을 받았습니다. 실제로 글로벌 산업용 로봇 설치 대수는 2023년 기준 연간 50만 대를 넘어섰는데, 이는 10년 전의 두 배 수준입니다(출처: 국제로봇연맹). 휴머노이드 로봇도 이와 비슷한 성장 곡선을 그릴 가능성이 높습니다.
솔직히 이 경쟁 구도에서 누가 이길지는 아직 모릅니다. 다만 두 회사 모두 예상보다 훨씬 빠르게 움직이고 있다는 점은 분명합니다. 제 생각엔 결국 두 전략이 모두 필요할 것 같습니다. 저렴한 가격으로 대중화를 이끄는 회사와, 고도의 지능으로 복잡한 업무를 처리하는 회사가 각각 다른 시장을 공략할 테니까요.
로봇이 일자리를 빼앗는다는 공포, 실제로는 어떨까
"로봇이 우리 일자리를 뺏을 것"이라는 두려움은 항상 나옵니다. 하지만 제 경험상 이런 기술 전환기마다 실제로 벌어지는 일은 조금 다릅니다. 전 세계 육체노동 일자리는 약 18억 개로 추정되는데, 그중 상당수는 사람들이 기피하는 위험하고 반복적인 일입니다. 창고 작업, 노인 돌봄, 재난 현장 대응, 심해 작업, 산불 진압 같은 직종은 인력 충원이 항상 어렵습니다. 이직률(Turnover Rate)이 연 100%를 넘는 곳도 많습니다. 이직률이란 1년 동안 직원이 얼마나 자주 그만두고 새로 채워지는지를 나타내는 지표입니다.
로봇이 이런 일자리를 대체하면, 인간은 더 창의적이고 안전한 일에 집중할 수 있게 됩니다. 역사적으로 보면 농업 혁명은 도시와 무역을 만들었고, 산업 혁명은 중산층과 여가 시간을 만들었고, 디지털 혁명은 인터넷 경제와 크리에이터 경제를 만들었습니다. 매번 기술이 일자리를 없앤 것처럼 보였지만, 실제로는 더 많은 새로운 일자리가 생겼습니다.
제가 주목하는 건 앞으로 생길 '로봇 경제' 일자리입니다. 로봇을 관리하고, 훈련시키고, 새로운 환경에 배치하고, 소프트웨어를 개발하는 직종은 지금 거의 존재하지 않습니다. 하지만 10년 뒤에는 가장 수요가 높은 직업군이 될 겁니다. 아이폰이 나오기 전에는 앱 개발자라는 직업도 없었잖아요.
다만 전환 과정에서 고통받는 사람들이 분명 있을 겁니다. 단순 반복 업무에 종사하던 분들, 새로운 기술을 배우기 어려운 연령대의 분들은 실질적인 지원이 필요합니다. 기술적 낙관론만 외치면서 이들의 현실을 외면하는 건 무책임한 태도입니다.
기술 격차가 줄어든다는 신호, 중국 기업의 약진
Figure 03 시연을 보면서 가장 놀랐던 건 기술 격차가 생각보다 빨리 좁혀지고 있다는 점입니다. 불과 1~2년 전까지만 해도 보스턴 다이내믹스와 테슬라가 압도적인 기술력으로 앞서 있었는데, 중국 기업이 이렇게 빠르게 따라잡을 줄은 몰랐습니다. 제가 이 영상이 고도로 훈련된 시나리오인지 아니면 원격 조종인지 확실히 알 수는 없습니다. 하지만 설령 일부 과장이 있더라도, 중국이 이 분야에 엄청난 자본과 인력을 쏟아붓고 있다는 사실 자체는 무시할 수 없습니다.
특히 주목할 점은 이들이 '통합 AI 모델' 접근법을 택했다는 겁니다. 기존 로봇들은 각 작업마다 별도의 컨트롤러를 사용했는데, Figure 03은 하나의 AI가 모든 상황을 판단하고 대응합니다. 이런 방식이 성공하면 로봇은 훨씬 더 유연하게 새로운 환경에 적응할 수 있습니다. 공장 바닥에서만 작동하던 로봇이 이제 집 거실에서도, 사무실에서도, 병원에서도 일할 수 있게 되는 거죠.
솔직히 Figure 03의 시연이 100% 실시간 자율 작동인지에 대해서는 의문이 남습니다. 하지만 궁극적으로 휴머노이드 로봇은 이런 수준의 작업을 해내야만 실용화될 수 있습니다. 그리고 이 기술이 진짜라면, 우리 곁으로 로봇이 오는 시점은 생각보다 훨씬 가까울 겁니다.
결국 중요한 건 이 기술을 어떻게 활용할지입니다. 로봇이 위험하고 힘든 일을 대신해주면서, 인간은 더 의미 있는 일에 집중할 수 있는 세상. 그게 우리가 만들어야 할 미래입니다. 하지만 동시에 기술 전환 과정에서 소외되는 사람이 없도록 사회적 안전망도 함께 준비해야 합니다. 기술 발전은 빠르지만, 그 혜택이 모두에게 골고루 돌아가려면 정책적 뒷받침이 반드시 필요합니다.