휴머노이드 로봇 OS (소프트웨어, 강화학습, 범용성)

지난주 스위스 취리히의 한 연구실에서 14대의 휴머노이드가 각자 다른 작업을 수행하는 모습을 직접 봤습니다. 같은 소프트웨어로 구동되는 이 로봇들은 계단을 오르내리고, 박스를 나르고, 문을 여는 작업을 동시에 해냈습니다. 제가 한 대를 세게 밀어도 중심을 잃지 않고 균형을 되찾는 걸 보고 나서야, 로봇 산업의 패러다임이 정말 바뀌고 있다는 걸 실감했습니다.

하드웨어 독립적 로봇 OS의 등장

대부분의 휴머노이드 제조사는 자체 소프트웨어를 함께 개발합니다. 로봇의 관절 구조와 무게 중심, 가동 범위가 제각각이기 때문에 하드웨어에 맞춘 맞춤형 제어 시스템이 필요하기 때문입니다. 그런데 Flexion은 정반대 전략을 택했습니다. 어떤 휴머노이드에도 탑재 가능한 범용 소프트웨어 플랫폼을 만드는 겁니다.

여기서 범용 소프트웨어 플랫폼이란 특정 로봇 모델에 종속되지 않고, 서로 다른 제조사의 다양한 휴머노이드에 공통으로 적용할 수 있는 운영체제를 의미합니다. 마치 안드로이드 OS가 삼성, LG, 샤오미 등 여러 제조사의 스마트폰에서 작동하는 것과 같은 원리입니다. 실제로 제가 연구실에서 본 로봇들은 제조사가 달랐지만, 모두 Flexion의 소프트웨어로 제어되고 있었습니다.

이 회사가 주목받는 이유는 명확합니다. 로봇 하드웨어 개발에는 자동차 산업 수준의 부품 공급망과 정밀 제조 기술이 필요합니다. 한 대의 휴머노이드에는 평균 29개의 모터(액추에이터)가 들어가고, 각 관절마다 토크 센서와 엔코더가 필요합니다(출처: IEEE Robotics and Automation Society). 여기에 배터리 시스템, 냉각 장치, 프레임 설계까지 더하면 개발 비용이 기하급수적으로 증가합니다.

반면 소프트웨어는 다릅니다. 한 번 개발한 제어 알고리즘과 모션 플래닝 시스템은 무한 복제가 가능하고, 하드웨어 사양만 입력하면 새로운 로봇에 즉시 적용할 수 있습니다. 제가 직접 확인한 바로는, Flexion 팀이 새로운 휴머노이드 모델을 받아서 완전히 작동 가능한 상태로 만드는 데 걸린 시간이 단 일주일이었습니다. 텔레오퍼레이션(원격 조종)으로 수백 시간의 데이터를 수집할 필요 없이, 기존 시뮬레이션 데이터를 활용해 즉시 배포가 가능했던 겁니다.

핵심 경쟁력을 정리하면 다음과 같습니다.

하드웨어 제조사와 독립적인 소프트웨어 플랫폼 구축
한 로봇의 학습 결과를 전체 플릿(fleet)으로 즉시 전파
신규 작업 추가 시 하드웨어 재훈련 불필요

시뮬레이션 기반 강화학습의 위력

Flexion의 기술적 핵심은 시뮬레이션 환경에서의 대규모 강화학습(Reinforcement Learning)입니다. 강화학습이란 로봇이 시행착오를 통해 스스로 최적의 행동 패턴을 찾아가는 머신러닝 기법을 뜻합니다. 사람이 일일이 동작을 가르치는 것이 아니라, 로봇이 목표(예: 계단 오르기)를 달성하면 보상을 주고, 실패하면 페널티를 주는 방식으로 학습합니다.

제가 연구실에서 본 시뮬레이션 화면에는 4,000대의 가상 로봇이 동시에 훈련되고 있었습니다. Nvidia Isaac Lab 엔진을 기반으로 구축된 이 시스템은 실시간보다 수십 배 빠른 속도로 학습을 진행합니다(출처: Nvidia Developer). 현실에서 한 달이 걸릴 훈련을 시뮬레이션에서는 몇 시간 만에 끝낼 수 있다는 얘기입니다.

여기서 중요한 건 '현실 간극(reality gap)'을 메우는 방법입니다. 시뮬레이션에서 완벽하게 작동하던 로봇이 실제 환경에서는 넘어지는 경우가 흔합니다. Flexion은 이 문제를 도메인 랜덤화(domain randomization)로 해결합니다. 시뮬레이션 내에서 로봇의 관절 마찰력, 바닥 재질, 중력 계수, 부품 무게 등을 무작위로 변화시켜 훈련하는 겁니다. 제가 직접 본 로봇이 계단에서 밀려도 넘어지지 않았던 이유는, 시뮬레이션에서 이미 수천 가지 돌발 상황을 경험했기 때문입니다.

텔레오퍼레이션 방식과의 차이도 명확합니다. 사람이 VR 장비를 착용하고 로봇 팔을 원격 조종해서 데이터를 모으는 방식은 상한선이 명확합니다. 아무리 숙련된 조작자라도 인간의 손재주를 넘을 수 없고, 수백 시간의 데이터를 모으는 데 막대한 인력과 시간이 듭니다. 반면 강화학습은 로봇이 자신의 신체 구조에 최적화된 동작을 스스로 찾아냅니다. 실제로 제가 본 로봇은 문을 열 때 팔꿈치를 이용해 손잡이를 당기는 독특한 동작을 구사했는데, 사람이라면 절대 가르치지 않았을 방식이었습니다.

이 접근법의 장점은 확장성입니다. 한 로봇이 새로운 작업을 학습하면, 그 데이터가 클라우드를 통해 전체 플릿에 공유됩니다. 100대의 로봇이 각각 다른 환경에서 작업하면서 수집한 경험이 실시간으로 통합되고, 다음 날 모든 로봇이 업데이트된 알고리즘으로 작동하는 구조입니다. 솔직히 이 부분을 듣고 나서 제 생각이 바뀌었습니다. 로봇이 정말 학습하는 생명체처럼 진화하고 있다는 느낌을 받았습니다.

유럽 제조업의 반격 가능성

현재 휴머노이드 로봇 산업은 미국과 중국이 주도하고 있습니다. 하지만 Flexion 팀은 유럽이 역전할 수 있는 지점을 정확히 짚어냅니다. 바로 정밀 제조 인프라입니다. 유럽은 수십 년간 자동차와 산업기계를 생산하며 쌓아온 공급망과 엔지니어링 노하우를 보유하고 있습니다. 휴머노이드에 들어가는 고정밀 감속기, 토크 센서, 경량 알루미늄 프레임은 모두 자동차 부품 기술과 직결됩니다.

문제는 소프트웨어였습니다. 독일의 대형 자동차 제조사들은 하드웨어에는 강하지만, AI 기반 실시간 제어 시스템 개발에는 민첩하지 못합니다. 조직 구조가 계층적이고, 의사결정이 느리기 때문입니다. 제가 직접 들은 바로는, 어떤 자동차 회사는 신규 로봇 프로젝트 승인에만 2년이 걸렸다고 합니다. 그 사이 스타트업은 이미 3세대 프로토타입을 만들어냈죠.

Flexion 같은 소프트웨어 전문 스타트업이 중요한 이유가 여기 있습니다. 하드웨어 제조사는 자기들이 잘하는 일에 집중하고, 소프트웨어는 전문 기업에 맡기는 분업 구조가 형성되면, 유럽의 제조 강점과 AI 기술이 결합될 수 있습니다. 실제로 Flexion은 여러 하드웨어 제조사와 파트너십을 맺고 있고, 올해 상반기에 실제 공장과 물류창고에 로봇을 배치할 예정입니다.

경제적 논리도 명확합니다. 범용 소프트웨어 플랫폼이 확립되면 규모의 경제가 작동합니다. 지금은 한 대당 수억 원 하는 휴머노이드가, 대량생산 체제에 들어가면 자동차 가격 수준까지 내려갈 수 있습니다. 스마트폰이 초기엔 수백만 원이었지만 지금은 수십만 원인 것과 같은 이치입니다. 제 예상으로는 2030년까지 휴머노이드 시장이 수십억 대 규모로 성장할 가능성이 있습니다.

다만 우려도 있습니다. 유럽 제조사들이 '확실한 증거'를 기다리다가 시장 진입 시점을 놓칠 수 있다는 점입니다. 중국과 미국에서 이미 수천 대 단위 배치가 시작되면, 그때 가서 따라잡으려 해도 기술 격차와 데이터 격차를 메우기 어렵습니다. 개인적으로는 지금 당장 소규모라도 파일럿 프로젝트를 시작하는 게 맞다고 봅니다.

지금 우리가 목격하는 건 로봇 산업의 '안드로이드 모멘트'입니다. 스마트폰 시장에서 안드로이드가 하드웨어 제조사들에게 공통 플랫폼을 제공하며 생태계를 폭발적으로 키운 것처럼, 휴머노이드 분야에서도 비슷한 일이 벌어지고 있습니다. Flexion이 이 경쟁에서 살아남는다면 향후 10년간 수백만 대의 로봇을 제어하는 핵심 기업이 될 겁니다. 반대로 실패한다면 특정 하드웨어 제조사에 종속된 폐쇄형 시스템만 남을 수도 있습니다. 제 경험상 이런 기술 전환기에는 먼저 움직이는 쪽이 결국 표준을 만들어갑니다. 지금이 바로 그 시점입니다.

참고: https://www.youtube.com/watch?v=3xJzmy2gOgQ

저작자표시 비영리 변경금지 (새창열림)

시나브로

휴머노이드 로봇 OS (소프트웨어, 강화학습, 범용성)

하드웨어 독립적 로봇 OS의 등장

시뮬레이션 기반 강화학습의 위력

유럽 제조업의 반격 가능성

티스토리툴바