DAIMON 로보틱스, 로봇 촉각 혁명 일으키다! 물리 AI 새 지평 여는 Daimon-Infinity 전격 해부

DAIMON 로보틱스가 로봇에게 섬세한 '손맛'을 선사하며 인공지능 로봇 분야에 새 역사를 썼다.

홍콩 기반의 DAIMON 로보틱스는 최근 물리 AI를 위한 세계 최대 옴니 모달 로봇 데이터셋 'Daimon-Infinity'를 전격 공개했다.

이는 로봇이 단순히 물체를 보는 것을 넘어, 직접 느끼고 상호작용하는 새로운 시대의 서막을 알리는 사건이다.

과연 이 혁신적인 데이터셋이 우리의 미래를 어떻게 바꿀지, 그리고 DAIMON 로보틱스의 비전은 무엇일지 자세히 파헤쳐 본다.

DAIMON 로보틱스, 로봇에 섬세한 촉각을 부여하다

DAIMON 로보틱스는 설립 2년 반 만에 비전 기반 촉각 센서 분야에서 독보적인 기술력을 자랑하는 회사로 성장했다.

손가락 끝만 한 모듈에 11만 개 이상의 감지 단위를 집적한 이 센서는 로봇의 손이 인간처럼 사물을 인지하게 돕는다.

이러한 하드웨어 기술력을 바탕으로, DAIMON은 광범위한 작업에 걸쳐 고해상도 촉각 센싱 데이터를 포함하는 'Daimon-Infinity'를 구축했다.

집에서 빨래를 개는 일부터 공장 생산 라인 작업까지, 방대한 실제 환경 데이터를 담고 있어 주목받는다.

구글 딥마인드, 노스웨스턴 대학, 싱가포르 국립 대학 등 세계 유수 기관들이 이 프로젝트에 참여했다는 사실은 그 중요성을 방증한다.

업계는 오랫동안 AI 로봇 학습에 필요한 실제 물리 상호작용 데이터 부족에 시달려왔다.

DAIMON은 바로 이 문제에 대한 해답으로, 자사의 독점적인 비전 기반 촉각 기술을 활용해 대규모 데이터를 생성했다.

데이터의 품질, 신뢰성, 비용 문제까지 해결하며 업계의 갈증을 해소하고 있다.

특히 DAIMON은 1만 시간 분량의 데이터를 오픈소스로 공개하여 물리 AI의 실세계 배포를 가속화하려는 의지를 보였다.

이는 단순히 기술 판매를 넘어, 전체 로봇 촉각 산업의 발전을 이끌겠다는 책임감으로 보인다.

본인의 분석으로는, 데이터 개방은 DAIMON의 센서 기술이 사실상의 표준이 되는 길을 열어줄 수도 있다.

VLA 넘어 VTLA로: 로봇의 '손끝 지능' 시대

현재 로봇 공학의 주류 패러다임은 VLA(Vision-Language-Action) 모델이다.

로봇은 시각 정보와 언어 명령을 통해 행동을 결정하지만, 촉각 정보가 없어 치명적인 한계를 드러낸다.

예를 들어, 어두운 환경에서 물체를 찾거나, 미끄러짐을 감지하지 못해 깨지기 쉬운 물건을 떨어뜨리곤 했다.

정밀한 힘 조절이 불가능하여 작업 실패나 물리적 손상으로 이어지는 경우도 다반사였다.

DAIMON의 공동 창립자이자 수석 과학자인 마이클 유 왕(Michael Yu Wang) 교수는 이러한 문제에 대한 해답으로 VTLA(Vision-Tactile-Language-Action) 아키텍처를 제시했다.

이는 촉각 정보를 시각 정보와 동등한 수준의 모달리티로 격상시켜 로봇의 인식 능력을 비약적으로 향상시킨다.

DAIMON의 비전 기반 촉각 센서는 손가락 끝 표면의 변형을 시각 이미지 형태로 포착한다.

이러한 시각적 촉각 데이터는 기존 VLA 프레임워크에 자연스럽게 통합되어 VTLA 시스템을 구축한다.

이는 고해상도 촉각 정보를 픽셀 수준으로 제공하며, 로봇이 물체의 재질, 미끄러짐, 접촉력 등을 실시간으로 정밀하게 파악하도록 돕는다.

VTLA 모델의 등장은 로봇이 단순히 ‘보는’ 것을 넘어 ‘느끼는’ 능력을 갖추게 되는 패러다임 전환을 의미한다.

앞으로는 휴머노이드 로봇이 더욱 복잡하고 섬세한 작업을 수행하며, 예측 불가능한 환경에서도 안정적으로 작동할 수 있을 거라 기대된다.

학계에서 실제 시장으로: DAIMON의 3D 전략과 미래

40년간 학계에서 로봇 공학 발전에 기여해온 왕 교수는 상업적 가능성을 보고 DAIMON 로보틱스를 창업했다.

그는 로봇이 인간처럼 일할 수 있는 조작 능력, 특히 섬세한 조작 능력의 발전 가능성을 높이 평가했다.

DAIMON의 비즈니스 전략은 '3D': Devices(장치), Data(데이터), Deployment(배포)로 요약된다.

고성능 촉각 센서 장치를 개발하고, 이를 통해 고품질 데이터를 수집하며, 실제 응용 환경에 배포하는 순환 구조다.

이러한 수직 통합 전략은 초기 스타트업 단계에서 효과적인 시장 침투 방안으로 보인다.

왕 교수는 로봇 촉각 기술이 적용될 실제 시나리오로 호텔 서비스 로봇과 편의점 로봇을 언급했다.

특히 비좁은 편의점 선반에서 물건을 집어 올리는 작업처럼 섬세한 조작이 필요한 곳에서 촉각 센서의 중요성을 강조했다.

본인의 생각에는, 이러한 틈새시장에서의 성공이 궁극적으로 범용 AI 로봇의 대규모 배포를 위한 마중물이 될 것이다.

결국, 로봇이 안전하고 신뢰할 수 있는 인간의 파트너가 되기 위해서는 'embodied skills(구체화된 기술)'이 필수적이라고 왕 교수는 강조한다.

하드웨어와 AI 기술의 놀라운 발전이 이제 로봇에게 '몸의 지능'을 부여할 최적의 시기에 도달했다고 판단한다.

자주 묻는 질문 (Q&A)

Q1: Daimon-Infinity 데이터셋이 왜 중요한가요?

A1: Daimon-Infinity는 물리 AI 학습에 필수적인 고해상도 촉각 데이터를 포함하는 세계 최대 옴니 모달 데이터셋이다. 로봇이 실제 환경에서 섬세한 조작을 배우고 적용하는 데 필요한 '연료'를 제공하여 AI 로봇의 실세계 배포를 가속화하는 데 결정적인 역할을 한다.

Q2: VTLA 모델은 기존 로봇과 무엇이 다른가요?

A2: 기존 VLA(Vision-Language-Action) 모델은 시각과 언어 정보에 의존하지만, VTLA(Vision-Tactile-Language-Action) 모델은 여기에 촉각 정보를 추가한다. 이로 인해 로봇은 물체의 재질, 미끄러짐, 접촉력 등을 감지하고 정밀하게 제어하여 어둡거나 섬세한 작업을 보다 능숙하게 수행할 수 있게 된다.

Q3: DAIMON의 촉각 센서는 어떤 독특한 장점을 가지나요?

A3: DAIMON의 촉각 센서는 손가락 끝 크기 모듈에 11만 개 이상의 감지 단위를 집적한 고밀도 비전 기반 단색 센서이다. 높은 감지 밀도와 빠른 반응 속도(다이내믹스)를 자랑하며, 변형, 미끄러짐, 마찰력, 재료 특성 등 다차원적인 촉각 데이터를 포착하여 로봇의 인지 능력을 극대화한다.

Q4: 휴머노이드 로봇이 실제 생활에 언제쯤 보급될까요?

A4: 왕 교수는 범용 휴머노이드 로봇의 대규모 배포까지는 아직 시간이 걸리겠지만, 특정 영역에서는 빠르게 확산될 것으로 본다. 이미 중국 호텔의 배달 로봇처럼 팔 없는 자율 로봇이 보편화되었고, 편의점, 약국 등 특정 도메인에서는 곧 완전한 휴머노이드 로봇이 보급될 것으로 예측한다.

결론 (마치며)

DAIMON 로보틱스의 혁신은 단순한 기술 개발을 넘어, 로봇이 세상을 인식하고 상호작용하는 방식 자체를 바꾸는 중이다.

Daimon-Infinity 데이터셋 공개와 VTLA 모델의 등장은 로봇에게 '손끝 지능'을 부여하며, 진정한 의미의 AI 로봇 시대를 열 것으로 기대된다.

로봇이 우리의 삶에 더 깊숙이 들어와 유익하고 신뢰할 수 있는 파트너가 될 날이 머지않았다고 확신한다.