구글 로봇공학팀이 "로봇공학 3원칙"에 영감 받은 로봇헌법 작성

 구글의 AI 연구부문 "구글 딥마인드(Google DeepMind)" 로봇공학팀이, 로봇에게 간단한 명령만 내리는 것만으로 작업을 수행받는 미래를 위한 연구 성과를 발표했는데, 그 중 트레이닝 데이터 수집 시스템 "AutoRT"에는, 아이작 아시모프의 "로봇공학 3원칙"을 바탕으로 한 "로봇헌법"이 포함되어 있다고 한다.



"AutoRT"는, 현실 세계에서 도움이 되는 로봇을 만들기 위한 적절한 훈련을 실현하는 보다 실천적이고 다양한 훈련 데이터를 수집하는 시스템. 실제로 7개월간의 실증 실험을 통해, 다양한 상황에서 20대의 로봇을 동시에 제어하여, 총 52대의 로봇으로 6650개의 독특한 작업에 걸친 7만7000번의 시도로 이루어진 다양한 데이터 세트를 수집할 수 있었다.


로봇이라고 해도 형상은 다양하지만, 이 실험에서 이용된 로봇은 "카메라", "암", "이동 베이스"로 이루어진 심플한 것으로, 카메라로 포착한 영상을 기초로, 시각 언어 모델(VLM)이 환경이라고 보이는 물체를 이해. 대규모 언어모델(LLM)은 로봇이 실행 가능한 창조적 작업 목록을 만들고, 거기서 수행해야 할 적절한 작업을 선택하는 의사결정자 역할을 했다고 한다.


현실 세계에서 로봇을 움직이는 데 중요한 것은 안전성으로, 아이작 아시모프는 "로봇은 인간에게 상처를 줘서는 안 된다", "앞의 원칙에 어긋나지 않는 한 로봇은 인간의 명령에 따라야 한다", :앞의 원칙에 어긋나지 않는 한 로봇은 스스로를 지켜야 한다"는 "로봇공학 3원칙"을 자신의 SF소설에서 보여주었다.


AutoRT는 이 세 원칙에 영감을 받은, 로봇이 작업을 수행함에 있어 준수해야 할 "로봇 헌법"을 의사결정자, 즉 LLM에 제공하고 있다. 또 안전규칙에 인간이나 동물, 예리한 것, 전자제품에 관련된 작업을 로봇이 시도해서는 안 된다는 것도 규정돼 있다는 것.



그러나, 이러한 "로봇 헌법"이나 안전규칙이 있어도 안전성은 보장되지 않는다고 하여, AutoRT에는 "관절에 가해지는 힘이 일정 이상이 되면 자동으로 정지한다"는 등의 대책이 포함되어 있으며, 모든 액티브 로봇은 물리적 킬 스위치를 가진 인간 감시자의 시야 내에 유지된다고 한다.


이 밖에 Google DeepMind는 Transformer 모델의 새로운 효율화를 실현하는 "SARA-RT", 트레이닝용 영상에 시각적 아웃라인을 추가함으로써 로봇의 움직임의 일반화를 지원하는 "RT-Trajectory"를 발표.

Previous
Next Post »