ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 구글 GenEM, LLM을 활용한 적응 조합이 가능한 표현 로봇 동작 생성
    인공지능 2024. 2. 12. 20:08

    구글 딥마인드, 토론토대학교, 그리고 호쿠 랩스의 연구진이 대형언어모델(LLM)을 활용하여 로봇의 다양한 표현 행동을 생성할 수 있는 새로운 솔루션 '젠EM(GenEM)'을 개발했다는 소식은 로봇공학과 인공지능 분야에 중요한 발전을 의미합니다. 이 기술은 로봇이 인간의 감정과 의사소통 방식을 더욱 정교하게 모방할 수 있게 함으로써, 인간-로봇 상호작용을 한층 더 자연스럽고 효과적으로 만들 것으로 기대됩니다.

    Generative Expressive Motion (GenEM)
    Generative Expressive Motion (GenEM)

    젠EM(GenEM)의 핵심 기능

    • 풍부한 사회적 맥락 이해: 젠EM은 LLM의 광범위한 지식을 활용하여 사회적 맥락에 기반한 표현 행동을 동적으로 생성합니다. 이는 로봇이 상황에 맞는 적절한 제스처를 사용할 수 있게 하여, 인간과의 상호작용을 더욱 의미 있고 자연스럽게 만듭니다.
    • 자연어 명령으로 제스처 생성: 젠EM은 자연어 명령을 받아 이를 로봇의 표현 행동으로 변환하는 일련의 AI 에이전트를 사용합니다. 이 과정에서 로봇은 주어진 사회적 맥락을 이해하고, 적절한 API 호출을 통해 원하는 행동을 수행합니다.
    • 단계별 접근 방식: 젠EM의 파이프라인은 생각의 사슬 기법인 LLM을 통해 인간 반응을 설명하고, 이를 로봇의 움직임으로 변환하는 여러 단계를 포함합니다. 이 접근 방식은 로봇이 인간의 감정과 반응을 더욱 세밀하게 모방할 수 있게 합니다.
    • 프롬프트 엔지니어링 기반: 젠EM은 특별한 LLM 훈련 없이도 작동하며, 로봇의 기능과 API 명세에 맞게 조정만 하면 됩니다. 이는 로봇 개발자들이 기존의 로봇 시스템에 젠EM을 쉽게 통합할 수 있게 해 줍니다.

    젠EM의 시사점과 잠재적 영향

    젠EM의 개발은 로봇이 인간의 사회적 상호작용을 더욱 잘 이해하고 반영할 수 있게 하는 중요한 발전입니다. 이는 다음과 같은 잠재적 영향을 가질 수 있습니다:

    • 인간-로봇 상호작용의 자연스러움 증가: 로봇이 인간의 제스처와 표현을 더욱 정교하게 모방할 수 있게 되면, 사람들은 로봇과의 상호작용을 더욱 편안하고 자연스럽게 느낄 수 있습니다.
    • 로봇의 사회적 적용 확대: 젠EM과 같은 기술은 로봇이 교육, 의료, 고객 서비스 등 다양한 분야에서 인간과 더욱 효과적으로 상호작용하는 데 사용될 수 있습니다.
    • 로봇 설계와 개발의 새로운 방향 제시: 젠EM은 프롬프트 엔지니어링과 LLM을 기반으로 한 새로운 접근 방식을 통해 로봇 설계와 개발 과정에 새로운 가능성을 열어 줍니다.

    이러한 기술의 발전은 로봇과 인간 간의 경계를 더욱 흐리게 만들며, 미래의 인간-로봇 상호작용에 있어 중요한 역할을 할 것으로 기대됩니다. 구글 딥마인드, 토론토대학교, 그리고 호쿠 랩스의 연구진이 개발한 젠EM은 로봇공학과 인공지능 분야에서의 혁신적인 발전을 상징하며, 이 분야의 미래 연구 방향에 대한 중요한 통찰을 제공합니다.

    https://arxiv.org/abs/2401.14673v2

     

    Generative Expressive Robot Behaviors using Large Language Models

    People employ expressive behaviors to effectively communicate and coordinate their actions with others, such as nodding to acknowledge a person glancing at them or saying "excuse me" to pass people in a busy corridor. We would like robots to also demonstra

    arxiv.org

    "대형언어모델(Large Language Models)을 사용한 생성적 표현 로봇 행동"에 관한 연구로, 로봇의 표현 행동을 생성하는 새로운 접근법인 GenEM을 소개합니다. 이 방법은 대형언어모델을 활용해 언어 지시사항을 로봇의 매개변수화된 제어 코드로 변환하여, 고개 끄덕임, 고개 흔들기, 빛 표시 등의 표현 행동을 수행할 수 있게 합니다. 사용자 연구와 실험을 통해 GenEM에 의해 생성된 행동이 사용자에게 이해하기 쉽고 유능하게 인식됨을 보여주며, LLM이 로봇의 표현력과 인간과의 상호작용을 향상시킬 잠재력을 강조합니다.

    사람들은 효과적인 의사소통과 타인과의 행동 조율을 위해 표현 행동을 사용합니다. 예를 들어, 누군가를 인정하기 위해 고개를 끄덕이거나 붐비는 복도에서 사람들을 지나가기 위해 "실례합니다"라고 말하는 것입니다. 로봇이 인간-로봇 상호작용에서도 이러한 표현 행동을 보여주기를 원합니다. 이전 연구에서는 새로운 의사소통 방식이나 사회적 상황에 확장하기 어려운 규칙 기반 방법을 제안했고, 데이터 기반 방법은 로봇이 사용되는 각 사회적 상황에 대한 전문화된 데이터셋이 필요합니다. 우리는 대규모 언어 모델(LLMs)에서 제공하는 풍부한 사회적 맥락과 지시사항이나 사용자 선호에 기반한 동작 생성 능력을 활용하여, 서로 위에 구축되는 적응 가능하고 조합 가능한 표현 로봇 동작을 생성할 것을 제안합니다.

    2401.14673v2.pdf
    1.94MB

     

     

Designed by Tistory.