ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 뉴럴 칩 원조 IBM, 더 빠르고 효율적인 AI 칩 아키텍처(NorthPole) 발표
    인공지능 2023. 10. 23. 00:47

    우리는 지금 AI의 캄브리아기 폭발의 한가운데에 있습니다. 지난 10년 동안 AI는 이론과 소규모 테스트에서 엔터프라이즈 규모의 사용 사례로 발전했습니다. 하지만 AI 시스템을 실행하는 데 사용되는 하드웨어는 점점 더 강력해졌지만 오늘날의 AI를 염두에 두고 설계되지 않았습니다. AI 시스템이 확장됨에 따라 비용도 치솟습니다. 그리고 프로세서의 회로 밀도가 매년 두 배로 증가한다는 무어의 법칙은 그 속도가 느려졌습니다.

    하지만 캘리포니아 알마덴에 위치한 IBM 연구소에서 20년 가까이 진행된 새로운 연구는 강력한 AI 하드웨어 시스템을 효율적으로 확장하는 방법을 크게 바꿀 수 있는 잠재력을 가지고 있습니다.

    반도체 산업이 탄생한 이래 컴퓨터 칩은 주로 처리 장치와 처리할 정보를 저장하는 메모리가 개별적으로 저장되는 동일한 기본 구조를 따랐습니다. 이 구조는 수십 년 동안 확장성이 뛰어난 단순한 설계를 가능하게 했지만, 메모리와 처리 장치, 칩 내의 다른 장치 간에 데이터를 계속 주고받는 데 시간과 에너지가 소모되는 폰 노이만 병목 현상을 일으켰습니다. IBM Research의 다르멘드라 모다와 그의 동료들은 뇌가 계산하는 방식에서 영감을 얻어 이를 바꾸는 것을 목표로 합니다. "폰 노이만 아키텍처와는 완전히 다른 길을 개척하는 것입니다."라고 Modha는 말합니다.

    지난 8년 동안 Modha는 신경 추론을 위한 새로운 유형의 디지털 AI 칩을 개발해 왔으며, 이를 NorthPole이라고 부릅니다. 이 칩은 2014년 이전에 Modha가 마지막으로 작업했던 두뇌에서 영감을 받은 칩인 TrueNorth의 확장판입니다. 이 새로운 프로토타입 디바이스는 널리 사용되는 ResNet-50 이미지 인식 및 YOLOv4 물체 감지 모델에 대한 테스트에서 현재 시중에 나와 있는 다른 어떤 칩보다 높은 에너지 효율, 높은 공간 효율성, 낮은 지연 시간을 보여주었으며 TrueNorth보다 약 4,000배 더 빠른 것으로 나타났습니다.

    BM Northpole
    IBM Northpole (* source IBM)

    노스폴 칩의 첫 번째 유망한 결과가 사이언스지에 게재되었습니다. 모댜에 따르면 노스폴은 에너지, 공간, 시간 효율성을 크게 개선하는 획기적인 칩 아키텍처입니다. ResNet-50 모델을 벤치마크로 사용한 결과, 노스폴은 일반적인 12nm GPU와 14nm CPU보다 훨씬 더 효율적입니다. (노스폴 자체는 12nm 노드 처리 기술을 기반으로 합니다.) 두 경우 모두 필요한 전력 1줄당 해석되는 프레임 수에서 노스폴은 25배 더 에너지 효율적입니다. 또한 노스폴은 필요한 트랜지스터 10억 개당 초당 해석되는 프레임 수와 지연 시간, 계산에 필요한 공간에서도 더 나은 성능을 보였습니다. Modha에 따르면, ResNet-50에서 노스폴은 현재 널리 사용되는 모든 주요 아키텍처, 심지어 4nm 공정으로 구현된 GPU와 같은 고급 기술 프로세스를 사용하는 아키텍처보다 성능이 뛰어납니다.

    어떻게 기존 칩보다 훨씬 효율적으로 컴퓨팅할 수 있을까요? 노스폴의 가장 큰 차이점 중 하나는 장치의 모든 메모리가 개별적으로 연결되지 않고 칩 자체에 있다는 점입니다. 폰 노이만 병목 현상이 없기 때문에 이미 시중에 나와 있는 다른 칩보다 훨씬 빠르게 AI 추론을 수행할 수 있습니다. 노스폴은 12nm 노드 공정으로 제작되었으며, 800제곱밀리미터에 220억 개의 트랜지스터가 포함되어 있습니다. 256개의 코어로 구성되어 있으며 8비트 정밀도로 사이클당 코어당 2,048개의 연산을 수행할 수 있으며, 4비트와 2비트 정밀도로 각각 2배와 4배로 연산 수를 늘릴 수 있습니다. "칩에 전체 네트워크가 탑재된 셈입니다."라고 모댜는 말합니다.

    PCIe 카드의 노스폴 칩
    PCIe 카드의 NorthPole Chip   (* source IBM)

    "구조적으로 노스폴은 컴퓨팅과 메모리 사이의 경계를 모호하게 만듭니다."라고 모댜는 말합니다. "개별 코어 수준에서는 노스폴이 메모리에 가까운 컴퓨팅으로 나타나고 칩 외부의 입출력 수준에서는 활성 메모리로 나타납니다." 따라서 노스폴은 시스템에 쉽게 통합할 수 있으며 호스트 머신의 부하를 크게 줄여줍니다.

    하지만 노스폴의 가장 큰 장점은 온보드 메모리에서 쉽게 가져올 수 있다는 제약 조건이기도 합니다. 칩이 다른 곳에서 정보에 액세스해야 하는 경우 칩에서 가능한 모든 속도 향상이 저하될 수 있습니다. 스케일아웃이라는 접근 방식을 통해 노스폴은 신경망을 노스폴의 모델 메모리에 맞는 작은 하위 네트워크로 나누고 이러한 하위 네트워크를 여러 노스폴 칩에 연결함으로써 실제로 더 큰 신경망을 지원할 수 있습니다. 따라서 특정 애플리케이션에 유용한 많은 모델을 위해 노스폴(또는 노스폴 세트)에 충분한 메모리가 있지만, 이 칩이 모든 것을 다 할 수 있는 것은 아닙니다. "이 칩에서 GPT-4를 실행할 수는 없지만 기업이 필요로 하는 많은 모델을 지원할 수 있습니다."라고 Modha는 말합니다. "물론 노스폴은 추론에만 사용할 수 있습니다."

    이러한 효율성은 이 장치가 작동하는 데 부피가 큰 액체 냉각 시스템이 필요하지 않다는 것을 의미하며, 팬과 방열판만으로도 충분하기 때문에 다소 좁은 공간에도 배치할 수 있습니다.

    노스폴의 잠재적 활용 분야

    노스폴 칩에 대한 연구는 아직 진행 중이지만, 노스폴 칩의 구조는 새로운 AI 사용 사례와 이미 확립된 사용 사례에 적합합니다.

    노스폴 팀은 테스트 과정에서 주로 컴퓨터 비전 관련 용도에 초점을 맞추었는데, 이는 프로젝트에 대한 자금이 미국 국방부로부터 지원되었기 때문입니다. 주로 고려한 애플리케이션은 감지, 이미지 분할, 비디오 분류 등이었습니다. 그러나 자연어 처리(인코더 전용 BERT 모델) 및 음성 인식(DeepSpeech2 모델)과 같은 다른 분야에서도 테스트를 거쳤습니다. 팀은 현재 디코더 전용 대규모 언어 모델을 노스폴 스케일아웃 시스템에 매핑하는 방안을 모색하고 있습니다.

    이러한 AI 작업을 생각하면 자율 주행 차량부터 로봇 공학, 디지털 비서 또는 공간 컴퓨팅에 이르기까지 모든 종류의 환상적인 사용 사례가 떠오릅니다. 실시간으로 방대한 양의 데이터를 처리해야 하는 다양한 종류의 엣지 애플리케이션이 노스폴에 적합할 수 있습니다. 예를 들어, 노스폴은 소규모로 작동하기 위해 정해진 지도와 경로가 필요한 기계에서 숙련된 인간 운전자에게도 현실 세계의 내비게이션을 어렵게 만드는 드문 에지 케이스 상황에 대해 생각하고 반응할 수 있는 장치로 자율주행 차량을 이동시키는 데 필요한 종류의 장치가 될 수 있습니다. 이러한 종류의 엣지 케이스는 향후 노스폴 애플리케이션에 딱 맞는 분야입니다. 노스폴은 농업을 모니터링하고 야생동물 개체수를 관리하며, 차량과 화물을 모니터링하여 더 안전하고 덜 혼잡한 도로를 만들고, 로봇을 안전하게 작동시키고, 사이버 위협을 탐지하여 더 안전한 비즈니스를 위한 위성을 구현할 수 있습니다.

    다음 단계

    이것은 북극의 Modha를 위한 작업의 시작에 불과합니다. 현재 CPU의 최첨단 기술은 3nm이며, IBM은 이미 수년 전부터 2nm 노드에 대한 연구를 진행하고 있습니다. 즉, 근본적인 아키텍처 혁신과 더불어 노스폴이 구현할 수 있는 몇 가지 세대의 칩 프로세싱 기술이 있으며, 이를 통해 효율성과 성능 향상을 지속적으로 모색할 수 있습니다.

    하지만 모댜에게 이것은 지난 19년간의 커리어를 지배해 온 연속선상에서 하나의 중요한 이정표에 불과합니다. 그는 뇌가 우리가 알고 있는 가장 에너지 효율적인 프로세서라는 사실을 알고 이를 디지털로 복제할 수 있는 방법을 모색하면서 그 기간 동안 뇌에서 영감을 받은 디지털 칩을 연구해 왔습니다. 트루노스는 뇌의 뉴런 구조에서 완전히 영감을 받아 꿀벌의 뇌만큼이나 많은 디지털 '시냅스'를 내장하고 있습니다. 하지만 2015년 샌프란시스코의 한 공원 벤치에 앉아 모드는 지금까지의 작업에 대해 곰곰이 생각해 보았다고 합니다. 그는 기억과 처리가 뇌 전체에 산재되어 있는 뇌의 처리 구조에 전통적인 처리 장치의 장점을 결합하면 무언가 해답이 있을 것이라는 믿음을 가지고 있었습니다. 모댜에 따르면 그 해답은 "실리콘 속도의 뇌에서 영감을 받은 컴퓨팅"이었습니다.

    이후 8년 동안 Modha와 그의 동료들은 이 비전을 현실로 만들기 위해 한마음 한뜻으로 연구에 매진했습니다. 알마덴에서 눈에 띄지 않게 고군분투한 이 팀은 올해까지 자신들의 작업에 대해 강연을 하거나 논문을 발표하지 않았습니다. 각자 다른 기술과 관점을 가지고 있었지만 모두가 협력했기 때문에 전체적으로 팀의 공헌은 부분의 합보다 훨씬 컸습니다. 이제 계획은 설계를 더 작은 칩 생산 공정으로 전환하는 방법을 모색하고 아키텍처의 가능성을 더 탐구하면서 NorthPole이 무엇을 할 수 있는지 보여줄 것입니다.

    이 작업은 어떻게 하면 뇌처럼 작동하는 컴퓨터를 만들 수 있을까라는 단순한 아이디어에서 시작되었으며, 수년간의 기초 연구 끝에 그 해답을 찾았습니다. 컴퓨팅의 큰 문제를 탐구할 수 있는 시간과 공간이 있는 IBM 리서치와 같은 곳에서만 가능한 일입니다. "노스폴은 실리콘 웨이퍼의 거울에 비친 뇌의 희미한 모습입니다."라고 모댜는 말합니다.

     

    IBM Research's new NorthPole AI chip | IBM Research Blog

    A new prototype chip from IBM Research could potentially bring energy-efficient AI to the edge.

    research.ibm.com

    More information: Dharmendra S. Modha et al, Neural inference at the frontier of energy, space, and time, Science (2023). DOI: 10.1126/science.adh1174

    Subramanian S. Iyer et al, AI computing reaches for the edge, Science (2023). DOI: 10.1126/science.adk6874

    Journal information: Science 
Designed by Tistory.