오픈AI DevDay 2024: AI 접근성과 비용 효율성을 높이는 4가지 업데이트

인공지능 2024. 10. 2. 13:13

2024년 10월 2일에 개최된 OpenAI의 DevDay는 2023년의 화려한 이벤트와는 다르게, 더 차분한 분위기 속에서 이루어졌습니다. 대규모 제품 출시는 없었지만, 기존 AI 도구와 API에 대한 점진적인 개선에 중점을 둔 것이 이번 행사의 특징입니다. OpenAI는 AI 경쟁이 치열해지는 가운데 개발자를 강화하고 커뮤니티의 이야기를 조명하는 데 집중함으로써, 새로운 전략적 전환을 보여주었습니다.

이번 DevDay에서 OpenAI는 4가지 주요 혁신을 발표했습니다: Vision Fine-Tuning, 실시간 API(Realtime API), 모델 증류(Model Distillation), 그리고 프롬프트 캐싱(Prompt Caching). 이들 도구는 OpenAI가 엔드 유저 애플리케이션 시장에서 경쟁하기보다는, 개발자 생태계를 강화하는 방향으로 전략적 초점을 맞추고 있음을 나타냅니다.

업데이트	내용	장점	적용 사례
프롬프트 캐싱 (Prompt Caching)	모델이 최근 처리한 입력 토큰에 대해 50% 할인 제공	비용 절감, 지연 시간 감소	자주 사용하는 컨텍스트를 재사용하는 애플리케이션
비전 파인 튜닝 (Vision Fine-Tuning)	이미지와 텍스트를 활용하여 GPT-4o의 시각적 이해 능력을 맞춤화	소량의 학습 데이터로 시각적 정확도 및 처리 능력 향상	Grab의 지도 서비스: 차선 수 및 속도 제한 표지판 정확도 개선
실시간 API (Realtime API)	저지연 음성 대 음성(speech-to-speech) 애플리케이션 구축 가능	대화형 AI 경험을 더욱 자연스럽고 직관적으로 개선	Healthify, Speak과 같은 음성 기반 애플리케이션
모델 증류 (Model Distillation)	고급 모델의 출력을 활용하여 더 효율적인 모델의 성능을 개선	리소스 제한 환경에서도 고급 AI 기능 사용 가능	소규모 의료 스타트업: 컴팩트한 AI 진단 도구 개발

프롬프트 캐싱(Prompt Caching): 개발자 비용 절감의 기회

가장 주목할 만한 발표 중 하나는 프롬프트 캐싱 기능의 도입입니다. 이 기능은 개발자의 비용과 지연 시간을 줄이는 데 중점을 둔 것으로, 모델이 최근에 처리한 입력 토큰에 대해 자동으로 50% 할인을 적용하는 시스템입니다. 이는 자주 사용하는 컨텍스트를 재활용하는 애플리케이션에서 상당한 비용 절감을 가능하게 할 수 있습니다.

OpenAI의 플랫폼 제품 책임자인 올리비에 고드망(Olivier Godement)은 이번 개발자 회의를 시작하면서 샌프란시스코 본사에서 소규모 기자 회견을 열어 이렇게 말했습니다. "우리는 지난 2년 동안 상당히 바빴습니다. 2년 전만 해도 GPT-3가 최고의 성과를 내고 있었죠. 이제 우리는 비용을 거의 1000배나 줄였습니다. 최근 2년 안에 비용을 1000배 줄인 기술 사례를 찾으려 했지만, 생각나는 예가 없습니다." 이 엄청난 비용 절감은 이전에는 비용 문제로 시도하지 못했던 새로운 애플리케이션을 탐구할 수 있는 기회를 스타트업과 대기업에 제공합니다.

오픈AI, API에서의 프롬프트 캐싱 소개

API에서의 프롬프트 캐싱모델이 최근 본 입력에 대해 자동으로 할인을 제공합니다.많은 개발자가 AI 애플리케이션을 구축할 때 코드베이스를 편집하거나 챗봇과 긴 다중 턴 대화를 나누는 경우

triangular.tistory.com

비전 파인튜닝(Vision Fine-Tuning): 시각적 AI의 새로운 영역

또 다른 중요한 발표는 OpenAI의 최신 대형 언어 모델인 GPT-4o에 대한 비전 파인 튜닝(Vision Fine-Tuning) 기능의 도입입니다. 이 기능은 개발자가 이미지와 텍스트를 모두 사용하여 모델의 시각적 이해 능력을 맞춤화할 수 있도록 합니다.

이 업데이트의 잠재적 영향은 자율주행차, 의료 영상 처리, 시각적 검색 기능 등 다양한 분야에 걸쳐 있습니다. OpenAI에 따르면, 동남아시아의 주요 음식 배달 및 라이드셰어 회사인 Grab은 이미 이 기술을 활용해 지도 서비스의 정확도를 향상시켰다고 합니다. Grab은 단 100개의 예시를 사용하여 차선 수 정확도를 20% 개선하고, 속도 제한 표지판 로컬라이제이션에서 13% 향상을 달성했다고 보고했습니다. 이 실제 사례는 소량의 시각적 학습 데이터를 사용하여 비전 파인 튜닝이 AI 기반 서비스를 어떻게 극적으로 향상시킬 수 있는지를 보여줍니다.

오픈AI, 비전 기능을 포함한 파인 튜닝 API 소개

비전 기능을 포함한 파인 튜닝 API 소개이제 개발자는 이미지와 텍스트로 GPT-4o를 미세 조정하여 비전 기능을 개선할 수 있습니다.오늘 우리는 GPT-4o에서 비전 파인 튜닝(Vision Fine-tuning)을

triangular.tistory.com

실시간 API(Realtime API): 대화형 AI의 격차를 메우다

OpenAI는 실시간 API(Realtime API)도 공개했습니다. 이제 공개 베타 상태로 제공되는 이 API는 개발자가 음성 대 음성(speech-to-speech) 애플리케이션에서 저지연, 다중 모달 경험을 만들 수 있도록 합니다. 이는 개발자가 ChatGPT의 음성 제어 기능을 애플리케이션에 추가할 수 있음을 의미합니다.

OpenAI는 이번 DevDay에서 실시간 API의 잠재력을 보여주기 위해 Wanderlust라는 여행 계획 애플리케이션을 업데이트해 시연했습니다. 이 API를 통해 사용자는 앱과 직접 대화하여 여행 계획을 세울 수 있습니다. 시스템은 심지어 중간에 말을 끊을 수 있도록 설계되어, 인간과의 대화를 모방합니다.

여행 계획은 하나의 예시일 뿐이며, 실시간 API는 다양한 산업 분야에서 음성 지원 애플리케이션의 가능성을 열어줍니다. 고객 서비스, 교육, 접근성 도구 등에서 개발자는 더욱 직관적이고 반응적인 AI 기반 경험을 만들 수 있는 강력한 새 도구를 얻게 되었습니다.

고드망은 "우리가 제품을 설계할 때는 스타트업과 대기업 모두를 대상으로 합니다. 알파 버전에서 많은 기업들이 이 API를 사용하고 있습니다."라고 설명했습니다. 실시간 API는 음성 비서와 같은 대화형 AI 도구를 구축하는 과정을 간소화하여, 음성 인식, 추론, 텍스트-음성 변환을 위해 여러 모델을 결합할 필요가 없게 만듭니다.

초기 채택자로는 영양 및 피트니스 코칭 앱인 Healthify와 언어 학습 플랫폼인 Speak이 있으며, 이들은 이미 실시간 API를 제품에 통합했습니다. 이러한 구현은 실시간 API가 헬스케어에서 교육에 이르기까지 다양한 분야에서 자연스럽고 몰입도 높은 사용자 경험을 창출할 수 있는 잠재력을 보여줍니다.

실시간 API의 가격 구조는 분당 오디오 입력 비용이 $0.06, 오디오 출력 비용이 $0.24로 저렴하지는 않지만, 음성 기반 애플리케이션을 구축하려는 개발자들에게는 상당한 가치 제안이 될 수 있습니다.

오픈AI, 실시간 API 소개

실시간 API 소개이제 개발자는 애플리케이션에 빠른 음성 대화 환경을 구축할 수 있습니다.오늘 우리는 실시간 API의 공개 베타 버전을 도입하여 모든 유료 개발자가 앱에서 저지연, 멀티모달 경

triangular.tistory.com

모델 증류(Model Distillation): 더 많은 접근성을 위한 AI

https://openai.com/index/api-model-distillation/

가장 변혁적인 발표 중 하나는 모델 증류(Model Distillation)의 도입이었습니다. 이 통합 워크플로우는 o1-preview 및 GPT-4o와 같은 고급 모델의 출력을 사용하여 GPT-4o mini와 같은 더 효율적인 모델의 성능을 개선할 수 있도록 합니다.

이 접근 방식은 더 작은 기업들이 고급 모델과 유사한 기능을 활용하면서도 동일한 계산 비용을 지불하지 않도록 합니다. 이는 리소스 집약적인 시스템과 더 적은 리소스를 사용하는 시스템 간의 오랜 격차를 해소하는 데 도움을 줄 수 있습니다.

예를 들어, 농촌 지역 클리닉에서 사용할 AI 기반 진단 도구를 개발하는 작은 의료 기술 스타트업이 있다고 가정해 보겠습니다. 모델 증류를 통해 이 회사는 더 큰 모델의 진단 능력을 많이 반영하는 컴팩트한 모델을 학습시킬 수 있으며, 이를 표준 노트북이나 태블릿에서도 실행할 수 있습니다. 이는 리소스가 제한된 환경에서 정교한 AI 기능을 제공하여, 소외된 지역에서의 의료 결과를 개선할 수 있는 잠재력을 가집니다.

오픈AI, API에서의 모델 증류 소개

API에서의 모델 증류대형 모델의 출력을 사용하여 비용 효율적인 모델을 파인 튜닝 – OpenAI 플랫폼에서 모두 가능오늘 우리는 모델 증류(Model Distillation) 기능을 새롭게 제공하여, 개발자가 OpenAI

triangular.tistory.com

OpenAI의 전략적 변화: 지속 가능한 AI 생태계 구축

OpenAI의 DevDay 2024는 대중의 이목을 끄는 제품 출시보다는 생태계 개발을 우선시하는 전략적 전환을 보여줍니다. 이번 접근 방식은 일반 대중에게는 덜 흥미로울 수 있지만, AI 산업의 현재 과제와 기회를 성숙하게 이해하고 있음을 보여줍니다.

이번 행사는 GPT 스토어 및 커스텀 GPT 생성 도구 출시로 iPhone 같은 흥분을 불러일으킨 2023년 DevDay와는 확연히 대조됩니다. 그러나 그 이후로 AI를 둘러싼 환경은 급격히 진화했습니다. 경쟁 업체들이 상당한 발전을 이루었고, 학습 데이터를 확보하는 문제에 대한 우려도 심화되었습니다. OpenAI의 이번 전략은 이러한 변화에 대한 신중한 대응으로 보이며, 모델의 효율성과 비용 효율성을 개선함으로써 경쟁력을 유지하고, 리소스 강도와 환경적 영향을 고려하는 것에 중점을 둔 것으로 보입니다.

OpenAI가 이제 혁신적인 파괴자가 아닌 플랫폼 제공자로 전환하면서, 그 성공 여부는 개발자 생태계를 얼마나 잘 구축할 수 있는지에 달려 있습니다. 개선된 도구와 비용 절감, 지원 증가를 통해 OpenAI는 장기적인 성장과 AI의 산업 전반에 걸친 확산을 위한 토대를 마련하고 있습니다.

https://openai.com/devday/

https://community.openai.com/t/devday-2024-san-francisco-live-ish-news/963456

저작자표시 비영리 변경금지

'인공지능' 카테고리의 다른 글

오픈AI, 비전 기능을 포함한 파인 튜닝 API 소개 (1)	2024.10.02
오픈AI, 실시간 API 소개 (4)	2024.10.02
소프트뱅크, 오픈AI에 6600억 원 투자 생성형 AI 산업 도약 (2)	2024.10.02
화웨이, 중국 엔비디아 시장 탈환 Ascend 910C GPU 샘플링 시작 (4)	2024.10.02
2024년 생성형 AI 트렌드 : AI 에이전트와 오픈소스 (5)	2024.10.01

ABOUT ME

Triangular Triangular

프롬프트 캐싱(Prompt Caching): 개발자 비용 절감의 기회

비전 파인튜닝(Vision Fine-Tuning): 시각적 AI의 새로운 영역

실시간 API(Realtime API): 대화형 AI의 격차를 메우다

모델 증류(Model Distillation): 더 많은 접근성을 위한 AI

OpenAI의 전략적 변화: 지속 가능한 AI 생태계 구축

'인공지능' 카테고리의 다른 글

티스토리툴바

ABOUT ME

프롬프트 캐싱(Prompt Caching): 개발자 비용 절감의 기회

비전 파인튜닝(Vision Fine-Tuning): 시각적 AI의 새로운 영역

실시간 API(Realtime API): 대화형 AI의 격차를 메우다

모델 증류(Model Distillation): 더 많은 접근성을 위한 AI

OpenAI의 전략적 변화: 지속 가능한 AI 생태계 구축

'인공지능' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바