-
ChatGPT 등장, 공개 지식 공유에 미친 영향: 스택 오버플로우 활동 25% 감소인공지능 2024. 10. 3. 00:52
최근 PNAS Nexus에 발표된 연구에 따르면, 대형 언어 모델(LLM)인 ChatGPT의 널리 확산된 사용이 프로그래밍 Q&A 사이트인 스택 오버플로우(Stack Overflow)와 같은 공개 지식 공유 플랫폼의 활동 감소를 유발한 것으로 나타났습니다. 연구는 ChatGPT 출시 후 6개월 동안 스택 오버플로우에서의 사용자 활동이 유사한 플랫폼 대비 25% 감소했다고 밝혔으며, 이는 ChatGPT에 접근할 수 없는 플랫폼들과의 차이를 통해 나타난 결과입니다.
마리아 델 리오 차노나(Maria del Rio-Chanona), 복잡성 과학 허브(CSH)의 부교수 겸 연구의 제1 저자는 “LLM은 매우 강력하고 가치가 높아, 세상에 큰 영향을 미칩니다. 이 기술의 미래에 대해 생각해 볼 필요가 있습니다.”라고 강조했습니다.
델 리오 차노나는 "사람들이 스택 오버플로우와 같은 공개 플랫폼에서 질문을 올리고 답변을 받는 대신, ChatGPT와 같은 LLM을 통해 개인적으로 질문을 해결하고 있다는 것이 우리의 연구 가설이었습니다. 그러나 LLM은 이러한 공개적이고 공공의 데이터를 기반으로 훈련된다는 점에서, 그들이 대체하고 있는 이 데이터를 지속적으로 어떻게 확보할 것인지가 의문입니다."라고 덧붙였습니다. 델 리오 차노나는 런던 대학교(UCL)의 조교수로 활동하며, 옥스퍼드 마틴 스쿨 산하 신경제사고 연구소 및 케임브리지 대학교의 베넷 공공정책 연구소에서도 연구를 수행하고 있습니다.
중요한 시사점
연구팀은 ChatGPT 출시 이후 스택 오버플로우에서 질문과 답변이 점점 줄어드는 현상을 관찰했습니다. 델 리오 차노나는 “이러한 현상은 매우 큰 시사점을 가지고 있습니다. 이는 미래에 AI 모델을 훈련할 수 있는 공개 데이터가 충분하지 않을 수 있다는 것을 의미합니다.”라고 경고했습니다. 본 연구는 뮌헨 루트비히 막시밀리안 대학교의 나제야 라우렌트세바(Nadzeya Laurentsyeva)와 복잡성 과학 허브 및 부다페스트 코르비누스 대학교의 요하네스 왁스(Johannes Wachs)와 공동으로 진행되었습니다.
왁스는 “스택 오버플로우는 인터넷에 연결된 누구나 접근할 수 있는 매우 가치 있는 지식 데이터베이스입니다. 전 세계 사람들이 타인이 게시한 질문과 답변을 통해 학습합니다.”라고 설명했습니다. 아이러니하게도, ChatGPT와 같은 AI 모델조차 스택 오버플로우에 게시된 인간이 생성한 콘텐츠로 훈련됩니다. 그러나 인간이 생성한 콘텐츠가 AI에 의해 대체되면서, 이는 AI 모델을 훈련하는 데 필요한 공공 데이터의 양을 감소시키고 있습니다. AI가 생성한 데이터를 기반으로 새로운 모델을 훈련하는 것은 일반적으로 성능이 떨어지는 것으로 평가되며, 이는 마치 복사된 문서를 다시 복사하는 것과 비슷하다는 설명입니다.
공개에서 개인으로의 지식 이동
이번 연구는 기술적 변화뿐만 아니라 경제 및 사회 구조의 변화를 포괄하는 시나리오도 제시합니다. LLM과의 상호작용이 증가함에 따라 사용자가 공개 지식 플랫폼에 기여하는 동기가 감소할 수 있으며, 그 결과 귀중한 데이터가 공공 저장소에서 민간 AI 시스템으로 이동한다고 연구진은 설명합니다. 연구진은 “이것은 지식이 공개 도메인에서 개인 도메인으로 이동하는 중요한 변화를 나타냅니다.”라고 강조했습니다.
또한, 이러한 변화는 AI 분야의 초기 선도 기업들의 경쟁 우위를 더욱 심화시켜, 지식과 경제력이 집중되는 현상을 가속화할 수 있다는 점도 지적했습니다.
모든 경험 및 품질 수준에 영향
델 리오 차노나와 연구진은 스택 오버플로우의 콘텐츠 생성 감소가 초보자부터 전문가에 이르기까지 모든 수준의 사용자에게 영향을 미쳤음을 발견했습니다. 또한, 사용자 피드백으로 측정한 게시물의 품질이 크게 떨어지지 않았다는 점에서, LLM에 의해 저품질 및 고품질 기여 모두가 대체되고 있음을 시사합니다.
더 나아가, 특정 프로그래밍 언어, 특히 파이썬(Python)과 자바스크립트(JavaScript)에 대한 게시 활동이 플랫폼의 평균보다 더 많이 감소한 것으로 나타났습니다. 델 리오 차노나는 “파이썬과 자바스크립트, 이 두 가지 가장 많이 사용되는 프로그래밍 언어에 대한 질문들이 스택 오버플로우보다는 ChatGPT에서 이루어지고 있다는 것을 시사하는 결과입니다.”라고 설명했습니다.
연구에 대해
이 연구는 “대형 언어 모델(LLM)이 온라인 Q&A 플랫폼에서 공개 지식 공유를 감소시킨다”는 제목으로 R 마리아 델 리오 차노나, 나제야 라우렌트세바, 요하네스 왁스에 의해 수행되었으며, PNAS Nexus에 발표되었습니다. 연구는 온라인에서 확인할 수 있습니다.
이번 연구는 AI 기술의 발전이 오히려 공개 지식 생태계를 잠식할 수 있다는 우려를 낳으며, 이는 AI가 발전을 위해 의존해왔던 데이터의 고갈로 이어질 수 있다는 심각한 시사점을 제시합니다. 이를 해결하기 위해서는 공개 지식 플랫폼을 유지하고 발전시키는 데 기여하는 새로운 방식이 필요할 것으로 보입니다.
AI의 미래가 더 큰 혁신으로 나아가기 위해서는 인간이 생성하는 데이터와 콘텐츠를 유지하고, 이를 보완할 수 있는 협력적 생태계 구축이 중요합니다.
https://academic.oup.com/pnasnexus/article/3/9/pgae400/7754871?login=false
'인공지능' 카테고리의 다른 글
엔비디아 CEO 젠슨 황 인터뷰 블랙웰 수요 폭발적 증가 예상 (4) 2024.10.04 오픈AI, 66억 달러 펀딩 완료 MS와 Nvidia 투자로 기업가치 1570억 달러 달성 (2) 2024.10.04 삼성 파운드리 이탈하는 국내 AI 반도체 기업들 (2) 2024.10.02 애플, 스마트 홈 전략 새로운 HomeOS, 로봇암 테이블탑 디바이스 (2) 2024.10.02 MS, Copilot, Bing, Windows 11 업데이트로 AI 전략 강화 (4) 2024.10.02