ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 알파미센스 : 최첨단 생물학 및 정밀 의학을 위한 유전자 변이 예측 혁신
    인공지능 2023. 10. 18. 20:28

    구글, 알파미센스로 AI의 의학 분야 활용성 보여줘

    구글이 보유한 거대 AI 기업인 딥마인드가 반격에 나섰습니다. 새로운 도구인 알파미센스(AlphaMissense)최첨단 단백질 구조 예측 AI인 알파폴드(AlphaFold)를 활용하여 단백질의 미센스 돌연변이의 병원성을 예측하며, 이미 온라인에 공개된 전체 인간 프로테옴에 대한 예측을 통해 다른 어떤 도구보다 더 정확할 것으로 예상됩니다. 이 새로운 도구는 유전체학의 중요한 요구를 해결하고 임상 진단 및 정밀 의학의 미래를 위한 엄청난 잠재력을 지니고 있습니다.

    알파미센스는 유전학에서 가장 까다로운 문제 중 하나인 미센스 돌연변이(즉, 코딩된 단백질의 아미노산 변화를 초래하는 돌연변이)가 단백질 기능에 미치는 영향을 파악하는 문제를 해결합니다. 원칙적으로 미센스 돌연변이는 단백질 기능을 방해하여 질병으로 이어질 수도 있고 그렇지 않을 수도 있으며, 최소한의 영향을 미치고 중립적일 수도 있습니다. 돌연변이의 영향을 해독하는 것은 특히 유전 질환의 정확한 진단을 위해 매우 중요합니다. 따라서 이 획기적인 발견은 유전자 코드에 숨겨진 비밀을 풀 수 있는 희망을 제시하여 궁극적으로 생명과학 연구자, 의료진, 그리고 무엇보다도 환자에게 도움이 될 것입니다.

    알파미센스는 알파폴드의 단백질 구조 예측 능력을 활용하고 이를 단백질 언어 모델과 결합하여 미센스 돌연변이의 영향을 정밀하게 예측할 수 있습니다. 알파폴드의 구조 정보는 알파미센스가 질병을 유발하는 돌연변이가 발생할 가능성이 있는 영역을 식별하는 데 도움이 됩니다. 그런 다음 단백질 언어 모델에서 얻은 정보를 통합하여 돌연변이로 인한 아미노산 변화가 부정적인 영향을 미칠지 또는 중립적인 영향을 미칠지 "결정"할 수 있습니다. 결과는 많은 것을 말해줍니다. 알파미센스는 질병을 유발하는 변이와 양성 변이를 구별하는 데 있어 다른 계산 도구보다 성능이 뛰어나며 실험실 실험에서 확인된 문제가 있는 변이를 식별하는 데 탁월합니다.

    딥마인드는 한 걸음 더 나아가 인간 게놈에서 가능한 모든 미센스 돌연변이에 대한 포괄적인 카탈로그를 만들어 다른 곳에서 해독하고 해석할 수 있는 원시 데이터로 제공함으로써 그 노력을 한 단계 더 발전시켰습니다. 딥마인드의 연구 결과에 따르면 이러한 돌연변이 중 57%는 양성일 가능성이 높지만, 32%는 잠재적으로 질병을 일으킬 수 있고 11%는 불확실한 것으로 나타났습니다. 이러한 풍부한 정보는 여러 분야의 연구자들에게 새로운 문을 열어줍니다.

    알파미센스의 잠재적 응용 분야는 광범위합니다. 분자 생물학자들은 이제 인간 단백질체 전체에서 아미노산 치환을 탐색하는 실험을 설계할 수 있는 귀중한 자원을 확보하게 되었습니다. 인간 유전학자들은 특히 기존 방법으로는 부족할 수 있는 짧은 유전자 및 저빈도 대립유전자에 대한 유전자의 기능적 중요성을 평가하기 위해 인구 코호트 기반 접근 방식에 알파미센스 예측을 통합할 수 있습니다. 마지막으로, 가장 흥미롭지만 실제 적용하기 전에 주의가 필요하고 많은 테스트와 벤치마킹이 필요한 알파미센스는 기존 방법으로는 샘플링이 부족한 희귀 유전 질환의 진단을 크게 개선할 수 있습니다.

    알파미센스는 큰 도약을 의미하지만, 이 분야는 여전히 진화하고 있다는 사실을 인정하는 것이 중요합니다. 컴퓨터 예측의 신뢰도가 점점 더 높아짐에 따라 유전 질환 진단에 더욱 중요한 역할을 할 것입니다. 그러나 이러한 도구가 실제 임상 분야에 민감하게 적용될 수 있도록 하기 위해서는 전문가들이 주장하는 바와 같이 엄격한 평가가 여전히 필수적입니다.

    질병의 원인을 정확히 파악하는 데 도움이 되는 유전자 돌연변이 카탈로그

    7,100만 개의 '미센스' 돌연변이의 영향을 분류하는 새로운 AI 도구

    질병의 근본 원인을 밝히는 것은 인간 유전학에서 가장 큰 난제 중 하나입니다. 수백만 개의 가능한 돌연변이와 제한된 실험 데이터로 인해 어떤 돌연변이가 질병을 일으킬 수 있는지는 여전히 미스터리입니다. 이러한 지식은 더 빠른 진단과 생명을 구하는 치료법 개발에 매우 중요합니다.

    오늘, 연구자들이 어떤 영향을 미칠 수 있는지에 대해 자세히 알아볼 수 있는 '미센스' 돌연변이 카탈로그를 공개합니다. 미센스 변이는 인간 단백질의 기능에 영향을 미칠 수 있는 유전적 돌연변이입니다. 경우에 따라 낭포성 섬유증, 겸상 적혈구 빈혈 또는 암과 같은 질병으로 이어질 수 있습니다.

    알파미센스 카탈로그는 미센스 변이체를 분류하는 새로운 AI 모델인 알파미센스(AlphaMissense)를 사용하여 개발되었습니다. 사이언스(Science)에 발표된 논문에 따르면, 이 모델은 7,100만 개의 미센스 변이 중 89%를 병원성 또는 양성 가능성으로 분류했습니다. 반면, 인간 전문가에 의해 확인된 것은 0.1%에 불과했습니다.

    변이의 영향을 정확하게 예측할 수 있는 AI 도구는 분자 생물학부터 임상 및 통계 유전학에 이르기까지 다양한 분야의 연구를 가속화할 수 있는 힘을 가지고 있습니다. 질병을 유발하는 돌연변이를 발견하기 위한 실험은 모든 단백질이 고유하고 각 실험을 개별적으로 설계해야 하므로 수개월이 소요되는 등 많은 비용과 노력이 필요합니다. AI 예측을 사용하면 연구자들은 한 번에 수천 개의 단백질에 대한 결과를 미리 볼 수 있어 리소스의 우선순위를 정하고 더 복잡한 연구를 가속화하는 데 도움이 될 수 있습니다.

    딥마인드는 모든 예측을 연구 커뮤니티에 무료로 공개하고 AlphaMissense의 모델 코드를 오픈 소스화했습니다.

     

    GitHub - google-deepmind/alphamissense

    Contribute to google-deepmind/alphamissense development by creating an account on GitHub.

    github.com

     

    알파미센스는 가능한 모든 7,100만 개의 미센스 변종에 대한 병원성을 예측했습니다. 89%를 분류하여 57%는 양성, 32%는 병원성일 가능성이 높다고 예측했습니다.

    미센스 변이란 무엇인가요?

    미센스 변이체는 DNA에서 한 글자가 치환되어 단백질 내에서 다른 아미노산이 생성되는 것을 말합니다. DNA를 언어라고 생각하면 한 글자를 바꾸면 단어가 바뀌고 문장의 의미가 완전히 달라질 수 있습니다. 이 경우 치환으로 인해 번역되는 아미노산이 변경되어 단백질의 기능에 영향을 미칠 수 있습니다.

    평균적으로 사람은 9,000개 이상의 미센스 변이체를 가지고 있습니다. 대부분은 양성이며 거의 또는 전혀 영향을 미치지 않지만 일부는 병원성이며 단백질 기능을 심각하게 방해할 수 있습니다. 미센스 변이는 몇 개 또는 단일 미센스 변이가 질병을 직접적으로 유발할 수 있는 희귀 유전 질환의 진단에 사용될 수 있습니다. 또한 다양한 유형의 유전적 변화가 복합적으로 작용하여 발생할 수 있는 제2형 당뇨병과 같은 복잡한 질병을 연구하는 데에도 중요합니다.

    미센스 변이체를 분류하는 것은 어떤 단백질 변화가 질병을 일으킬 수 있는지 이해하는 데 중요한 단계입니다. 이미 인간에게서 발견된 400만 개 이상의 미센스 변이 중 전문가들에 의해 병원성 또는 양성으로 주석이 달린 것은 2%에 불과하며, 이는 전체 가능한 미센스 변이 7,100만 개 중 약 0.1%에 해당합니다. 나머지는 영향에 대한 실험 또는 임상 데이터가 부족하여 '중요하지 않은 변이'로 간주됩니다. 알파미센스는 알려진 질병 변이 데이터베이스에서 90%의 정확도를 달성한 임계값을 사용하여 변이의 89%를 분류함으로써 지금까지 가장 명확한 그림을 얻었습니다.

    병원성 또는 양성: AlphaMissense가 변이체를 분류하는 방법

    알파미센스는 과학계에 알려진 거의 모든 단백질의 구조를 아미노산 서열로부터 예측한 획기적인 모델 알파폴드(AlphaFold)를 기반으로 합니다. 이 모델을 적용하면 단백질의 개별 아미노산을 변경하는 미센스 변이체의 병원성을 예측할 수 있습니다.

    알파미센스를 훈련하기 위해 인간과 밀접한 관련이 있는 영장류 집단에서 나타나는 변이를 구분하는 라벨에 알파폴드를 미세 조정했습니다. 흔히 볼 수 있는 변이는 양성으로, 전혀 볼 수 없는 변이는 병원성으로 취급합니다. 알파미센스는 돌연변이에 따른 단백질 구조의 변화나 단백질 안정성에 대한 기타 영향을 예측하지 않습니다. 대신, 관련 단백질 서열 데이터베이스와 변이의 구조적 맥락을 활용하여 변이가 병원성이 될 가능성을 대략적으로 평가하는 0에서 1 사이의 점수를 생성합니다. 연속적인 점수를 통해 사용자는 정확도 요구 사항에 맞는 변종을 병원성 또는 양성으로 분류하는 임계값을 선택할 수 있습니다.

    알파미센스가 인간 미센스 변종을 분류하는 방법의 예시입니다. 미센스 변이체를 입력하면 AI 시스템이 병원성 또는 양성 가능성으로 점수를 매깁니다. AlphaMissense는 구조적 맥락과 단백질 언어 모델링을 결합하고, 인간과 영장류 변이체 집단 빈도 데이터베이스를 기반으로 미세 조정됩니다.

    알파미센스는 이러한 데이터에 대한 명시적인 훈련 없이도 광범위한 유전 및 실험 벤치마크에 걸쳐 최첨단 예측을 달성합니다. 이 도구는 인간 변종과 질병의 관계에 대한 공개 데이터 아카이브인 ClinVar에서 변종을 분류하는 데 사용되었을 때 다른 계산 방법보다 뛰어난 성능을 보였습니다. 또한 이 모델은 실험실의 결과를 예측하는 데 가장 정확한 방법이었으며, 병원성을 측정하는 다양한 방법과도 일치하는 것으로 나타났습니다.

    알파미센스는 미센스 변종 효과 예측에서 다른 계산 방법보다 성능이 뛰어납니다.

    왼쪽: Clinvar 공개 아카이브에서 변종 분류에 대한 AlphaMissense와 다른 방법의 성능 비교. 회색으로 표시된 메서드는 ClinVar에서 직접 훈련되었으며, 일부 훈련 변종이 이 테스트 세트에 포함되어 있기 때문에 이 벤치마크에서의 성능은 과대평가되었을 가능성이 높습니다.
    오른쪽: 생물학적 실험에서 측정값을 예측하는 데 있어 알파미센스와 다른 방법의 성능을 비교한 그래프.

    커뮤니티 리소스 구축

    알파미센스는 알파폴드를 기반으로 전 세계의 단백질에 대한 이해를 증진합니다. 1년 전, 알파폴드를 사용하여 예측된 2억 개의 단백질 구조를 공개했으며, 이는 전 세계 수백만 명의 과학자들이 연구를 가속화하고 새로운 발견을 향한 길을 열 수 있도록 돕고 있습니다. 알파미센스가 유전체학 및 생물 과학 전반의 미해결 문제를 해결하는 데 어떻게 도움이 될지 기대됩니다.

    알파미센스의 예측을 과학계에서 자유롭게 사용할 수 있도록 공개했습니다. 또한, EMBL-EBI와 함께 앙상블 변이 효과 예측기를 통해 연구자들이 더 쉽게 사용할 수 있도록 하고 있습니다.

    미센스 돌연변이 조회 테이블에 더해, 19,000개 이상의 인간 단백질에서 가능한 모든 2억 1,600만 개의 단일 아미노산 서열 치환에 대한 확장된 예측을 공유했습니다. 또한 유전자의 진화적 제약을 측정하는 것과 유사한 각 유전자에 대한 평균 예측도 포함했는데, 이는 해당 유전자가 유기체의 생존에 얼마나 필수적인지를 나타냅니다.

    알파폴드 예측 구조에 오버레이된 알파미센스 예측의 예(빨간색=병원성 예측, 파란색=양성 예측, 회색=불확실). 빨간색 점은 알려진 병원성 미센스 변이, 파란색 점은 ClinVar 데이터베이스에서 알려진 양성 변이를 나타냅니다.

    왼쪽: HBB 단백질. 이 단백질의 변이는 겸상 적혈구 빈혈을 유발할 수 있습니다.
    오른쪽: CFTR 단백질. 이 단백질의 변이는 낭포성 섬유증을 유발할 수 있습니다.

    유전 질환 연구 가속화

    이러한 연구를 해석하는 데 있어 중요한 단계는 과학계와의 협력입니다. 저희는 이러한 예측이 희귀질환의 유전학을 연구하는 데 어떻게 도움이 될 수 있는지 알아보기 위해 Genomics England와 협력하고 있습니다. Genomics England는 알파미센스의 연구 결과를 이전에 인간 참가자를 대상으로 집계한 변종 병원성 데이터와 상호 참조했습니다. 그 결과 알파미센스의 예측이 정확하고 일관된 것으로 확인되어 알파미센스에 대한 또 다른 실제 벤치마크를 제공했습니다.

    알파미센스의 예측은 임상에서 직접 사용하도록 설계된 것은 아니며 다른 증거 자료와 함께 해석해야 하지만, 이 연구는 희귀 유전 질환의 진단을 개선하고 새로운 질병을 유발하는 유전자를 발견하는 데 도움이 될 수 있는 잠재력을 가지고 있습니다.

    궁극적으로 연구자들이 다른 도구와 함께 알파미센스를 통해 질병을 더 잘 이해하고 생명을 구할 수 있는 새로운 치료법을 개발할 수 있기를 바랍니다.

     

    A catalogue of genetic mutations to help pinpoint the cause of diseases

    New AI tool classifies the effects of 71 million ‘missense’ mutations Uncovering the root causes of disease is one of the greatest challenges in human genetics. With millions of possible mutations and limited experimental data, it’s largely still a m

    deepmind.google

     

     

    성과내고 있는 AI... '노벨상' 받는 시대 오나

    구글의 인공지능(AI) 기업 딥마인드가 질병을 일으킬 수 있는 유전자 변이를 예측하는 AI '알파미스센스(AlphaMissense)'를 개발해 생물학계의 주목을 끌고 있다. 2020년 단백질 구조 예측 AI인 알파폴

    n.news.naver.com

     

     

    “이걸 해내는구나”…360억개 약물을 1만5000여개 인간 단백질에 적용했더니 [사이언스라운지] -

    2016년 인공지능(AI) 알파고가 한국의 프로기사 이세돌을 이기며 바둑에서 세계를 제패한 지 7년이 된 지금, 이제 AI가 신약개발마저 ‘정복’할 지에 대해 관심이 쏠리고 있다. 지난 2020년 구글 딥

    www.mk.co.kr

     

Designed by Tistory.