Q1. 안녕하세요. 보람님, 간단한자기소개부탁드립니다.

A1. 안녕하세요. 디어젠 신약개발연구소에서 연구리더를 맡고있는 백보람입니다. 면역학과 미생물학을 주 전공 분야로 하고 있으며, 디어젠에서는 인공지능 팀과 커뮤니케이션을 하며 다양한 생물학적 데이터에서 적용점과 인사이트를 뽑아내고 있습니다. 이번 디어젠의 코로나 치료제 예측에 대한 연구를 주도하였습니다.

Q2. 71일부터 국내에 코로나 치료제로 긴급승인  공급되고 있는 ‘렘데시비르(remdesivir)’ 디어젠이 2월에 예측했다고 하는데요인공지능을 활용한 코로나 치료제 예측 연구를 어떻게 시작하게 되었을까요?

A2. 전 세계 코로나 감염자 수가 2만 명이 되기 전, SARS-CoV-2에대한유전체가 NCBI에공개되면서 디어젠 멤버 중 단국대에 부교수로 계신 강근수 CSO님과 당시 Emory University에 계신 신봉근 CAIO님의 “코로나 종식을 위해 우리가할 수 있는 일이 뭔가 없을까?”라는 물음에서 시작되었는데요. COVID-19에 대한 gene sequence과 protein annotation이 공개되어 있고 디어젠의 데이터베이스에 코로나바이러스는 아니지만, 다양한 바이러스 단백질과 약물의 학습 데이터가 있는 상황이었기 때문에 바로 연구에 들어가게 되었습니다.

Q3. 연구 과정을   설명해 주실  있을까요?

A3. 네. 앞서 말씀드린 질문이 나오고 바로 아이디어 논의를 시작해서 하루 만에 연구 결과 분석을 마치게 되었습니다. 저희의 연구 결과를 더 많은 분과 공유하고자 BioRixv에 Preprint 논문을 게재하게 되었는데 그때가 1월 31일이니 아이디어 논의 후 3일째 되는 날이네요.

연구는 저희 자체 인공지능 기술인 MT-DTI를 모델을 이용하여 COVID-19 단백질을 공격할 수 있는 약물 후보군을 예측해보는 것이었는데요. 약물 데이터로는 항바이러스제 및 기타 약물을 포함해 약 4,000개의 FDA 승인된 약물 데이터를사용했습니다. 이번 보고에서는 빠른 적용이 가능한 항바이러스제를 중심으로 분석 내용을 공개했습니다. 항암제와 같이 항바이러스제로 승인되지 않은 약물 중에서도 COVID-19 감염 치료에 효과를 보일 수 있는 약물이 있을 수 있지만,비항바이러스 약물이 항바이러스 효과가 있음을 증명하기 위해서는 항바이러스제와 비교해 실험적으로 검토해야 할 부분이 더 많을 것으로 예상되기 때문입니다. 다만, 항바이러스제가 아닌 약물들 역시 승인받지 않은 약물 후보군에 비해 훨씬 치료제로 빠르게 적용할 수가 있는 장점이 있습니다.  

그 결과 BMS의 HIV 예방 및 치료제 atazanavir가 코로나바이러스 치료제에 가장 유망한 후보물질로 예측되었습니다. 그 외 Abbvie의 HIV치료제 Kaletra의 주성분인 lopinavir, ritonavir와 Johnson & Johnson의 HIV 치료제 darunavir (제품명 프레즈코빅스)도 예측되었습니다.

Preprint 논문 이후 현재 7월부터 국내에 치료제로 공급되고 있는 길리어드사의 remdesivir에 대한 추가 연구를 진행했는데, 6개의 평가 기준 중 4가지 항목에 대해서 처음 예측했던 atazanavir보다 더 강한 효능을 보이는 것으로 예측되었습니다. remdesivir에 대한 예측 결과를 포함한 연구 결과는 올해 3월 Comput. Struct. Biotechnol. 저널에 정식 논문 게재되었습니다 (Beck, B. R., Shin, B., Choi, Y., Park, S., & Kang, K. (2020). Predicting commercially available antiviral drugs that may act on the novel coronavirus (SARS-CoV-2) through a drug-target interaction deep learning model. Computational and structural biotechnology journal).

Q4. 상당히 빠르게 연구가 진행된 것 같은데요인공지능 기술로 후보물질을 예측하는 데에는 시간이 얼마나 걸린 건가요?

A4. FDA 승인된 약물 데이터셋을 인공지능 모델이 예측하는 데는 10분 정도 소요된 거 같습니다. 사실 MT-DTI모델은 코로나 치료제 예측을 위해 개발된 모델이 아닌 디어젠이 기존에 개발하여 사용할 준비가 되어있던 모델입니다. 따라서 데이터 입력 및 예측 결과를 도출하는 데는 약 10분밖에 걸리지 않았던 거 같네요.

Q5. MT-DTI모델은 어떤 모델인지 간단하게 설명부탁드려요.

A5. MT-DTI는 약물-단백질 상호작용을 예측하는 모델입니다.  Moleculule Transformer-Drug Target Interaction의 줄여서MT-DTI라고 합니다. 셀프 어텐션(Self-Attention) 메커니즘을 활용하여 화학구조를 효과적으로 모델링하고 PubChem의 약1억 개의 화합물을 사전학습 (pre-training) 시켜 정밀도를 높인 기술입니다.

셀프 어텐션 메커니즘을 간단하게 설명드리자면, 약물-단백질의 상호작용 학습 시 약물의 각 원자 간의 지엽적인 정보(Local context)를 학습하는 게 아닌 약물이 가지는 모든 원자의 전체적인 정보(Global context)를 학습할 수 있어 보다 정밀하게 약물에서 vector라고 부르는 고유 숫자를 추출하고 고려해 약물-단백질 상호작용을 예측할 수 있는 기술입니다.

Q6. MT-DTI 모델이 코로나바이러스 치료제 예측과 같은 분야에서 갖는 특이점이나 강점이 있을까요?

Q6. 다양한 기법의 기존 DTI 모델들이 있겠지만, 디어젠의 DTI모델의 강점이라고 하면 물질의 3D 구조를 필요로 하지 않는다는 점입니다. MT-DTI는 앞서 말씀드린 Self-Attention 메커니즘 외에 BERT 메커니즘을 사용하여 input 데이터로 SMILES 서열과 FASTA 서열을 사용할 수 있습니다. 따라서, 물질의 3D 데이터 없이 2D 정보만으로도약물-단백질 상호작용을 예측할 수 있습니다. 이 부분이 사실 굉장히 중요한데요. 그렇기 때문에 COVID-19 단백질처럼 실험적으로 확인된 3D 구조가 없는 표적 단백질도 유행 초기 단계에서 계산을 할 수 있었습니다.

Q7. 처음부터 remdesivir 약물 데이터에 넣지 않고 나중에 추가하셨는데요 이유가 있나요길리어드와 어떤 컨택트 포인트가 있으신 건지 (웃음)?

A7. 아, 그런 건 아니구요 (웃음). 초기 예측에서는 FDA 승인된 약물만을 데이터로 넣었기 때문에 에볼라 치료제로써FDA 승인에 실패했던 remdesivir는 데이터에 포함되지 않았습니다. Preprint 논문 이후 중국에서 remdesivir를 세포실험으로 평가한 논문과 기사를 접하게 되었고, 빠르게 한번 예측해봤는데 높은 효과가 예측되어서 저희도 임상결과를 많이 기대했었습니다. 그때 바이오스펙테이터라는 바이오 전문 뉴스를 통해서 remdesivir 결과를 포함해서 정식 논문 출간 전에 먼저 보고를 했습니다.

Q8. remdesivir 실제로 임상에서 좋은 결과를 얻게 되고치료제로 사용되는 모습을 보면서 어떠셨나요?

A8. 너무 좋았죠. 사실 인공지능이 신약 개발 시장에 들어오게 된 지는 그리 오래되지 않았습니다. 따라서 아직 인공지능을 활용하여 예측한 신약후보물질 중 승인된 물질이 없기 때문에 신뢰도 측면에 있어서 아직 증명해야 할 부분이 많은데요. 실제로 디어젠의 인공지능 모델로 예측한 후보물질이 임상에서 효과를 보이고, 치료제로 사용되면서 저희의 기술력이 한번 증명된 것 같아 좋았습니다. 

그러나 최근에 알려졌듯이, remdesivir가 긴급 승인을 받았지만 일정 부분 제한적인 효과라는 점이 보고되고 있습니다. 이는 약물-단백질 상호작용 외에도 더 많은 요소가 약물 개발에 필요하다는 것을시사하고 있습니다. 함께 사용하면 좋을, 혹은 더 좋은 약물을 찾는 것도 시급한 과제일 것이라 생각듭니다.

추가로 atazanavir도 좋을 것으로 예측되었는데 브라질 연구 그룹의 세포실험 결과 (Fintelman-Rodrigues, N., Sacramento, C. Q., Lima, C. R., da Silva, F. S., Ferreira, A. C., Mattos, M., … & Miranda, M. D. (2020). Atazanavir, alone or in combination with ritonavir, inhibits SARS-CoV-2 replication and pro-inflammatory cytokine production. Antimicrobial Agents and Chemotherapy.) 가 긍정적이었고, 현재 3건의 임상이 진행 또는 준비 중인 것으로 알고 있습니다 (NATADEX, NCT04452565; NACOVID, NCT04459286; REVOLUTIOn, NCT04468087). 

Q9. 영국의 AI 신약 개발 스타트업 Benevolent A.I 관련 연구를 진행했는데요. Benevolent AI 류머티즘 관절염 치료제인 baricitinib 코로나바이러스 치료 후보물질로 예측했습니다디어젠과 결과가 다른 이유가 있을까요?

A9. 제가 BenevoletnAI 의 기술에 대해 잘 알지는 못하지만, 접근 방식이 다르지 않을까 합니다. 저희 연구의 접근방식에는 크게 3가지가 있는데요. 

  1. 먼저 FDA가 승인한 항바이러스 약물을 약물 데이터로 사용했습니다. 항바이러스 약물은 암과 같은 다른 적응증을위해 개발된 약물에 비해 임상에 가속하기가 더 쉬울 수 있습니다. 
  2. 두 번째로는 항암제와 같은 비항바이러스 약물의 독성프로필이 저희 모델에서는 모델이 판단하지 못하는 위험 요소일 수 있을 것입니다.
  3. 마지막으로 저희는 표적 단백질로 바이러스 복제 관련 단백질 데이터를 사용했습니다. 저희가 예측한 atazanavir, remdesivir와 같은 약물은 바이러스 단백질 분해 효소 또는 RNA/DNA 복제를 억제하는데 효과가 좋은 약물로 예측되었습니다.

Q10. 연구 결과에 대한 추가 연구가 있을까요?

A10. 위 연구 외에 코로나바이러스 관련한 몇 가지 연구를 더 진행 중이며, 그 중 tiotropium이라는 약물에 대해 디어젠의 최윤정 소장님과 강근수 CSO님이 분석한 논문 게재되었습니다 (Kang, K., Kim, H. H., & Choi, Y. (2020). Tiotropium Is Predicted to Be a Promising Drug for COVID-19 Through Transcriptome-Based Comprehensive Molecular Pathway Analysis. Viruses, 12(7), 776.). 또한 국가연구과제 1건을 통해서 다양한 예측 결과들을 생성하고 분석 중입니다. 

이전에 보고한 결과는 바이러스의 복제가 중심이 되었다면, 이번에는 숙주인 사람의 타겟들을 중심적으로 분석을 하고있습니다. 그 외에도 디어젠은 코로나19 치료제에 국한하지 않고, 다양한 적응증에 대한 novel target 발굴과 신약 개발을 위해 국내외 제약사 및 바이오 스타트업과 연구 협력을 확대해 가고자 합니다.