디어젠(주)는 자체 개발한 저분자화합물 선도물질 최적화 (lead optimization) 인공지능 모델 molecule equalizer (MolEQ) 을 2020년 1월 9일-1월 12일간 American Association for Cancer Research (AACR)에서 주최한 Advancing Precision Medicine Drug Development: Incorporation of Real-World Data and Other Novel Strategies Special Conference에서 포스터 발표했습니다. 

Introduction

선도물질 최적화 과정 (lead optimization)은 신약개발의 첫 단계에 있어서 효능, 독성, 물성 등 약을 구성하는 다양한 속성들을 화학 구조식을 변경해가며 최적의 물질로 개발해내는 중요한 과정입니다. Hit 물질을 발굴하는 과정만큼 이 과정 역시 손이 많이 가고 대단히 노동집약적인 단계라고 할 수 있습니다. 최적화를 거친 선도물질들은 몇 가지 효능/효과에 대한 검증을 거치고 통과한 다음에야 후보물질 (candidate)가 될 수 있습니다. 그렇기 때문에 이 과정 역시 인공지능 기술의 수요가 높은 분야입니다.

Background

앞서 말한 것과 같이 선도물질 최적화 과정을 인공지능 기법으로 접근하려는 시도가 다양하게 있습니다. 그러나 대부분의 모델들이 약물의 하나의 속성, 예를 들어 대표적으로 Quantitative estimate of drug-likeness (QED)에 집중하여 물질의 약물유사성을 높히려는 시도가 주류입니다. 그러나 이 경우에 결합력, 독성, ADME (Absoprtion, Distribution, Metabolism, and Excretion)은 크게 고려되지 못하기에 다중 속성에 대한 최적화 모델이 요구되고, 디어젠(주)는 molecule equalizer (MolEQ) 모델을 선보였습니다.

Methods

MolEQ는 1) molecule transformer (MT) [1], convolutional neural network (CNN), recurrent neural network (RNN)을 기반으로한 약물-단백질간의 결합력 (affinity)을 예측하는 모듈, ADME 예측 모듈, 독성 예측 모듈을 구성하고, 2) molecule deep Q-network (MolDQN)으로 알려진 화학구조식 조작 모델 [2] 을 차용하였습니다 (Figure 1). MolEQ에서 input seed molecule을 Markov decision process를 통해 원소 추가, 원소 제거, 결합 추가, 결합 제거의 4가지 행동을 통해서 다양한 변형된 물질 구조를 생성하게 되고, 생성된 물질 구조는 MT-Drug-Target Interaction (DTI), DearADMET, 물질 평가 (QED, Synthetic accessibility, LogS 등)의 평가 과정을 거치게 됩니다. 평가된 물질에 대해 reward function이 주어지게 되면 강화 학습 (RL, reinforcement learning)을 통해 추가적인 행동을 통해 구조를 변형하는 iteration을 진행하고, 최적화 된 다양한 물질 구조를 제시하게 됩니다. 이 과정 중에서 affinity, ADME, toxicity 등 사용자가 더 가중치를 두고 싶은 부분에 weight를 지정할 수 있어 선도물질 최적화의 방향성을 설정해 줄 수 있습니다. 평가 모듈중 MT-DTI에 관련된 자세한 내용은 다른 글에서 잘 설명하고 있습니다 (링크 첨부).

Figure 1. Graphical presentation of MolEQ architecture. Four actions (atom addition, atom deletion, bond addition, bond deletion) are randomly performed to the original molecule in Markov decision process. Each action of the Markov decision process is indicated with red circles. Generated molecules of the environment then assessed to prediction of multiple properties with predictor combined of CNN and RNN. Especially, the small molecule to target protein binding affinity prediction is measured by a self-attention deep learning model named MT-DTI during the process with SMILES of small molecules and FASTA sequences of target proteins. Predicted properties are rolled as reward function, and further action through a loop of evaluation and modification by reinforcement learning process is performed to conclude optimized candidates. 

Results

모델을 시험해 보기 위해, 임상 3상에서 실패한 항암제 3종을 선택하였습니다. Iniparib은 poly (ADP-ribose) polymerase (PARP)를 억제하는 약물로 개발되었으나, 임상 3상에서 효능이 입증되지 않아 실패하여 [3], affinity를 강화하는 케이스로 선택했습니다. Vascular endothelial growth factor recpetor 2 (VEGFR2)를 억제 대상으로 하는 brivanib의 경우, 효능과 예측하지 못한 독성이 발생했다는 FDA 보고서 [4]에 근거하여 DearADMET으로 독성평가를 해보니 hERG (심장독성) 수치가 높게 예측되어 hERG 수치를 낮추는 최적화의 케이스로 선택되었습니다. 마지막으로 rebimastat은 MMP9을 억제하는 것으로 알려진 약물이지만, 피부 독성이 나타나 임상 3상에서 실패했다는 보고 [5]에 근거하여 DearADMET으로 예측해보니 역시 높은 피부 독성 점수가 나타났습니다. 따라서 피부 독성 개선을 중점으로 둔 최적화를 rebimastat로 진행하였습니다. 전반적으로 모든 약물에 대해 가장 중요한 수치인 affinity가 개선되는 것을 확인했고, 각 약물들의 문제점으로 지적된 부분들의 수치가 낮아지는 것을 확인했습니다 (Table 1).

하나의 예로써 brivanib의 최적화 결과물 구조를 보면 원래의 핵심 구조를 유지하면서 최적화가 진행된 것을 볼 수 있습니다 (Figure 2). 물론 가령 benzene 고리 하나만 seed molecule로 제공하고 신규 물질 생성하는 방법도 적용이 가능합니다. Iniparib, rebimastat의 경우에는 기존의 약물구조와는 상당히 차이나는 구조로 생성이 되었던 것을 확인하였습니다 (결과 미제공: 지적재산권과 관련하여 해당 내용은 보여드리지 못하는 것 양해 부탁드립니다).

Figure 2. Two optimization results of brivanib

요약하자면, MolEQ 모델은 기획의도처럼 최적화 과정에 방향성을 제시해 줄 수 있고, affinity에 중심을 두고 있는 것을 확인하였습니다. 그 이상으로 놀라웠던 것은 최적화 과정으로 서술하긴 했지만, 다수의 경우에 신규 물질 생성 (generation)에 가까운 작업을 수행해 낼수 있다는 것도 확인하였습니다.

Conclusion

위에서 보여드린 것과 같이 3가지 임상 3상 실패 약물에 대한 in silico 최적화는 의도대로 진행되었습니다. 특히, 합성 가능성 (synthetic accessibility)에 조금 더 가중치를 둠으로써 실제 합성을 용이하게 해 줄 수 있다는 점도 장점 중 하나입니다. 디어젠(주)는 MolEQ를 활용함으로써 신약개발을 더 가속화할 수 있고, 투자비용을 줄일 수 있기를 기대합니다.

References

[1] Shin, B., Park, S., Kang, K., & Ho, J. C. (2019, October). Self-Attention Based Molecule Representation for Predicting Drug-Target Interaction. In Machine Learning for Healthcare Conference (pp. 230-248). [2] Zhou, Z., Kearnes, S., Li, L., Zare, R. N., & Riley, P. (2019). Optimization of molecules via deep reinforcement learning. Scientific reports, 9(1), 10752. [3] Mateo, J., Ong, M., Tan, D. S., Gonzalez, M. A., & De Bono, J. S. (2013). Appraising iniparib, the PARP inhibitor that never was—what must we learn?. Nature reviews Clinical oncology, 10(12), 688. [4] FDA. (2017). 22 Case studies where phase 2 and phase 3 trials had divergent results. [5] Winer, A., Adams, S., & Mignatti, P. (2018). Matrix metalloproteinase inhibitors in cancer therapy: turning past failures into future successes. Molecular cancer therapeutics, 17(6), 1147-1155.