본문 바로가기
돈되는 생활 정보

신약 개발에 수학과 컴퓨터를 사용하는 이유

by ubmuhan 2023. 5. 16.
반응형

화이자 출신 수학자가 밝힌 신약 개발 금액은 약 7조라고 합니다.

결론은 돈 입니다.

 

https://www.youtube.com/shorts/eN645AtsE1o

 

 

 

 

수학과 컴퓨터를 이용한 효율적인 신약 개발에 대한 블로그 소개해 드립니다.

 

MoLeR: Creating a path to more efficient drug design

보통 실험실에서 유망한 약물 후보 화합물에 대한 단계적 검색을 통해 약물을 발견합니다.

이 단계에서 전문 의약 화학자들은 초기 스크리닝에서 일부 유망한 특성과 일부 바람직하지 않은 특성을 나타내는 화합물인 "적중" 분자를 개선하기 위해 노력합니다. 

 

후속 테스트에서 화학자들은 생물학적 효능을 개선하고 잠재적인 부작용을 줄이기 위해 히트 분자의 구조를 조정하려고 합니다. 이 프로세스는 지식, 창의성, 경험 및 직관을 결합하며 종종 수년 동안 지속됩니다.

 

수십 년 동안 분자가 실험실에서 어떻게 작동할지 예측하는 데 도움이 되는 전산 모델링 기술이 개발되어 비용과 시간이 많이 소요되는 실험이 가장 유망한 화합물에 집중할 수 있습니다.

 

그림 1: 고전적인 인간 주도 약물 설계(하단)는 새로운 화합물을 제안하고 시험관 내에서 테스트하는 반복 프로세스입니다. 이 과정은 실험실에서 합성이 필요하기 때문에 비용과 시간이 많이 소요됩니다. 전산 모델링(상단)을 사용하여 가장 유망한 분자만 실험실에서 만들고 최종적으로 생체 내에서 테스트함으로써 분자 설계를 신속하게 in silico로 수행할 수 있습니다.

 

MoLeR 모델

MoLeR 모델에서 우리는 원자가 결합에 해당하는 가장자리로 연결된 정점으로 나타나는 그래프로 분자를 나타냅니다. 우리 모델은 자동 인코더 패러다임에서 훈련됩니다. 즉, 입력 분자를 소위 잠재 코드로 압축하는 것을 목표로 하는 그래프 신경망(GNN)인 인코더 와 디코더 로 구성됩니다., 이 코드에서 원래 분자를 재구성하려고 시도합니다. 디코더는 짧은 인코딩을 임의의 크기의 그래프로 압축 해제해야 하므로 재구성 프로세스를 순차적으로 설계합니다. 각 단계에서 새로운 원자 또는 결합을 추가하여 부분적으로 생성된 그래프를 확장합니다. 우리 모델의 중요한 특징은 디코더가 이전 예측에 의존하지 않고 부분 그래프와 잠재 코드만을 기반으로 각 단계에서 예측을 한다는 것입니다.우리는 또한 구성 순서가 임의의 선택이기 때문에 다양한 다른 순서로 동일한 분자를 구성하도록 MoLeR를 훈련시킵니다.

 

그림 2: 분자를 인코딩하거나 이전 분포에서 샘플링하여 얻을 수 있는 잠재 코드가 주어지면 MoLeR은 이를 단계별로 해독하는 방법을 학습합니다. 각 단계에서 원자, 결합 또는 전체 구조 모티프를 추가하여 주어진 부분 분자를 확장합니다. 이러한 선택은 교육 데이터 세트의 분자에 대한 구성 시퀀스에 대해 교육된 그래프 신경망(GNN)에 의해 안내됩니다.

 

앞서 언급했듯이 약물 분자는 원자의 무작위 조합이 아닙니다 . 그것들은 더 큰 구조적 모티프로 구성되는 경향이 있습니다. 자연어의 문장은 단어의 조합이지 임의의 문자 순서가 아닙니다. 따라서 CGVAE와 달리 MoLeR은 먼저 데이터에서 이러한 공통 구성 요소를 발견한 다음 전체 모티프(단일 원자가 아닌)를 사용하여 부분 분자를 확장하도록 훈련됩니다. 결과적으로 MoLeR은 약물과 같은 분자를 구성하는 데 더 적은 단계를 필요로 할 뿐만 아니라 생성 절차도 화학자가 분자 구성에 대해 생각하는 방식과 더 유사한 단계에서 발생합니다. 

 

그림 3: Imatinib(노바티스에서 개발한 약물, 왼쪽에 표시됨)에 적용된 Motif 추출 전략은 공통 빌딩 블록 및 개별 원자 모음으로 변환합니다(오른쪽에 표시, 모티프는 빨간색 상자, 나머지 원자는 파란색 상자에 있음). ).

 

약물 발견 프로젝트는 먼저 스캐폴드 (이미 유망한 특성을 보인 분자의 중심 부분)를 정의한 다음 스캐폴드를 하위 그래프로 포함하는 화합물만 탐색하여 화학 공간의 특정 하위 집합에 초점을 맞추는 경우가 많습니다.MoLeR의 디코더 설계를 통해 임의 스캐폴드를 디코딩 루프의 초기 상태로 사용하여 원활하게 통합할 수 있습니다. 훈련 중에 생성 순서를 무작위화함에 따라 MoLeR은 암시적으로 임의의 하위 그래프를 완성하는 방법을 학습하므로 집중된 스캐폴드 기반 탐색에 이상적입니다.

 

그림 4: 특정 관심 스캐폴드(빨간색으로 강조 표시됨)를 포함하는 분자(중앙의 상자에 표시됨)가 주어지면 MoLeR은 스캐폴드가 제한된 잠재 공간을 가로질러 유사한 구조를 가진 주어진 분자의 "이웃"을 제안할 수 있습니다. 및 속성.

 

MoLeR로 최적화

위에서 논의한 대로 모델을 훈련한 후에도 MoLeR에는 분자의 "최적화" 개념이 없습니다. 그러나 관련 접근법과 마찬가지로 기성 블랙박스 최적화 알고리즘을 사용하여 잠재 코드 공간에서 최적화를 수행할 수 있습니다. 이것은 훨씬 더 복잡한 그래프 인코딩을 사용하는 CGVAE에서는 불가능했습니다. 우리 작업에서 우리는 다른 모델에서 잠재 공간 최적화에 대한 최신 결과를 보여주는 MSO(Molecular Swarm Optimization)를 사용하기로 결정했으며 실제로 MoLeR에 매우 잘 작동한다는 것을 알았습니다. 특히 우리는 대형 스캐폴드를 사용하는 현실적인 약물 발견 프로젝트와 유사한 새로운 벤치마크 작업에 대해 MSO 및 MoLeR로 최적화를 평가했으며 이 조합이 기존 모델을 능가하는 것으로 나타났습니다.

 

<블로그 원문> 

https://www.microsoft.com/en-us/research/blog/moler-creating-a-path-to-more-efficient-drug-design/

 

MoLeR: Creating a path to more efficient drug design - Microsoft Research

Drug discovery has come a long way from its roots in serendipity. It is now an increasingly rational process, in which one important phase, called lead optimization, is the stepwise search for promising drug candidate compounds in the lab. In this phase, e

www.microsoft.com

 

 

in silico modeling

In silico 모델링은 컴퓨터 시뮬레이션과 데이터 분석을 사용하여 생물학적, 화학적, 물리학적, 공학적 등 다양한 분야의 문제를 연구하고 해결하는 기술입니다.

 

이 기술은 생명 과학에서 분자 구조, 단백질 상호작용, 대사 경로 등을 연구하는 데 사용될 수 있으며, 물리학에서는 물리적 상호작용, 복잡한 시스템 및 현상을 모델링하는 데 사용됩니다. 또한 화학 및 공학에서는 화학반응, 물리적/화학적 성질 등을 예측하는 데 사용됩니다.

 

이러한 분야에서 in silico 모델링을 사용하는 이유는 실험 데이터를 수집하는 것이 어려울 때, 또는 실험으로는 시간, 비용 및 윤리적 제약이 있는 경우 등 다양한 이유로 인해 필요합니다. 따라서 컴퓨터 모델링은 실험 결과를 대체할 수 있고, 예측 및 최적화에 도움이 됩니다.

 

in silico 모델링에는 분자 동력학 시뮬레이션, 유전 알고리즘, 인공 신경망, 머신 러닝 등 다양한 기술이 사용됩니다. 이러한 기술은 데이터를 분석하고 시뮬레이션을 통해 예측 및 최적화를 수행할 수 있습니다.

 

 

 
반응형

댓글