KNAPS

AI 기술을 활용한 신약개발

서론
 
인간의 질병을 치료하고 인류의 삶의 질을 높이는 기여해온 신약개발은 시간과 천문학적인 비용이 필요하고 성공률 또한 매우 낮다. 이에 따라, 최근에는 AI 활용하여 임상데이터와 적합한 AI 알고리즘을 신약 개발에 활용하려는 시도가 늘고있다. AI 기술은 IT뿐만 아니라 제조업, 서비스업 전반적인 산업군에 접목되어 새로운 패러다임을 이끌고 있는데, 제약/바이오산업에서도 영향력을 행사하고 있다. AI 이용하여 신약 개발에 요구되는 시간, 경제적 비용 등을 절감하고 데이터 분석을 통한 오차를 줄일 있어 많은 제약사들은 AI 기술을 적극적으로 활용하고 있다. 대웅제약, 삼진제약, 보령, 유한양행 국내 제약사는 자체 개발을 거치기보다는, ‘Open innovation’ 형태로 AI 기업들과 업무 협약을 맺어 다양한 분야에서 신약후보 물질을 탐구하는 방향으로 나아가고 있다. 아직은 AI 기술이 신약 개발 전체 과정에 적용되기보다는 후보물질 탐구 일부에 국한되어 활용되고 있으나, 점차 AI 전반적인 단계에서 활용될 것으로 기대된다. 이번 기사에서는 AI 신약 개발에서 어떻게 접목될 있는지 소개하고자 한다.

 

 

본론1 약물 개발에서 AI 활용: 약물 디자인과 다양한 분야에서의 AI 접목

 신약을 개발할 때는 약물을 어떻게 디자인 할지가 중요한 요소 하나이다. 최근 신약 개발 분야에서는 컴퓨터의 도움으로 약물을 찾는 컴퓨터 지원 약물 디자인 방식(Computer-Aided Drug Design methods, CADD)들이 강력한 기술로 대두되고 있다. 특히, 중요한 단계 하나로 De novo 약물 디자인(De Novo Drug Design, DNDD) 예로 있다. De novo 약물 디자인이란 이전에 반응이 없던 원자들 중에서 새로운 분자구조를 생성하는 컴퓨터 접근 방식이다.

De novo 약물 디자인의 경우, 수용체의 구조를 아는 경우에는 분자 도킹(Molecular Docking) 정보를 이용하고, 수용체의 구조를 알지 못하지만 활성 자리의 생물학적 특성과 활발하게 결합하는 물질인 리간드의 구조를 아는 경우에는 분자구조와 바이오-활성 관계 평가(Quantitative Structure-Activity Relationships & Pharmacophore modeling, QSAR) 이용할 있다. 외에도 원자화 기법이나 다양한 DNDD 이용되고 있으며, 광범위하게 이용되는 진화 알고리즘을 통한 de novo 약물 디자인 방식도 있다.

 또한, 최근에는 데이터의 형태나 종류에 따라 딥러닝 기술도 적용되고 있다. DNDD 다양한 인공신경망들이 이용되면서 새로운 유효 물질[1] 찾고 가능성이 높은 선도 물질[2] 효과적으로 접근할 있게 하는 약물 정보 활용, 새로운 화합물의 디자인, 친밀도가 높은 데이터를 기반으로 강화 학습을 거쳐 새로운 화합물의 활성 예측에 정확도를 높이게 된다.

[1]유효 물질: 화합물이 타깃 유기체 또는 단백질에 선택적으로 시험관내(in vitro) 활성을 보이는 물질

[2]선도 물질: 질환에 약효를 발현하는 초기단계의 물질로서 구조적 특성을 신약설계에 응용하는 사용하게 되는 물질

 

 AI 약물 디자인 외에도 약물 스크리닝(Drug screening), 약물 재창출(Drug repurposing), 다중 약리학(Polypharmacology), 화학 합성(Chemical synthesis) 신약 개발의 다양한 분야에서 효과적으로 활용될 있다. 약물 스크리닝 분야에서는 AI 기술을 접목해 약물의 생체 내 활성도, 독성, 생화학적 특성을 예측할 있다. 재창출 분야에서는 기존에 발견된 화합물 또는 의약품의 새로운 적응증을 발견할 있다. 다중 약리학에서는 다중 기전의 약물 분자를 설계하고, 화학 합성 분야에서는 반응 수율, 합성 역합성 경로 예측 등에 AI 활용될 있다.

 AI 활용도가 높을 것으로 예상되는 약물 스크리닝 분야에서는 Hit-to-Lead 단계의 가상 스크리닝 (Virtual Screening, VS) 흡수, 분포, 대사, 배설, 독성(ADMET) 예측 등에 적용될 있다. VS 통해 비선도 화합물(non-lead compound) 빠르게 제거하고 나은 약물 분석을 통해 적절한 약물 분자 선택에 기여함으로써 약물 개발 비용도 줄일 있다. 이와 더불어, 화합물의 용해도, 분배계수, 이온화도 등의 물리화학적 특성과 생체 활성도의 예측에 다양한 AI 기술이 사용될 있다.

 

 

본론2 임상 시험 개선을 위한 AI 활용

 인공지능을 활용하여 임상시험의 시간과 비용을 단축시킬 수도 있다. 예로 임상시험 데이터를 기반으로 임상시험 전체 단계에서 속도와 성공률을 높이는 플랫폼 메디데이터 있다. 메디데이터는 빅데이터와 인공지능을 활용하여 과거 임상시험에 참여했던 환자들의 데이터를 기반으로 가상의 합성대조군을 생성한다. FDA 희귀질환과 같이 임상시험 대상자 모집이 어렵거나 윤리적 문제가 발생할 있는 임상시험의 경우 합성대조군 사용을 승인해주고 있다. 이를 활용한 개발을 통해 임상시험 시간과 비용을 획기적으로 줄일 수 있다. 이외에도 AI 통해 임상시험에 가장 적합한 연구기관과 국가를 효율적으로 선정하고 관리하는 것은 물론 시험기관의 연구현황을 실시간으로 확인하고 예측할 수도 있어 문제를 조기에 발견하고 연구 성공률을 높일 있다.

 

 

본론3 AI 통한 신약개발의 잠재적 쟁점과 도전 과제

 앞서 여러번 언급하였듯이 신약개발 과정에 AI 활용하면 소요되는 시간과 비용을 크게 단축할 있다. 하지만 현재 국내에서는 신약개발 과정 타겟 단백질 발굴, 신약후보물질 탐색, 임상시험 일부에만 국한되어 AI 기술이 사용되고 있다. AI 이용한 신약개발을 더욱 성공적으로 실현하기 위해서는 다음과 같은 문제를 해결해야 한다.

 첫번째로 단백질 3차구조 이해에 대한 어려움이다. 단백질은 수천개의 아미노산으로 이루어져 있어 각각의 단백질마다 접히는 방식과 구조가 상이하기 때문에 이것의 전체적인 구조를 파악하는 것은 매우 어렵다. 단백질의 구조를 정확히 파악하는 것은 질병의 이해는 물론 치료를 위한 타겟 단백질 선정에도 매우 중요하다. 최근 구글 자회사의 딥마인드가 딥러닝 기술을 이용하여 단백질의 3 구조를 예측하는 ‘알파폴드’를 발표하였다. 알파폴드는 딥러닝을 이용한 기술로, 이를 통해 3 구조에 대한 정확한 이해가 뒷받침 된다면 신약개발 아니라 여러 바이오 산업에 새로운 바람을 불러일으킬 있을 것이다.

 또한 신약개발에는 다양한 학문이 융합된다. 중에서도 특히 화학과 생물학이 중요한데, 생물학이 화학보다 계산적으로 처리되기 어렵다는 것이 도전적 과제가 된다. AI 그동안 축적된 많은 데이터를 이용하여 화학적 모델링에 바탕을 두고 발전했다. 하지만 실제 약물은 생물학적 시스템 내에서 작용하므로 약물의 효능 안정성을 높이기 위해서는 생물학적 데이터에 기반을 AI 기술 발전이 필요하다.

 같은 맥락으로 AI 기술은 어떤 학습자료를 사용하느냐에 따라 기술 발전 차이를 야기하므로 자료의 질이 중요하다. 계산적으로 생물학적 복잡성을 완벽히 구현할 없으므로 AI 학습 자료에 대한 연구가 필요하다. 뿐만 아니라 머신러닝과 딥러닝 기술에는 대규모 데이터 세트가 필요한데, 생물학적 데이터와 같은 경우 양적으로 많은 자료를 확보하기 어렵기 때문에 제한된 데이터를 사용하는 방법에 대한 연구도 진행되고 있다.

 

 

결론

 기존에는 평균 10 넘게 소요되었던 신약 개발 과정이 AI 기술을 활용한다면 시간과 비용을 크게 줄이는 동시에 개발 성공률도 높일 있어, AI 신약 개발은 미래 제약 산업의 핵심 분야로 떠오르고 있다. 앞서 말한 AI 기술은 후보물질 탐색, 전임상 시험 설계 자동화, 독성 예측, 임상 시험의 설계 최적화 신약 개발의 많은 과정에서 활용될 있다.

 세계 AI 신약 개발 시장 규모는 2021년에는 4 1,320 달러, 2022년에는 6 980 달러였다. 매해 45.7% 성장률을 보이며 2027년에는 40 350 달러, 한화로 5조원에 이를 것으로 전망된다. 분야별로는, 면역 항암제 분야가 44.5% AI 신약 개발 시장에서 가장 비중을 차지하고 있고 2027년에 17 6,500 달러에 이를 것으로 예측된다. 또한, 2027, 신경 퇴행성 질환 분야는 14 9,230 달러, 심혈관 질환 분야는 3 5,910 달러, 대사 질환 분야는 1 1,510 달러로 성장할 것으로 전망된다.

 전통적인 신약 개발 방식은 시간과 비용이 막대하고 불확실성이 높다는 진입장벽이 있다. 따라서 AI 기술은 이에 대한 하나의 해결책이 있을 것이다. 그러기 위해서는 약학 분야와 IT 분야의 적극적인 협업, 데이터 구축, 전문인력 양성이 필요하다. 현대 첨단과학기술은 끊임없이 발달해 나가고 있고, 이러한 발전의 흐름에 따른 AI 신약 개발을 통해, 더욱더 정밀화되고 예측적인 의료로 발돋움하는 역할을 수행할 있을 것으로 기대해 본다.

 

The Use of AI in Drug Development

Drug development, which has contributed to treating human diseases and improving the quality of life of mankind, requires a long time and astronomical cost and has a very low success rate. Accordingly, in recent years, attempts have been made to utilize AI algorithms suitable for clinical data in drug development using AI. AI technology is leading a new paradigm by being applied not only to IT but also to overall industries such as manufacturing and service industries, and it has a great influence in the pharmaceutical industry. Many pharmaceutical companies are actively utilizing AI technology because AI can reduce the time and economic costs required to develop new drugs and reduce errors through data analysis. Domestic pharmaceutical companies such as Daewoong Pharmaceutical, Samjin Pharmaceutical, Boryung, and Yuhan Corporation are moving toward exploring new drug candidates in various fields by signing business agreements with AI companies in the form of "Open Innovation". Although AI technology is still being used only in some areas, such as exploring candidate materials, rather than being applied to the entire process of developing new drugs, it is expected that AI will be used gradually at the overall stage. In this article, I would like to introduce how AI can be applied in the development of new drugs.

 

 

The Use of AI in Drug Development: Combining Drug Design with AI in Various Fields

 When developing a new drug, how to design the drug is one of the important factors. Computer-Aided Drug Design Methods (CADD) have recently emerged as a powerful technology in the field of new drug development. In particular, one of the important steps is De Novo Drug Design (DNDD). De novo drug design is a computer approach that generates new molecular structures from previously unresponsive atoms.

 In the case of De novo drug design, molecular docking information can be used to know the structure of receptors, and if you do not know the structure of receptors but know the structure of ligands, which are substances that actively bind to the biological properties of active sites, you can use Quantitative Structure-Activity Relationships & Pharmacophore modeling, QSAR. In addition, atomization techniques and various DNDDs are used, and there is also a DNDD method through widely used evolutionary algorithms.

 In addition, in recent years, deep learning technology has also been applied depending on the type data. The use of various artificial neural networks in DNDD increases accuracy in predicting the activity of new compounds through drug information, design of new compounds, and reinforcement learning based on high-density data.

 

In addition to drug design, AI can be effectively used in various fields of new drug development such as drug screening, drug repurposing, polypharmacology, and chemical synthesis. In the field of drug screening, AI technology can be applied to predict the activity, toxicity, and biochemical properties of drugs in vivo. In the field of drug repositioning, new indications of previously discovered compounds or medicines can be found. In the field of polypharmacology, AI can be applied to designing drug molecules of multiple mechanisms and in the field of chemical synthesis, AI can be used for reaction yield, synthesis, and reverse synthesis path prediction.

In the field of drug screening, which is expected to be highly utilized in AI, it can be applied to virtual screening (VS) and absorption, distribution, metabolism, excretion, and toxicity (ADMET) prediction in the Hit-to-Lead stage. VS allows rapid removal of non-lead compounds and better drug analysis to contribute to appropriate drug molecular selection and reduce drug development costs. In addition, various AI technologies can be used to predict physicochemical properties such as solubility, distribution coefficient, and ionization of compounds and bioactivity.

 

 

Utilizing AI to Improve Clinical Trials

 Artificial intelligence can also be used to shorten the time and cost of clinical trials. An example is "Medidata", a platform that increases speed and success rates throughout clinical trials based on clinical trial data. Medidata uses big data and AI to generate synthetic control arm based on data from patients who participated in past clinical trials. The FDA approves the use of synthetic control arms in clinical trials, such as rare diseases, where it is difficult to recruit clinical trial subjects or ethical problems may occur. Using this, it is possible to drastically reduce the time and cost of clinical trials. In addition, AI can efficiently select and manage research institutes and countries that are most suitable for clinical trials, as well as check and predict the research status of test institutions in real time, which can detect problems early and increase the research success rate.

 

 

Potential Issues and Challenges of Drug Development using AI

As mentioned several times earlier, using AI in the process of developing new drugs can greatly reduce the time and cost required. However, AI technology is currently being used only in some parts of the new drug development process, such as finding target proteins, searching for new drug candidates, and clinical trials. In order to realize the development of new drugs using AI more successfully, the following problems must be solved.

 The first one is the difficulty of understanding the tertiary structure of protein. Proteins are made up of thousands of amino acids, so it is very difficult to grasp the overall structure of them because each protein has a different folding method and structure. Accurate understanding the structure of proteins is very important not only for understanding diseases but also for selecting target proteins for treatment. Recently, DeepMind of Google's subsidiary announced “AlphaFold” that predicts the tertiary structure of proteins using deep learning technology. AlphaFold is a technology using deep learning, and if an accurate understanding of the tertiary structure is supported through this technology, it will be able to raise an affair not only in the development of new drugs but also in various bio industries.

 In addition, various studies are combined in the development of new drugs. Chemistry and biology are especially important, and the challenge is that biology is more computationally difficult to process than chemistry. AI has developed based on chemical modeling using a lot of data accumulated so far. However, since actual drugs work within the biological system, AI technology based on biological data is needed to increase the efficacy of drugs.

 In the same vein, AI technology causes differences in technological development depending on which learning materials are used, so the quality of data is important. Since computationally, biological complexity cannot be fully implemented, more research on AI learning materials is needed. In addition, machine learning and deep learning technologies require large-scale datasets, and research is being conducted on how to use limited data because it is difficult to obtain a large amount of data quantitatively in the case of biological data.

 

 

 

The development of new drugs, which used to take more than 10 years on average, can greatly reduce time and cost while increasing the development success rate, so AI new drug development is emerging as a key field in the future pharmaceutical industry. The aforementioned AI technology can be used in many processes in the development of new drugs, including candidate material search, preclinical test design and automation, toxicity prediction, and clinical trial design and optimization.

 The global AI new drug development market was $413.2 million in 2021 and $609.8 million in 2022. It is expected to grow at 45.7% every year, reaching USD 4.3 billion and KRW 5 trillion by 2027. By sector, the immuno-cancer drug sector accounts for the largest portion of the AI new drug development market with 44.5%, and is expected to reach $1.8 billion in 2027. In addition, by 2027, the neurodegenerative disease sector is expected to grow to $1.5 billion, the cardiovascular disease sector to $359 million, and the metabolic disease sector to $115 million.

 Traditional drug development methods have entry barriers that are enormous in time and cost and high in uncertainty. Therefore, AI technology could be a solution to this. To do so, it is necessary to actively collaborate in the pharmaceutical and IT fields, build data, and train professionals. Modern advanced science and technology is constantly developing, and it is expected that it will play a major role in becoming more precise and predictive medical care through the development of new AI drugs in accordance with this trend of development.