SAIPharm

글

1. AI 기반 신약개발의 패러다임 변화

11월 26, 2025

AI 기반 신약개발의 패러다임 변화 강좌 개요 모듈 1, 강좌 1 | AI/ML 기초 및 신약개발 개론 1. 전통적 신약개발의 한계 전통적인 신약개발 과정은 타겟 발굴부터 시판 승인까지 평균 10-15년이 소요되며, 개발 비용은 단일 신약당 10억 달러를 상회합니다. 이 과정에서 임상 진입 후보물질의 약 90%가 최종 승인에 실패하는데, 이는 초기 단계에서의 부정확한 타겟 선정, 비효율적인 화합물 스크리닝, 그리고 ADMET 특성 예측의 한계에서 기인합니다. 특히 문제가 되는 것은 "Valley of Death"로 불리는 전임상-임상 1상 전환 구간입니다. 동물 모델에서 효과를 보인 후보물질이 인체에서 동일한 효능을 나타내지 못하는 translational gap이 신약개발 실패의 주요 원인으로 지목되어 왔습니다. 2. AI 기반 신약개발로의 패러다임 전환 2.1 핵심 전환점 AI 기반 접근법은 신약개발의 세 가지 핵심 병목을 해소합니다. 첫째, 타겟 발굴 단계 에서 multi-omics 데이터 통합 분석을 통해 질병 관련 타겟을 체계적으로 식별합니다. 유전체, 전사체, 단백질체, 대사체 데이터를 동시에 분석하여 단일 데이터 소스로는 발견하기 어려운 타겟-질병 연관성을 규명할 수 있습니다. 둘째, 히트 발굴 단계 에서 가상 스크리닝과 생성 AI 모델을 활용해 화학 공간 탐색 효율을 극대화합니다. 기존의 HTS(High-Throughput Screening)가 수백만 개 화합물을 물리적으로 테스트하는 데 비해, AI 기반 가상 스크리닝은 수십억 개의 가상 화합물 라이브러리를 며칠 내에 평가할 수 있습니다. 셋째, 리드 최적화 단계 에서 ADMET 특성, 합성 가능성, 특허 회피를 동시에 고려한 다목적 최적화가 가능해집니다. 2.2 주요 기술 구성요소 단계 전통적 방법 AI 기반 방법 타겟 발굴 문헌 리뷰, 개별 실험 Network pharmacology, Knowledge graph 히...

자세한 내용 보기

2025년 양자컴퓨팅 최신 기술 50선 종합 보고서

11월 25, 2025

2025년 양자컴퓨팅 최신 기술 50선 종합 보고서 작성일 : 2025년 10월 31일 대상 : 약물 발견 AI 연구자 출처 : McKinsey, Nature, IBM, Google, Microsoft 등 최신 자료 📋 목차 양자 하드웨어 플랫폼 (15개) 양자 소프트웨어 및 프로그래밍 (10개) 양자 암호화 및 보안 (7개) 양자 센서 및 계측 (7개) 양자 통신 및 네트워크 (5개) 양자 알고리즘 및 응용 (12개) 1. 양자 하드웨어 플랫폼 1.1 Google Willow Chip 특징 : 105큐비트 초전도 양자칩 최초로 임계값 이하 오류율 달성 (2024년 12월) 큐비트 수 증가시 지수적 오류 감소 시연 Random Circuit Sampling 벤치마크에서 10^25년 걸릴 계산을 5분에 완료 장점 : ✅ 양자 오류 정정의 획기적 돌파구 ✅ 실용적 양자 컴퓨팅으로의 명확한 경로 제시 ✅ 빠른 게이트 속도 (~100ns) ✅ 높은 큐비트 충실도 단점 : ❌ 극저온 냉각 필요 (15mK) ❌ 높은 운영 및 유지보수 비용 ❌ 제한된 큐비트 연결성 (nearest-neighbor) ❌ 상용화까지 수년 소요 예상 활용 분야 : 🔬 재료 과학 (초전도체, 배터리 재료) 💊 약물 발견 (복잡한 분자 시뮬레이션) 🤖 머신러닝 최적화 🧬 단백질 접힘 예측 무료 여부 : 클라우드 접근 가능 (유료) 공개 여부 : 연구용 제한적 공개, Google Cloud 통해 접근 개발사 : Google Quantum AI 1.2 IBM Heron Processor & IBM Quantum System Two 특징 : 133큐비트 Heron R2 프로세서 모듈러 아키텍처로 16,632큐비트까지 확장 가능 5,000+ 게이트 파라메트릭 회로 실행 가능 2025년 Nighthawk (120큐비트 square lattice) 출시 예정 장점 : ✅ 우수한 회로 품질과 낮은 오류율 ✅ Qiskit 생태계...

자세한 내용 보기

약물 발견 분야의 숨은 팁

11월 25, 2025

약물 발견 분야에서 일하시는 분께 딱 맞는 숨은 고수들의 툴들을 알려드리겠습니다: 데이터베이스 & 리소스 ChEMBL-RDF / UniChem API ChEMBL 쓰시겠지만, RDF 버전과 UniChem의 structure-based cross-referencing은 아는 사람이 적어요. 화합물 ID 매핑할 때 진짜 개꿀입니다. BindingDB의 hidden dataset Ki, Kd, IC50 데이터가 40만개 이상인데, 대부분 사람들은 웹 인터페이스만 써요. bulk download해서 로컬 PostgreSQL에 넣으면 속도가 10배 차이납니다. PubChem Protein Target 다들 화합물만 찾는데, protein-chemical interaction 네트워크 데이터가 엄청나요. BLAST 없이도 유사 타겟 찾기 가능. 계산화학 라이브러리 RDKit의 숨은 기능 rdkit.Chem.Descriptors3D - 3D descriptor 계산 (대부분 2D만 써요) rdkit.Chem.rdMolInterchange - JSON 직렬화가 pickle보다 빠름 rdkit.Chem.rdRGroupDecomposition - R-group 자동 분해, SAR 분석에 필수 datamol 라이브러리 RDKit wrapper인데 진짜 편해요. standardization, clustering 원라이너로 해결. molfeat 분자 feature 추출 통합 라이브러리. Morgan부터 transformer embedding까지 API 하나로. AI/ML 특화 TAPE (Tasks Assessing Protein Embeddings) 단백질 시퀀스 pretrained model들. ESM, ProtBERT보다 가벼운데 성능 비슷. TorchDrug graph neural network 약물 발견 특화. 논문 재현 코드 다 있음. DeepChem의 MolGAN 생성 모델인데 문...

자세한 내용 보기

약물 발견 업무를 하시는 분들을 위한 팁 2

11월 25, 2025

🧬 분자 데이터베이스 & 검색 (HGET/TGET 관련) ZINC20 (2020버전) 기존 ZINC15는 2억개인데, ZINC20은 10억개 이상 purchasable compounds wget 으로 bulk download 가능: tranches/ 디렉토리 실전 팁: lead-like , fragment-like subset만 받으면 80% 빠름 Docking 전용 3D conformer도 제공 (MOL2 format) wget -r -l1 -np -nd -A "*.mol2.gz" http://files.docking.org/catalogs/ SureChEMBL vs PatCID SureChEMBL : 특허 내 화학구조 1억개 (API: https://www.surechembl.org/api/ ) PatCID : PubChem의 특허 subset, CID 기반 cross-reference 조합기술: SureChEMBL로 구조 찾고 → PatCID로 생물활성 데이터 매핑 # SureChEMBL API 예제 import requests r = requests.get(f"https://www.surechembl.org/api/compounds/{schembl_id}") ChemSpider API (무료지만 숨은기능) InChIKey로 여러 DB 동시 검색 (ChEMBL, PubChem, DrugBank 통합) 실시간 상업성 체크: commercialAvailability endpoint # 숨은 엔드포인트 GET /v2/compounds/{id}/details/suppliers MolPort API 800개 이상 벤더 실시간 가격/재고 확인 Building block screening (합성 가능성 예측) 무료 tier: 월 1000 requests COCONUT (Natural Products) 천연물 40만개, SMILES + 3D 구조 기존 UNPD보...

자세한 내용 보기

AI 기반 신약개발 강좌 (100 강) - 2025년 11월 21일 시작 합니다.

11월 21, 2025

AI 기반 신약개발 강좌 (100) 모듈 1: AI/ML 기초 및 신약개발 개론 (1-10) 1. AI 기반 신약개발의 패러다임 변화 설명 : 전통적 신약개발 (10-15 년 , 10 억 달러 이상 소요 ) 에서 AI 기반 신약개발로의 전환 과정 최신 트렌드 : 2024 년 AI 신약개발 시장 규모 18 억 달러 , 2030 년까지 91 억 달러 성장 전망 . AI 발굴 약물의 Phase 1 성공률 80-90% 로 전통적 방법 (40-65%) 보다 월등히 높음 근거 : Nature Communications (2024), Drug Discovery Trends 2024 리포트 2. 머신러닝 기초 : 지도학습 , 비지도학습 , 강화학습 설명 : 신약개발에 적용되는 ML 알고리즘의 기본 원리와 각 학습 방법의 특성 최신 트렌드 : 지도학습 (ADMET 예측 ), 비지도학습 ( 화합물 클러스터링 ), 강화학습 ( 분자 최적화 ) 의 통합적 활용 증가 근거 : PMID: 41266628, Journal of Chemical Information and Modeling (2024) 3. 딥러닝 아키텍처 : CNN, RNN, Transformer 설명 : 분자 데이터 처리에 적용되는 신경망 구조와 각각의 장단점 최신 트렌드 : Transformer 기반 모델이 분자 특성 예측에서 SOTA 성능 달성 . MolGPS(30 억 파라미터 ) 등 대규모 모델 등장 근거 : NeurIPS 2024 Best Paper (MolPhenix), BioPharmaTrend 2025 리포트 4. 그래프 신경망 (GNN) 과 분자 표현 학습 설명 : 분자 구조를 그래프로 표현하고 GNN 을 통해 학습하는 방법론 최신 트렌드 : Chemprop-RDKit, ChemXTree 등 GNN 기반 ADMET 예측 모델...

자세한 내용 보기

이 블로그 검색

SAIPharm

글

WaterMap 관련 기술 - 최신 기술 동향 종합 보고서

1. AI 기반 신약개발의 패러다임 변화

2025년 양자컴퓨팅 최신 기술 50선 종합 보고서

약물 발견 분야의 숨은 팁

약물 발견 업무를 하시는 분들을 위한 팁 2

AI 기반 신약개발 강좌 (100 강) - 2025년 11월 21일 시작 합니다.