석차옥 갤럭스 대표는 "현재 AI 신약개발은 기술적 난도에 따른 phase3 경쟁단계에 진입했다"고 밝혔다.
이어 그는 "GPCR 처럼 기존 방식으로 접근이 어려웠던 고난도 타깃(hard-to-drug)을 대상으로 원하는 기전을 가진 약물을 설계하는 수준의 경쟁"이라며 "이는 phase1, 2단계의 라이브러리 또는 플레이트 스케일에서의 일반적인 후보물질 확보 단계와는 질적으로 다른 단계"라고 강조했다.
석 대표는 29일 서울 코엑스에서 열린 바이오코리아2026의 'AI·양자컴퓨팅 기술 확산에 따른 신약개발 패러다임의 변화' 세션에서 연자로 발표했다.
그는 "신약 개발이라고 하면 미충족의료수요를 충족하는 것이 목표이고, 발굴(디스커버리) 단계에서 좋은 물질을 찾아내지 못하면 임상단계에서 바꿀 여지가 거의 없다"고 말했다.
이어 "AI를 이용해 임상에 들어간 갯수보다는 AI가 해당 신약에 얼마나 깊이 관여했고, 기존 방법으로 해결할 수 없었던 것을 해소해 얼마나 완성도 높은 파이프라인을 만들었나를 봐야 한다"고 덧붙였다.
석 대표는 "그래서 발굴-개발, 부작용-효능까지 전체가 연결되는 어떤 개념을 가지고 있어야 한다"며 "프로테오믹스 레벨에서 상당한 데이터가 축적돼 있고, 이를 이용한 디스커버리부분에서 만족할만한 분자설계는 AI로만 할 수 있다고 생각한다"고 설명했다.
갤럭스는 지난 2020년 설립된 AI 기반 신약개발 기업이다. 갤럭스는 AI, 물리, 화학을 결합한 단백질/항체 de novo 설계 플랫폼을 보유하고 있다. 이를 기반으로 원하는 기능을 가진 단백질을 처음부터 설계하는 데 초점을 맞추고 있다.
지난해 12월에는 글로벌 제약사인 베링거인겔하임과 공동연구개발 계약을 맺으면서 업계의 주목을 받았다. 국내에서 AI를 이용한 단백질 설계기업으로는 최초이기 때문이다. 계약을 통해 베링거인겔하임은 갤럭스의 단백질 설계 플랫폼 ‘갤럭스디자인(GaluxDesign)’을 이용해 특정 단백질을 최초의 설계단계부터 구현하는 것을 목표로 한다.
이런 협력은 갤럭스의 기술력이 바탕이 됐다. 갤럭스의 AI 신약발굴 모델은 구글의 알파폴드3와 비교해 우수한 퍼포먼스를 보였다. 해당 모델은 2024년 구축한 AI 모델로, 후보물질을 얼마나 정교하게 설계할 수 있는지 타깃만 주고 제로샷(Zero-shot) 방식으로 후보물질을 설계했다.
제로샷은 실험적으로 최적화가 필요없는 설계방식으로 신약 개발의 시행착오를 혁신적으로 줄일 수 있다.
그 결과 시판 PD-1 항체인 '티쎈트릭'과 비교해 우수한 결합력(affinity)을 가진 PD-1 항체를 설계했다. 이렇게 설계한 단백질 구조는 초저온 전자현미경(Cryo-EM)을 통해 원자수준에서 상당히 일치하는 것을 확인했다.
갤럭스는 플레이트 스케일(plate scale)의 연구에서도 AI 모델의 성능을 확인했다. 하나의 에피톱을 대상으로 50개를 설계한 경우 약 30% 정도의 성공률을 보였다. 즉, 100개를 설계하면 30개는 의도한 대로 결합하는 항체를 얻을 수 있다는 의미다.
석 대표는 "이렇게 발굴한 후보물질은 노블하면서도 다양한 서열을 가지고 있다"며 "연구개발할 거리가 많다는 의미"라고 강조했다.
경쟁기업의 AI 모델 기반 분석에서도 우수한 결과를 보이면서 기술적 경쟁력을 확인했다. 동일한 9개의 난치성 타깃 단백질에 대해 각각의 AI 모델을 통해 항체를 설계했을 때, 글로벌 경쟁사인 차이 디스커버리(Chai Discovery)는 4개, 나블라 바이오(Nabla Bio)는 5개 타깃에 결합하는 항체를 설계했다.
반면, 갤럭스는 8개의 타깃에 결합하는 항체를 설계하는데 성공했다.
석 대표는 AI 모델의 성공을 결정짓는 4대 원칙, 사하(SA-HA) 프레임워크에에 대해서도 소개했다. AI 모델이 실질적인 임팩트를 내기 위해서는 이들 4개의 핵심 설계 원칙이 유기적으로 맞물려야 한다는 설명이다.
이 4개 핵심 설계 원칙은 S(무엇을, What), A(데이터, Data), H(어떻게, How), A(얼마나 잘, How Well)이다. S는 문제를 정의한다. 수학적 입출력(Input/Output) 설정 및 해결하려는 생물학적 문제의 본질을 규명하는 것이 목표다. A는 학습의 원천이다. 모델 학습에 필요한 데이터의 확보 및 정제된 데이터의 질적 수준을 결정하게 된다.
H는 모델의 아키텍쳐를 의미한다. AI모델의 신경망 아키텍처 설계 및 파라미터(Parameter) 최적화와 훈련 방법론을 포함한다. A는 평가 및 검증이다. AI 모델의 예측 결과의 정확도 측정 및 실험적/인실리코(In silico) 검증을 의미한다.
석 대표는 "이 중 가장 결정적인 요소는 '평가(A, How Well)'다"며 "구글 딥마인드는 CASP라는 단백질 구조 예측 대회가 존재했기에 평가기준이 마련됐고, 알파폴드가 탄생할 수 있었다"고 말했다.
