
미국 아크연구소(Arc Institute)와 엔비디아(NVIDIA) 연구팀은 스탠퍼드대, 버클리캘리포니아대(UC버클리), 샌프란시스코캘리포니아대(UC샌프란시스코) 연구팀과 협력해 에보 2를 개발하고 연구결과를 4일(현지시간) 국제학술지 '네이처'에 발표했다.
DNA는 생명체의 작동 원리가 암호화된 유전 물질이다. DNA의 변이는 질병 유발 등 생명 현상과 밀접하게 연결돼 있지만 정확히 어떤 유전자의 변화와 상호작용이 어떤 결과를 초래하는지에 대한 인류의 이해 수준은 매우 부족하다.
에보 2는 인간과 박테리아, 식물, 매머드 등 12만8000종 이상의 생물체에서 추출한 염기서열 9.3조개를 수개월간 학습했다. 한 번에 최대 100만개의 염기서열로 이뤄진 유전체를 처리할 수 있다. 한 번에 처리할 수 있는 유전체 크기가 클수록 물리적으로 멀리 떨어진 유전자 사이의 관계를 이해하기 용이하다. 2024년 출시된 에보 1보다 30배 많은 데이터로 훈련됐다.
연구를 주도한 브라이언 히 아크연구소 연구원은 "세계가 대규모 언어 모델(LLM) 훈련에 사용되는 인터넷 언어에 흔적을 남긴 것처럼 진화도 염기서열에 흔적을 남겼다"며 "수백만년에 걸쳐 정제된 패턴에는 분자가 작동하고 상호작용하는 방식에 대한 신호가 담겨 있다"고 설명했다.
에보 2 연구성과는 지난해 논문사전공개 사이트에 게재된 이후 약 1년 만에 정식으로 출판됐다. 그 사이에 연구자들은 이미 에보 2를 알츠하이머 환자의 유전질환 위험 예측, 가축 종 전반에서 유전자 변이 효과 평가 등 다양한 과학 문제에 활용했다.
아크연구소 연구팀은 "에보 2로 박테리아를 숙주로 삼는 바이러스 종류인 박테리오파지를 기능성으로 설계·합성해 항생제 내성 세균 치료에 대한 응용 가능성을 확인했다"고 밝혔다.
연구팀은 세포 내에서 에너지를 생산하는 세포소기관인 미토콘드리아나 효모의 유전체 등을 인공으로 설계하기도 했다. 생물학자들은 에보 2로 잘 작동하는 100% 인공 생명체를 구현하기에는 아직 무리가 있다고 말한다.
니코 클라세스 네덜란드 바헤닝언대 교수는 네이처에 "생명을 70%만 설계할 수는 없다"며 "단 하나의 필수 유전자라도 누락되거나 잘못 모델링되면 유전체가 세포 내에서 작동하지 않을 것"이라고 밝혔다.
에보 2는 서로 다른 생물체 간 유전자 서열 패턴을 식별할 수 있어 전통 실험 방식으로는 수년 걸리는 과정을 단시간 내 해결할 수 있다. 세포·동물 실험에 드는 시간과 비용을 절약해 인간 질병의 유전적 원인을 찾아내고 신약 개발을 가속화할 것으로 기대된다.
또 유방암 관련 유전자인 브라카1(BRCA1)의 다양한 돌연변이 중 어떤 형태가 잠재적으로 병원성인지 90% 이상의 정확도로 맞추는 데 성공하기도 했다. 다만 실제 임상에 적용되기 위해서는 넘어야 할 산이 많다.
기초 모델인 에보 2는 앞으로 연구자들의 응용 방향에 따라 다양한 방식으로 활약이 기대된다.
데이브 버크 아크연구소 최고기술책임자(CTO)는 "에보 2를 기반으로 더 구체적인 AI 모델을 구축할 수 있다"며 "연구자들이 에보 2를 창의적인 방식으로 활용하기 시작하면 상상도 못 한 유용성이 나타날 것으로 기대한다"고 밝혔다.
<참고 자료>
- doi.org/10.1038/s41586-026-10176-5











