-
[과학 | 철학] [사이언스샷] 이세돌 이긴 알파고 기술로 최적의 백신 만든다2023.05.05 PM 04:40
美워싱턴대, AI 강화학습으로 최적 단백질 설계
동물 실험에서 기존 백신보다 항체 더 많이 유도
유전자 전달, 줄기세포 배양 등 다양한 응용 가능
단백질 설계 인공지능으로 실리콘 노벨상도 받아
인공지능 강화학습으로 만든 단백질 구조./미 워싱턴대
이세돌 9단을 이긴 인공지능(AI) 기술이 백신 효능을 획기적으로 높일 수 있다는 연구 결과가 나왔다. 같은 방법이 백신은 물론, 유전자 치료와 산업용 바이오 소재 개발에도 적용될 수 있을 것으로 기대된다.
미국 워싱터대 생화학과의 데이비드 베이커(David Baker) 교수 연구진은 지난 21일 국제 학술지 ‘사이언스’에 “체스나 바둑에서 능력이 입증된 인공지능 기술로 단백질을 훨씬 효과적으로 설계하는 소프트웨어를 개발했다”고 밝혔다. 연구진은 이 방법으로 백신용 단백질을 만들어 동물실험에서 이전보다 항체를 더 많이 유도했다고 발표했다.
◇알파고 기술로 백신 단백질 설계
베이커 교수는 “이번 결과는 인공지능의 강화학습(reinforcement learning)이 보드 게임을 통달하는 것 이상으로 많은 일을 할 수 있음을 보였다”며 “단백질 과학의 오랜 퍼즐을 풀도록 훈련하자 유용한 분자를 만드는 데 뛰어난 능력을 보였다”고 말했다.
강화학습은 반려견의 행동을 교정할 때 널리 쓰인다. 강아지에게 특정 행동을 계속 설명하기보다 그 행동을 했을 때 칭찬이나 먹이 같은 보상을 주는 훈련 방식이다. 이세돌 9단을 누른 바둑 인공지능 알파고도 마찬가지다. 개발진은 바둑의 모든 수를 일일이 가르치지 않고, 인공지능이 가상 바둑 경기를 거듭하면서 승패를 통해 가장 좋은 수를 스스로 알아내도록 했다.
연구진은 같은 방법으로 백신용 단백질을 설계했다. 질병을 일으키는 바이러스는 단백질 껍질 안에 유전물질이 들어있는 형태다. 백신은 바이러스의 단백질을 인체에 주입해 면역반응을 유도,한다. 백신 효능은 이 단백질이 얼마나 정확하게 만들어졌는지에 달려있다.
먼저 인공지능에 복잡한 단백질을 구성하는 단순 물질 수백만개에 대한 정보를 제공했다. 그 다음에 원하는 백신용 단백질의 크기, 구멍 수 같은 정보를 알려줬다. 원하는 제품의 제원을 입력한 셈이다.
인공지능은 이 정보를 토대로 강화학습을 했다. 알파고가 가상의 바둑을 수없이 두듯, 인공지능은 단순 물질들을 이리저리 맞춰 수많은 단백질을 가상으로 합성했다. 그리고 이 단백질이 처음 제시한 목표에 맞는지 대조하기를 반복했다.
데이비드 베이커 미 워싱턴대 생화학과 교수. 의대 단백질 설계연구소(IPD) 소장도 맡고 있다./미 워싱턴대
◇유전자 치료제. 줄기세포 치료에도 적용
연구진은 인공지능이 강화학습을 거쳐 만든 수십만개의 단백질 껍질 중 350개를 골라 실험실에서 합성했다. 전자현미경으로 관찰했더니 컴퓨터가 설계한 형태 그대로였다. 이전보다 훨씬 조밀한 구조가 만들어진 것이다. 오차는 원자 하나 크기보다 적었다.
연구진은 이전에는 단백질 구성물질을 하나씩 결합해 원하는 구조를 만드는 바텀업(bottom up·상향식) 설계였다면, 이번 인공지능은 단백질 제원에 맞게 합성하는 톱다운(top down·하향식) 설계를 했다고 밝혔다. 이를테면 지금까지는 단백질 레고 기성품을 먼저 사고 나중에 새로운 구조대로 결합하는 방식이어서 맞지 않는 부분들이 있을 수밖에 없었지만, 이번에는 인공지능이 무엇을 만들지 먼저 알고 그에 맞는 기본 레고 조각들을 설계하고 정확하게 결합한 것과 같다는 것이다.
연구진은 인공지능 설계대로 합성한 단백질 껍질에 다양한 바이러스의 표면 돌기를 끼워 생쥐에 주입했다. 그러자 인플루엔자(독감) 돌기를 끼운 합성 단백질은 기존 인플루엔자 백신보다 더 많은 항체를 유도했다고 연구진은 밝혔다.
과학계는 인공지능 강화학습이 단백질 설계에 일대 혁신을 가져올 수 있다고 기대했다. 영국 뉴캐슬대의 마틴 노블(Martin Noble) 교수는 뉴사이언티스트지에 “단백질 하나를 설계하고 정확하게 접기까지 수십억년 동안 진화했지만, 여러 단백질을 끼워 맞춰 완전한 구조를 만드는 것은 또 다른 차원의 복잡성”이라며 “연구진이 이 일을 해냈다니 정말 놀랍다”고 말했다.
연구진은 이번 인공지능이 백신 외에도 다양한 곳에 활용될 수 있다고 기대했다. 일례로 줄기세포로 혈관을 만드는 틀을 만들 수 있다. 단백질 틀이 더 조밀할수록 혈관이 더 잘 만들어진다는 것이다. 항암제나 생분해성 옷감 개발에도 적용할 수 있다고 연구진은 밝혔다.
미국 미시건대의 양 장(Yang Zhang) 교수는 “인공지능이 설계한 단백질 껍질은 백신뿐 아니라 유전자 치료에도 활용할 수 있다”며 “치료용 유전물질을 단백질 껍질 안에 넣고 전달하면 환자의 세포가 거부반응을 일으키지 않을 것”이라고 말했다.
단백질 구조 예측게임 폴드잇 화면. 2020년 일반인들이 게임에 참여해 코로나바이러스를 막을 단백질도 설계했다./미 워싱턴대
◇실리콘 밸리 노벨상 수상하기도
데이비드 베이커 교수는 단백질 인공지능 설계 분야에서 세계적인 명성을 갖고 있다. 그는 지난 2020년 미국 브레이크스루 상(Breakthrough Prize) 생명과학상을 받았다. 당시 치료용 합성 단백질을 설계하는 인공지능인 로제타(Rosetta) 소프트웨어를 개발한 공로로 수상했다.
브레이크스루 상은 2012년 러시아 출신의 벤처투자자 유리 밀너와 페이스북 창업자 마크 저커버그, 구글 공동창업자 세르게이 브린, 알리바바 창업자 마윈 등이 만든 기초과학상이다. 실리콘밸리 투자자와 기업인들이 만들었다고 ‘실리콘밸리 노벨상’으로도 불린다.
베이커 교수는 2000년대 초부터 로제타를 개발했으며, 2005년에는 분산형 컴퓨터 과학연구프로젝트인 ‘로제타앳홈 (Rosetta@home)’을 시작했다. 이 프로젝트는 일반 참가자의 컴퓨터 유휴 자원을 모아 에이즈 치료제에 쓸 단백질 구조를 분석했다
이번 논문의 공저자인 백민경 서울대 생명과학부 교수는 워싱턴대에서 박사후 연구원으로 있으면서 2021년 베이커 교수와 사이언스에 단백질의 구조는 물론 단백질 간의 결합 형태까지 예측할 수 있는 AI 프로그램인 로제타폴드(RoseTTAFold)를 발표했다. 백 교수는 이 논문의 제1 저자였다.
베이커 교수는 인터넷에서 단백질 입체 구조 문제를 푸는 폴드잇(Foldit) 게임도 개발해 일반인 25만여명을 단백질 연구에 참여시켰다. 폴드잇은 2008년 에이즈 치료용 단백질 구조를 풀기 위해 처음 개발됐는데, 2011년에는 10년간 과학자들이 풀지 못하던 에이즈 관련 단백질 구조를 일반인 게이머 6만여 명이 게임을 통해 단 10일 만에 해결했다.
단백질은 아미노산들이 연결된 구조를 가진다. 그렇다고 아미노산들이 실처럼 일렬로 늘어서 있는 것은 아니다. 아미노산 사슬들은 이리저리 접히면서(fold) 입체 형태를 만드는데, 이런 형태에 따라 단백질의 기능이 달라진다. 폴드잇 게이머들이 과학적 원리에 맞는 구조를 만들면 더 높은 점수를 얻고 순위가 높아질 뿐 다른 보상은 없었다.
코로나바이러스 표면에 돌기처럼 돋은 스파이크(붉은색)에 숙주 세포의 ACE2를 모방한 미끼 단백질(흰색)이 결합한 상상도. ACE2를 모방한 미끼 단백질은 바이러스가 인체 세포에 달라붙기 전에 먼저 결합해 인체 감염을 사전 차단한다./미 워싱턴대
◇국내 제약사와 코로나 치료제도 개발
베이커 교수는 2020년 9월 사이언스에 코로나 바이러스가 인체에 감염되는 과정을 차단하는 새로운 단백질 구조를 발표하기도 했다. 워싱턴대 연구진은 앞서 폴드잇 게이머들에게 코로나바이러스의 돌기 단백질 구조를 제시하고 여기에 들어맞는 치료제 단백질을 만들도록 했다.
코로나바이러스가 코나 목으로 들어오면 먼저 마치 열쇠를 끼우듯 돌기 모양의 스파이크 단백질을 인체 호흡기 세포 표면에 있는 ACE2 수용체 단백질에 결합시키고 세포 안으로 침투한다. 베이커 교수는 인체 ACE2 수용체 단백질에서 코로나바이러스와 결합하는 부분 세 곳을 모방한 미끼 단백질을 개발했다.
국내 제약사 SK바이오사이언스는 워싱턴대와 함께 코로나바이러스를 속이는 미끼 단백질로 분무형 코로나 예방약을 개발하고 있다. 분무형 코로나 예방약은 동물실험에서 효능이 입증돼 올해 인체 대상 임상시험에 들어간다. 코로나바이러스에 결합하는 단백질을 코 안에 분사해 인체 감염을 사전 차단하는 원리이다.
user error : Error. B.