본문 바로가기

흥미로운 의학 이야기/의학과 기술, Hi-tech

[Hi-tech] 알파폴드(AlphaFold), 4차 혁명의 해답 될까

반응형

지난 2016년, 알파고(AlphaGo)의 화려한 등장 이후 머신 러닝(Machine Learning)에 대한 기대가 매우 높아졌습니다. 알파고를 개발한 딥마인드(DeepMind)는 "바둑은 시작일 뿐"이라며 무궁무진한 머신 러닝의 가능성을 제시하였는데, 알파고 이후 알파고 제로(AlphaGo Zero), 알파제로(AlphaZero) 등이 보여준 퍼포먼스는 그야말로 월등한 기술력을 보여주었고, 알파스타(AlphaStar)는 단순 턴제 보드 게임을 넘어 실시간으로, 불완전한 데이터를 수집하여 가공하고 최선의 판단을 내리는 과정에서 인공지능(AI)이 보여줄 수 있는 능력을 다시금 확인하여 주었습니다.

알파고, 알파스타, 다음은 알파폴드

바둑은 두 대국자가 모두 정확히 공개된 정보를 바탕으로 수를 읽고, 전략을 수립합니다. ① 최대한 다양한 경로의 경우의 수를 ② 최대한 깊게 읽어내어, 자신에게 보다 유리한 방향으로 판을 이끌어나가는 것이 승리의 핵심입니다. 반면 알파스타가 도전한 RTS(Realtime Tactical Simulation) 분야는 ① 불확실한 정보를 취합하여 ② 매우 짧은 시간 안에 판단하고, ③ 교전 상황에서 컨트롤을 발휘해 판을 이끌어나가는 것이 승리의 핵심입니다.

알파고와 알파스타는 인공적으로 만들어진 게임이라는 환경 안에서 승부에 임한다는 공통점이 있지만, 가장 핵심적인 차이는 판의 모든 정보를 취합한 후 판단을 내리느냐, 불확실한 정보만으로 판단을 내리느냐의 차이가 있습니다. 헷갈릴 수 있지만 판단에 소요되는 시간의 경우 단순 연산량의 합에 불과하므로 핵심적인 차이가 될 수 없습니다. 이미 공개된 알파고의 자기학습 기보를 살펴보면, 각자 주어진 시간 10초의 초읽기 상황에서 두어진 바둑임에도 불구하고 상당히 깊은 수읽기를 통해 접전이 벌어지는 상황을 확인할 수 있습니다.

알파고 다음이 알파스타인 이유를 예상할 수 있습니다. 게임이라는 틀을 넘어 실생활의 문제 해결에 적용될 수 있는 답을 찾는 과정은 대부분 불확실한 정보를 기반으로 판단을 내리는 과정이기 때문입니다. 예를 들어 기상(氣象)을 예측한다거나 주식 시장의 흐름을 예측하는 등의 상황을 생각해보면, 관련한 모든 변수를 고려하는 것이 사실상 불가능함에도 불구하고 정답에 가까운 최선의 판단이 필요합니다. 그리고 이같은 발전의 연장선 상에서 알파스타 다음으로 공개된 것이 바로, 알파폴드(AlphaFold)입니다.

알파폴드란 무엇인가

알파폴드의 개발사 딥마인드에서 공개한 'Protein folding explained(단백질 접힘의 비밀)' 영상을 통해 알파폴드가 무엇인지 쉽게 알 수 있습니다. 단백질은 20가지 아미노산의 결합으로 구성되는데, 아미노산의 결합량·결합 순서의 차이는 고유한 입체 구조의 차이를 만들어내고, 이는 각기 다른 역할과 구조로 이어집니다. 예를 들어 면역 체계에서 활용되는 항체 단백질은 알파벳 'Y'와 비슷한 모양을 가지는데, 이는 바이러스나 박테리아 등 항원을 감지하고 제거하는 데에 효과적입니다. 콜라겐 단백질은 인체 조직 사이에 긴장을 전달하기 위한 끈(Cord) 모양입니다.

아미노산의 결합으로 만들어지는 복잡한 입체 구조 / image from DeepMind.com

이같은 단백질의 구조가 간단하다면 참 편하겠지요. 세상에 존재하는 수많은 종류의 단백질이 각기 다른 역할을 한다는 것은 총 20가지에 불과한 아미노산이 얽히고 꼬이는 과정이 말도 안 되게 복잡하다는 사실의 방증이기도 합니다. 아미노산은 각기 결합하며 α-나선 구조(Alpha helix) 또는 주름진 판 구조(Pleated sheet)를 형성하며, 이는 다시 얽히고 꼬이며 입체 구조를 만들어냅니다.

만약 아미노산의 결합 순서만을 알 수 있을 때, 결합 후의 입체 구조를 파악할 수 있을까요? 아직까지는 불가능합니다. 결합이 이루어질 때 아미노산 간에 이루어지는 상호 작용이 너무나 다양하기 때문입니다. A-B-C의 모양을 이미 알고 있는 상황이라 하더라도, A-B-C-D-E 구조 속의 'A-B-C' 부분은 이전에 알고 있던 'A-B-C'의 모양과 다를 수 있습니다. D 또는 E, 또는 'D-E'와의 상호 작용을 고려해야 하기 때문입니다.

그러나 반드시 예측이 불가능한 것만은 아닙니다. C-D 모양에서 만들어지는 수많은 구조들에서 패턴을 찾을 수 있다면, A-B-C의 정보만으로 B-C-D 또는 A-B-C-D의 모양 등을 예측할 수 있는 정도의 경향성은 존재하기 때문입니다. 물론 정확한 확인을 위해서는 저온전자현미경법(Cryo-electron Microscopy), 핵자기공명(Nuclear Magnetic Resonance), X선 결정학(X-ray Crystallography) 등의 방법을 통해 그 구조를 직접 확인해보아야 하겠지요.

그래서? 알파폴드의 가능성은

만일 단백질 구조를 '정확히' 예측할 수 있다면, 이미 알고 있는 정보를 아주 효율적으로 활용할 수 있게 됩니다.

인류의 난제로 불리는 암(Cancer)을 예로 들어 생각해보면, 암세포의 표면을 구성하는 단백질 구조를 분석한 후, 암세포의 표면에만 특이적(Specific)으로 결합할 수 있는 항체를 인위적으로 만들어낼 수 있게 됩니다. 현재는 정확한 단백질 구조를 예측할 수 없기 때문에 표적 항암제(Carcinostatis Substance)를 개발함에 있어서도 한계가 명확한데, 알파폴드의 기술력을 통해 이 한계를 극복할 수 있게 되는 것입니다.

알파폴드의 가능성은 인체의 생리·병리에 국한되지 않습니다. 꿀벌부채명나방 애벌레가 소화 효소를 이용해 폴리에틸렌 비닐을 분해하듯, 다양한 효소를 인공적으로 만들어내어 그간 전 인류가 골똘히 고민해왔던 환경 문제를 해결하기 위한 도구로도 활용할 가능성이 있습니다.

즉, 의학에 국한되지 않고 생명공학 전반에 걸친 대변혁이 이루어질 가능성이 있다는 것입니다.

보장된 장밋빛 미래? 알파폴드의 한계는

지난 해와 올해, 알파폴드의 역량을 보여준 CASP(세계 단백질 구조 예측 대회, The Critical Assessment of protein Structure)가 현실이 반영된 결과를 보여주었음에도 불구하고 우려의 목소리 또한 들려옵니다.

엄밀히 말해 아미노산의 결합량과 서열에 의해서도 단백질의 구조와 역할이 달라지겠지만, 아미노산의 결합 주변 환경에 따라서도 단백질의 구조와 역할이 달라질 수 있기 때문에 CASP에서의 성적만으로 활용 가능성을 낙관하기에는 이르다는 것입니다. 또한 이미 만들어진 단백질이 주변 환경에 따라 변성되는 경우 등 단순한 시험 문제 풀이를 넘어 현실계에 적용되기 위해서 알파폴드가 극복해야 할 문제들이 산재해 있다는 것입니다.

또, 기계가 인류의 운명을 좌지우지한다는 것이 윤리적으로 올바른지도 고려해볼 필요가 있습니다. 만일 알파폴드가 잘못된 판단을 내리게 된다면 그 책임 소재가 어디에 있느냐는 물음도 쉽게 답을 내놓기 어려운 문제입니다. 게임에서야 잘못된 판단이 만들어내는 결과가 '한 판의 패배'에 불과하지만, 생명공학에서 활용되는 인공지능은 '삶과 죽음'을 마주하여야 하기에 감당해야 할 무게가 너무나도 무겁습니다.

이같은 반박에 대한 또다른 반박 또한 제기됩니다. 알파고와 이세돌 9단의 대국 직전, 많은 바둑인들이 '인공지능은 두터움을 계산할 수 없다.', '인공지능은 확정되지 않은 모양에서의 집 계산이 불가능하다' 등의 한계를 지적하며 알파고의 열세를 예측했지만 당시 AI에 대한 지식을 갖춘 공학자들은 '어차피 인간도 하지 못하는 부분일 뿐이다'라고 일축했지요. 이와 마찬가지로 현재 알파폴드가 가진 많은 한계는 전 인류가 달려들어도 해결할 수 없는 문제일 뿐이므로 결국 인공지능만이 해답에 가장 가까이 다가갈 수 있다는 주장입니다.

알파폴드, 그 다음은?

가공되지 않은 날 것의 데이터가 충분하며, 데이터 사이에서 패턴을 찾아 정답을 찾아나가는 많은 분야에서 인공지능이 활용될 수 있을 것으로 보입니다. 제 생각에 천문학 또한 인공지능이 그 위력을 발휘하기에 더할 나위 없이 좋은 환경이 아닐까 싶은데, 과연 알파폴드 다음으로 딥마인드가 관심을 가질 분야가 어떤 분야일지도 궁금해집니다. 그리고, 이 모든 노력들이 4차 산업혁명의 핵심 역할로 자리잡을 수 있을지도 아주 궁금합니다.

반응형