지금으로부터 약 10만년 전 인류는 아프리카를 떠난 후에 다양한 환경에 적응하며 전 세계로 퍼져나갔다. 극한의 환경에서 생리적으로 적응하여야 하고, 농경사회로의 전환에 따른 식습관 변화에 적응하기 위해 유당분해 능력을 유지하는 유전적 변이가 발생했다. 이러한 유전적 변이는 문화적 적응을 통해 이루어졌을 것으로 추정된다.
인공지능(AI) '알파고(AlphaGo)'가 바둑 게임에서 인간을 비웃기라도 하듯이 가볍게 승리하고 세상에 등장한 시점을 변곡점이라고 가정할 때 인류의 과학적 진보 속도와 수준은 말이 끄는 마차에서 자동차로 이동수단이 발전된 것 이상으로 획기적이다.
올해 노벨 화학상과 노벨 물리학상의 핵심요소는 인공지능 알파폴드(AlphaFold)였다. 알파(Alpha)는 구글 딥마인드가 이전에 개발한 인공지능 프로그램인 알파고(AlphaGo)에서 유래한 것이다. 폴드(Fold)는 단백질의 구조가 형성되는 것을 뜻한다.
단백질은 아미노산 서열에 따라 특정한 위치에서 3차원 구조로 '접히는(folding)' 과정을 거치며, 이 과정이 단백질의 기능에 결정적인 영향을 미친다. 따라서 알파폴드(AlphaFold)는 단백질 구조에서 접히는 패턴을 찾아내는 인공지능 모델이라는 의미를 내포하고 있다. 결국 알파폴드(AlphaFold)는 인공지능 기술을 활용하여 단백질의 구조를 빠르게 예측할 수 있다는 점이 미래의 바이오산업 분야에 중요한 변화를 예견할 수 있다.
인공지능 알파폴드(AlphaFold) 이전의 단백질 분자구조분석은 X-레이 회절, NMR 분광, 활성화 에너지 분석, 극저온 전자현미경 등을 이용한 방법으로 샘플 준비부터 데이터 수집,이미지 처리까지의 전체 과정에 몇 주에서 몇 달이 소요되었으나 이에 비해 알파폴드와 로제타폴드는 보통 몇 시간에서 몇 일 만에 단백질 구조를 정확하게 예측할 수 있게 되었다.
단백질은 우리가 꼭 섭취해야 할 중요한 영양소이면서 인체에 없어서는 안 되는 생체 분자이기도 하다. 단백질은 인체 구석구석에 필요한 물질들을 운송해 주는 라이더와 같은 역할과 음식을 섭취 했을 때 분해해서 에너지를 얻거나, 인체에 필요한 물질을 합성하는 화학 반응을 좀 더 잘 일어나게 촉진시켜 주는 효소(Enzyme) 활동도 단백질이 한다.
또한 세포가 적절한 반응을 하도록 전달 과정에도 단백질들이 서로 신호를 전달해 준다. 외부의 병원체가 우리 몸에 침입했을 때 면역 반응에도 다양한 단백질들이 기여를 한다. 단백질이 공기 중에 떠다니는 냄새 유발물질을 인식해서 냄새를 맡을 수 있는 것도 우리 몸 안에 있는 DNA 유전 정보를 바탕으로 끊임없이 단백질이 만들어지기 때문이다.
지난 50여년 동안 과학자들은 단백질의 서열(sequence)로 구조(structure)를 예측할 수 있는 다양한 시도를 하였다. 마침내 전통적인 실험방법을 답습하지 않고 단백질의 구조를 찾아내는 획기적인 방법을 모색한 결과 계산을 통한 혁신적인 방법을 찾게 된 것이다. 인공지능이 사람보다 월등히 우수한 점은 숨어있는 패턴을 재빨리 찾아내는 일이다.
데이터만 충분히 누적되어 있다면 잠재적 패턴을 굉장히 잘 찾아낸다. 이런 이유로 단백질구조 예측에 인공지능을 결합하였다. 알파폴드 역시 단백질구조 예측을 위한 진화정보를 담고 있는 수많은 단백질의 서열 데이터에서 구조와 관련된 패턴을 찾아 단백질의 3차원 구조를 예측하는 일이다.
현재까지 밝혀진 약 20만개의 단백질 구조 데이터를 학습 데이터로 활용해서 단백질구조 예측 인공지능을 가장 빠르고 잘 학습시킨 결과 구글 딥마인드의 알파폴드가 스트럭처 모듈패턴을 기반으로 단백질의 3차 구조를 개발한 것이다.
단백질의 디자인과 함께 중요한 점은 원하는 단백질의 서열들을 설계해 주는 인공지능이다. 인공지능을 활용하기 시작하면서 단백질 디자인의 성공 확률이 굉장히 높아지고 있다. 지금까지 단백질 디자인의 성공확률은 1%도 되지 않았다. 컴퓨터를 활용해서 수십만 개를 디자인한 다음 그중에서 100개를 골라서 실험을 하면 한 개가 성공할까 말까 할 정도로 낮은 확률이었지만 인공지능을 활용하기 시작하면서 단백질 디자인의 장벽이 매우 낮아지고 있다.
단백질 디자인이 쉬워지면 환경 문제와 같은 다양한 분야에서 단백질 디자인이 접목되고 활용될 것이다. 단백질 기반의 하이드로젤을 개발해서 생분해성이 높은 소재를 개발하거나 플라스틱 분해 효소를 개발해서 플라스틱으로 인한 환경오염 문제 등 단백질 디자인은 바이오산업을 중심으로 파급력이 더욱 커질 것이다.
여기서 주목해야 할 점은 바로 단백질이다. 우리가 섭취하는 식품에서 단백질, 탄수화물, 지방을 3대 영양소라고 지칭하는데 탄수화물과 지방분자는 비교적 안정적인 구조를 나타내는데 반해 단백질은 약간의 열이나 산, 소금, 공기 등에 노출되면 특성이 완전히 달라진다. 이러한 특성의 변화는 단백질의 생물학적 역할과 기능에 기인한다.
우리가 음식으로 섭취하는 탄수화물과 지방은 주로 소극적인 저장에너지 형태에 불과하지만 단백질은 적극적으로 생명을 유지하는 장치에 해당한다. 단백질은 자신들을 포함하여 세포를 만드는 분자를 조립하고 해체함으로써 세포 내의 한곳에서 다른 곳으로 분자를 이동하고 근섬유의 형태로 개체 전체를 이동시킨다. 단백질은 모든 기관의 활동, 성장, 운송과 같은 핵심 역할을 한다. 따라서 단백질의 특성은 적극성과 민감성이 내재되어 있다.
단백질이 함유된 음식을 조리할 때 단백질 구조와 농도가 변하는 모습을 볼 수 있는데 이는 바로 단백질의 역동적 특성을 나타낸 것이다. 단백질의 기능 중 운송 역할은 우리가 겼었던 코로나 바이러스에서 쉽게 알 수 있다. 대부분의 코로나 바이러스는 호흡기 바이러스로서 바이러스가 공기 중에 떠다니다가 우리가 숨을 쉬는데, 그 바이러스가 우리 몸으로 들어오면 바이러스에 감염이 된다.
코로나 바이러스가 우리 몸 안에 들어올 때는 바이러스의 표면에 있는 단백질을 활용하다. 바이러스 표면에 여러 단백질들이 있는데, 그 중에서도 스파이크 프로틴이라고 부르는 돌기 단백질이 있다. 이 단백질이 세포의 표면에 있는 어떤 단백질과 만나게 되면 결합을 하면서 우리 몸 안으로 들어오게 된다.
만약 이 돌기(spike) 단백질의 구조와 그 사람의 수용체 단백질의 구조, 그리고 그 단백질의 결합 구조를 파악하게 된다면, 코로나 바이러스가 우리 몸 안에 들어올 때 돌기 단백질이 사람의 수용체 단백질과 결합을 하면서 우리 몸 안에 들어오게 된다는 것을 구체적으로 설명을 할 수가 있다. /연윤열 ESG 푸드테크 소사이어티 대표
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성