한국의 개인유전체 연구 분석 시장 주도에 최선을
개인 질환의 위험도 예측하고, 발병률 감소에 기여
한국 최고의 인재군단인 서울대학교 생물정보통계 연구실이 그 주인공이다. 연구실에서는 이외에도 다양하고 복잡한 유전체 간의 상호작용을 시각화하여 보다 효율적인 지식체계를 잡을 수 있도록 하며, GPU 및 클라우드 컴퓨팅 기술을 기반으로 대규모 유전체 복합 상호작용 분석 시스템을 개발하는 것을 목표로 두고 연구에 박차를 가하고 있다. 이 기술은 다양한 응용분야에 양질의 유전체 자료를 제공하고, 유전자간의 상호작용과 유전자와 환경요인들 간의 상호작용에 대한 복잡한 현상에 대한 연구 기반기술을 제공할 것으로 기대를 모으고 있다. 한국이 변화하는 개인 유전체 연구 분석 시장을 주도해 나가는데 혼신의 노력을 경주하는 그들을 알아본다.
2005년 국내 통계학 분야 최초로 국가지정연구실 지정
서울대학교 생물정보통계연구실(BIBS: Bioinfomatics and Biostatistics)은 1999년에 박태성 교수가 생물학적 자료를 분석하는 통계적인 방법론을 개발하기 위해 운영하기 시작했다. BIBS의 현재 구성원은 박태성 교수를 중심으로 박사 후 연구원 1명, 통계학 전공 석/박사과정 7명과 생물정보학 전공 석/박사과정 10 명 학생들로 이루어져 있으며, 생물정보학 연구를 체계적으로 수행할 수 있도록 통계학과 전산학에 기반한 IT와 생물학에 기반한 BT, 이 두 분야가 유기적이고 상호보완적으로 구성되어 있다.
연구실의 출범으로 인해 통계학적인 지식만으로는 접근하기 어려운 생물학적 자료의 원리를 깊이 이해하고 효과적으로 분석해 낼 수 있었으며 또한, 각 연구원들의 뛰어난 능력을 공유하여 통합적인 통계방법론을 연구하는데 높은 상승효과를 창출하고 있다. 특히 마이크로어레이 자료의 분석 및 품질관리에 관한 연구실적을 인정받아 2005년에 국내 통계학 분야에서는 최초로 국가지정연구실(NRL; National Research Laboratory)로 지정되어 2010년까지 5년 동안 통계학 및 생물정보학 분야를 연계하여 유전체 자료에 대한 품질관리와 복합 상호작용에 대한 많은 연구들을 활발하게 진행해 오고 있다. 또한 이 연구실에서 박사학위를 취득한 학생들은 현재 외국의 유수대학에서 연구원으로 성공적으로 활동하고 있다.
한국의 유전체 연구 분석 시장 주도에 혼신을 경주
현재 연구실에서 집중적으로 연구하는 것은 단일염기변이(SNP; Single Nucleotide Polymorphism)간의 상호작용연구와 대규모 유전체 분석방법, 그리고 유전자 상호작용연구, 복합유전체 자료의 통합분석 모형연구, 유전체 자료의 품질관리등과 마이크로어레이 통계분석 워크샵, 국내 유일의 통계프로그램 R의 한국 미러사이트 운영등을 들 수 있다.SNP간의 상호작용연구의 경우 SNP간의 상호작용을 발굴하여, 개인의 유전체 정보를 통해 질환에 대한 위험률을 계산해 낼 수 있어서, 예방 의학적인 측면에서 상당한 의미가 있는 것으로 알려지고 있다. 또한 질병관리본부의 ‘유전체실용화사업’ 수행을 통해 그동안 미국 및 유럽의 주도 하에 이루어져왔던 유전체연구 분야에서 한국인 연구 그룹의 세계적 경쟁력을 확보할 수 있었으며 이러한 성과는 국내의 유전체연구 역량을 세계 우수 연구그룹의 수준에 접근하게 하는데 기여했다고 평가받고 있다. 많은 사람들이 암이나 당뇨와 같은 복합, 만성질환으로 어려움을 겪고 있다.
이러한 복합, 만성질환은 몇 몇의 유전자에 의한 유전병과는 달리, 여러 유전자들과 환경과의 상호작용에 의하여 발병되고 진행되는 특징을 가지고 있다. 그렇기 때문에, 유전자들 간의 상호작용과 유전자 환경간의 상호작용의 연구가 매우 중요한 것이다. 연구실에서는 유전자칩을 이용한 유전자 발현패턴을 군집화하는 방법을 여러 가지 통계학적인 기법을 이용하여 향상시키고, 유전자들 간의 생물학적 상호작용의 의미를 찾아내는데 큰 성과를 거두고 있다. GPU(Graphics Process Unit)를 이용한 SNP 상호작용 연구의 고효율 병렬처리 연구도 빼놓을 수 없다. GPU(Graphics Process Unit)는 컴퓨터의 그래픽카드에 들어가 있는 계산 유닛이다.
GPU는 본래 그래픽 렌더링을 위해 개발이 되었지만, 수십에서 수백 개의 core를 가지고 있어서, 이를 일반적인 계산을 위한 유닛으로 사용할 수 있다. 질병과 가장 연관성이 있는 SNP 조합을 찾아내기 위해서는 많은 계산량이 필요한데, 본 연구실에서는 GPU를 이용하여 질병과 연관성이 있는 SNP 조합을 찾는 고효율의 병렬처리 소프트웨어를 개발하였고, 이것은 현재 비슷한 소프트웨어에서 세계에서 가장 빠른 성능을 보이는 것으로 나타나고 있다. 이외에도, 국내에는 아직 생물통계학 분야가 크게 활성화 되지 않은 상태여서 통계적 분석 역량이 국가 전체적으로 부족한 것을 보완하기 위해 마이크로어레이 통계분석 워크샵을 개최, 통계학적 분석기법을 전파하는데 큰 공헌을 하고 있다. 또한, 대규모 인구집단의 유전체 연구는 다수의 연구기관의 연계 하에 협력연구가 필수적이다. 때문에 연구소에서는 국내외 여러 연구진과 함께 미국 국립보건원 산하 NIDDK (National Institute of Diabetes and Digestive and Kidney Diseases)에서 주관하는 “다인종으로부터 제2형 당뇨병 원인유전자 발굴을 위한 연구” 국제공동연구 컨소시엄에도 참여하고 있다. 이러한 연구를 통해 제2형 당뇨병의 원인을 더욱 이해할 수 있을 것으로 학계는 기대하고 있다.유전체 정보 분석 인프라 구축 및 분석 센터 설립 시급
현재 세계는 차세대 DNA 시퀀싱 기기의 발전과 질량분석기기의 발전으로 대용량의 유전체/단백체 데이터들이 빠른 시간에 쏟아져 나오고 있다. 따라서 이제는 생물학적 데이터를 얻는 것보다 이를 분석하는 것이 더 중요한 시대로 변화해 가고 있는 실정이다.
특히 차세대 DNA 시퀀싱 기기의 급속한 발전으로 개인 유전체를 기반으로 하는 개인맞춤의학 및 개인질환진단 분야가 빠르게 확산되어 가고 있고, 미국과 같은 선진국에서는 이미 유전체를 기반으로 하는 분석 사업이 상업화 되어 가고 있는 추세이다.
연구실의 박태성 교수는 “빠르게 급변하는 상황에서 유전체 정보 분석에 대한 요구를 반영하기 위해 본 연구실에서는 통계학, 전산학, 그리고 생물학에 기반을 둔 전문가들을 양성하고, 정보 분석에 대한 원천기술을 개발해 오고 있습니다. 이미 중국은 대대적인 투자를 통해 베이징 지놈 연구소(Beijing Genome Institute)를 설립하고, 시퀀싱 설비뿐만 아니라 분석 인력 양성과 분석 설비에 아낌없는 투자를 하고 있어서, 차후 유전체 연구를 주도해 나갈 움직임을 보이고 있습니다. 이에 한국은 좋은 IT 인프라와 IT 기술을 보유하고 있음에도 생물학 정보 특히 개인유전체시대에 유전체 정보를 기반으로 하는 분석 인프라의 구축이 열악한 상황입니다. 대규모 유전체 데이터를 잘 관리하고 통계적으로 분석하기 위한 전문적인 분석 센터의 설립이 시급합니다”라고 말하고 있다.