카카오엔터프라이즈는 지난 22일부터 25일까지 경주화백컨벤션센터에서 열린 한국생명정보학회 정기학술대회 '바이오인포 2024'에서 카카오클라우드 기반의 유전체 빅데이터 분석 교육 워크숍을 진행했다고 30일 밝혔다.
이번 워크숍은 의료·바이오산업 분야에서 카카오클라우드 사용을 늘리고 연구 기술을 고도화하는 것을 목표로 한다. 병원 관계자와 연구원, 대학생 등 30여 명이 참여했다. 워크숍은 ▲카카오클라우드 소개 ▲유전체 분석 툴 키트(GATK) 파이프라인 구성과 개요 ▲빅데이터 분석 실습 등으로 구성됐다.
복잡한 유전체 데이터를 효과적으로 처리하기 위해선 클라우드 기반 분석 도구가 필수다. 의료 빅데이터의 핵심 자원으로 주목받고 있는 유전체 데이터가 염기 서열 분석이나 변이 식별 등 복잡한 계산을 필요로 하기 때문이다.
워크숍에서는 미국 국립표준기술연구소(NIST) 주도의 GIAB 컨소시엄이 제공하는 골드 스탠다드 유전체 'NA12878'를 활용해 유전체 변이 발생 빈도와 질병 간 관계 등을 분석 실습했다.
유전체 분석에는 GATK 파이프라인이 활용됐다. 카카오클라우드의 분산 데이터 처리 프레임워크인 '하둡 에코'를 기반으로 분산·병렬 연산 구조를 최적화했다.
최광묵 카카오엔터프라이즈 사업개발TF장은 "이번 워크숍을 통해 카카오클라우드 환경에서 유전체 변이 관련 발생 빈도, 임상 정보, 유해성 예측 등 다양한 데이터 분석 실습이 성공적으로 진행됐다"며 "카카오클라우드는 의료·바이오산업 분야에서 클라우드를 더욱 원활하게 사용할 수 있도록 적극 지원하고 있으며 업계 전문가들과 지속적인 기술 교류 및 협력을 이어갈 것"이라고 전했다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성