백 롱 민국가바이오빅데이터구축사업단 단장
정밀 의료는 더 이상 먼 미래의 개념이 아니다. 유전체 분석 기술과 인공지능의 눈부신 발전은 의료를 질병 치료 중심에서 예방, 조기진단, 맞춤형 치료로 전환하고 있다. 암, 희귀질환, 만성질환과 같은 복합질환의 발생 기전은 유전적 요인뿐 아니라 환경, 생활 습관, 생체신호 등 다양한 요인이 복합적으로 작용한다. 따라서, 이러한 다양한 정보를 통합한 고도화된 데이터가 정밀 의료 실현의 핵심 조건으로 떠오르고 있다.
이러한 배경 속에서 대한민국은 「국가통합 바이오 빅데이터 구축 사업(BIKO – BioBigData.Korea)」을 출범시켰다. 이 사업은 범부처 사업으로 보건복지부, 과학기술정보통신부, 산업통상자원부, 질병관리청 4개 부처가 협력해 100만 명 규모의 유전체, 임상 정보, 인체 자원, 공공 및 개인 건강 정보를 통합 수집하여 고품질 바이오 빅데이터 인프라를 구축하는 국가 전략 사업이다. 특히, 희귀·암·중증질환자뿐 아니라 건강한 일반인까지 아우르는 다양한 데이터 구성을 통해 연구적, 의료적, 산업적, 정책적으로 활용할 수 있는 데이터 기반을 마련하고자 한다.
이 사업의 핵심은 참여자 중심의 데이터 수집과 통합이다. 전국 48개 주요 의료기관과 협력하여 임상 정보 및 검체를 수집하고, 공공기관 데이터, 라이프로그 등 다양한 데이터를 개인 단위로 통합해 품질관리를 거친 후, 연구 목적의 데이터 활용을 위해 개방한다. 또한, 향후 연구자뿐 아니라 참여자에게도 예방·진단·치료 정보로 환류되도록 하여, 실질적인 의료 효과를 기대할 수 있도록 할 예정이다.
이처럼 개인정보, 의료정보 등 민감한 데이터를 국가 단위에서 대규모로 수집하고 제공하는 데 있어, 정보보호와 개인정보 보안 체계는 사업의 전제이자 필수 요건이다. 이에, 본 사업은 「개인정보 보호법」 및 「생명윤리 및 안전에 관한 법률」, 「정보통신망 이용촉진 및 정보보호 등에 관한 법률」 등 관련 법령의 법적 요건을 준수하고, 전자동의 시스템, ISMS-P 인증, 개인정보 책임보험 가입 등 법적·기술적 보호 조치를 마련하였다. 데이터 제공은 정보의 민감도에 따라 4단계 등급(Tier) 분류를 통해 차등 제공될 예정이며, 연구자는 사전 심의를 거쳐 안전한 가상 연구환경(VDI)과 클라우드 기반 분석 환경에서 데이터를 활용할 수 있고, 분석 결과 역시 반출 심사를 통해 관리된다.
더 나아가 이러한 고품질의 바이오 빅데이터는 AI 기술 등 새로운 기술들과의 융합을 통해 더욱 폭발적인 가치로 확장될 수 있다. 특히, ChatGPT를 비롯한 초거대 언어모델(LLM) 및 의료 특화 AI와 결합하면, 단순한 질환 예측을 넘어 맞춤형 진단·치료 알고리즘 개발, 신약후보물질 추천 및 임상시험 설계, 복합질환의 병태생리 예측, 부작용 예측 및 대응, 정밀 코호트 자동 분류, 건강관리 서비스 개발 등 다양한 분야에서 높은 파급력을 보일 것으로 기대된다.
국가통합 바이오 빅데이터 구축 사업은 단순한 데이터 수집 사업이 아니다. 대한민국 정밀 의료를 현실화하는 국가 전략 자산이자 기반이며, 보건의료 데이터의 공공성과 활용 가치를 동시에 실현하는 새로운 의료 패러다임의 출발점이다. 의료계와 연구계, 산업계의 적극적인 참여와 협력이 함께 할 때, 대한민국이 AI 시대의 미래 의학의 중심에 설 수 있을 것이다.