Skip Navigation
Skip to contents

E-NEWSLETTER No.141 August 2022

기획특집

◎ 누구나 가능한, 손끝으로 수행하는 대규모 다기관 관찰연구

박 래 웅아주의대 의료정보학과

모 대학병원의 A교수는 고지혈증 환자들을 진료하면서 스타틴을 처음 사용하는 환자들 중에서 pitavastatin이 기존 atorvastatin이나 rosuvastatin에 비하여 신규 당뇨병 발생위험이 더 높을지 낮을지 궁금하였다. 기존 문헌을 찾아보았으나 스타틴을 처음 사용하는 환자들에 대한 개별 약물 간 비교에 대한 충분한 문헌이 없어 결론을 내기 어려웠다. 이러한 의문을 직접 확인해 보고자 피더넷(www.feedernet.com)을 이용해 여러 병원의 임상 데이터를 분석해 보기로 했다. 피더넷에 참여한 54개 병원의 임상데이터는 이미 공통데이터모델(CDM)로 표준화되어 있으니 A교수는 분석에만 신경 쓰면 되었다. 특히 참여 기관 간 무제한 상호 접속이 가능한 연구자유지대에 속한 여러 병원의 데이터는 언제 어디서나 분석할 수 있기에 데이터를 찾아 헤맬 필요도, 사용 허가를 얻기 위해 고생할 필요도 없었다. A교수는 피더넷의 분석 도구인 ATLAS를 이용하여 온라인 상에서 연구를 설계하고 연구자유지대에 속한 병원 중 10개 병원 데이터를 이용하여 분석한 결과 pitavastatin이 기존 atorvastatin이나 rosuvastatin에 비하여 20-30% 당뇨가 적게 생긴다는 결과를 얻었고, 이를 관련 유명 학술지에 제출하여 바로 게재 승인되었다. (Seo et al. Impact of pitavastatin on new-onset diabetes mellitus compared to atorvastatin and rosuvastatin: a distributed network analysis of 10 real-world databases. Cardiovasc Diabetol. 2022 May 23;21(1):82)

보건의료 연구자들이 여러 의료기관의 OMOP-CDM으로 변환된 실제 환자 진료 기록을 이용해 신뢰도 높은 실세계 근거(RWE, real world evidence) 연구들을 수행하고 있다. OMOP-CDM은 의료기관별 서로 다른 진료 기록의 형식과 의미를 표준화·익명화한 데이터모델로서 분산연구망(DRN, distributed research network)을 가능하게 한다. 연구자들은 CDM 분산연구망을 이용해 ATLAS라는 툴을 이용하여 한 개의 동일한 통계 분석 코드를 만들어 이를 각 병원에 전송하고, 병원 내부에서 해당 분석코드가 자동으로 실행되면 분석 결과를 공유해 통합 분석하는 방식으로 연구를 진행한다. 이와 같이 분석 결과만 공유되고 개별 환자의 임상정보는 볼 수 없으므로 개인정보 유출의 위험이 원천적으로 차단됨과 동시에 여러 기관의 핵심 근거를 동시에 모음으로써 의료데이터 활용을 극대화할 수 있다.

OMOP-CDM은 오딧세이(OHDSI) 국제 비영리 컨소시엄이 운영·관리하는 전세계에서 가장 많이 사용되는 공통데이터모델이다. 전세계 74개국 400개 이상의 기관이 오딧세이에 참여하고 있으며, 공통데이터모델로 변환된 임상데이터가 20억명분이 넘는다. 이로 인해 국내외 기관들과 함께 과거보다 빠르게 신뢰도 높은 전세계적 수준의 임상근거 도출이 가능하며, 기관별, 국가별, 지역별, 인종별 비교 분석 등 심화된 데이터 분석이 가능하다.

한국은 전국적인 CDM 데이터망과 분산형 바이오헬스 빅데이터 분석 플랫폼인 FeederNet (www.feedernet.com)을 구축하였으며, 이를 활용하여 활발하게 CDM 연구를 하고 있는 리더 국가이다. 현재 국내 54개 병원의 7200백만 이상의 환자 데이터(중복환자 포함)가 OMOP-CDM으로 변환 완료되었으며, 건강보험심사평가원의 12년 치 전국민 보험청구데이터도 OMOP-CDM으로 변환되어 있다. 41개 의료기관이 FeederNet 플랫폼과 온라인으로 연계되어 있어 간소화된 의료기관 승인 절차를 통해 쉽고 빠르게 다기관 데이터 활용 연구가 가능하다.

한국 오딧세이는 다기관 공동연구 활성화를 위해 연구자유지대(RFZ, research-border free zone)를 운영하고 있다. 다기관이 함께 연구를 수행하기 위해서는 해당 병원 내에 연구 대상 환자 수가 충분한지 사전 확인이 필요하나, 이에 상당한 비용과 시간이 소요되는 것이 현실이다. 그리고, 각 기관별로 상이한 IRB 승인 절차와 방법은 공동연구를 어렵게 하는 큰 걸림돌 중 하나이다. 다행히 연구자유지대에 참여하는 의료기관 소속 연구자들은 연구자유지대에 참여 중인 타 병원 CDM에 대해 상호 분석 권한을 가지며, 한 기관에서 승인된 IRB는 모든 연구자유지대 참여 병원에서 인정된다. 현재 18개 기관이 연구자유지대에 참여하고 있으며 조만간 6개 의료기관이 추가 참여할 예정이다. 연구자유지대 소속 연구자들의 분석이 FeederNet 플랫폼에서 수행된 CDM 분석 건의 80% 이상을 차지하고 있으며, 2022년에는 연구자유지대를 이용해 스타틴계 약물간 신규 당뇨병 발병 위험도를 비교한 연구가 Cardiovascular Diabetology(IF: 9.951)에 게재된 바 있다. 특히 연구시작에서 분석 및 제출, 게재승인까지 수개월만이 신속하게 이루어져서 피더넷의 가치가 빛을 발하였다.

CDM을 활용한 국내 연구자들의 연구 성과는 양적, 질적으로 나타나고 있다. FeederNet 플랫폼 상에서의 CDM 분석 건수는 플랫폼이 서비스를 시작한 2019년 5월 이후 2022년 7월 현재 14,000건을 넘어섰으며, 2021년 한 해에만 4,700건의 분석이 수행되었다. CDM 분석 건수의 증가는 저널에 출판된 논문의 증가로도 이어지고 있다. Google scholar에서 ‘OMOP-CDM’ 키워드로 2017년 이후부터 2022년 6월까지 저널에 게재된 논문을 검색한 결과, 1저자가 한국기관 소속인 논문은 총 97편이었다. 영문으로 씌여진, 저널에 출판된 총 439편의 OMOP-CDM 논문 중 22%에 해당하는 숫자였으며, 년도별로는 2017-2018년에 1편씩, 2019년에 4편, 2020년에 21편, 2021년에 55편, 2022년 6월까지 15편이 출판되어 매년 CDM 논문이 증가하고 있음을 알 수 있다.

국내 연구자들의 CDM 활용연구의 질도 높아졌다. 2019년 Lancet(IF: 202.731)에 국내외 연구자들과 2억 5천만명 분의 고혈압 치료 데이터를 분석한 연구를 게재하였으며, 2020년에는 JAMA(IF: 157.3), Nature communications(IF: 17.69), Journal of Allergy and Clinical Immunology(IF: 14.290), 2021년에는 Hypertension(IF: 10.19), The Lancet Digital Health(IF: 36.615), 2022년에는 Cardiovascular Diabeotology(IF: 9.951) 등 유수의 저널에 CDM을 활용한 분석 연구를 게재하였다.

한국 오딧세이는 분기마다 각 참여 병원의 CDM 책임자들이 모이는 OHDSI Korea 리더십미팅을 통해 CDM 고도화(R&D), 연구 활성화 정책 등을 논의하고 있으며, 다음과 같은 CDM 발전 방향을 세우고 있다. 첫째, 실시간 CDM 변환이다. 년 배치가 아닌 일, 주 단위의 짧은 주기로 CDM이 변환된다면 감염병 모니터링, 최신 약제나 기기, 시술에 대한 신속한 효과 및 부작용 탐지가 가능하다. 둘째, 비정형 임상데이터의 CDM 변환이다. 의료영상, 의료노트, 생체신호 등의 비정형 데이터로의 CDM 확장은 심도 있는 연구를 가능하게 해 줄 것으로 기대한다. 마지막으로, 다기관 CDM의 연계이다. 환자의 동의를 기반으로 연계된 CDM은 환자의 개인정보를 강력하게 보호하면서도 환자 생애 주기별 연구를 가능케 하고, 개발된 AI 예측모델을 환자 개인 수준에 직접 적용할 수 있게 될 것이다. 현재 CDM은 과거자료를 기반으로 한 후향적 관찰연구만 가능하나, 실시간 데이터 변환, 개인 환자별 자료연계가 가능해지면 전향적인 연구가 가능한 실용적 임상 시험(pragmatic clinical trial) 연구망으로 그 기능이 확장되어 기존의 무작위배정임상시험이나 후향적 관찰연구로 수행할 수 없었던 다양한 분석이 가능하게 될 것이다.

이제 의료전문가들은 환자를 위한 정밀의료 실현이나 스스로의 연구 역량 강화를 위해서도 데이터 분석 역량이 필요한 시대가 되어가고 있다. 다기관 CDM 분석 도구의 발전은 실세계 임상빅데이터의 활용을 점점 더 쉽고 빠르게 만들고 있다. 데이터 분석을 어렵게만 느꼈던 의료전문가들도 데이터 분석 연구의 시작으로 CDM에 관심을 가지고 도전해 보기를 바란다.


대한의학회(https://www.kams.or.kr)
(06762) 서울특별시 서초구 바우뫼로 7길 18