[reinvent 2024] 실제 데이터와 증거를 통해 헬스케어 혁신을 가속화하기

Summary

AWS를 활용한 실사용 데이터(RWD)와 실사용 증거(RWE)를 이용하여, 생명 과학 분야에서 정보 처리하는 방법을 탐구해 봅니다. 대규모의 다양한 데이터 세트를 처리함과 동시에 엄격한 개인정보 보호 기준을 유지할 수 있는 인프라 구축 방법을 배울 수 있습니다. AWS Clean Rooms, Amazon EMR, 및 기타 최첨단 서비스를 사용하여 완전한 RWD/RWE 솔루션을 개발하는 인사이트를 얻을 수 있습니다. 다양한 정보 제공자로부터 RWD를 원활하게 검색, 평가 및 분석하여 사용자 중심의 증거 생성을 가능하게 하고, 클라우드를 이용한 가속화를 통해 혁신적인 헬스케어 발전을 이끌어낼 수 있는 방법을 탐구해 봅니다.


리인벤트 2024 테크 블로그의 더 많은 글이 보고 싶다면?

Tech Blog

AWS re:Invent 2024 Tech Blog written by MegazoneCloud

Overview

  • Title:  Accelerate healthcare innovation with real-world data and evidence [REPEAT]
  • Date: 2024년 12월 2일(월)
  • Venue: MGM Grand | Level 1 | 102
  • Speaker:
  • Praveen Haridas(WW Lead – HCLS Data Solutions, Amazon Web Services)
  • Chaitanya Vejendla(Sr Solutions Architect, Amazon Web Services)
  • Industry: Healthcare & Life Sciences

들어가며

이 세션은 통해 헬스케어 산업에서 실제 데이터와 실증적 증거를 어떻게 활용할 수 있는지 다루었습니다. 현재 헬스케어 산업은 막대한 양의 데이터와 복잡한 연구 절차로 인해 혁신을 가로막는 도전 과제에 직면해 있습니다. 하지만 AWS와 같은 클라우드 기술을 통해 데이터를 더욱 빠르고 효율적으로 통합, 분석하고 활용할 수 있는 솔루션이 등장하면서 연구와 임상 시험 과정이 변화하고 있습니다.

이번 세션에서 가장 중요하게 다룰 주제는 다음과 같습니다. 첫째, 실제 데이터(Real-World Data, RWD)와 이를 통해 도출되는 실증적 증거(Real-World Evidence, RWE)의 개념과 중요성입니다. 둘째, 데이터를 통합하고 분석하는 과정에서 발생하는 문제점과 해결 방안입니다. 마지막으로, AWS Clean Room과 데이터 토큰화 기술이 어떻게 헬스케어 산업의 혁신을 가속화하는지 알아보겠습니다. 이를 통해 헬스케어 연구자와 개발자들이 데이터를 효과적으로 활용할 수 있는 인사이트를 제공하고자 합니다.

실제 데이터와 실증적 증거란 무엇인가?

실제 데이터(Real-World Data, RWD)는 환자의 건강 상태, 진료 기록, 실험실 검사 결과, 유전자 정보 등 다양한 출처에서 발생하는 데이터를 의미합니다. 예를 들어, 병원에서 기록된 EMR(전자 의무 기록), 환자의 실험실 결과, 유전자 검사를 통해 얻어진 유전자 데이터 등이 이에 해당합니다. 이러한 데이터는 환자의 건강 상태를 보다 종합적으로 이해하는 데 핵심적인 역할을 합니다.

반면 실증적 증거(Real-World Evidence, RWE)는 이 데이터를 분석하고 가공하여 질병 패턴, 치료 효과, 안전성 등 중요한 의료 결정을 뒷받침하는 결과를 의미합니다. 기존의 임상 시험이 인위적으로 설계된 환경에서 데이터를 수집하는 것과 달리, 실제 데이터는 현실 세계에서 환자의 상태와 치료 결과를 반영하므로 더욱 신뢰성 있는 결과를 제공합니다. 이를 통해 제약 회사와 연구자들은 보다 효율적으로 약물을 개발하고, 의료 혁신을 이끌 수 있습니다.

제약 산업에서 실제 데이터의 활용

현재 신약 개발 과정은 엄청난 시간과 비용이 소요됩니다. 평균적으로 하나의 약물을 시장에 출시하기까지는 10년의 시간과 1.5~2억 달러의 비용이 필요하며, 이 중 50~60%가 연구 개발과 임상 시험에 사용됩니다. 특히, 전통적인 임상 시험은 시간과 비용이 많이 들 뿐만 아니라, 한정된 데이터를 기반으로 진행되기 때문에 완벽하지 않은 경우가 허다 합니다.

그래서 제약 회사들은 실제 데이터를 활용해 연구와 임상 시험의 효율성을 극대화하고자 합니다. 예를 들어, 특정 질병의 바이오마커를 분석하거나 환자의 안전성과 효능 데이터를 실시간으로 검토하는 것이 가능합니다. 이를 통해 기존의 임상 시험보다 더 정교하고 타겟화된 연구가 가능해집니다. 또한, 데이터 분석을 통해 약물의 라벨 확장(다른 질병에 대한 적용)을 보다 빠르게 검토할 수 있어, 약물 개발의 전체적인 비용과 시간을 절감할 수 있습니다.

환자 데이터의 단절과 통합의 어려움

환자 데이터는 병원, 실험실, 보험 회사 등 다양한 기관에 분산되어 있습니다. 예를 들어, 병원에서 기록된 EMR 데이터, 보험 청구 데이터를 담은 클레임 데이터, 그리고 실험실에서 생성된 유전자 데이터 등이 서로 다른 위치와 포맷으로 존재합니다. 이러한 데이터를 통합하려면 수많은 시간과 리소스가 소요됩니다.

현장의 연구자들은 데이터 통합에 평균 3~4개월이 걸리며, 대부분의 과정은 전화와 이메일을 통해 수작업으로 이루어집니다. 게다가 데이터의 불완전성과 일관성 부족으로 인해 연구의 정확도가 떨어질 위험이 있습니다. 이러한 데이터 단절 문제는 연구의 속도와 효율성을 저해하는 주요 원인입니다.

AWS Clean Rooms 를 이용한 데이터 통합 솔루션

AWS Clean Rooms은 데이터 제공자와 소비자가 데이터를 이동시키지 않고도 안전하게 분석할 수 있도록 돕는 클라우드 기반 협업 환경입니다. 이 솔루션을 통해 데이터는 제공자의 AWS 환경에 안전하게 저장되며, 소비자는 필요한 데이터를 직접 분석할 수 있습니다.

토큰화 기술을 통해 데이터는 개인정보가 노출되지 않도록 보호되며, 프라이버시를 유지하면서도 데이터의 통합 분석이 가능합니다. 예를 들어, 병원 A의 EMR 데이터와 연구소 B의 유전자 데이터를 연결해 환자의 상태를 종합적으로 분석할 수 있습니다. AWS Clean Rooms은 연구자와 기업이 복잡한 데이터 통합 과정을 대폭 간소화하고, 연구를 가속화하는 데 기여합니다.

데이터 밴드의 토큰화 기술

데이터 밴드의 토큰화 기술은 데이터를 hash 값으로 변환해 개인정보를 보호하면서도 여러 출처의 데이터를 연결할 수 있게 해줍니다. 예를 들어, 병원 A와 연구소 B가 각각의 데이터를 토큰화하면, AWS Clean Rooms을 통해 이 데이터를 공통의 키로 연결할 수 있습니다.

이 과정에서 개인정보는 그대로 보호되며, 데이터 제공자는 데이터의 보안을 유지하면서도 필요한 분석에 데이터를 제공할 수 있습니다. 데이터 소비자는 안전하게 데이터를 통합하고 분석할 수 있어 연구의 정확도와 효율성이 높아집니다.

사용자 친화적 데이터 탐색과 분석 도구

AWS Clean Rooms은 SQL 쿼리를 지원해 사용자가 데이터를 손쉽게 분석할 수 있도록 돕습니다. 향후에는 PySpark를 지원해 대용량 데이터 분석의 성능을 더욱 높일 예정이라고 합니다.

또한, 사용자 인터페이스(UI)를 통해 데이터 제공자는 데이터를 플랫폼에 등록하고, 데이터 소비자는 필요한 데이터를 탐색해 분석할 수 있습니다. 이러한 도구를 통해 연구자는 데이터를 빠르게 탐색하고 분석에 집중할 수 있으며, 데이터 제공자는 자신의 데이터를 더욱 효과적으로 제공할 수 있습니다.

데이터 제공자의 새로운 기회

데이터 제공자는 AWS Clean Rooms을 통해 자신의 데이터를 완전히 통제할 수 있습니다. 특정 소비자에게만 데이터를 제공하거나, 특정 조건에 따라 접근을 제한할 수 있어 보안과 통제가 강화됩니다.

또한 데이터를 더 빠르게 판매할 수 있어 수익을 극대화할 수 있습니다. 기존의 비효율적인 데이터 제공 과정이 생략되면서 판매 과정이 단축되고, 데이터 소비자는 더욱 빠르게 데이터를 활용할 수 있습니다.

데이터 소비자의 이점과 효율성

데이터 소비자는 AWS Clean Rooms을 통해 여러 출처의 데이터를 신속하게 통합 분석할 수 있습니다. 병원의 EMR 데이터와 보험 데이터를 겹쳐 분석하거나 환자의 상태를 종합적으로 평가하는 것이 가능합니다.

또한 데이터를 일부만 구매할 수 있어 비용 절감이 가능합니다. 대규모 데이터베이스를 구매하는 대신 필요한 데이터만 선택적으로 활용할 수 있기 때문에 비용 효율성이 크게 향상됩니다.

결론

이번 세션에서는 실제 데이터와 실증적 증거를 활용해 헬스케어 혁신을 가속화하는 방법을 살펴보았습니다. 특히 AWS Clean Rooms과 데이터 밴드의 토큰화 기술을 통해 데이터의 보안과 통합을 동시에 해결할 수 있다는 점이 강조되었습니다.

환자 데이터를 통합하고 분석하는 과정에서 발생하는 문제점을 AWS Clean Rooms 을 통해 해결한다는 점이 인상적이었습니다. 또한, 데이터를 일부만 구매할 수 있다는 점은 연구와 비용 효율성을 극대화하는 새로운 접근법이었습니다. AWS Clean Rooms 는 데이터를 보호하면서도 통합할 수 있는 혁신적인 솔루션으로, 헬스케어 연구와 개발의 패러다임을 바꿀 수 있을 것이라 생각됩니다. 우리가 주목할 부분은 AWS Clean Rooms 와 데이터 밴드의 토큰화 기술입니다. 이를 통해 데이터 보안과 효율성을 동시에 확보할 수 있으며, 헬스케어 연구가 한층 더 발전할 수 있을 것입니다.
글 │메가존클라우드, Cloud Technology Center (CTC), Global PreSales Engineer Team, 이용진
게시물 주소가 복사되었습니다.