Interoperabilidad en la asistencia sanitaria: Colaboración a través de OMOP-CDM para la normalización
04/01/2024João Fonseca es un experto ingeniero y científico de datos. Licenciado en Bioingeniería por la FEUP, especializado en Ingeniería Biomédica, su competencia abarca todo el espectro de los datos sanitarios. Navega con destreza por todo el conducto de datos sanitarios, demostrando experiencia en la recopilación de datos, armonización, ingeniería y análisis científico exhaustivo. La pasión de João reside en aprovechar su formación multidisciplinar para desvelar ideas e innovaciones dentro del intrincado ámbito de los datos biomédicos.
João Fonseca, ingeniero y científico de datos, marca la primera entrevista de la serie.
Interoperabilidad en la asistencia sanitaria: Colaboración a través de OMOP-CDM para la normalización
Interoperabilidad en la asistencia sanitaria: Colaboración a través de OMOP-CDM para la normalización de datos
¿Cuál es su experiencia en el trabajo con modelos de datos sanitarios estandarizados como OMOP-CDM?
Mi exposición a los datos sanitarios estandarizados comenzó durante mi tesis de maestría, centrada en probar un modelo de predicción de mortalidad basado en IA comparándolo con el estándar actual. Descubrí un escollo importante en el análisis sanitario: realizar comparaciones sin conjuntos de datos idénticos. Para mitigarlo, utilicé datos comunes de bioseñales MIMIC-III. Sin embargo, la escasez de datos y las alteraciones de los investigadores plantearon retos que dificultaron el análisis estandarizado.
Ahí es donde entra en juego OMOP-CDM.
Desde junio de 2022, me he comprometido estrechamente con OMOP-CDM y he descubierto su amplia participación comunitaria. Desarrolladores, clínicos, creadores de herramientas, empresas y custodios de datos contribuyen activamente, fomentando la adopción y el perfeccionamiento generalizados. Este crecimiento impulsado por la comunidad facilita el análisis estandarizado, conjuntos de datos más grandes y estudios multicéntricos, abordando los problemas de mi tesis y mejorando tanto la calidad de la investigación como mi experiencia en la utilización de datos sanitarios.
¿Qué fue lo que inicialmente despertó su interés por trabajar como ingeniero de datos en el sector sanitario y por qué le resulta tan atractiva esta área de la ingeniería de datos?
La sanidad se ha quedado rezagada a la hora de adoptar los recientes avances tecnológicos, algo evidente en el proceso de programar consultas o acceder a la información sobre tratamientos. A menudo, reservar citas significaba soportar largas colas para la introducción manual de datos.
Estos problemas impregnan las experiencias de los pacientes y las tendencias más generales de la atención sanitaria. La implantación de sistemas de datos integrales podría revolucionar las operaciones y el análisis de la asistencia sanitaria.
Esto impulsó mi búsqueda de datos sanitarios, un campo maduro para la transformación. La mejora de los sistemas de datos tanto organizativos como analíticos encierra la promesa de remodelar nuestra comprensión y enfoque de la prestación de asistencia sanitaria y la investigación.
Transformación y normalización de datos
¿Cómo convierte Promptly diversos formatos de datos sanitarios en el OMOP-CDM estandarizado para su análisis y a qué retos se enfrenta Promptly durante el proceso de transformación de datos, y cómo se abordan estos retos?
Los principales objetivos de la utilización de OMOP-CDM en Promptly son reutilización y escalabilidad.
El proceso implica perfilar los conjuntos de datos de origen para comprender su estructura y, a continuación, aplicar un proceso de extracción, carga y transformación para alinearlos con un modelo común OMOP-CDM.
En particular, esta transformación implica normalización de vocabularios utilizados en los datos, traduciendo conceptos diversos como "Enfermedad cardiaca" a sistemas de codificación estandarizados como SNOMED o CIE10. OMOP-CDM se basa en el vocabulario Athena como fuente de estos códigos, fomentando los esfuerzos continuos de la comunidad para actualizar y definir la fuente primaria de verdad de los conceptos médicos.
Promptly se enfrenta a un reto importante en la armonización, abordado mediante una herramienta como USAGI, que sugiere automáticamente códigos de conceptos estándar, refinados por especialistas clínicos. Se están realizando esfuerzos para desarrollar una herramienta más eficaz basada en la IA que aproveche los vastos conceptos médicos de la base de datos de origen, reentrenando el modelo para mejorar las correspondencias de vocabulario y reducir el trabajo manual.
Esta fuente unificada de la verdad permite reutilización y escalabilidad facilitando la reutilización de la cartografía entre los clientes y mejorando la eficacia de la herramienta a lo largo del tiempo.
Garantía de calidad de los datos
¿Qué medidas emplea Promptly para garantizar la calidad y la integridad de los datos al adoptar el modelo común OMOP-CDM?
Emplee con prontitud diversas medidas para salvaguardar la calidad y la integridad de los datos al adoptar el marco OMOP-CDM. Inicialmente, la adhesión a las normas fundamentales de OMOP-CDM relativas a la estructura y los vocabularios es un objetivo primordial para garantizar la calidad de los datos.
Posteriormente, garantizar la eficacia de los procesos de extracción, carga y transformación (ELT) implica integrar pruebas de calidad de los datos en cada etapa, empezando por los datos de origen hasta los cuadros de mando analíticos que se proporcionan a los clientes.
Estas pruebas se implementan a un nivel granular, comenzando con evaluaciones específicas de columna, progresando a evaluaciones a nivel de tabla y culminando en pruebas unitarias de alto nivel. Estas pruebas exhaustivas permiten realizar comparaciones entre los datos de origen y los datos presentados en los cuadros de mando analíticos, lo que garantiza su precisión y fiabilidad.
Capacidades analíticas
¿Cómo mejora el modelo normalizado OMOP-CDM la eficacia o la precisión de los procesos analíticos?
Utilizar un modelo estandarizado no sólo permite estandarizar los análisis, sino que también facilita las comparaciones entre los distintos resultados de los análisis, lo que aumenta significativamente el valor de la investigación y de las pruebas del mundo real (RWE).
Además, la adopción de un modelo de este tipo permite la posibilidad de realizar estudios multicéntricos. Cuando múltiples socios de datos armonizan sus datos con OMOP-CDM, los análisis agregados se hacen factibles. Este conjunto más amplio de datos utilizados en los análisis abarca un segmento mayor de la muestra de población. En consecuencia, las conclusiones extraídas de estos estudios tienden a ajustarse mucho más a la realidad.
Interoperabilidad y colaboración
¿Cómo facilita Promptly la interoperabilidad y la colaboración entre las diferentes partes interesadas u organizaciones que utilizan el OMOP-CDM?
Una de las principales ventajas de la armonización hacia un modelo de datos común es, de hecho, la colaboración. Podemos pensar que las partes interesadas y las organizaciones hablan el mismo idioma en lugar del suyo propio. Eso también facilita el uso de las mismas herramientas, el análisis y la interoperabilidad en general.
Promptly desempeña un papel crucial en este ecosistema al establecer una red de pruebas del mundo real respaldada por el marco OMOP-CDM. Interviene con prontitud para proporcionar análisis estandarizados adaptados a las necesidades de cada organización. Actuando como intermediario, Promptly se conecta con cada entidad, realizando análisis exhaustivos sin acceder directamente a los datos ni sacarlos de las instalaciones de la organización. Esto se consigue mediante un sofisticado modelo de federación, que garantiza la seguridad e integridad de los datos al tiempo que fomenta una colaboración sin fisuras.
Adaptabilidad y escalabilidad
¿Hasta qué punto es adaptable el enfoque de Promptly a la hora de incorporar nuevas fuentes de datos o actualizaciones de las normas OMOP-CDM?
OMOP-CDM ofrece notables ventajas en términos de reutilización y escalabilidad. Mediante la racionalización del mapeo de vocabulario, el empleo de una canalización ELT (extracción, carga y transformación) estandarizada y el uso de análisis estandarizados, la herramienta demuestra una adaptabilidad excepcional a los distintos clientes.
La tarea restante consiste en analizar el modelo de datos específico del cliente y establecer el aspecto de "carga" de la canalización.
Medidas de privacidad y seguridad
¿Qué estrategias emplea Promptly para garantizar la privacidad del paciente y la seguridad de los datos mientras trabaja con el OMOP-CDM?
El OMOP-CDM sirve como modelo de datos pseudoanonimizados al no conservar información identificable del paciente o del médico, lo que constituye su principal medida de privacidad.
En la fase de armonización, el pipeline aplica además un algoritmo hash a las identificaciones de los pacientes y los médicos en la base de datos inicial. Este paso garantiza la imposibilidad de rastrear los datos de los pacientes desde la OMOP-CDM hasta la base de datos original, que podría contener información personal por necesidades administrativas.
Más información Soluciones Promptly Data