Interoperabilidade nos cuidados de saúde: Colaboração através de OMOP-CDM para normalização

04/01/2024

João Fonseca é um engenheiro de dados e cientista. Com um mestrado em Bioengenharia pela FEUP, com especialização em Engenharia Biomédica, a sua proficiência abrange todo o espetro de dados de saúde. Navega habilmente por todo o pipeline de dados de saúde, demonstrando experiência na recolha de dados, harmonização, engenharia e análise científica abrangente. A sua paixão reside no aproveitamento da sua experiência multidisciplinar para desbloquear conhecimentos e inovações no intrincado domínio dos dados biomédicos.

João Fonseca, Engenheiro de Dados e Cientista, marca a primeira entrevista da série.

Interoperabilidade nos cuidados de saúde: Colaboração através de OMOP-CDM para normalização

Interoperabilidade nos cuidados de saúde: Colaboração via OMOP-CDM para a normalização de dados

Qual é a sua experiência de trabalho com modelos de dados de cuidados de saúde normalizados como o OMOP-CDM?

A minha exposição a dados de saúde normalizados começou durante a minha tese de mestrado, centrada no teste de um modelo de previsão de mortalidade por IA em comparação com a norma atual. Descobri uma grande armadilha na análise dos cuidados de saúde: efetuar comparações sem conjuntos de dados idênticos. Para atenuar este problema, utilizei dados de bio-sinais MIMIC-III comuns. No entanto, a escassez de dados e as alterações efectuadas pelos investigadores colocaram desafios, dificultando a análise normalizada.

É aqui que entra o OMOP-CDM.

Desde junho de 2022, tenho trabalhado de perto com o OMOP-CDM e descobri o vasto envolvimento da sua comunidade. Programadores, clínicos, criadores de ferramentas, empresas e responsáveis pela custódia de dados contribuem ativamente, promovendo a adoção e o aperfeiçoamento generalizados. Este crescimento impulsionado pela comunidade facilita a análise padronizada, conjuntos de dados maiores e estudos multicêntricos, abordando as questões da minha tese e melhorando tanto a qualidade da investigação como a minha experiência na utilização de dados de cuidados de saúde.

O que é que inicialmente despertou o seu interesse em trabalhar como engenheiro de dados no sector da saúde e porque é que considera esta área da engenharia de dados interessante?

Os cuidados de saúde têm-se atrasado na adoção dos recentes avanços tecnológicos, o que é evidente no processo de marcação de consultas ou no acesso ao feedback dos tratamentos. A marcação de consultas implicava frequentemente longas filas de espera para a introdução manual de dados.

Estes problemas afectam as experiências dos doentes e as tendências mais gerais dos cuidados de saúde. A implementação de sistemas de dados abrangentes pode revolucionar as operações e a análise dos cuidados de saúde.

Este facto levou-me a investigar os dados relativos aos cuidados de saúde - um domínio pronto a ser transformado. A melhoria dos sistemas de dados organizacionais e analíticos promete reformular a nossa compreensão e abordagem da prestação de cuidados de saúde e da investigação.

Transformação e normalização de dados

Como é que a Promptly converte diversos formatos de dados de cuidados de saúde no OMOP-CDM normalizado para análise e que desafios enfrenta durante o processo de transformação de dados, e como é que esses desafios são resolvidos?

Os principais objectivos da utilização do OMOP-CDM no Promptly são reutilização e escalabilidade.

O processo envolve a caraterização dos conjuntos de dados de origem para compreender a sua estrutura e, em seguida, a implementação de um processo de extração, carregamento e transformação para os alinhar com um modelo comum OMOP-CDM.

Nomeadamente, esta transformação implica normalização de vocabulários utilizados nos dados, traduzindo conceitos diversos como "Cardiac disease" (doença cardíaca) em sistemas de codificação normalizados como o SNOMED ou a ICD10. A OMOP-CDM baseia-se no vocabulário Athena como fonte para estes códigos, promovendo esforços contínuos da comunidade para atualizar e definir a principal fonte de verdade para os conceitos médicos.

O Promptly enfrenta um grande desafio em termos de harmonização, resolvido através de uma ferramenta como a USAGI, que sugere automaticamente códigos de conceitos padrão, aperfeiçoados por especialistas clínicos. Estão a ser envidados esforços para desenvolver uma ferramenta mais eficiente baseada em IA, aproveitando os vastos conceitos médicos da base de dados de origem, treinando novamente o modelo para melhorar os mapeamentos de vocabulário e reduzir o trabalho manual.

Esta fonte unificada da verdade permite-lhe reutilização e escalabilidade facilitando a reutilização de mapas entre clientes e melhorando a eficiência da ferramenta ao longo do tempo.

Garantia de qualidade dos dados

Que medidas utiliza a Promptly para garantir a qualidade e a integridade dos dados ao adotar o modelo comum OMOP-CDM?

Adopte prontamente várias medidas para salvaguardar a qualidade e a integridade dos dados ao adotar o quadro OMOP-CDM. Inicialmente, a adesão às regras fundamentais do OMOP-CDM no que respeita à estrutura e aos vocabulários é o principal objetivo para garantir a qualidade dos dados.

Subsequentemente, garantir a eficácia dos processos de extração, carregamento e transformação (ELT) implica a integração de testes de qualidade dos dados em todas as fases, desde os dados de origem até aos painéis analíticos fornecidos aos clientes.

Estes testes são implementados a um nível granular, começando com avaliações específicas da coluna, progredindo para avaliações ao nível da tabela e culminando em testes unitários de alto nível. Estes testes exaustivos permitem comparações entre os dados de origem e os dados apresentados nos painéis analíticos, garantindo precisão e fiabilidade.

Capacidades analíticas

Como é que o modelo normalizado OMOP-CDM melhora a eficiência ou a precisão dos processos analíticos?

A utilização de um modelo normalizado não só permite uma análise normalizada, como também facilita as comparações entre vários resultados analíticos, aumentando significativamente o valor da investigação e das provas do mundo real (RWE).

Além disso, a adoção de um modelo deste tipo permite a realização de estudos multicêntricos. Quando vários parceiros de dados harmonizam os seus dados com o OMOP-CDM, torna-se possível efetuar análises agregadas. Este conjunto mais alargado de dados utilizados nas análises engloba um segmento maior da amostra da população. Consequentemente, as conclusões retiradas destes estudos tendem a alinhar-se muito mais com a realidade.

Interoperabilidade e colaboração

Como é que o Promptly facilita a interoperabilidade e a colaboração entre as diferentes partes interessadas ou organizações que utilizam o OMOP-CDM?

Uma das principais vantagens da harmonização para um modelo de dados comum é, de facto, a colaboração. Podemos pensar nisto como se as partes interessadas e as organizações falassem a mesma língua e não a sua própria. Isso também facilita a utilização das mesmas ferramentas, a análise e a interoperabilidade em geral.


A Promptly desempenha um papel crucial neste ecossistema, estabelecendo uma rede de provas do mundo real sustentada pelo quadro OMOP-CDM. Intervém prontamente para fornecer análises padronizadas e adaptadas às necessidades de cada organização. Actuando como intermediário, a Promptly liga-se a cada entidade, realizando análises exaustivas sem aceder diretamente ou retirar os dados das instalações da organização. Isto é conseguido através de um modelo de Federação sofisticado, que garante a segurança e a integridade dos dados, ao mesmo tempo que promove uma colaboração sem descontinuidades.

Adaptabilidade e escalabilidade

Qual é o grau de adaptabilidade da abordagem da Promptly quando incorpora novas fontes de dados ou actualizações das normas OMOP-CDM?

A OMOP-CDM oferece benefícios notáveis em termos de reutilização e escalabilidade. Através da simplificação do mapeamento de vocabulário, da utilização de um pipeline ELT (extrair, carregar e transformar) normalizado e da utilização de análises normalizadas, a ferramenta demonstra uma adaptabilidade excecional a diferentes clientes.

A tarefa restante consiste em analisar o modelo de dados específico do cliente e estabelecer o aspeto "carga" do pipeline.

Medidas de privacidade e segurança

Que estratégias utiliza a Promptly para garantir a privacidade dos doentes e a segurança dos dados quando trabalha com o OMOP-CDM?

O OMOP-CDM funciona como um modelo de dados pseudo-anonimizado ao não reter informação identificável do doente ou do médico, constituindo a sua principal medida de privacidade.

Na fase de harmonização, o pipeline aplica adicionalmente um algoritmo de hashing aos IDs dos doentes e dos médicos na base de dados inicial. Esta etapa garante a impossibilidade de rastrear os dados dos doentes do OMOP-CDM até à base de dados original, que pode conter informações pessoais para fins administrativos.

Saiba mais sobre Soluções de Dados Promptly