Abstract
Hintergrund: In einem abgeschlossenen Projekt mit einem Medizingeräte-Hersteller wurde gezeigt, wie intensivmedizinische Daten auf den HL7 CDA Dialekt "PHMR" (Personal Healthcare Monitoring Report) abgebildet werden können, um Vorteile semantisch interpretierbarer Daten ausnutzen zu können, z.B. die Integration entscheidungsunterstützender Systeme ohne Anpassung an proprietäre Datenstrukturen klinischer Systeme [1]. Nach dieser positiven Erfahrung ist der Projektpartner an umfangreicheren Inhalten der in den USA bereitgestellten Datenbank MIMIC-II (Multiparameter Intelligent Monitoring in Intensive Care II) interessiert [2]. Mit Verweis auf Smits et al. [3] wurde entschieden, die auf einem relationalen Datenbankschema basierenden Daten in geeignete Ressourcen des Standards HL7 FHIR (Fast Healthcare Interoperability Resources) zu transformieren [4], [5]. Analog zu Schult et al. [6] sollte im Rahmen einer studentischen Arbeit für definierte Ausschnitte der MIMIC-II-Datenbank eine solche Abbildung realisiert werden [7]. Im Gegensatz zum Dokumentenstandard HL7 CDA verspricht der Ressourcen-orientierte Standard HL7 FHIIR die detaillierten Inhalte fein-granulärer abzubilden.
Methoden: Bevor die MIMIC-II-Datenbank in Form von Flat Files heruntergeladen werden kann, muss trotz sorgfältiger De-Identifikation von Personendaten eine Online-Schulung zu Themen wie „Privacy“ und „Datenschutz“ erfolgreich abgeschlossen werden [8]. Die MIMIC-II-Datenbank (30 GB) wurde unter Verwendung von Postgres mit SQL-Import-Befehlen aufgesetzt. Neben Patientendaten mit demographischen und klinischen Kerndaten sind umfangreiche Labordaten, Scores, Signale und Bilder enthalten [9]. Zwei wesentliche Aufgabenbereiche bestehen im Studium der MIMIC II Datenbankstruktur sowie der relevanten Ressourcen des HL7 FHIR Standards.
MIMIC II:
Schemaanalyse und Identifikation relevanter Tabellen, Attribute und Datentypen
Analyse strukturierter Attributwerte bzw. der über Fremdschlüssel verknüpften Stammtabellen
FHIR:
Analyse relevanter FHIR-Ressourcen und deren XML-Schemata
Abbilden von Stammtabellen auf Value Sets und die Erstellung korrespondierender FHIR-Profile
Zur Transformation der relationalen Daten der MIMIC II – Datenbank wurden mit dem Werkzeug Altova MapForce® als Mapping-Tool geeignete XSL-Transformationen generiert, um die Inhalte in XML-Ressourcen des FHIR-Standards zu transformieren. Die erzeugten FHIR-Ressourcen wurden über ein Java-Programm unter Verwendung der HAPI-FHIR-Bibliothek per REST-Aufrufe auf einem lokal verfügbaren HL7 FHIR-Server gespeichert.
Ergebnisse: Basierend auf den Erkenntnissen, welche während der Erstellung der zugrundeliegenden Bachelorarbeit entstanden sind, wurden zunächst die grundlegenden Inhalte der MIMIC II Datenbank in Form von Patienten-, Aufnahme- und Diagnosedaten in die standardisierte Repräsentationsform von FHIR-Ressourcen transformiert. Es konnten 32.535 Patienten und mit diesen zusammenhängend 36.094 Aufnahmen und 314.648 Diagnosen erfolgreich gemappt werden.
Zusammenfassung: Im Verlauf dieser Arbeit stellte sich heraus, dass ein großer Aufwand darin bestand, die zahlreichen Stammtabellen der MIMIC-II-Datenbank auf geeignete FHIR-ValueSets abzubilden, z.B. Ethnicity oder Religion. Mit Blick auf die in FHIR verfügbaren ValueSets müssen über geeignete Profile Ergänzungen vorgenommen werden, bevor FHIR-basierte Ressourcen wie Patient oder Observation mit Referenz auf die ValueSet-Ressourcen erzeugt werden können. Erschwert wird dieses durch fehlende Werte, die mit geeigneten Nullflavors in FHIR abgebildet werden müssen, sowie durch eine nicht unterstützte Gewährleistung referentieller Integrität. Grundsätzlich leidet die Verwendbarkeit der MIMIC-II-Datenbank mit Intensivdaten aus einer US-amerikanischen Klinik unter einigen Defiziten, z.B. werden Diagnosen über ICD-9-CM kodiert und Haupt- bzw. Nebendiagnosen nicht differenziert. Deshalb wird angestrebt, de-identifizierte Intensivdaten aus lokal verfügbaren Datenbeständen gemäß einer analogen Vorgehensweise auf HL7 FHIR abzubilden und dann weitere, oben genannte Datenkategorien wie Vitalwerte und Bilder einzuschließen.
Methoden: Bevor die MIMIC-II-Datenbank in Form von Flat Files heruntergeladen werden kann, muss trotz sorgfältiger De-Identifikation von Personendaten eine Online-Schulung zu Themen wie „Privacy“ und „Datenschutz“ erfolgreich abgeschlossen werden [8]. Die MIMIC-II-Datenbank (30 GB) wurde unter Verwendung von Postgres mit SQL-Import-Befehlen aufgesetzt. Neben Patientendaten mit demographischen und klinischen Kerndaten sind umfangreiche Labordaten, Scores, Signale und Bilder enthalten [9]. Zwei wesentliche Aufgabenbereiche bestehen im Studium der MIMIC II Datenbankstruktur sowie der relevanten Ressourcen des HL7 FHIR Standards.
MIMIC II:
Schemaanalyse und Identifikation relevanter Tabellen, Attribute und Datentypen
Analyse strukturierter Attributwerte bzw. der über Fremdschlüssel verknüpften Stammtabellen
FHIR:
Analyse relevanter FHIR-Ressourcen und deren XML-Schemata
Abbilden von Stammtabellen auf Value Sets und die Erstellung korrespondierender FHIR-Profile
Zur Transformation der relationalen Daten der MIMIC II – Datenbank wurden mit dem Werkzeug Altova MapForce® als Mapping-Tool geeignete XSL-Transformationen generiert, um die Inhalte in XML-Ressourcen des FHIR-Standards zu transformieren. Die erzeugten FHIR-Ressourcen wurden über ein Java-Programm unter Verwendung der HAPI-FHIR-Bibliothek per REST-Aufrufe auf einem lokal verfügbaren HL7 FHIR-Server gespeichert.
Ergebnisse: Basierend auf den Erkenntnissen, welche während der Erstellung der zugrundeliegenden Bachelorarbeit entstanden sind, wurden zunächst die grundlegenden Inhalte der MIMIC II Datenbank in Form von Patienten-, Aufnahme- und Diagnosedaten in die standardisierte Repräsentationsform von FHIR-Ressourcen transformiert. Es konnten 32.535 Patienten und mit diesen zusammenhängend 36.094 Aufnahmen und 314.648 Diagnosen erfolgreich gemappt werden.
Zusammenfassung: Im Verlauf dieser Arbeit stellte sich heraus, dass ein großer Aufwand darin bestand, die zahlreichen Stammtabellen der MIMIC-II-Datenbank auf geeignete FHIR-ValueSets abzubilden, z.B. Ethnicity oder Religion. Mit Blick auf die in FHIR verfügbaren ValueSets müssen über geeignete Profile Ergänzungen vorgenommen werden, bevor FHIR-basierte Ressourcen wie Patient oder Observation mit Referenz auf die ValueSet-Ressourcen erzeugt werden können. Erschwert wird dieses durch fehlende Werte, die mit geeigneten Nullflavors in FHIR abgebildet werden müssen, sowie durch eine nicht unterstützte Gewährleistung referentieller Integrität. Grundsätzlich leidet die Verwendbarkeit der MIMIC-II-Datenbank mit Intensivdaten aus einer US-amerikanischen Klinik unter einigen Defiziten, z.B. werden Diagnosen über ICD-9-CM kodiert und Haupt- bzw. Nebendiagnosen nicht differenziert. Deshalb wird angestrebt, de-identifizierte Intensivdaten aus lokal verfügbaren Datenbeständen gemäß einer analogen Vorgehensweise auf HL7 FHIR abzubilden und dann weitere, oben genannte Datenkategorien wie Vitalwerte und Bilder einzuschließen.
Original language | German |
---|---|
DOIs | |
Publication status | Published - 09.08.2016 |
Event | HEC 2016: Health - Exploring Complexity; Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI - München, Germany Duration: 28.08.2016 → 02.09.2016 https://www.egms.de/static/en/meetings/gmds2016/16gmds147.shtml |
Conference
Conference | HEC 2016: Health - Exploring Complexity; Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI |
---|---|
Country/Territory | Germany |
City | München |
Period | 28.08.16 → 02.09.16 |
Internet address |