Abstract
Einleitung: Die zentrale Forderung des TMF-Datenschutzkonzeptes A im Zusammenhang mit biomedizinischer Forschung ist die physikalische und organisatorische Trennung der patientenidentizierenden (IDAT), der Proben-(ProbDAT) sowie der medizinischen Kontextdaten (MDAT). Eine Zusammenführung dieser Daten soll dabei nur auf dem Rechner des berechtigten Benutzers erfolgen [1]. Für Datenauswertungen in multizentrischen, klinischen Studien ist es erforderlich, dass die am Rechner des berechtigten Nutzers an jedem Standort zusammengefügten Daten ohne IDAT in ein Recherchesystem (z.B. Datawarehouse-System i2b2 [2]) exportiert werden können. Dieser Schritt, ProbDAT und MDAT über die IDAT zusammenzuführen, stellt Kliniken wegen momentaner Restriktionen des TMF-PID-Generators/-Dispatchers vor einem Problem, denn das Zusammenführen von ProbDAT und MDAT ist zunächst aufgrund fehlender Rückabbildungen erzeugter Pseudonyme nicht möglich.
Im Rahmen des Projektes „North German Tumor Bank of Colorectal Cancer (ColoNet)“ [3] soll eine Software erstellt werden, die es ermöglicht, auf einfache Weise IDAT, MDAT und ProbDAT zu erfassen und zu verwalten sowie MDAT und ProbDAT zusammenzuführen und nach i2b2 zu exportieren, ohne dabei die Regeln des Datenschutzes zu verletzten.
Material und Methoden: Zur Primärdatenerfassung, d.h. der getrennten, aber koordinierten Erfassung von Probendaten einerseits und medizinischen Kontextdaten andererseits soll das Gesamtsystem sowohl kommerzielle Lösungen als auch selbst entwickelte Software „tolerieren“. Momentan wird für das Probenmanagement eine STARLiMS-Testversion und für klinische Annotationen eine selbst entwickelte und ersetzbare Software, jeweils basierend auf einer MS SQL-Datenbank, verwendet. Das Gesamtsystem besteht damit aus drei Microsoft SQL-Datenbanken auf zwei Windows 2008 Servern und der für i2b2 benötigten ORACLE-Datenbank auf einem UNIX-Server. Auf einem Windows-Server sind zwei Datenbanken (DB) angelegt: eine Datenbank für die Verwaltung der fallspezifisch pseudonymisierten Probenentitäten (ProbDAT) und eine Datenbank zur Verwaltung der fallspezifisch pseudonymisierten medizinischen Kontextdaten (MDAT). Auf dem besonders gesicherten zweiten Server wird eine Datenbank für die identifizierenden Daten der Patienten (IDAT, inkl. Falldaten) verwaltet. Der Fallbezug der über die jeweilige Klinik rekrutierten Patienten ermöglicht die Erkennung der für das ColoNet-Projekt wichtigen Follow-Up-Informationen.
Ergebnisse und Diskussion: Es wurde ein System entwickelt, mit dem Probendaten und klinische Annotationen datenschutzkonform erfasst und verwaltet werden können. Für den praktikablen Routinebetrieb im Labor ist es wichtig, dass Study-Nurses nicht nur mit Pseudonymen, sondern mit den Patientennamen arbeiten können. Das entwickelte Tool übernimmt die Pseudonymisierung und ermöglicht durch ein geeignetes Berechtigungskonzept, kontextabhängig zulässige Daten bereitzustellen sowie ProbDAT und MDAT zusammenzuführen, ohne dass die datenschutzkritischen IDAT aufgerufen werden müssen. Die so zusammengeführten Daten (gemäß eines vereinbarten Minimaldatensatzes) werden in definierten Zeitabständen als CSV-Dokument für den Datenexport ins i2b2-Datawarehouse bereitgestellt. Zusammen mit den exportierten Daten anderer Projekt-Standorte können zertifizierte Nutzer die Biomaterialien aller Standorte über das i2b2-System online auswerten [4].
Im Vergleich zu ähnlichen Ansätzen wie der generischen Softwarebibliothek von Lablans et al. [5] wird hier auf temporäre Identifier (TempIDs) [1] verzichtet. Durch die strikte Trennung von Behandlungs- und Forschungskontext einerseits sowie der Nutzung von Fall- statt Patientenpseudonymen andererseits ist es möglich, Forschern das Probenpseudonym und zugehörige klinische Annotationen zur Verfügung zu stellen. Die Reidentifizierung der Probanden über das dem Forscher zur Verfügung stehende Pseudonym ist ohne Zugriff auf den gesondert gesicherten Server mit den identifizierenden Daten nicht möglich.
Im Rahmen des Projektes „North German Tumor Bank of Colorectal Cancer (ColoNet)“ [3] soll eine Software erstellt werden, die es ermöglicht, auf einfache Weise IDAT, MDAT und ProbDAT zu erfassen und zu verwalten sowie MDAT und ProbDAT zusammenzuführen und nach i2b2 zu exportieren, ohne dabei die Regeln des Datenschutzes zu verletzten.
Material und Methoden: Zur Primärdatenerfassung, d.h. der getrennten, aber koordinierten Erfassung von Probendaten einerseits und medizinischen Kontextdaten andererseits soll das Gesamtsystem sowohl kommerzielle Lösungen als auch selbst entwickelte Software „tolerieren“. Momentan wird für das Probenmanagement eine STARLiMS-Testversion und für klinische Annotationen eine selbst entwickelte und ersetzbare Software, jeweils basierend auf einer MS SQL-Datenbank, verwendet. Das Gesamtsystem besteht damit aus drei Microsoft SQL-Datenbanken auf zwei Windows 2008 Servern und der für i2b2 benötigten ORACLE-Datenbank auf einem UNIX-Server. Auf einem Windows-Server sind zwei Datenbanken (DB) angelegt: eine Datenbank für die Verwaltung der fallspezifisch pseudonymisierten Probenentitäten (ProbDAT) und eine Datenbank zur Verwaltung der fallspezifisch pseudonymisierten medizinischen Kontextdaten (MDAT). Auf dem besonders gesicherten zweiten Server wird eine Datenbank für die identifizierenden Daten der Patienten (IDAT, inkl. Falldaten) verwaltet. Der Fallbezug der über die jeweilige Klinik rekrutierten Patienten ermöglicht die Erkennung der für das ColoNet-Projekt wichtigen Follow-Up-Informationen.
Ergebnisse und Diskussion: Es wurde ein System entwickelt, mit dem Probendaten und klinische Annotationen datenschutzkonform erfasst und verwaltet werden können. Für den praktikablen Routinebetrieb im Labor ist es wichtig, dass Study-Nurses nicht nur mit Pseudonymen, sondern mit den Patientennamen arbeiten können. Das entwickelte Tool übernimmt die Pseudonymisierung und ermöglicht durch ein geeignetes Berechtigungskonzept, kontextabhängig zulässige Daten bereitzustellen sowie ProbDAT und MDAT zusammenzuführen, ohne dass die datenschutzkritischen IDAT aufgerufen werden müssen. Die so zusammengeführten Daten (gemäß eines vereinbarten Minimaldatensatzes) werden in definierten Zeitabständen als CSV-Dokument für den Datenexport ins i2b2-Datawarehouse bereitgestellt. Zusammen mit den exportierten Daten anderer Projekt-Standorte können zertifizierte Nutzer die Biomaterialien aller Standorte über das i2b2-System online auswerten [4].
Im Vergleich zu ähnlichen Ansätzen wie der generischen Softwarebibliothek von Lablans et al. [5] wird hier auf temporäre Identifier (TempIDs) [1] verzichtet. Durch die strikte Trennung von Behandlungs- und Forschungskontext einerseits sowie der Nutzung von Fall- statt Patientenpseudonymen andererseits ist es möglich, Forschern das Probenpseudonym und zugehörige klinische Annotationen zur Verfügung zu stellen. Die Reidentifizierung der Probanden über das dem Forscher zur Verfügung stehende Pseudonym ist ohne Zugriff auf den gesondert gesicherten Server mit den identifizierenden Daten nicht möglich.
Original language | German |
---|---|
Pages | ID 261, 336-338 |
Number of pages | 3 |
DOIs | |
Publication status | Published - 13.09.2012 |
Event | 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS) - Braunschweig, Germany Duration: 16.09.2012 → 20.09.2012 |
Conference
Conference | 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS) |
---|---|
Country/Territory | Germany |
City | Braunschweig |
Period | 16.09.12 → 20.09.12 |