Abstract
Die vorliegende Arbeit beschäftigt sich mit der Implementierung von Teilen eines Registrierungsalgorithmus in der Compute Unified Device Architecture (CUDA) von NVIDIA und der daraus resultierenden Zeitersparnis. Es wurden die einzelnen Schritte des Registrierungsalgorithmus analysiert und auf ihre Parallelisierbarkeit untersucht. Die Implementierungen wurden anhand von 20 thorakalen CT-Datens ätzen evaluiert und der SpeedUp berechnet. Es wurde eine Beschleunigung vom Faktor 143 bei der TPS Interpolation und ein Faktor 12 beim Image Warping erreicht. Obwohl nur 2 Teilschritte auf der GPU umgesetzt wurden, konnte ein Speedup des Gesamtverfahren von 2.175 erreicht werden. Dies zeigt das eine GPU-Implementierung effizienter als eine CPU-basierte Parallelisierung sein kann.
Original language | German |
---|---|
Title of host publication | Bildverarbeitung für die Medizin 2011 |
Editors | Heinz Handels, Jan Ehrhardt, Thomas M. Deserno, Hans-Peter Meinzer, Thomas Tolxdorff |
Number of pages | 5 |
Publisher | Springer Berlin Heidelberg |
Publication date | 13.03.2011 |
Pages | 99 - 103 |
ISBN (Print) | 978-3-642-19334-7 |
ISBN (Electronic) | 978-3-642-19335-4 |
DOIs | |
Publication status | Published - 13.03.2011 |
Event | Workshops Bildverarbeitung fur die Medizin 2011 - Lübeck, Germany Duration: 20.03.2011 → 22.03.2011 Conference number: 99531 |