Abstract

In this work we present an optimized version of the Adaptive Radix Tree (ART) index structure for GPUs. We analyze an existing GPU implementation of ART (GRT), identify bottlenecks and present an optimized data structure and layout to improve the lookup and update performance. We show that our implementation outperforms the existing approach by a factor up to 2 times for lookups and up to 10 times for updates using the same GPU. We also show that the sequential memory layout presented here is beneficial for lookup-intensive workloads on the CPU, outperforming the ART by up to 10 times. We analyze the impact of the memory architecture of the GPU, where it becomes visible that traditional GDDR6(X) is beneficial for the index lookups due to the faster clock rates compared to High Bandwidth Memory (HBM).
OriginalspracheEnglisch
Seiten12:1-12:10
DOIs
PublikationsstatusVeröffentlicht - 2021

Strategische Forschungsbereiche und Zentren

  • Zentren: Zentrum für Künstliche Intelligenz Lübeck (ZKIL)
  • Querschnittsbereich: Intelligente Systeme

DFG-Fachsystematik

  • 4.43-03 Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
  • 4.43-06 Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik

Fingerprint

Untersuchen Sie die Forschungsthemen von „CuART - a CUDA-based, scalable Radix-Tree lookup and update engine.“. Zusammen bilden sie einen einzigartigen Fingerprint.

Zitieren