Abstract
A reference library can be described as a corpus of an individual composition of documents. Over time, the corpus might grow because an agent decides to extend its corpus with additional documents, e.g., new publications, or new articles. Existing approaches use topic modelling techniques to compare documents with each other within the same corpus by the documents' topic distribution. However, for new documents, only the text, and no topic distribution is available. Thus, this paper describes three techniques for estimating topic distributions of new unseen documents considering the initial documents in a corpus. Additionally, we present an extensive evaluation about the performance and runtime of the three topic modelling techniques for various scenarios and different sized corpora.
| Originalsprache | Englisch |
|---|---|
| Titel | 2020 IEEE 14th International Conference on Semantic Computing (ICSC) |
| Seitenumfang | 8 |
| Herausgeber (Verlag) | IEEE |
| Erscheinungsdatum | 02.2020 |
| Seiten | 451-458 |
| Aufsatznummer | 9031467 |
| ISBN (Print) | 978-1-7281-6333-8 |
| ISBN (elektronisch) | 978-1-7281-6332-1 |
| DOIs | |
| Publikationsstatus | Veröffentlicht - 02.2020 |
| Veranstaltung | 14th IEEE International Conference on Semantic Computing - San Diego, USA / Vereinigte Staaten Dauer: 03.02.2020 → 05.02.2020 Konferenznummer: 158497 |
UN SDGs
Dieser Output leistet einen Beitrag zu folgendem(n) Ziel(en) für nachhaltige Entwicklung
-
SDG 3 – Gesundheit und Wohlergehen
-
SDG 4 – Qualitativ hochwertige Bildung
-
SDG 9 – Industrie, Innovation und Infrastruktur
-
SDG 11 – Nachhaltige Städte und Gemeinschaften
-
SDG 12 – Verantwortungsvoller Konsum und Produktion
-
SDG 14 – Lebensraum Wasser
-
SDG 15 – Lebensraum Land
Strategische Forschungsbereiche und Zentren
- Zentren: Zentrum für Künstliche Intelligenz Lübeck (ZKIL)
- Querschnittsbereich: Intelligente Systeme
DFG-Fachsystematik
- 409-06 Informationssysteme, Prozess- und Wissensmanagement
Fingerprint
Untersuchen Sie die Forschungsthemen von „Maintaining Topic Models for Growing Corpora“. Zusammen bilden sie einen einzigartigen Fingerprint.Zitieren
- APA
- Author
- BIBTEX
- Harvard
- Standard
- RIS
- Vancouver