To Extend or Not to Extend? Context-Specific Corpus Enrichment

Felix Kuhr*, Tanya Braun, Magnus Bender, Ralf Möller

*Korrespondierende/r Autor/-in für diese Arbeit

Abstract

An agent in pursuit of a task may work with a corpus of documents with linked subjective content descriptions. Faced with a new document, an agent has to decide whether to include that document in its corpus or not. Basing the decision on only words, topics, or entities, has shown to not lead to a balanced performance for varying documents. Therefore, this paper presents an approach for an agent to decide if a new document adds value to its existing corpus by combining texts and content descriptions. Furthermore, an agent can use the approach as a starting point for high quality content descriptions for new documents. A case study shows the effectiveness of our approach given varying types of new documents.

OriginalspracheEnglisch
TitelAI 2019: AI 2019: Advances in Artificial Intelligence
Redakteure/-innenJixue Liu, James Bailey
Seitenumfang12
Band11919 LNAI
Herausgeber (Verlag)Springer, Cham
Erscheinungsdatum25.11.2019
Seiten357-368
ISBN (Print)978-3-030-35287-5
ISBN (elektronisch)978-3-030-35288-2
DOIs
PublikationsstatusVeröffentlicht - 25.11.2019
Veranstaltung32nd Australasian Joint Conference on Artificial Intelligence - Adelaide, Australien
Dauer: 02.12.201905.12.2019
Konferenznummer: 234489

Strategische Forschungsbereiche und Zentren

  • Zentren: Zentrum für Künstliche Intelligenz Lübeck (ZKIL)
  • Querschnittsbereich: Intelligente Systeme

DFG-Fachsystematik

  • 409-06 Informationssysteme, Prozess- und Wissensmanagement

Zitieren