Bereiche | Tage | Auswahl | Suche | Aktualisierungen | Downloads | Hilfe
AGI: Arbeitsgruppe Information
AGI 1: Digitale Agenda in Theorie und Praxis: Was geschieht in der Wissenschaft? (mit AGjDPG)
AGI 1.3: Vortrag
Mittwoch, 18. März 2015, 10:45–11:15, TA 251
Content Mining des TIB|AV-Portals: Automatische Analyse und Verschlagwortung von AV-Medien — •Sven Strobel — Technische Informationsbibliothek (TIB), Welfengarten 1B, 30167 Hannover
Das TIB|AV-Portal wurde vom Kompetenzzentrum für nicht-textuelle Materialien an der Technischen Informationsbibliothek gemeinsam mit dem Hasso-Plattner-Institut für Softwaresystemtechnik von 2011 bis 2014 entwickelt. Der Schwerpunkt seines Sammlungsprofils liegt auf AV-Medien aus Technik und Naturwissenschaft. Der Vortrag beleuchtet die automatische Videoanalyse des TIB|AV-Portals unter besonderer Berücksichtigung der automatischen Verschlagwortung.
Die Prozesskette der automatischen Videoanalyse besteht aus dem Ingest der AV-Medien und manuell-intellektuellen Metadaten, der Szenenerkennung, der Audio- und Texterkennung (Speech to Text, OCR-Analyse), Bilderkennung sowie automatischen Verschlagwortung (Named Entity Recognition). Darüber hinaus bekommen die Videos einen Digital Object Identifier (DOI) vergeben; den einzelnen Videosegmenten wird ein Media Fragment Identifier (MFI) zugewiesen. Mit Hilfe von DOI und MFI können die Videos bzw. Videosegmente eindeutig und permanent dereferenziert und zitiert werden.
Die automatische Verschlagwortung der AV-Medien verläuft segmentbasiert, so dass eine zielgenaue Suche innerhalb der Videos möglich ist. Für die Verschlagwortung werden Fachabzüge der Gemeinsamen Normdatei (GND) herangezogen. Das bedeutet: Die Videos werden je nach Fachzugehörigkeit mit einem entsprechenden GND-Fachabzug aus Technik, Physik, Mathematik etc. indexiert. Die Sachbegriffe der GND stehen in semantischer Beziehung zueinander (Synonyme, Unterbegriffe, englische Übersetzungen etc.), was bei der Suche genutzt wird, um die Ergebnismenge zu erweitern. Der Vortrag schließt mit einer Zusammenfassung des Mehrwerts des TIB|AV-Portals, der sich im Wesentlichen durch die automatische Videoanalyse ergibt.