Topic/S beim Leipziger Semantic Web Tag

„Der Leipziger Semantic Web Tag (LSWT) bietet seit 2009 Unternehmen und Organisationen die Möglichkeit, sich zu Themen im Bereich semantischer Technologien auszutauschen.“ [Einladung] Genau aus diesem Grund reichten wir auf dieser, für uns auch örtlich sehr nahen Tagung einen Vortrag ein, der auch angenommen wurde. Thema in diesem Jahr war "Von Big Data zu Smart Data", wobei insbesondere die Extraktion von Semantik aus Texten im Mittelpunkt stand. Dies wurde auch u.a. durch die sehr interessante Keynote von Prof. Uszkoreit deutlich, die das Thema weniger aus der Domäne des Semantic Web sondern aus der Computer Linguistik betrachtete. Aber auch die Tutorials am zweiten Tag (http://aksw.org/Events/2013/LeipzigerSemanticWebTag/Tutorien.html), die von Michael besucht wurden, gaben vertiefte Einblicke in die Thematik. Neben uns zeigten auch Firmen wie Empolis, Unister, Ontos oder Wolters Kluwer (Veranstaltungsplan), wie man Informationen extrahiert, verwaltet, bereinigt und an den (End-)Nutzer weiter gibt.

Hinsichtlich unserem Topic/S-Projektes stellten wir die Probleme und Ziele vor, die wir adressieren, und gaben einen konzeptionellen Überblick unseres Workflows. Detailliert gingen wir dabei auf die Konzepte zur Spracherkennung, Kategorisierung und Named Entity Recognition und Disambiguierung ein, die in ihrer Gesamtheit die Informationsextraktion aus den Artikeltexten ermöglichen. Der zweite Schwerpunkt war die Vorstellung des Clusterings, welches uns die Themen basierend aus den identifizierten semantischen Elementen liefert. Letztlich gaben wir noch einen kurzen Einblick in die Demo-Anwendung, die mit ersten Widgets Themen samt Metainformationen für den Redakteur aufbereiten.

Ähnlich wie die Vorträge bei der WIMS und bei der I-Semantics war auch dieser ein Erfolg, da wir einerseits unsere industrienahe Forschung einem breiten Publikum aus Forschung und Wirtschaft präsentieren konnten und andererseits auch Fragen und Feedback erhielten, die im restlichen Projektverlauf oder Folgeprojekten einbezogen werden können. Bei Diskussionen in den Kaffeepausen kristallisierte sich vor allem die Themen „Halbwertszeit“, Aktualität und ständige Anpassung der semantischen Daten heraus, die für alle Anwesenden wichtig sind, wenn es um die Produktiveinsatz der geschaffenen Linked-Data-Anwendungen geht.

Die Folien zum Vortrag sind unter http://www.slideshare.net/MartinVoigt/topics-lswt verfügbar.