Topic/S beim Leipziger Semantic Web Tag

„Der Leipziger Semantic Web Tag (LSWT) bietet seit 2009 Unternehmen und Organisationen die Möglichkeit, sich zu Themen im Bereich semantischer Technologien auszutauschen.“ [Einladung] Genau aus diesem Grund reichten wir auf dieser, für uns auch örtlich sehr nahen Tagung einen Vortrag ein, der auch angenommen wurde. Thema in diesem Jahr war "Von Big Data zu Smart Data", wobei insbesondere die Extraktion von Semantik aus Texten im Mittelpunkt stand. Dies wurde auch u.a. durch die sehr interessante Keynote von Prof. Uszkoreit deutlich, die das Thema weniger aus der Domäne des Semantic Web sondern aus der Computer Linguistik betrachtete. Aber auch die Tutorials am zweiten Tag (http://aksw.org/Events/2013/LeipzigerSemanticWebTag/Tutorien.html), die von Michael besucht wurden, gaben vertiefte Einblicke in die Thematik. Neben uns zeigten auch Firmen wie Empolis, Unister, Ontos oder Wolters Kluwer (Veranstaltungsplan), wie man Informationen extrahiert, verwaltet, bereinigt und an den (End-)Nutzer weiter gibt.

Hinsichtlich unserem Topic/S-Projektes stellten wir die Probleme und Ziele vor, die wir adressieren, und gaben einen konzeptionellen Überblick unseres Workflows. Detailliert gingen wir dabei auf die Konzepte zur Spracherkennung, Kategorisierung und Named Entity Recognition und Disambiguierung ein, die in ihrer Gesamtheit die Informationsextraktion aus den Artikeltexten ermöglichen. Der zweite Schwerpunkt war die Vorstellung des Clusterings, welches uns die Themen basierend aus den identifizierten semantischen Elementen liefert. Letztlich gaben wir noch einen kurzen Einblick in die Demo-Anwendung, die mit ersten Widgets Themen samt Metainformationen für den Redakteur aufbereiten.

Ähnlich wie die Vorträge bei der WIMS und bei der I-Semantics war auch dieser ein Erfolg, da wir einerseits unsere industrienahe Forschung einem breiten Publikum aus Forschung und Wirtschaft präsentieren konnten und andererseits auch Fragen und Feedback erhielten, die im restlichen Projektverlauf oder Folgeprojekten einbezogen werden können. Bei Diskussionen in den Kaffeepausen kristallisierte sich vor allem die Themen „Halbwertszeit“, Aktualität und ständige Anpassung der semantischen Daten heraus, die für alle Anwesenden wichtig sind, wenn es um die Produktiveinsatz der geschaffenen Linked-Data-Anwendungen geht.

Die Folien zum Vortrag sind unter http://www.slideshare.net/MartinVoigt/topics-lswt verfügbar.

Topic/S auf der I-Semantik

Die I-Semantics ist eine Konferenz zu semantischen Technologien. Sie findet parallel zur I-Know statt, deren Schwerpunkt auf Wissensmanagement liegt. Beide Themenbereiche können sich so ergänzen. Es gab interessante Keynotes unter anderem von Ed Chi (Google) der die Bedeutung von Sprache für das Veröffentlichen und Verarbeiten von Online-Medien herausgestellt hat.

Unser praxisorientierter Vortragstrack war mit Präsentationen von PoolParty (Management von Thesauri, Semantische Suche) und der ESA (Verwaltung und Austausch von Projekterfahrungen) thematische gemischt, hatte aber das Verwalten und Erschließen von Dokumentensammlungen als gemeinsame Grundlage. Die Resonanzen auf unseren Vortrag waren positiv und haben gezeigt, dass auch in anderen Branchen Interesse besteht, Dokumentensammlungen semantischen zu erschließen und deren Inhalt automatisch zu analysieren. Dieser Eindruck wurde durch Gespräche mit anwesenden Firmen z. B. CID bestätigt. Diese sind mit ihrem Produkt „Topic Analyst“, das ähnlich zum Topic/S-Projekt ist, bereits bei Firmen aus der Automobil oder Finanzbranche erfolgreich aktiv.

Bemerkenswert ist, dass einige ostdeutsche Hochschulen auf der I-Semantics erfolgreich vertreten waren. Unser Forschungspartner die TU Dresden gewann mit ihrem Projekt OntoSketch den „Best-Demo“ Award.

Der englischsprachige Abstract zum Topic/S Vortrag:
http://i-semantics.tugraz.at/ipraxis/program-overview/michael-aleythe