Mein Beitrag aus der Fachzeitschrift IWP (Information, Wissenschaft & Praxis),
Veröffentlichungsdatum März 2004
Semantische Netze als Mittel gegen die Informationsflut
„Thesaurus linguae latinae“ – so heißt einer der frühesten Wort-Sammlungen. Seit Alters her beschäftigen sich Menschen mit der qualifizierten Aufbereitung von Information. Noch älter ist sogar das Konzept der Ontologie (wörtlich: die „Lehre vom Sein“), die sich als Disziplin der Philosophie bereits seit Aristoteles (384-322 v.Chr.) mit einer objektivistischen Beschreibung der Wirklichkeit beschäftigt. Ontologien – als Disziplin des modernen Wissensmanagements – sind eine Methode, in möglichst kompakter Form, d.h. unter Verwendung von Konzepten in verschiedenen Meta-Ebenen die reale Welt zu beschreiben.
Thesaurus und Ontologie stellen zwei Konzepte dar, die auch heute noch in der Wissenschaft – und in jüngster Zeit mit zunehmender Bedeutung auch in der Wirtschaft – im Bereich des Informations- und Wissensmanagements zum Einsatz kommen. Beide spannen gewissermaßen den konzeptionellen Bogen auf, zwischen denen sich ein pragmatisches Wissensmanagement heutzutage ausrichtet und sich in Form sog. semantischer Netze – auch Wissensnetze genannt – wiederfindet.
Thesauri: Informationsselektion
Das Konzept eines Thesaurus hat in seiner Geschichte verschiedene Bedeutungen erlangt. Ursprünglich als Wortschatz einer Sprache verstanden, entwickelten sich Thesauri seit Mitte des 19. Jh. zu Synonymwortbüchern. Gemäß DIN 1463 versteht man unter einem Thesaurus:
„[…] eine geordnete Zusammenstellung von Begriffen und deren Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient“.
Ein Thesaurus dient also dem Indexieren zum späteren Selektieren von Information auf der Grundlage eines verbindlichen – domänenspezifischen – Vokabulars. Syntaktisch besteht ein Thesaurus aus Begriffen, die verschiedene Bezeichner tragen und Beziehungen zwischen diesen Begriffen. Unterschiedliche Bezeichner sind dabei beispielsweise Synonyme, Begriffsnummer oder andere Notationen, die auf den gleichen Begriff (im Sinne eines Konzeptes) verweisen. DIN 1463 sieht in Thesauri auch spezielle Arten von Beziehungen vor, nämlich Äquivalenzrelation, Hierarchische Relation und Assoziationsrelation. Die Bedeutung einer Äquivalenzrelation oder auch die möglichen Arten von Assoziationen sind dabei allerdings nicht prägnant beschreibbar.
Ein Thesaurus eignet sich sehr gut für die Indexierung von Information (im Sinne eines Wörterbuches) sowie für die Erschließung weiterer Informationen auf Basis der vom Thesaurus angezeigten verwandten Begriffe. Im Zeitalter der Digitalisierung sind die Anforderungen an das Informationsmanagement aber deutlich gestiegen. So leiden viele Wissensarbeiter nicht unter einem Mangel an Informationen, sondern an Methoden der effizienten Filterung derjenigen solcher Informationen, die aus der elektronischen, multi-medialen Informationsflut für den eigenen Wissens- und Handlungsbedarf entscheidend sind. Vor dem Hintergrund der überragenden wirtschaftlichen Bedeutung der Ressource Wissen für die Schaffung wertschöpfender Produkte und Dienstleistungen spielt heutzutage daher zunehmend neben dem reinen Managament von Informationen das Wissensmanagement eine bedeutende Rolle.
Vom Thesaurus zum Semantischen Netz
Thesauri unterstützen über die Indexierung von Dokumenten die wichtigen Prozesse der Wissensidentifizierung sowie des Wissenserwerbs. Zu den Kernprozessen, die ein modernes Wissensmanagement ausmachen, zählen nach Probst et al. [1] aber auch die Wissensteilung, sowie die Bewahrung und operative Nutzung von Wissen. Mit anderen Worten: für das Wissensmanagement ist es nicht ausreichend, Informationen zu selektieren, sondern es ist notwendig, möglichst effizient entscheidungsrelevante Informationen zu identifizieren, sie im individuellen Anforderungskontext zu vestehen, um sie schlussendlich in eigenes Wissen zu überführen und auf dessen Grundlage zu handeln. Um Anwender dabei zu unterstützen, ist eine Strukturierung über einfache „verwandt mit“-Beziehungen nicht ausreichend, sondern es geht darum, wirkliche Bedeutungszusammenhänge aufzuzeigen.
Rein syntaktisch weisen semantische Netze zunächst große Ähnlichkeiten mit Thesauri auf. In Erweiterung der obigen Definition eines Thesaurus lässt sich dies wie folgt beschreiben:
Ein semantisches Netz ist eine geordnete Zusammenstellung von Begriffen und deren Bezeichnungen, deren Zusammenhang über beliebige Beziehungen miteinander definiert wird. Sowohl Begriffe als auch Beziehungen sind typisierbar und es existiert eine Grammatik für deren Verwendung.
Somit stellen Thesauri einen Spezialfall eines semantischen Netzes dar. Letztere bieten deutlich erweiterte Strukturierungsmerkmale und erschließen somit auch neue Einsatzbereiche (s.u.).
Insgesamt weisen semantische Netze drei wesentliche Erweiterungen gegenüber einem Thesaurus auf:
- Explizite Abbildung von Kontexten
- Beschreibbarkeit von Informationsmustern (Meta-Strukturierung)
- Sprachliche Ausdrucksstärke durch Verwendung prädikativer Beziehungen
Dies soll im folgendem anhand eines Beispiels aus der Versicherungswirtschaft erläutert werden. Dabei beginnen wir mit einer sehr vertrauten Strukturierungsmethode, die sich in allen Formen semantischer Netze – und somit insbesondere auch in Thesauri – wiederfindet, nämlich einer hierarchischen Begriffsstruktur, auch Taxonomie genannt.
Taxonomien als Bestandteil von semantischen Netzen
Abb. 1 zeigt einen Ausschnitt aus einer Taxonomie von Versicherungssparten.
Allgemein werden beim Erstellen einer Taxonomie Begriffe nach bestimmten Ordnungskriterien miteinander verglichen und in der Rolle des Allgemeineren und des Spezielleren zueinander in Beziehung gesetzt. Die angewandten Ordnungskriterien dienen dazu, konzeptionelle Gemeinsamkeiten in Form von Überbegriffen und Unterschiede in Form von Unterbegriffen herauszuarbeiten. Das Aufstellen der Kriterien und ihrer Wertigkeit zueinander ist nicht einheitlich oder gar selbstverständlich. So mag die dargestellte Struktur vielleicht aus Sicht der Produktentwicklung korrekt sein und auch die innere Struktur der von der Versicherung vertriebenen Produkte widerspiegeln. Gleichzeitig können die genannten Begriffe jedoch auch Geschäftsfelder darstellen, die als solche ganz anders geordnet wären. Hier spielen dann nämlich andere Ordnungskriterien eine Rolle, wie beispielsweise die historische Entwicklung und die Konzernstruktur des Unternehmens oder auch regionale Unterschiede einzelner Firmenstandorte.
Die Erstellung einer sinnvollen und auch für verschiedene Benutzer tragfähigen Taxonomie (oder analog einer Verzeichnisstruktur zur Ordnung elektronischer Dokumente) ist eine sehr schwierige Aufgabe. Die Erfahrung zeigt, dass selbst bei äußerster Sorgfalt keine eindeutige und für verschiedene Zielgruppen gültige Struktur gefunden werden kann. Die Ursache ist klar: Die Komplexität des in einer Organisation vorhandenen Wissens kann nur abgebildet werden, wenn die unterschiedlichen Sichtweisen, die verschiedene Zielgruppen in der Organisation haben, explizit berücksichtigt werden. Hierarchische Strukturen sind dabei häufig sinnvoll und für definierte Ausschnitte auch korrekt. In einer ganzheitlichen Sicht bedarf es daneben jedoch zusätzlich kontext-orientierter assoziativer Verknüpfungen, die verschiedene Substrukturen in einen sinnvollen Zusammenhang stellen.
Kontext-orientierte Sichten schaffen
Genau hier haben Semantische Netze ihre konzeptionelle Stärke, erlauben sie doch unter Verwendung geeigneter Tools eine einfache Beschreibung dieser Zusammenhänge. Abb. 2 zeigt einen weiteren Ausschnitt aus dem gleichen semantischen Netz wie Abb. 1. Das Konzept der Versicherungssparte wird hier in graphischer Notation übersichtlich in einen Zusammenhang mit anderen Konzepten gestellt. Die fachliche Sicht „Experte – entwickelt – Produkt, (für) Versicherungssparte“ wird hier in Zusammenhang damit gebracht, dass gewisse Versicherungssparten innerhalb einzelner strategischer Projekte von besonderer Bedeutung sind. Wenn dies auch aus der isolierten Sicht des Experten zunächst keine besondere Relevanz haben mag, so ist es doch für die Gesamtorganisation von entscheidender Bedeutung. Und letztlich muss auch der Experte in seiner Arbeit strategische Vorgaben kennen und in seinen Konzepten berücksichtigen.
Semantische Netze ermöglichen also verschiedene Sichten in einem gemeinsamen Modell zu konsolidieren und damit Synergien unterschiedlicher Zielgruppen innerhalb der Organisation zu fördern.
Rein syntaktisch enthalten semantische Netze dabei gegenüber Thesauri erweiterte Strukturmerkmale zur expliziten Beschreibung von Kontexten. Der Topic Map – Standard[1] kennt hierfür das Rollenkonzept (ein Begriff kann pro Assoziation eine unterschiedliche Rolle spielen) und den sog. scope (engl. für „Bereich“/„Kontext“) mit dem unterschiedliche Bezeichner eines Begriffes explizit unterschiedlichen Kontexten zugeordnet werden können.
Für das Wissensmanagement spielt es dabei eine ganz besondere Rolle, dass damit auch der organisatorische Kontext von Wissen transparent gemacht werden kann. Das obige Beispiel illustriert dies. So ist gleichzeitig in dem semantischen Netz auch die Information verfügbar, welchem Unternehmen ein Experte angehört oder an welchen Projekten er teilnimmt. Wertvoll sind Informationen erst dann, wenn sie Menschen in die Lage versetzen, konkrete Entscheidungen und nachfolgende Handlungen zu unterstützen. Innerhalb einer Organisation erfolgt dies jedoch fast immer unter Berücksichtigung und Nutzung der von ihr vorgegebenen Rahmenbedingungen. Dafür bedarf es dann jedoch auch einer Kenntnis dieser Strukturen, die ebenfalls über das semantische Netz – in Verbindung mit den jeweiligen Inhalten – gegeben wird.
Bereichsübergreifende Wiederverwendbarkeit dank Meta-Modellierung
Abb. 2 verdeutlicht noch einen weiteren Vorteil semantischer Netze. Sie erlauben die Formulierung von beliebigen Zusammenhängen auf einem beliebigen Abstraktionsniveau. Die in der Abbildung beschriebenen Zusammenhänge gelten allgemein für verschiedene Organisationen, mit anderen Worten: sie gelten auf einer Meta-Ebene. Die in diesem semantischen Netz gemachten Aussagen (von denen das Diagramm nur einen Ausschnitt beinhaltet) sind also frei auf andere Organisationen übertragbar, wo sie als Vorlage zur Formulierung konkreter Zusammenhänge dienen (gemäß Abb. 2 bspw. welche strategischen Projekte von welchem Unternehmen unter Einbindung welcher Experten und in bezug auf welches Geschäftsfeld betrieben werden). Sie stellen somit einen wiederverwendbaren Wert dar. Im Sinne einer Informationsarchitektur lassen sich derartige Vorlagen in horizontalen Bibliotheken organisieren und projektübergreifend einsetzen. Thesauri dagegen sind nur im Sinne vertikaler (fachlicher) Bibliotheken einsetzbar. In semantischen Netzen ist beides modular miteinander kombinierbar.
Sprachliche Ausdrucksstärke
Kennzeichnend für Semantische Netze ist zudem ihre Ausdrucksstärke. Da sie sich an der Grammatik der menschlichen Sprache anstatt an technischen Programmiersprachen orientieren, sind sie für Menschen ebenso leicht lesbar wie formulierbar. Über die Verwendung von Prädikaten lassen sich Aussagen prägnant formulieren. Da die Prädikate zudem typisiert sind, lassen sich über semantische Netze damit auch Vorgänge und Zuständigkeiten bis hin zu kausalen Wirkungszusammenhängen abbilden. Semantische Netze bieten damit eine hervorragende Möglichkeit, Informationen verdichtet und wiederverwendbar zu organisieren. Und diese dabei so zu ordnen, dass sie Menschen unmittelbar in ihren Entscheidungsprozessen operativ unterstützen, indem sie den Handlungskontext des Anwenders explizit beschreiben. So eignet sich eine semantische Modellierung – wiederum bezogen auf die Versicherungswirtschaft – hervorragend zur maschinellen Unterstützung wiederkehrender, wissensintensiver Tätigkeiten wie der Schadensregulierung. Das hierfür notwendige Wissen findet sich oftmals versteckt in umfangreichen AGBs oder Handbüchern. Eine korrekte Bearbeitung der Fälle erfordert daher einen sehr umfangreichen Kenntnisstand. Anders im Fall eines semantischen Netzes, wo die Schadensbearbeitung direkt entlang einer im Netz abgebildeten assoziativen Kette voneinander abhängiger Informationen erfolgt, die für die korrekte Bearbeitung des Sachverhaltes notwendig sind. Das Netz weist situativ den Weg zu weiteren Vorgängen oder benötigten Formularen bzw. Zusatzinformation.
Indexierung und Klassifikation mit semantischen Netzen
Die besprochenen Erweiterungen eines semantischen Netzes gegenüber einem Thesaurus ändern jedoch nichts daran, dass es im Kern ebenso für die Indexierung und Klassifikation von Informationsressourcen eingesetzt werden kann. Dafür ist es in vielen Fällen sinnvoll, Thesauri – wo vorhanden – in semantische Netze zu importieren und dort mit den genannten Erweiterungen zu versehen.
Die Verbindung zwischen dem Netz und den Informationsressourcen sollte dabei wechselseitig sein. Heißt: So sinnvoll eine Indexierung eines Dokumentenbestandes über ein kontrolliertes Begriffssystem auch ist, so wichtig ist auch eine Anpassung der Begriffsstruktur an die dynamische inhaltliche Entwicklung der Informationen selbst. Das semantische Netz sollte also nicht nur einen einmaligen statischen Blick auf Informationen bieten, sondern deren gesamten Lebenszyklus zu managen helfen. Dafür ist eine Kombination mit Methoden des TextMining ein gangbarer Weg, wie er beispielsweise in der L4-Plattform gewählt wird (vgl. [2]).
Abgrenzung semantische Netze/Ontologien
Der Vollständigkeit halber bedarf es in diesem Zusammenhang auch des Hinweises auf das verallgemeinerte Konzept einer Ontologie, von denen im Bereich des Wissensmanagements inzwischen häufiger die Rede ist. Dabei ist es sinnvoll, zwischen unterschiedlichen Arten von Ontologien zu unterscheiden. Betrachtet man allein den Aspekt der Wissensrepräsentation, so bieten semantische Netze allgemein und somit auch Topic Maps eine pragmatische Möglichkeit der Ontologiebeschreibung („light ontologies“). Notwendige Voraussetzung ist hierfür, dass die zugrundeliegende Sprache neben einem Begriffskonzept auch semantische, typisierte Beziehungen kennt und die Formulierung von Wissen in verschiedenen Abstraktionsgraden (Meta-Ebenen) möglich macht. Ein erweiterter Ontologiebegriff schließt zudem die Definition von Regeln (Axiomen) innerhalb der Ontologiesprache ein („heavy ontologies“). Ziel dieser Axiomatik ist die selbständige Erweiterung der Ontologie um konkrete Sachverhalte durch logisches Schlussfolgern. Die „Ontology Web Language“ (OWL), die vom W3C standardisiert wird, fällt in diese Klasse der Semantic Web Sprachen.
Letztere sind dem Bereich der Künstlichen Intelligenz zuzuordnen und als solche sicher mehr eine Disziplin der Informatik denn der Informationswissenschaft. Aufbau und Pflege derartiger Ontologiesysteme stellen weitreichende Anforderungen an den Modellierer und erfordern Kenntnisse in Prädikatenlogik. Damit die Regelsysteme einwandfrei arbeiten, bedarf es schließlich einer hohen logischen Konsistenz, insbesondere einer Widerspruchsfreiheit. Dies erfordert die Ordnung in eindeutige, klassenorientierte Beschreibungen[2]. Dies ist wohlgemerkt mit der Realität nur selten in Einklang zu bringen. Weist doch die menschliche Sprache beliebige (kontext-bezogene!) Bedeutungsnuancen auf, die ja gerade wieder eine computer-gestützte Informationserschließung so schwierig gestalten.
Somit stellt insbesondere die Berücksichtigung von Kontext ein herausragendes Strukturmerkmal von semantischen Netzen dar, das eine Fülle neuer Anwendungen erschließt.
Einsatz von semantischen Netzen
Einige der wesentlichen Einsatzgebiete von semantischen Netzen sollen abschließend kurz vorgestellt werden.
Dokumentenmanagement
Das Dokumentenmanagement ist derzeit sicherlich das Kerneinsatzgebiet, zumal es sich nahtlos an den Einsatz von Thesauri in diesem Bereich anschließt. Wie in Abb. 3 dargestellt, können einzelne Begriffe dabei zu beliebig vielen Dokumenten verknüpft werden. Umgekehrt weist ein Dokument typischerweise auch Verknüpfungen zu mehreren Begriffen gleichzeitig auf. Aus Sicht der Dokumente stellt das Netz Meta-Daten über deren Inhalt zur Verfügung. Wie in einem Index verweist ein Begriff im Netz also auf mehrere zugehörige Ressourcen. Nützlicherweise sind die Meta-Daten selbst jedoch vernetzt und zeigen dem Anwender bereits während der Navigation an, dass neben dem aktuellen Begriff weitere Begriffe zu anderen Themengebieten führen. Über die Vernetzung liefert das semantische Netz somit nicht nur Informationen über den Inhalt eines Dokumentes sondern auch über den Kontext zwischen einzelnen Dokumenten. Semantische Netze bieten weitreichende Möglichkeiten, den Kontext von begrifflichen Verknüpfungen explizit zu beschreiben. Damit können dann Begrifflichkeiten, die in unterschiedlichen Geschäftsbereichen oder Anwendungsgebieten verschiedene Bedeutung haben, bereichsübergreifend verbindlich definiert werden.
Vergleichbar ist der Einsatz im Bereich von Bibliothekssystemen. Hier ist die Verwendung eines semantischen Netzes sogar umso nützlicher, weil in derartigen Systemen zum Teil eben keine elektronischen Dokumente gespeichert werden, die über Suchmaschinen gefunden werden können. Somit profitiert eine reine Buchbestandsverwaltung oder auch ein Medien-Archiv-System umso mehr von den Vorteilen einer kontext-basierten assoziativen Organisation von Meta-Daten auf Basis eines semantischen Netzes.
Entscheidungsunterstützung
Darüber hinaus erschließen semantische Netze aber neue Möglichkeiten eines operativen Wissensmanagements, die über die reine Disposition von Information hinausgehen. Die Eigenschaft semantischer Netze Informationen zielgruppen-orientiert prägnant darzustellen, prädestiniert sie für den Einsatz als Mittel zur Entscheidungsunterstützung (Decision Support). Das oben beschriebene Vorgehen, auf der Meta-Ebene assoziative Zusammenhänge zu entwickeln, hilft übergeordnete Muster selbst in komplexen Strukturen herauszuarbeiten und Entscheidern effizienten Zugriff auf relevante Informationen zu gewähren.
Beschwerdemanagement
Die wirtschaftliche Notwendigkeit zu mehr Serviceorientierung zwingt mehr und mehr Unternehmen ein systematisches Beschwerdemanagement einzuführen. Datenbank-gestützte Systeme ohne semantische Intelligenz scheitern an der Anforderung, komplexe Inhalte zielgruppenorientiert zu filtern. Auch hier helfen semantische Netze wiederkehrende Anfragen effizient abzuarbeiten und diese systematisch und für den Support-Mitarbeiter nachvollziehbar zu archivieren.
Merger & Acquisition, dynamische Strukturierungsprozesse
Die Dynamik wirtschaftlicher Veränderungen, die sich im wieder zunehmenden Trend zu Merger & Acquisition, Verlagerungs- und Restrukturierungsprozessen niederschlägt, verlangt zusätzlich nach neuen Methoden den Lebenszyklus von Informationszusammenhängen zu managen. Semantische Modellierungstechniken sind prädestiniert dafür, komplexe Projekte strukturiert zu begleiten. Organisationsweite Wissensnetze helfen, die Sichten fusionierter Organisationen zu harmonisieren und zu vereinheitlichen und die in der Organisation versteckten Wissenspotenziale freizulegen.
Weitere Anwendungen in diesem Umfeld findet man im Bereich der Marktforschung, beispielsweise für eine teil-automatisierte Wettbewerbsbeobachtung.
Zukunftstrend „Knowledge Engineering“
Der beschriebene Trend vom klassischen Konzept des Thesaurus hin zu flexibel einsetzbaren semantischen Modellen ist Ausdruck der aktuellen Debatte um die Wissensgesellschaft. Sie hat zur Folge, dass auch zunehmend operative Computer-Anwendungen eine wissensbasierte Grundlage haben. Reines Software-Engineering im Sinne des Aufbaus datenbank-gestützter Anwendungen wird diesen Anforderungen nicht mehr gerecht. Stattdessen bedarf es eines grundlegenden Knowledge-Engineering, bei dem das hinter den operativen Anwendungen stehende Wissen (in Form elektronischer Information sowie impliziten Erfahrungs- und Organisationswissens) im Mittelpunkt steht.
Dies hat nicht zuletzt eine grundsätzliche wirtschafts- und gesellschaftspolitische Bedeutung: Ein systematisches Knowledge Engineering erfordert ein neues Berufsbild, das interdisziplinäre Qualifikationen aus den Bereichen der Sprachwissenschaft, Ingenieurswissenschaft bis hin zur Philosophie einer Renaissance zuführt. Dies eröffnet neue Chancen für die Wirtschaft und im speziellen Maße für den leider oftmals unterschätzten Beruf des Informationsspezialisten.
[1] ISO-Norm 13250 bzw. der XML-Standard „XML Topic Maps“ (XTM)
[2] Das heißt in der Praxis, dass gewisse Aussagen in einer derartigen Sprache nur dann formuliert werden können, wenn zuvor ein logisches Gerüst auf einer abstrakten Ebene definiert wurde, von denen konkrete Konzepte dann instanziiert werden. Dies entspricht jedoch nicht dem menschlichen Vorgehen bei der Wissensverarbeitung und ist in vielen Fällen nicht sinnvoll.
Quellen
[1] G. Probst, S. Raub, K. Romhardt, „Ressource Wissen – Wissensmanagement für die Unternehmenspraxis“, Frankfurter Allgemeine/Gabler, Frankfurt (Main)/Wiesbaden 1997.
[2] Dr. Heiko Beier, „Intelligente Informationsstrukturierung und TextMining mit Semantischen Netzen“, Beitrag zur 25. DGI-Online Tagung, Frankfurt (Main), 2003.