Semantisches Web und semantische Suche
Mit der Frage, inwieweit Google Semantik kann, hat Alex sich bereits in seinem Artikel zu Googles Menschlichkeit befasst. Das Thema Semantik möchte ich heute noch einmal aufgreifen und speziell auf das semantische Web und die semantische Suche eingehen.
Mensch gegen Maschine
Es ist ein Paradoxon der Informatik, dass Menschen sich schwer tun mit Aufgaben, die Computer leicht lösen, während Computer manche Aufgaben nicht lösen können, mit denen kleine Kinder keinerlei Probleme haben. Einerseits gibt es Schachprogramme, die die weltbesten menschlichen Schachspieler besiegen können. Andererseits stellt die Wort- oder Bilderkennung den Computer noch vor Probleme.
Google kann bisher wenig Semantik
Google findet Webseiten, die Wörter oder Satzteile aus der Suchanfrage im Text, in den Metadaten oder in Anchortexts haben. Was Google aber nicht kann, ist, den Sinn hinter indexierten Texten zu erfassen. Enthält eine Website beispielsweise den Begriff „Deutschland importiert Autos aus Frankreich“, dann „versteht“ Google im Umkehrschluss nicht, dass Frankreich Autos nach Deutschland exportiert.
Die semantische Suchmaschine hingegen versteht diesen Umkehrschluss. Die semantische Suche ist ein Teil des semantischen Web. Bevor hier näher auf die semantische Suche eingegangen wird, soll geklärt werden, was das semantische Web ist.
Das semantische Web
Das semantische Web ist eine Erweiterung des World Wide Web. Während im WWW Daten miteinander vernetzt sind, verknüpft das semantische Web Informationen auf der Ebene ihrer Bedeutung miteinander.
Im WWW kann der Computer nicht erkennen, ob es sich bei dem Text „Hamburg“ um einen Nachnamen, den Namen einer Stadt oder den Namen eines Unternehmens handelt. Doch im semantischen Web sind diese Daten in einer Form aufbereitet, die es Computern ermöglicht, die Daten auszulesen und entsprechend ihrer inhaltlichen Bedeutung zu verarbeiten (z.B. könnten die Texte „Hamburg“ und „Deutschland“ durch die Beziehung „ist eine Stadt in“ verknüpft sein).
Durch die Semantik sind Aktualität und Konsistenz der Informationen sichergestellt. Will man alle deutschen Städte auflisten, so müsste man das im WWW per Hand tun. Das semantische Web hingegen erlaubt es, algorithmisch all jene Texte aufzulisten, die mit der Beziehung „ist eine Stadt in“ mit „Deutschland“ verknüpft sind.

Rich Snippet: Blaubeerkuchen
Ein Schritt auf dem Weg hin zum semantischen Web sind Googles Rich Snippets. Hier werden dem Computer strukturiert Informationen geliefert, die helfen, diese zueinander in Beziehung zu setzen und zu verarbeiten. Bei den Kochrezepten sind beispielsweise Informationen wie Zutaten, Zubereitungszeit und Kalorien hinterlegt, die es Google erlauben, verschiedene Rezepte zueinander in Beziehung zu setzen (wie dies durch das Filtern der Rezepte bei google.com ja schon möglich ist).
Die semantische Suche
Bei semantischen Suchmaschinen wird die Suchanfrage häufig nicht in Schlagworten, sondern direkt als Frage formuliert. Die Suchmaschine versucht dann, die Semantik einer Frage zu erfassen. Die Antwort besteht dabei (im Idealfall) aus einzelnen Aussagen statt aus ganzen Dokumenten, wie dies bei Google üblich ist.
Eine semantische Suchmaschine ist beispielsweise die „Antwortmaschine“ wolframalpha.com, die vom britischen Mathematiker Stephen Wolfram entwickelt wurde (bisher nur englischsprachig).
Vergleicht man die Suchergebnisse zu „Marie Curie“ bei wolframalpha und Google, bietet wolframalpha auf den ersten Blick die besseren Informationen als Google.
Direkt in den SERPs von Google lassen sich zwar Geburtsdatum und -ort, Todesdatum und -ort, ihr Bild sowie die Tatsache, dass sie Physikerin war, erkennen. Dass ihr jedoch zwei Nobelpreise verliehen wurden, wird erst durch einen Klick auf eines der Suchergebnisse deutlich. Interessant ist auch, dass Marie Curie bei wolframalpha als Chemikerin, bei Google jedoch als Physikerin bezeichnet wird (tatsächlich hat sie sich mit beiden Wissenschaften befasst und in jeder wurde ihr je einmal der Nobelpreis verliehen).
Bei komplizierteren Anfragen tut sich jedoch auch die semantische Suchmaschine wolframalpha schwer. Zu der Anfrage „when did john lennon die“ gibt die Suchmaschine als Antwort das Todesdatum (8. Dezember 1980). Fragt man allerdings „how did john lennon die“, bekommt man genau dieselben Informationen ausgeliefert. Dabei sollte eine semantische Suchmaschine in der Lage sein, den Unterschied zwischen einer Frage nach dem Datum (wann) und der Frage nach der Todesart (wie) zu erkennen. Die korrekte Antwort müsste lauten, dass John Lennon ermordet wurde.

Es zeigt sich also, dass semantische Suchmaschinen bisher auch noch nicht das können, was sie versprechen.
Fazit
Die semantische Suche und das semantische Web werden immer weiter ausgebaut. Auch Google arbeitet daran – die Rich Snippets sind ein Hinweis darauf. Fortschritte sind bei Google bereits erkennbar, so wird die Suchmaschine beispielsweise bei der Erkennung von Synonymen immer besser.
Der Weg zur semantischen Suche ist für Google noch lang und steinig. Wenn es allerdings gelingen sollte, überzeugende semantische Suchergebnisse zu präsentieren, wäre die Vormachtstellung für die nächsten Jahre gefestigt.
semantisches Web
wolframalpha und wurde
am Mittwoch, den 06. April 2011 geschrieben. Wir freuen uns auf Deine Meinung, nutz hierfür einfach die Kommentarfunktion.








Am schönsten war hierzu das Beispiel auf der SEMSO letztes Jahr. Dort wurde gesucht nach “Evangelische Gemeine” + Stadt deren Namen ich nicht mehr weiß.
Google hat Gemeine mit Kirchengemeinde gleichgesetzt und dafür rankte die katholische Kirche auf Platz 1.
[...] Semantisches Web und semantische Suche var szu=encodeURIComponent(location.href); var [...]
Ich habe letzte Woche über die Smartlogic Semantik Technologie geschrieben :
http://www.tipblog.de/enterprise-search-spezialist-smartlogic-mit-seiner-semantischen-plattform-jetzt-in-deutschland-aktiv/
Das Video dazu ist sehr aufschlussreich. Man sieht die Taxonomie auch in Google eingebaut.
[...] Semantisches Web und semantische Suche [...]
Sehr interessanter Artikel, gut geschrieben!
Da besteht für die Zukunft definitiv noch Nachbesserungsbedarf, aber wie schon geschrieben wurde: Ganz dumm sind die Suchmaschinen auch nicht (mehr). Ist auf jedenfall ein spannendes Thema!