Intelligente Informationszugänge - Teil1
Geschrieben von Dieter Josten am 19. Mai 2009 | Abgelegt unter Allgemein, Semantik, Technologie
Zurzeit überschlagen sich die Nachrichten über neue Suchansätze. Alle sind auf der Suche nach dem heiligen Gral – der Informatik.
Wenn jeder im Sinne Web 2.0 weiter so fleißig mitmacht, wird die Menge des eingestellten Contents zur Herausforderung. Wir benötigen neue Systeme die uns bei der Bewertung und Bedeutung von Informationen aktiv unterstützen. Soziale Empfehlungen helfen nur bedingt, da diese unter umständen den Horizont zu stark einengen.
Ich definiere den heiligen Gral mal so: Daniel Tammet einen Synästhetiker (Savant)
Daniel ist ein Mensch mit außergewöhnlichen Fähigkeiten. Er kann Sprachen innerhalb einer Woche lernen, die Zahl PI bis auf 22514 Stellen aufsagen und kann in Sekunden sagen, dass der 10. Januar 2017 ein Dienstag sein wird. Das Besondere - wie er lernt:
Am Anfang lese ich vor allem Kinderbücher. Die sind einfach, haben Bilder und machen Spaß. Sie bringen mich zum Lachen. Danach lese ich Magazine, Zeitungen und Bücher für Erwachsene. Wichtig ist, dass mich die Texte interessieren. Sie dürfen nicht langweilig sein. Dann suche ich mir jemanden, der die Sprache spricht. Mit dem rede ich dann einfach den ganzen Tag.
Vor allem hilft mir, dass Regionen in meinem Gehirn auf ungewöhnliche Art miteinander verschaltet sind. Die meisten Menschen denken in isolierten Kategorien. Bei mir jedoch ist alles vernetzt. Wenn ich über Worte nachdenke, nutze ich Informationen aus allen Teilen meines Gehirns. Gefühle, Farben und Formen verbinden sich mit den Worten. Synästhesie lautet der Fachbegriff für diese Fähigkeit. Sie hilft mir, sehr schnell zu lernen.
Da ist zum Beispiel das Wort “Gras”. Mir gefällt daran, dass der erste Buchstabe genau zum Gegenstand passt. Wörter mit “G” sind für mich nämlich grün. Oder Apfel: Dieses Wort wirkt auf mich rot. Das ist sehr hilfreich, weil Äpfel auch häufig rot sind. Solche Zusammenhänge helfen mir, mich gut zu erinnern. In fremden Sprachen bin ich immerfort auf der Suche nach interessanten Phrasen, Mustern und Zusammenhängen. Ich starte mit einem Wort, zum Beispiel “Hand”, und bin dann gleich bei “Handy” und “Handel”. Oder ich suche nach Verbindungen zwischen verschiedenen Sprachen.
Letztendlich macht er sich Muster, die in allen Sprachen gleich sind zu nutze, zum Beispiel der i-Klang für kleine Dinge: “Tiny” und “little” im Englischen, “petite” im Französischen, im Deutschen “klein”. Zudem sind Wörter, die gebräuchlicher sind, häufig kürzer. “Socke” zum Beispiel ist ein kurzes Wort. Wir ziehen sie täglich an. Sandalen dagegen benutzen wir seltener. Und siehe da: das Wort hat drei Silben. Ähnlich ist es bei Tieren. Der Hund hat nur eine Silbe. Er ist ja auch ausgesprochen häufig. Das Wort “Elefant” dagegen ist länger. Zumindest in dieser Weltregion ist er auch seltener als der Hund.
Auszüge in Deutsch
Hätten wir also eine Maschine die diese Muster kennt und so lernen/denken würde wie Daniel, wären alle Probleme gelöst.
Aktuell denken nur sehr wenige Firmen in diese Richtung, eine davon die Firma Qimaya. Die Jungs versuchen das menschliche Gehirn zu emulieren, besser sie bauen seine assoziative Struktur 1:1 nach. Es wird automatisch nach Relevanz und Redundanz von Information unterscheiden können. Hierdurch kann von einer Sekunde auf die andere eine komplett neue Ontologie emuliert werden. Zurzeit läuft der zweite closed Beta Tests, mal schauen - viel viel Glück!
Andere versuchen es mit ausgeklügelten Statistiken, starren Ontologien, statistischen, linguistischen, morphologischen Textanalysen oder Anreicherung von Daten über Daten (Mirco contents, semantic Web, Web 3.0…). Martin Waiss hat zu den verschiedenen Ansätzen und Problemstellungen eine wunderbare Artikelserie (zur Zeit offline!!!) verfasst, weshalb ich hier nicht im einzelnen noch mal darauf eingehen möchte.
Wolfram Alpha
Ein anderer Kandidat ist das gerade am Wochenende gestartete Wolfram Alpha. Es ist in vielerlei Hinsicht beeindruckend, vorausgesetzt man nutzt es für die dafür vorgesehenen Aufgaben. Gina Trapani führt ein paar beeindruckende Beispiele an die zeigen das Wolfram Alpha für das Finden bestimmter Fakten und Zusammenhänge gut geeignet ist. Ich glaube es ist noch zu früh etwas über das Potential für die “Allgemeinheit” zu sagen, ist es doch aus meiner Sicht stark auf Wissenschaftler, Chemiker, Linguisten… ausgerichtet.
Im Vergleich zu Qimaya handelt es sich bei Wolfram Alpha um einen knowing-that Ansatz. Qimaya schreibt dazu :
..Wolfram Alpha beruht – soweit man den Berichten entnehmen kann – auf symbolischer künstlicher Intelligent (KI). Die prinzipielle Begrenzung des symbolischen Ansatzes der KI hat H.L. Dreyfus einleuchtend dargestellt. Anschaulich unterscheidet man zwischen knowing-how und knowing-that.
Eine typische knowing-that-Frage ist: “Wie hoch ist der Mount Everest?” Ein derartiges Faktenwissen kann in der Tat durch symbolische KI gut abgebildet werden. Eine knowing-how-Frage hingegegen wäre: “Wie fühlt es sich an, wenn auf 6000 Meter Höhe die Luft dünner wird?” Mit knowing-how ist das Handlungswissen gemeint, das sich nur in der tatsächlich durchgeführten Handlung zeigt. Das kontextabhängige, implizite Wissen kann durch symbolische KI nicht abgebildet werden.
Prinzipiell nicht. Auch für das Semantic Web und für eCommerce-Applikationen reicht der Ansatz nicht aus. Betrachten wir ein Beispiel aus der Praxis: Jemand bestellt das Buch “Feuchtgebiete” bei amazon. Der Käufer wird darüber informiert, dass das Buch “Frühling und so” von Rebecca Martin ebenfalls interessant sein könnte, da andere Kunden beide Bücher zusammen in den Warenkorb legten. Das ist implizites Handlungswissen. Die symbolische KI arbeitet mit starren Regeln. Unser tägliches Leben ist aber eher assoziativ und ein wenig fuzzy…
Eine weitere Herausforderung von Wolfram Alpha sehe ich in der notwendigen Vorauswahl der Datenquellen und Aufbereitung dieser durch das Wolfram Alpha Team. Wissen ist immer im Fluß und dies handverlesen zu selektieren wird extrem schwierig und zeitaufwendig sein. Google und Wikipedia sind dagegen offen und in ständiger Bewegung und verfolgen das Wissensverständnis des Web – Inhalte kommen theoretisch von Jedem und werden durch das Kollektiv (Diskussion..) veredelt. Hier stößt Wolfram Alpha wahrscheinlich an seine Grenzen – was aber auch nicht weiter schlimm ist, da anderer Fokus.
Die Antwort von Google auf das Wolfram Alpha Projekt ließ nicht lange auf sich warten. Google stellte auf der diesjährigen „Searchology“ die neuen Search Options, Rich Snippets und Google Squared vor – genialer Schritt in Richtung relevanter Wissenshappen, anstelle Wissensuniversum. Cool auch die neuen Funktionen bei Google Suggest und den neuen Web Elements.
Bei den Search Options (auch Wonder Wheel genannt) handelt es sich um eine Art „guided seach“, sprich google „entzieht“ den gefunden Daten ihre wesentlich Attribute wie z.B. Erstellungsdatum, Dokumenttyp, ThemenCloud.. und stellt diese als Filter zur Verfügung. So kann ich mir beispielsweise zu einem Produkt die aktuellsten Beiträge anschauen ohne jeden einzelnen Treffer nach Aktualität zu prüfen. Endeca einer der Väter dieser BI-Technologie wird darüber wohl nicht sonderbar erfreut sein. Bin mal gespannt ob da noch ein Rechtsstreit entbrennt…
Mit den Snippets wertet Google Suchergebnissen auf. Bei der Suche nach einem Produkt könnten beispielsweise die durchschnittliche Bewertung von Nutzern, die Zahl der Bewertungen oder Preisinformationen in einem Snippet auftauchen. Snippets extrahieren dazu nützliche Informationen aus den Header einer Seite. Dies bedeutet viel Arbeit für alle Werbetreibende und Suchmaschinenoptimierer – ran an RDF und Mircroformate. Eigentlich Irrsinn, denn wir schreiben Daten über Daten um sie zu verstehen – Daten führen ihren Kontext doch schon mit…
Mit Google Squared gibt Google zudem eine Vorschau auf eine neue Art von Suchmaschine. Statt Webseiten zu finden, sammelt Google Squared automatisiert Fakten aus dem Internet, was von der Grundidee stark an Wolfram Alpha erinnert. Die Ausgabe erfolgt in einer Tabelle, welche ich dann nach Belieben sortieren und filtern kann. Eine schöne Funktion stellt die Möglichkeit da Tabellen um Spalten mit vorgeschlagenen oder eigenen Kriterien anzureichern. Cool – so kann ich mir einen Produktvergleich auf Basis meiner Kriterien in wenigen Sekunden zusammenklicken.
Das neueste von Google Suggest (dynamische Vorschläge während der Eingabe des Suchbegriffs) finden Sie hier.
Bei den Web Elements handelt es sich um eine Sammlung von Widgets, mit denen man Google-Services wie Suche, Kalender und Maps mit geringem Aufwand in die eigene Webseite oder Blog einbauen kann. Konversation mit seinen Besucher sind so nicht länger auf Kommentare beschränkt, sondern können Video und Audio Elemente beinhalten. Das Besondere: Konversation können auf Wunsch via “Google Friend Connect” global geteilt werden. Des weiteren lassen sich jetzt Dokumente aus Google Docs einbinden - cool, direkt mal ausprobieren…
Weitere Spieler
Zu erwähnen wäre noch eyeplore der ähnlich wie Qimaya nach implizitem Handlungswissen sucht. Interessant ist hier die Visualisierung des Wissens via einen Radar. Das Radar ist, abhängig des eingegebenen Begriffs, kategorisiert z.B. nach Personen, Arbeit, Technologie, Kultur… Per Drag und Drop kann der Ausgangsbegriff mit gefunden Begriffen der Kategorien kombiniert werden, um die Suche so zu verfeinern. Klickt man auf einen Begriff, werden weiterführende Infos dazu eingeblendet.
Ups, ist das lang geworden, ich wollte doch noch was zu kontextrelevante Suchen im Bereich mobile Endgeräte, Finden statt Suchen, augmented reality… sagen – Ok - Fortsetzung folgt
Keine Kommentare »