Intelligente Informationszugänge – Teil1

Geschrieben von am 19. Mai 2009 | Abgelegt unter Allgemein, Semantik, Technologie

Zurzeit überschlagen sich die Nachrichten über neue Suchansätze. Alle sind auf der Suche nach dem heiligen Gral – der Informatik.

Wenn jeder im Sinne Web 2.0 weiter so fleißig mitmacht, wird die Menge des eingestellten Contents zur Herausforderung. Wir benötigen neue Systeme die uns bei der Bewertung und Bedeutung von Informationen aktiv unterstützen. Soziale Empfehlungen helfen nur bedingt, da diese unter umständen den Horizont zu stark einengen.

Ich definiere den heiligen Gral mal so: Daniel Tammet einen Synästhetiker (Savant)

Daniel ist ein Mensch mit außergewöhnlichen Fähigkeiten. Er kann Sprachen innerhalb einer Woche lernen, die Zahl PI bis auf 22514 Stellen aufsagen und kann in Sekunden sagen, dass der 10. Januar 2017 ein Dienstag sein wird. Das Besondere – wie er lernt:

Am Anfang lese ich vor allem Kinderbücher. Die sind einfach, haben Bilder und machen Spaß. Sie bringen mich zum Lachen. Danach lese ich Magazine, Zeitungen und Bücher für Erwachsene. Wichtig ist, dass mich die Texte interessieren. Sie dürfen nicht langweilig sein. Dann suche ich mir jemanden, der die Sprache spricht. Mit dem rede ich dann einfach den ganzen Tag.

Vor allem hilft mir, dass Regionen in meinem Gehirn auf ungewöhnliche Art miteinander verschaltet sind. Die meisten Menschen denken in isolierten Kategorien. Bei mir jedoch ist alles vernetzt. Wenn ich über Worte nachdenke, nutze ich Informationen aus allen Teilen meines Gehirns. Gefühle, Farben und Formen verbinden sich mit den Worten. Synästhesie lautet der Fachbegriff für diese Fähigkeit. Sie hilft mir, sehr schnell zu lernen.

Da ist zum Beispiel das Wort “Gras”. Mir gefällt daran, dass der erste Buchstabe genau zum Gegenstand passt. Wörter mit “G” sind für mich nämlich grün. Oder Apfel: Dieses Wort wirkt auf mich rot. Das ist sehr hilfreich, weil Äpfel auch häufig rot sind. Solche Zusammenhänge helfen mir, mich gut zu erinnern. In fremden Sprachen bin ich immerfort auf der Suche nach interessanten Phrasen, Mustern und Zusammenhängen. Ich starte mit einem Wort, zum Beispiel “Hand”, und bin dann gleich bei “Handy” und “Handel”. Oder ich suche nach Verbindungen zwischen verschiedenen Sprachen.

Letztendlich macht er sich Muster, die in allen Sprachen gleich sind zu nutze, zum Beispiel der i-Klang für kleine Dinge: “Tiny” und “little” im Englischen, “petite” im Französischen, im Deutschen “klein”. Zudem sind Wörter, die gebräuchlicher sind, häufig kürzer. “Socke” zum Beispiel ist ein kurzes Wort. Wir ziehen sie täglich an. Sandalen dagegen benutzen wir seltener. Und siehe da: das Wort hat drei Silben. Ähnlich ist es bei Tieren. Der Hund hat nur eine Silbe. Er ist ja auch ausgesprochen häufig. Das Wort “Elefant” dagegen ist länger. Zumindest in dieser Weltregion ist er auch seltener als der Hund.

Auszüge in Deutsch

Hätten wir also eine Maschine die diese Muster kennt und so lernen/denken würde wie Daniel, wären alle Probleme gelöst.

Aktuell denken nur sehr wenige Firmen in diese Richtung. Ein Unternehmen versucht das menschliche Gehirn zu emulieren, besser sie bauen seine assoziative Struktur 1:1  nach. Es wird automatisch nach Relevanz und Redundanz von Information unterscheiden können. Hierdurch kann von einer Sekunde auf die andere eine komplett neue Ontologie emuliert werden. Zurzeit läuft der zweite closed Beta Tests, mal schauen – viel viel Glück!

Andere versuchen es mit ausgeklügelten Statistiken, starren Ontologien, statistischen, linguistischen, morphologischen  Textanalysen oder Anreicherung von Daten über Daten (Mirco contents, semantic Web, Web 3.0…). Martin Waiss hat zu den verschiedenen Ansätzen und Problemstellungen eine wunderbare Artikelserie (zur Zeit offline!!!) verfasst, weshalb ich hier nicht im einzelnen noch mal darauf eingehen möchte.

Wolfram Alpha
Ein anderer Kandidat ist das gerade am Wochenende gestartete Wolfram Alpha. Es ist in vielerlei Hinsicht beeindruckend, vorausgesetzt man nutzt es für die dafür vorgesehenen Aufgaben. Gina Trapani führt ein paar beeindruckende Beispiele an die zeigen das Wolfram Alpha für das Finden bestimmter Fakten und Zusammenhänge gut geeignet ist. Ich glaube es ist noch zu früh etwas über das Potential für die “Allgemeinheit” zu sagen, ist es doch aus meiner Sicht stark auf Wissenschaftler, Chemiker, Linguisten… ausgerichtet.

Eine weitere Herausforderung von Wolfram Alpha sehe ich in der notwendigen Vorauswahl der Datenquellen und Aufbereitung dieser durch das Wolfram Alpha Team. Wissen ist immer im Fluß und dies handverlesen zu selektieren wird extrem schwierig und zeitaufwendig sein. Google und Wikipedia sind dagegen offen und in ständiger Bewegung und verfolgen das Wissensverständnis des Web – Inhalte kommen theoretisch von Jedem und werden durch das Kollektiv (Diskussion..) veredelt. Hier stößt Wolfram Alpha wahrscheinlich an seine Grenzen – was aber auch nicht weiter schlimm ist, da anderer Fokus.

Google

Die Antwort von Google auf das Wolfram Alpha Projekt ließ nicht lange auf sich warten. Google stellte auf der diesjährigen „Searchology“ die neuen Search Options, Rich Snippets und Google Squared vor – genialer Schritt in Richtung relevanter Wissenshappen, anstelle Wissensuniversum. Cool auch die neuen Funktionen bei Google Suggest und den neuen Web Elements.

Bei den Search Options (auch Wonder Wheel genannt) handelt es sich um eine Art „guided seach“, sprich google „entzieht“ den gefunden Daten ihre wesentlich Attribute wie z.B. Erstellungsdatum, Dokumenttyp, ThemenCloud.. und stellt diese als Filter zur Verfügung. So kann ich mir beispielsweise zu einem Produkt die aktuellsten Beiträge anschauen ohne jeden einzelnen Treffer nach Aktualität zu prüfen. Endeca einer der Väter dieser BI-Technologie wird darüber wohl nicht sonderbar erfreut sein. Bin mal gespannt ob da noch ein Rechtsstreit entbrennt…

Mit den Snippets wertet Google Suchergebnissen auf. Bei der Suche nach einem Produkt könnten beispielsweise die durchschnittliche Bewertung von Nutzern, die Zahl der Bewertungen oder Preisinformationen in einem Snippet auftauchen. Snippets extrahieren dazu nützliche Informationen aus den Header einer Seite.  Dies bedeutet viel Arbeit für alle Werbetreibende und Suchmaschinenoptimierer – ran an RDF und Mircroformate. Eigentlich Irrsinn, denn wir schreiben Daten über Daten um sie zu verstehen – Daten führen ihren Kontext doch schon mit…

Mit Google Squared gibt Google zudem eine Vorschau auf eine neue Art von Suchmaschine. Statt Webseiten zu finden, sammelt Google Squared automatisiert Fakten aus dem Internet, was von der Grundidee stark an Wolfram Alpha erinnert. Die Ausgabe erfolgt in einer Tabelle, welche ich dann nach Belieben sortieren und filtern kann. Eine schöne Funktion stellt die Möglichkeit da Tabellen um Spalten mit vorgeschlagenen oder eigenen Kriterien anzureichern. Cool – so kann ich mir einen Produktvergleich auf Basis meiner Kriterien in wenigen Sekunden zusammenklicken.

Das neueste von Google Suggest (dynamische Vorschläge während der Eingabe des Suchbegriffs) finden Sie hier.

Bei den Web Elements handelt es sich um eine Sammlung von Widgets, mit denen man Google-Services wie Suche, Kalender und Maps mit geringem Aufwand in die eigene Webseite oder Blog einbauen kann. Konversation mit seinen Besucher sind so nicht länger auf Kommentare beschränkt, sondern können Video und Audio Elemente beinhalten. Das Besondere: Konversation können auf Wunsch via “Google Friend Connect” global geteilt werden. Des weiteren lassen sich jetzt Dokumente aus Google Docs einbinden – cool, direkt mal ausprobieren…

Weitere Spieler

Zu erwähnen wäre noch eyeplore der nach implizitem Handlungswissen sucht. Interessant ist hier die Visualisierung des Wissens via einen Radar. Das Radar ist, abhängig des eingegebenen Begriffs,  kategorisiert z.B. nach Personen, Arbeit, Technologie, Kultur… Per Drag und Drop kann der Ausgangsbegriff mit gefunden Begriffen der Kategorien kombiniert werden, um die Suche so zu verfeinern. Klickt man auf einen Begriff, werden weiterführende Infos dazu eingeblendet.

Ups, ist das lang geworden, ich wollte doch noch was zu kontextrelevante Suchen im Bereich mobile Endgeräte, Finden statt Suchen, augmented reality… sagen – Ok – Fortsetzung folgt :-)

Trackback URI | Kommentare als RSS

Einen Kommentar schreiben