Skip to main content

Die semantische Suche ist der feuchte Traum jedes Web-Investors, vieler Startup-Gründer und absolut jedes Propheten des Internet-Zeitalters. Der Traum, dass eine Suchmaschine erahnt, was der Suchende mit seiner Anfrage mein, die Maschine also den Sinn hinter den Worten erkennt, lässt viele nicht ruhen. „Semantische Suche“ ist bei der Suche nach Geld derzeit eines der heißesten Buzzwords, doch taugt es bei den meisten Gründern, die damit hausieren gehen eben doch nur zum Bullshit Bingo.

Umso ernster muss man es vielleicht nehmen, wenn kein junger Stanford-Absolvent ankündigt, eine solche Suchmaschine zu starten – sondern ein renommierter, erfahrender Mathematiker namens Stephen Wolfram. In der schönen bunten Zeit der New Economy, gab es viele Medienrummeligkeiten. Eine der unterhaltsamsten war der um ein rätselhaftes Verkehrsmittel, von dem große Namen wie Amazon-Gründer Jeff Bezos oder Bill Gates schwärmten. Entworfen hatte es Dean Kamen, ein Erfinder mit substanziellem Lebenslauf. Name des Projektes: Segway.

Der Roller mit zwei Rädern kam tatsächlich auf den Markt – doch revolutioniert hat er wenig. Er scheiterte am hohen Preis, seiner völligen Andersartigkeit und rechtlichen Vorgeben wie jener deutschen, dass ein Zweirad einen Sattel haben muss. Erst jetzt, Jahre später, sieht man Segways häufiger, meist als Mittel für Stadtrundfahrten (und sollten Sie, liebe Leser, eine Stadt besuchen, in der es Segway-Touren gibt – machen Sie es, es ist großer Spaß).

Seit dieser Zeit bin ich skeptisch, wenn jemand der Öffentlichkeit vorgestellt wird mit dem Versprechen, sein Projekt werde alles verändern. Und deshalb plagt mich auch eine Grundskepsis im Fall von Wolfram Alpha.

Seit dem Wochenende vibriert die US-Web-Szene ob eines Artikels von Nova Spivack, dem Chef des Startups Radar Networks. Er hat sich das neueste Projekt von Stephen Wolfram angeschaut, einem britischen Mathematiker, dessen Software Mathematica zum Standard für Wirtschaftsmathematiker gehört.

Was Spivack beschreibt ist die größte Gefahr für Google, die es bisher gab: Wolfram Alpha soll in der Lage sein, ganz normale, menschliche Fragen zu beantworten. Doch wirft die Maschine nicht Dokumente aus – wie Google das tut -, sondern konkrete Antworten. Die Frage „Wie hoch ist der Mount Everest“ würde also „8.848 Meter“ ergeben.

Schon im Mai soll der Dienst online sein, schreibt Wolfram in seinem Firmenblog. Wenn all das so funktioniert, wie es beschrieben wird, dann ist es ein Erdbeben in der Technologie, eine Sensation, Googles größte Gefahr, vielleicht das nächste Google.

Eine Grundskepsis aber bleibt: In den vergangenen zwei Jahren wurden reichlich neue Suchmaschinen hochgejubelt. Erinnert sich noch jemand an Cuil? Auch heute ist der Dienst nicht in der Lage, brauchbare Ergebnisse zu liefern.

Skepsis ist also angebracht. Eines aber unterscheidet Wolfram dann doch von der Konkurrenz. Seine Herangehensweise:
„Well, some people have thought the way forward must be to somehow automatically understand the natural language that exists on the web. Perhaps getting the web semantically tagged to make that easier.

But armed with Mathematica and NKS I realized there’s another way: explicitly implement methods and models, as algorithms, and explicitly curate all data so that it is immediately computable.“

Bis es so weit ist mit seinem Alpha (Web-Witz: Geht Wolfram Alpha in ein closed beta?), empfehle ich den Blick auf ein pseudo-semantisches Startup, das seine Wurzeln in Kassel hat.

Anfang vergangenen Jahres traf ich bei einer Reise nach San Francisco zum ersten Mal die Macher von Qitera. Sie ermöglichen eine Weiterentwicklung von Link-Verwaltungen wie Delicious. Und das geht so:
– Als Browser-Zusatz wird ein Qitera-Knopf installiert, bei dessen Betätigung die aktuelle Seite gespeichert wird.
– Diese Seite ist auf Qitera als Link erhalten und außerdem in der Version, die man gesehen hat. Verändert sich also eine Seite, kann man die alte und die neue sehen.
– Die gespeicherten Seiten sind Volltext durchsuchbar – und zwar über Google. Wer Qitera installiert hat, bekommt als erste Suchtreffer jene Seiten, die er bei Qitera gespeichert hat:

– Diese gespeicherten Seiten können nun zu Themen gruppiert und in einem Netzwerk weitergegeben werden. So kann ein Team sich beispielsweise eine Wissensdatenbank aufbauen. Genau darauf setzt Qitera auch in Sachen Umsatz: Man bietet Firmen an, die Voraussetzungen zu schaffen, damit die Mitarbeiter hier gemeinsam eine Art Web-Bibliothek schaffen.

Ich teste den Dienst seit kurzem. Erstes Fazit: Sehr cool!


Kommentare


kaltmamsell 9. März 2009 um 13:00

Interessant: Die Firma Autonomy versprach vor neun, zehn Jahren Ähnliches, ebenfalls auf mathematischer Basis. Eben habe ich nachgeschaut und festgestellt, dass die ihre Technik inzwischen dafür anbieten, Firmendaten zu organisieren.

Antworten

DonDahlmann 9. März 2009 um 13:01

Suchmaschinen leben nicht nur vom Algorhythmus, sondern auch vom Suchindex. Wenn der zu klein ist, dann scheitern neue Suchmaschinen, weil die User eben doch bei Google bleiben.
Außerdem – die Suchseite sollte schon wissen was ich will, wenn ich sie aufrufen 😉

Antworten

Jan 9. März 2009 um 14:40

Ein spannendes Projekt zum Thema Semantic Web mit wissenschaftlichem Hintergrund ist übrigens Qimaya, falls das nicht schon bekannt ist: http://qimaya.wordpress.com/

Antworten

Peer 9. März 2009 um 16:57

kleiner Exkurs: Ja, diese Segways.

mir als Innenstadt-Fahrradfahrer kommt es oft so vor wie bei \“Zombies im Kaufhaus\“, wenn Fußgänger einfach über die Strassen torkeln. Vielleicht hat mein Helm ja auch eine integrierte Tarnkappe – ich weiß es nicht. Zuhause der Spiegel funktioniert jedoch – hab\’s schon probiert.

Aber heute wird es wieder passieren: ich fahre die Strasse entlang, am Bordstein steht ein Mensch, der schaut auf Auto, bleibt stehen, sieht mich, schaut mich an und geht los!

In der Hamburger Innenstadt sind jetzt die Beschäftigten des Business Development Districts mit diesen Zweirädern unterwegs. ich muss leider sagen:fürchterlich. Die rollen da rum – hin und her zwischen den Autos hindurch.

Zurück zum Thema: Etwas Google-konkurrenz wäre ganz erfrischend – auch für Google 🙂

Antworten

Andreas Gehret 9. März 2009 um 22:20

Ich bin recht zuversichtlich, dass das gut funktonieren kann solange hinreichend gebildete Leute ihre Fragen an die Anwendung stellen. Das Problem: Was der Mainstream-Benutzer in ein Suchfeld so als \“natürliche Sprache\“ eingibt spottet manchmal jeder Beschreibung und ist meiner Erfahrung nach kaum mit linguistischen oder semantischen Verfahren analysierbar. Ich nehme daher an, dass Wolfram Alpha in der Early Adopter Phase recht erfolgreich sein wird. Später nicht mehr.

Antworten

Igor Schwarzmann 10. März 2009 um 9:05

Spivack ist ja tatsächlich eine Experte in seinem Feld. Microsoft freut sich auch sicherlich, dass er nun fuer sie arbeitet. Wenn aber solche Experten anfangenzu behaupten, dass sie wuessten was die groesste Gefahr fuer Google ist bzw. was das naechste Google sein wird, dann machen sie sich laecherlich, weil niemand den ungeahnten Erfolg von Google vorhersehen konnte und koennen wird. Neben einem unglaublich guten Produkt steckt da auch einfach \“Glueck\“ mit drin. ,)

Uebrigens wollen auch etablierte Mathematiker reich werden, insofern sehe ich da keinen Unterschied zu jedem anderen Gruender bis auf die Tatsache, dass Wolfram anscheinend eitler ist (Wolfram Alpha als Name fuer eine Suchmaschine, wirklich?) und eine bessere Finanzierung im Stealth Mode erhalten hat.

Antworten

Siegfried Hirsch 10. März 2009 um 10:09

Wolfram Alpha scheint ja wirklich ein interessanter Ansatz zu sein, Fragen zu verstehen. Dass die Antworten dann nur für intelligente Menschen ala Wolfram und Nova zu verstehen sind, find ich dann wiederum erst mal bezeichnend. Spivacks Physics of Ideas hatte mich ziemlich fasziniert, hab aber nicht weiter verfolgt, ob was draus geworden ist.

Das Spannenende an dem Wolfram Ansatz scheint die Tatsache, dass es wohl kein semantisches Web braucht. Zwar ist das semantische Web eine wunderbare Idee, aber wer, frage ich mich, soll denn die vorhandenen Informationen in die für das semantische Web notwendige Struktur aufbereiten?

Aber vielleicht lässt sich das ja mit Hilfe der Wolram\’schen Lösung aufbauen. Denn die Antworten auf die Fragen wären ja wohl der Lösungsansatz für die Strukturierung in eine semantisches Web. Oder?

Antworten

Tim 10. März 2009 um 11:48

Wolfram liebt die großen Töne. Seine \“new kind of science\“ war damals ja auch nur der Aufwasch einer uralten Idee.

Antworten

Armin 10. März 2009 um 14:02

Das Mount Everest Beispiel ist aber nicht gerade das beste. Wenn ich bei Google (UK) \“how high is mount everest?\“ eingebe, dann wird mir gleich als erstes folgendes ausgegeben (in einem anderen Format als die anderen Suchergebnisse):

Mount Everest — Elevation: 8,848 metres (29,029 FT) Ranked 1st According to http://en.wikipedia.org/wiki/Mount_Everest – More sources »

Aber irgendwas scheint Google da auch schon in der Hinterhand zu haben, denn das gleiche funktioniert auch bei der Frage \“how many people live in England?\“ Da wird gleich als erstes angezeigt:

United Kingdom — Population: 60,943,912 (July 2008 est.)
According to https://www.cia.gov/library/publications/the-world-factbook/print/uk.html – More sources »

Das ist allerdings noch verbesserungsbeduerftig, da es die falsche Antwort ist. England hat nur ~50mio, die Antwort von Google bezieht sich auf das ganze UK.

Antworten

Roy 10. März 2009 um 14:19

@Herr Hirsch, ich kann Ihnen nur Recht geben. Die Erschaffung der Struktur ist das Problem. Warum sonst dümpelt das Semantic Web seit Jahren vor sich hin, trotz W3C.

Antworten

Michael 10. März 2009 um 17:09

autonomy liefert seit rd. 10 jahren suchergebnisse, die unabhängig von der sprache, umgangssprachliche abfragen erlauben. die sind mittlerweile weltmarktführer im kommerziellen \“knowledge management\“. der spass geht so bei 250K€ los. wenn es interessiert der klickt da mal rein:

http://www.autonomy.com/

da gibt es den kompletten werkzeugkasten..nach oben keine grenzen.

Antworten

David Wagner 10. März 2009 um 20:24

Mal bei Google Folgendes eingeben: wieviele einwohner hat deutschland?

Antworten

Jörg Friedrich 10. März 2009 um 21:03

Stephen Wolfram hat vor 25 Jahren einen großen Teil der mathematischen Naturwissenschaften revolutioniert, es war ein Hype, der noch heute nichts von seiner Kraft verloren hat. Ich selbst war,muss ich zugeben, ein Teil dieses Hypes. Ich glaube, dass Wolfram das Zeug zur nächsten Revolution hat.

Antworten

Jörg Friedrich 10. März 2009 um 21:04

Oh, der Link ist weg, obwohl er in der Vorschau so gut funktioniert hatte. Zweiter Versuch: http://www.xn--jrg-friedrich-imb.de/2009/03/10/stephen-wolfram-und-ich/

Antworten

Roy 11. März 2009 um 11:15

Einen Hinweis wie es bei Wolfram Alpha unter der Haube aussieht findet man bei den Blogpiloten http://www.blogpiloten.de/2009/03/11/wolfram-alpha-matrix-reloaded/

Antworten

uezi 12. März 2009 um 16:05

Suchmaschinen die auf Fragen direkt antworten gibts ja eigentlich schon. (z.B. trueknowledge) Jetzt bleibt abzuwarten wie Wolfram Alpha genau funktioniert bzw. ob die Antworten auf die gestellten Fragen wirklich passen. Ein Google Killer? Sicher nicht so schnell wie es von manchen schon wieder vorher gesagt wird. Wenn man dem Team allerdings nach dem Launch etwas Zeit gibt und nicht gleich wieder bei den kleinsten Probleme von einer Enttäuschung spricht, kann ich mir schon vorstellen, dass es zumindest ein Konkurrent für Google wird.

Antworten

Amidelis 22. März 2009 um 16:28

Spannende Einwände und interessante Gedanken zu WALPHA. Die Maschine muss sicher zeigen, was sie zu leisten imstande ist. Da ich aber auch leicht zu begeistern bin, hinterlasse ich mal das Statement: WALPHA wird das Web 3.0.
Wenn ich mich täusche gebe ich in 5 Jahren einen Kasten Bier aus.

Antworten

Hartz 29. April 2009 um 15:48

Wenn die Suchmaschine wirklich einen Erfolg haben wird, wird Google das Projekt einfach aufkaufen. Und das wars dann mit der Konkurrenz!

Antworten

Du hast eine Frage oder eine Meinung zum Artikel? Teile sie mit uns!

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

*
*