Googles Forschungschef Peter Norvig sprach mit Technology Review über die Zukunft der Suchtechnologie und die Möglichkeit eine Maschine per Sprache zu steuern.
- Google arbeitet daran Informationen aus Standbildern, Videos und Audioquellen zu gewinnen.
- Dass Erkennen von gesprochenem Text und die automatische Übersetzung in andere Sprachen sind dafür extrem wichtig.
- Die Möglichkeit bei GOOG-411 per Sprachsteuerung zu suchen kann in der Zukunft vielleicht auf PCs übertragen werden die man ohne Tastatur bedient.
- Google schätzt die eigenen Spracherkennungstechnologien als marktführend ein.
Spracherkennung
Die Sache mit der Spracherkennung macht mit ein wenig Sorgen. Über Google-Talk, die eigene Breitbandlizenz und, wenn es denn wirklich kommen sollte, das Google Phone könnten diverse Gespräche aufgezeichnet und die Inhalte nicht nur analysiert sondern auch eindeutig einem Nutzer zugeordnet werden.
Behavioral Targeting
Sollten diese Informationen für Behavioral Targeting genutzt werden würden sich ungeahnte Möglichkeiten ergeben. Egal ob man ein Taxi bestellt, eine Pizza ordert oder sich mit Freunden verabredet: Jeder Anruf gibt wertvolle persönliche Details preis welche eine noch zielgerichtetere Werbung ermöglichen.
Werbeunterbrechungen bei Telefonieren
Wie wäre es mit automatischer Werbeunterbrechung? Ich rufe beim Liefersercive meines Vertrauens an und mitten in der Bestellung wird das Gespräch pausiert und Googles Computer Stimme sagt mit, dass sie 1) genau weiß, dass ich zu der Salamipizza noch zwei Baguettes mit Schinken und drei Dosen Cola nehmen werde und sie 2) einen Lieferdienst kennt bei dem ich das ganze zwei Euro billiger bekommen kann.
Dann könnte Google das gPhone wirklich umsonst anbieten.
Alle Informationen indizieren
Bis Google in der Lage ist alle weltweit verfügbaren Informationen zu indizieren wird zwar noch viel Zeit verstreichen aber die Spracherkennung für Audio- und Videofiles ist ein wichtiger Schritt in diese Richtung.
Die Frage ist nur ob Google auch in der Lage sein wird die gewonnenen Informationen zu verarbeiten. Bei audio-visueller Kommunikation werden viele Informationen über Stimmlage, Gestik und Mimik vermittelt und das sind Dinge die Google auch mit Spracherkennung nicht auswerten kann.
Dieser Artikel wurde am 06.08. 2007 von nXplorer geschrieben.