point of origin - logo
13.12.2018: https://www.pointoforigin.at//google_speech_api.htm

Google Speech API

Google Speech API

Die Zukunft der Spracherkennung

Mithilfe der benutzerfreundlichen Google Cloud Speech API können Entwickler gesprochene Wörter in digitalen Text umwandeln. Dabei kommen leistungsstarke neuronale Netzmodelle zum Einsatz. Die API erkennt über 110 Sprachen und Varianten, sodass Ihre Nutzer auf der ganzen Welt davon profitieren können. Die Programmierschnittstelle ermöglicht es, Sprache zu transkribieren, die innerhalb einer Anwendung über das Mikrofon aufgenommen wurde, die Sprachsteuerung zu aktivieren oder Audiodateien zu transkribieren, um nur einige Anwendungsfälle zu nennen. In dem Moment, wo der in der Anfrage hochgeladene Audioinhalt erkannt wird, kann er über Google Cloud Storage in Ihren Audiospeicher integriert werden. Dabei nutzen Sie dieselbe Technologie wie Google bei seinen eigenen Produkten.

  • Durch maschinelles Lernen unterstützt
    Wenden Sie die fortgeschrittensten Algorithmen des neuronalen Deep-Learning-Netzes zur Spracherkennung auf die gesprochenen Wörter Ihrer Nutzer an. Die Treffsicherheit der Ergebnisse ist beeindruckend. Die Speech API wird im Laufe der Zeit immer besser. Dies liegt daran, dass Google die interne Spracherkennungstechnologie, die von Google-Produkten verwendet wird, kontinuierlich optimiert
  • Über 110 Sprachen
    Die Speech API erkennt über 110 Sprachen und Varianten, um Ihre globale Nutzerbasis zu unterstützen. Sie können außerdem unangemessene Inhalte in Textergebnissen ausfiltern.
  • Textergebnisse in Echtzeit zurückgeben
    Die Speech API kann Textergebnisse streamen. Sie brauchen keine fortgeschrittene Signalverarbeitung. Der erkannte Text erscheint dann sofort während des Sprechens. Es besteht auch die Möglichkeit, dass die Speech API erkannten Text aus Audioinhalten zurückgibt, die in einer Datei gespeichert sind.
  • Treffsicher auch in lauten Umgebungen
    Sie brauchen keine zusätzliche Anwendung oder Geräuschunterdrückung einzusetzen, bevor Sie gesprochene Wörter an die Speech API senden. Der Dienst ist in der Lage, Audio mit Störgeräuschen aus unterschiedlichsten Umgebungen zu verarbeiten.
  • Kontextbasierte Erkennung
    Die Spracherkennung kann auf den Kontext zugeschnitten werden, indem mit jedem API-Aufruf eine separate Liste mit Worthinweisen bereitgestellt wird. Dies ist insbesondere bei der Steuerung von Geräten oder Apps hilfreich.
  • Funktioniert mit Apps auf allen Geräten
    Die Speech API unterstützt jedes Gerät, das eine REST- oder gRPC-Anfrage senden kann, darunter Smartphones, PCs, Tablets und IdD-Geräte wie Autos, Fernseher oder Lautsprecher.
  • Automatische Spracherkennung
    Die automatische Spracherkennung wird vom neuronalen Deep-Learning-Netzwerk unterstützt. Hiervon profitieren Anwendungen wie die Sprachsuche oder die Transkription.
  • Globales Vokabular
    Erkennt über 110 Sprachen und Varianten mit einem umfassenden Vokabular.
  • Streamingerkennung
    Gibt erkannte Ergebnisse zurück, noch während der Nutzer spricht.
  • Worthinweise
    Die Spracherkennung kann auf einen bestimmten Kontext zugeschnitten werden, indem Wörter und Formulierungen bereitgestellt werden, die wahrscheinlich gesprochen werden. Dies ist besonders nützlich für das Hinzufügen von benutzerdefinierten Wörtern und Namen zum Vokabular und für die Sprachsteuerung.
  • Unterstützung von Echtzeitinhalten und aufgezeichneten Audioinhalten
    Die Audioeingabe kann vom Mikrofon in einer Anwendung erfasst oder von einer zuvor aufgezeichneten Audiodatei gesendet werden. Es werden mehrere Audiocodierungen unterstützt, darunter FLAC, AMR, PCMU und Linear-16.
  • Unterdrückung von Nebengeräuschen
    Verarbeitet Audioinhalte mit Nebengeräuschen aus verschiedensten Umgebungen, ohne dass eine zusätzliche Geräuschunterdrückung notwendig ist.
  • Unangemessene Inhalte ausfiltern
    Bei einigen Sprachen können unangemessene Inhalte in Textergebnissen herausgefiltert werden.
  • Integrierte API
    Audiodateien können in der Anfrage hochgeladen oder in Google Cloud Storage integriert werden.

Google Speech API

Die Zukunft der Spracherkennung

Marketing Consulting & Consumer Intelligence GmbH
Kontakt

HEAD OFFICE WIEN

Himmelpfortgasse 19
1010 Wien
T +43 1 548 48 00 - 0
F +43 1 548 48 00 - 9

LAB WIEN

Goldschlagstraße 172
Stiege 6, 3. Stock
1140 Wien
T +43 699 14228240

OFFICE ZÜRICH

Rietstrasse 50
8702 Zollikon
T +41 43 499 61 44

OFFICE SAN FRANCISCO

44 Tehama St
San Francisco
CA 94105, USA
T +14157679278

Newsletter

Abonnieren Sie jetzt hier unseren Blog-Newsletter.

Um Ihnen den bestmöglichen Service bieten zu können, verwendet diese Website Cookies und Services (z.B. Google Maps) von Drittanbietern. Mit der Benutzung dieser Website erklären Sie sich damit einverstanden. Mehr Informationen

OK