The Future Office Company.
X
  • Keine Produkte in der Liste

Profi-Tipps für besseres Diktieren: So bedienen Sie Spracherkennung optimal

Profi-Tipps für besseres Diktieren

Mit unseren Profi-Tipps für besseres Diktieren erstellen Sie Texte mit einer Spracherkennungssoftware bis zu dreimal schneller als durch Tippen. Wer die Vorteile von Spracherkennung optimal nutzen will, benötigt geeignete Software und die richtige Diktiertechnik – richtige Technik aber nicht nur im Sinne der Hardware, sondern auch der Bedienung. So erreichen Sie eine präzise Erkennung des Gesprochenen, vermeiden unnötige Korrekturen, sparen wertvolle Zeit und steigern Ihre Produktivität.

Das Beste aus der Spracherkennung herausholen

KI-Spracherkennungssoftware, z. B. die Dragon-Spracherkennung von Nuance, revolutioniert die Arbeitsweise von Fachleuten in verschiedensten Branchen. Diese fortschrittliche Technologie ermöglicht es, Texte schnell, präzise und komfortabel per Spracheingabe zu erstellen sowie den PC per Sprache zu steuern – und das, dank der Nutzung künstlicher Intelligenz (KI) mit der Erkennung von Zusammenhängen, mit beeindruckender Geschwindigkeit.

Um das volle Potenzial von der Spracherkennungssoftware optimal zu nutzen und den Aufwand für Nachbearbeitungen zu reduzieren, sind einige bewährte Tipps und Techniken beim Diktieren und der Bedienung unerlässlich. Gute Aufnahmegeräte und die richtige Vorgehensweise können den Unterschied zwischen guten und hervorragenden Ergebnissen ausmachen. Mit etwas Übung und der Befolgung einiger wichtiger Regeln lässt sich die Genauigkeit der Spracherkennung deutlich verbessern.

Hintergrundwissen Spracherkennung: Von der Sprache zum Text

Spracherkennungssoftware wandelt zunächst Audiodaten mithilfe eines akustischen Modells in Phoneme, d. h. eine Lautschrift, um. Im zweiten Schritt schaut die Spracherkennungssoftware, welche Wörter aus dem zugrundeliegenden Lexikon zu den Phonemen passen. Bei mehreren in Betracht kommenden Wörtern wird anhand des Sprachmodells entschieden, welches Wort am wahrscheinlichsten ist. Am Ende werden die Wörter zusammen als Phrase, also als Text, ausgegeben.

Komponenten der Spracherkennung – Der Weg von der Sprache zum Text

Schaubild Komponenten der Spracherkennung
Schaubild: Komponenten der Dragon Spracherkennung – Der Weg von der Sprache zum Text © Thax Software GmbH

Mit diesem Wissen lassen sich Optimierungen an verschiedenen Stellen der Spracherkennung finden. Damit Spracherkennungssoftware mit möglichst wenig Zeit- und Rechenaufwand aus den Audiodaten die Phoneme produziert, sind die folgenden fünf Hinweise zum richtigen Diktieren zu beachten.

Voraussetzungen, damit die Spracherkennungssoftware gut arbeiten kann

  1. Die Audioaufnahme sollte möglichst nur Ihre Stimme beinhalten, d. h. je weniger Hintergrundgeräusche, desto besser.
  2. Die Aufnahmequalität hängt auch von der verwendeten Diktiertechnik bzw. dem Mikrofon ab. Hier lohnt es sich, auf Qualität zu setzen. Einige Headsets oder speziell für die Spracherkennung entwickelte Diktiermikrofone können teilweise Hintergrundgeräusche wegfiltern.
  3. Bei kabellosen Geräten (Bluetooth oder DECT) könnte je nach Modell und Funkstandard durch eine komprimierte drahtlose Datenübertragung die Qualität etwas leiden.
  4. Des Weiteren produzieren hochwertige Mikrofone Audiodaten in einer von der Spracherkennungssoftware geforderten Abtastrate und Bittiefe. Beispielsweise verlangt die Dragon-Spracherkennungssoftware eine Abtastrate (Samplingrate) von mindestens 16 kHz. Beachten Sie auch unseren Beitrag „Diktiergeräte im Test und Vergleich – Welche Diktiertechnik eignet sich für welchen Einsatzzweck?“.
  5. Ergänzend zur Aufnahmequalität zählt auch die Qualität Ihrer Aussprache. Vermeiden Sie es zu nuscheln und Wörter undeutlich auszusprechen, Silben zu verschlucken und starke Dialekte zu verwenden.

Hat die Spracherkennungssoftware aus den Audiodaten die Phoneme gebildet, gilt es nun, die dazu passenden Wörter auszugeben. Beispielsweise ergibt der Laut „Rat“ [ʁaːt] die zwei Wörter „Rad“ und „Rat“. Sollte zu einem Phonem kein passendes Wort im Lexikon der Spracherkennung gefunden werden, wird ein ähnlich lautendes, aber womöglich nicht von Ihnen gemeintes Wort ausgegeben. Somit ist eine wichtige Grundlage der Spracherkennung auch das fachspezifische Lexikon, welches genau die Wörter aus dem Fachbereich beinhaltet, in welchem Sie sich bewegen. Beispielsweise benötigen Ärzte medizinische Begriffe in der Spracherkennung im Gegensatz zu Rechtsanwälten, welche juristische Begriffe diktieren.

Fachvokabulare für die Spracherkennung

Häufig lässt es Spracherkennungssoftware zu, ein entsprechendes Lexikon, auch Vokabular genannt, aufzubauen. Eine alternative und deutlich schnellere Lösung ist, auf ein bereits entwickeltes Fachvokabular zurückzugreifen, indem man entweder eine speziell für eine Branche entwickelte Spracherkennungssoftware erwirbt – zum Beispiel Dragon Legal für Juristen oder Dragon Medical One für Mediziner – oder ein entsprechendes Fachvokabular hinzukauft oder sich von einem Dienstleister auf Grundlage von eigenen Dokumenten entwickeln lässt.

Entscheidend bei einem Fachvokabular ist nicht nur die reine Wortliste, sondern auch das Sprachmodell, welches angibt, in welchem Zusammenhang welche Wörter verwendet werden. Diktieren Sie beispielsweise „Ich fahre Rad“, so wird die Spracherkennung „Rad“ ausgeben, während in dem Satz „Ich gebe Ihnen einen guten Rat“ das Wort „Rat“ verwendet wird. Ein Dienstleister, welcher über die entsprechenden Tools und die Expertise in der Spracherkennung verfügt, kann solche Vokabulare inklusive Sprachmodell erstellen bzw. Ihnen vorgefertigte Fachvokabulare anbieten.

Professionelle Spracherkennungssoftware bietet dem Benutzer außerdem die Möglichkeit für Korrekturen, sodass die Software aus Fehlern lernt. Hierbei ist die korrekte Bedienung der Korrekturfunktion der Spracherkennungssoftware unabdingbar. Einige Lösungen verlangen die Nutzung eines speziellen Korrekturmenüs, bei anderen, wie der Findentity Back-End Spracherkennung, reicht einfaches Überschreiben eines Textes im Word-Dokument.

Nuance Dragon Professional v16 und Nuance Dragon Legal v16 bieten außerdem die Möglichkeit für Optimierungen des akustischen Modells und des Sprachmodells der Spracherkennung auf Grundlage gesammelter Diktatdaten und Korrekturen.

Tipps zum besseren Diktieren in die Spracherkennungssoftware

Auch wenn Spracherkennungssoftware immer besser geworden ist, arbeitet sie i. d. R. schneller bzw. ressourcensparender (mit weniger in Anspruch genommener Rechenleistung) und liefert bessere Ergebnisse, wenn Sie als Diktant während der Aufnahme des Diktats folgende Tipps für die Spracherkennung beachten:

Aufnahmeumgebung bei der Spracherkennung

  • Nehmen Sie Ihr Diktat in einer ruhigen Umgebung auf.
  • Geräusche wie Stimmen anderer Personen, Telefonklingeln, Straßenlärm oder Hall aufgrund der Räumlichkeiten verschlechtern die Spracherkennung.

Position des Aufnahmegeräts

  • Bringen Sie das Mikrofon des Aufnahmegeräts (Diktiermikrofon, Diktiergerät, Headset oder Smartphone) mit gleichbleibendem Abstand möglichst nah an Ihren Mund und sprechen Sie in Richtung des Mikrofons.
  • Ein gleichbleibend dichter Abstand zum Mikrofon ist generell für eine gute Sprachaufnahme vorteilhaft.
  • Vermeiden Sie jedoch mit Ihrem Mund unmittelbar und zu dicht am Mikrofon zu sein, da so starke Pustgeräusche entstehen, welche die Spracherkennung erschweren.

Pause während des Diktats

  • Wenn Sie längere Pausen machen oder Sie sich räuspern müssen, unterbrechen Sie die Aufnahme.
  • Bei Nutzung der Front-End Spracherkennung drücken Sie dazu auf das Mikrofon-Symbol der Dragon-Leiste, drücken die entsprechend konfigurierte Taste (meistens Num+) oder sagen Sie den Befehl: „Geh schlafen“.

Die wichtigsten Aspekte zur Bedienung der Spracherkennung

  • Die Spracherkennung schreibt nur das, was Sie diktieren. D. h. Sie müssen Satzzeichen wie Punkt, Komma, Anführungszeichen und Absätze etc. mitdiktieren. Dazu gibt es bestimmte Diktierbefehle für die Dragon Spracherkennung. Beachten Sie dazu unseren separaten Blog-Beitrag „Die 200 besten Befehle der Dragon Spracherkennung: Tipps zum besseren Diktieren mit Sprachbefehlen“.
  • Vorteilhaft für gute Spracherkennung ist es, wenn Sie deutlich, aber dennoch natürlich sprechen.
  • Da der KI-Algorithmus der Dragon Spracherkennung stark auf Satzzusammenhänge setzt, ist es wichtig, dass Sie komplette – und sinnvolle – Sätze oder Satzteile mit einem Mal flüssig diktieren.
  • Möchten Sie die Funktions- oder Leistungsfähigkeit Ihrer Dragon-Software oder des Mikrofons testen, werden Sie eventuell ein unerwartet schlechtes Ergebnis der Spracherkennung erzielen, wenn Sie beispielsweise „Test, Test, A, B, C, 1, 2, 3“ diktieren. Diktieren Sie stattdessen einen Satz wie „Das ist ein Test Punkt“, bekommen Sie ein repräsentativeres Ergebnis für die Funktionsfähigkeit der Spracherkennungssoftware und Ihres Mikrofons.
  • Vermeiden Sie Füllsilben wie „ähm“, denn auch diese wird die Spracherkennung eventuell versuchen, in Text umzusetzen.

Bedienung bei mobilen Aufnahmegeräten wie Diktiergerät oder Smartphone für die Spracherkennung

  • Wenn Sie zwecks Korrektur zurückspulen und überschreiben/übersprechen möchten: Achten Sie darauf, nach einem zuvor aufgenommenen, abgeschlossenen Wort oder Satz fortzusetzen. Bleibt durch das Überschreiben eine Silbe übrig, wird die Spracherkennung versuchen, diese in Text zu übersetzen, wodurch Sie ein schlechteres Ergebnis erhalten. Schlecht ist auch, wenn durch das Übersprechen das abschließende Satzzeichen des letzten Satzes verloren geht, da Dragon Satzzeichen nicht selber einsetzt, sondern diese mitdiktiert werden müssen.
  • Wenn Sie sich korrigieren müssen, spulen Sie zurück und übersprechen Sie den zu korrigierenden Teil. Lassen Sie dagegen einen Versprecher stehen und diktieren einfach danach das Richtige, wird die Spracherkennung versuchen, beides in Text zu übersetzen, wodurch Sie nicht das gewünschte Ergebnis erhalten.
  • Diktat stoppen: Schieben Sie den Schiebeschalter des Diktiergeräts erst auf STOP bzw. drücken Sie erst auf STOP, wenn Sie zu Ende gesprochen haben. Halb aufgenommene Wörter werden von der Spracherkennung nicht verstanden!
  • Möchten Sie Zusatzinformationen – zum Beispiel für Ihre Assistenzkraft – mitgeben, bieten einige Diktiergeräte, wie GRUNDIG Digta 7, OM SYSTEM / OLYMPUS DS-9000 Serie, PHILIPS DPM 8000 Serie, den Wechsel in eine Infospur (auch Anweisung oder Kommentar genannt) an. In Verbindung mit einer professionellen Diktat-Workflowsoftware wie Findentity Dictate von Thax Software werden diese Infospuren vor Übergabe an die Spracherkennungssoftware erkannt bzw. herausgefiltert, sodass die diesbezüglichen Texte entweder farblich unterlegt im Word-Dokument ausgegeben werden oder dort gar nicht erscheinen.

Besonderheiten bei branchenspezifischen Versionen der Dragon Spracherkennung

Für die Bedienung mittels Sprachbefehlen sowie die Berücksichtigung branchenspezifischer Terminologie durch die Spracherkennung in den Dragon Legal-Editionen und der Dragon Medical-Edition von Nuance lesen Sie unseren Blog-Beitrag „Die 200 besten Befehle der Dragon Spracherkennung: Tipps zum besseren Diktieren mit Sprachbefehlen“.

Wenn Sie beispielsweise „Paragraf eins Absatz zwei“ diktieren, wird Dragon Legal „§ 1 Abs. 2“ ausgeben, während die Dragon Professional Spracherkennung die Wörter „Paragraf“ und „Absatz“ ausschreibt, sofern nicht individuelle Worteigenschaften vom Nutzer konfiguriert worden sind. Jeder Nutzer von Dragon Professional 16 und Dragon Legal 16 kann nämlich, genauso wie man dem Dragon-Vokabular eigene Wörter hinzufügen kann, Eigenschaften bestimmter Wörter definieren, d. h. in welcher Form sie als Text ausgegeben werden sollen und ob vorangehende oder nachfolgende Zahlen als Wort oder in Ziffern ausgegeben werden sollen.

Fazit: Richtige Bedienung und Voraussetzungen steigern die Effizienz der Spracherkennung

Für ein zufriedenstellendes Ergebnis und eine frustfreie Nutzung von Spracherkennungssoftware ist es wichtig, einige Regeln und Tipps beim Diktieren und der Bedienung zu beachten. Qualitative Diktierhardware wie Diktiergerät, Diktiermikrofon oder Headsets und die Kombination der Spracherkennung mit dem richtigen Vokabular hilft Diktanten, die Genauigkeit ihrer Spracherkennung auf 99 Prozent oder mehr zu erhöhen.

Das von Thax Software unten bereitgestellte Gratis-Handbuch mit Profi-Tipps und Bedienungshinweisen für die Dragon Spracherkennung ist eine praktische Hilfe. Schöpfen Sie das volle Potenzial der Software aus und optimieren Sie die Arbeitsabläufe.

Profi-Tipps für besseres Diktieren mit der Dragon Spracherkennung gratis herunterladen

Wenn Sie sich für Diktier- und Spracherkennungslösungen interessieren, aber unsicher sind, ob Ihnen die Technik zusagt und welche Lösung im beruflichen Alltag die gewünschten Vorteile bringt, dann sprechen Sie uns einfach an. Wir zeigen Ihnen Spracherkennung und Diktiersystem in einer Präsentation und stellen Ihnen bei Interesse eine Testinstallation zur Verfügung. Darüber hinaus schulen wir Sie und Ihre Mitarbeiter in der Bedienung der Diktier- und Spracherkennungssoftware.

Thax Software ist zertifizierter Fachhändler und Integrator für alle Versionen der Dragon Spracherkennung von Nuance. Wir sind darauf spezialisiert, Sie bestmöglich mit Beratung, Installation, Schulungen und Hilfe zu unterstützen, damit Sie das Beste aus Ihrem Dragon herausholen.

Die Berücksichtigung wichtiger Bedienungshinweise und Regeln für Dragon tragen maßgeblich zu einer optimalen Nutzung und besseren Ergebnissen der Spracherkennung bei. Unser nützliches Handbuch „Profi-Tipps für besseres Diktieren mit Spracherkennung“ können Sie hier kostenlos downloaden:

Weiterführender Link – Software für Spracherkennung: So sieht die optimale Nutzung aus

Beachten Sie auch den Artikel über Thax Software mit dem Thema „Software für Spracherkennung: So sieht die optimale Nutzung aus“ auf der Website der WirtschaftsWoche.

Inhalt

Artikel teilen:

Diese Beiträge könnten Sie auch interessieren

News verpasst? Bleiben Sie auf dem Laufenden mit unserem Newsletter

Jetzt Newsletter abonnieren und 50 € Gutschein* sichern!

Mit Klick auf „Anmelden“ stimme ich der Nutzung meiner personenbezogenen Daten für werbliche E-Mails von Thax Software zu (Details siehe Datenschutzerklärung, Widerruf jederzeit möglich).

* Netto, einmalig einlösbar ab netto 200 € Bestellwert. Einfach Gutscheincode in Ihrer Anfrage angeben und der Wert wird im Angebot bzw. in der Rechnung abgezogen. Bei einer Miete erfolgt der Abzug über ein Jahr verteilt. Kombination mit anderen Aktionsrabatten, Auszahlung und Weitergabe ausgeschlossen.