Skip to content

Mein allererstes mit Dragon NaturallySpeaking diktiertes Blogpost

26. Januar 2009

Dies ist also mein erster Versuch, mit Dragon NaturallySpeaking ein Blogpost zu schreiben. Die erste Erkenntnis, wenig überraschend: das Programm kennt das Wort Blogpost nicht, sondern schlägt vor „ein Blockhaus zu schreiben“. Die zweite Erkenntnis: es ist gar nicht so einfach, perfekt ausformulierte Sätze zu sprechen. Eins der Hauptverkaufsargumente der Texterkennungs-Softwareverkäufer ist ja, dass ihr wir viermal so schnell sprechen wie wir tippen können. Der Vorteil am langsam Tippen ist freilich, dass man auch viermal soviel Zeit hat über das zu Formulierende nachzudenken.

Ebenfalls gewöhnungsbedürftig ist die Tatsache, dass man sich doch ein wenig deppert vorkommt, wenn man in dieser gestelzten Sprache mit dem Computer spricht. Ich für meinen Teil mag mich diesen diesem Dispositiv nicht in der Anwesenheit anderer Personen aussetzen (verblüfft bin ich nun aber doch, dass die Software das Wort Dispositiv bereits kannte).

Und wie aufwändig ist es nun Dragon NaturallySpeaking dazu zu bringen, die eigene Sprache in überzeugender Weise zu notieren? Wenn man erst einmal so weit gekommen ist, dass man Worte in ein Textverarbeitungsprogramm diktieren kann, dann hat man das Schlimmste bereits hinter sich. Bis zu diesem, dritten Absatz habe ich der Software erst zwei Worte beibringen müssen; selbst Worte wie „Hauptverkaufsargumente“ wurden auf Anhieb erkannt. Auch das trainieren von Worten scheint wenig aufwändig zu sein, da man Befehle zum eintrainieren ebenfalls einsprechen kann.

Bevor man jedoch dorthin kommt, muss man Dragon NaturallySpeaking das eigene Modelle näher bringen. Im konkreten Fall macht man das, indem man der Software 10 Minuten lang Märchen vorliest; natürlich nicht irgendwelche Märchen, sondern einen Märchentext, den die Software bereits kennt (der Hase und Igel und ein irritierendes Märchen von Hans Christian Andersen, in welchem Hunde mit Augen so groß wie Mühlräder vorkommen).

Und vor all dieser Vorleserei lag natürlich die Installation, die in den ersten drei Anläufen schief ging. Irgendein Installationselement konnte nicht ordnungsgemäß abgeschlossen werden, weshalb auch die eigentliche Installation nicht starten konnte. Es blieb nur der Anruf bei der Hotline in Frankfurt am Main; der Supportmitarbeiter vermutete Probleme mit einem Visual C++ Paket (arf!) und schickte mir 5 min später eine E-Mail mit einem Download-Link und weiteren Anweisungen. Unter anderem sollte ich den die Microsoft Updates deaktivieren und irgend etwas im Sicherheitscenter verändern – das war mir dann doch etwas zu heiß und ich habe stattdessen erst einmal alle bereits verfügbaren Microsoft Updates installiert. Irgendwie hat das das Problem bereits gefixt (es sei also allen Vista-Usern empfohlen, zunächst einmal die noch ausstehenden Updates zu installieren).

Die Installation selbst dauerte aus unerfindlichen Gründen dann aber doch noch fast eine Stunde.

Dies hier ist bestimmt das langweiligste Blogpost, das ich seit ewigen Zeiten geschrieben habe. Aber immerhin eine willkommene Gelegenheit, um Dragon NaturallySpeaking erstmals auf Herz und Nieren prüfen (was allerdings stört ist, dass man gezwungen ist den Markennamen voll auszusprechen damit statt steigen oder schweigen wirklich Dragon zu lesen ist – vermutlich steckt da die Marketingabteilung des Herstellers dahinter).

P. S. Was ich nun aber doch sehr super finde, ist, dass ich meine Worte auch direkt in den Firefox diktieren kann. Immerhin habe ich ja extra einen PC gekauft (nachdem ich nun seit vier Jahren auf einem Apple arbeite und die Windows Ästhetik gründlich hasse), um die Software nicht nur unter Bootcamp laufen, sondern in diversen Anwendungen nutzen zu können.

21 Kommentare leave one →
  1. 26. Januar 2009 9:47 pm

    Hallo Jana, dies ist ein mit Dragon NaturallySpeaking diktierter Kommentar. Deine ersten Erfahrungen sind auch mit den meinen vergleichbar. für längere komplexe Texte ist es wirklich sehr gewöhnungsbedürftig. Gut funktioniert es aber, wenn man ganz schnell viele E-Mails kurz beantworten will und man nicht viel Wert auf ausgefeilte Formulierungen legen muss. Die schaffe ich nämlich nicht beim Sprechen. Trotz immer wieder auftretender kleinerer und größerer Fehler und Missverständnisse Ist Dragon NaturallySpeaking bei mir dennoch täglich im Einsatz. Irgendwie schon spannend, dass das jetzt halbwegs gut funktioniert. Viel Erfolg beim weiteren Besprechen deines Weblogs!

  2. Matthias Samwald permalink
    26. Januar 2009 9:52 pm

    Extra einen (Vista!!) Laptop gekauft? Deine Sehnenscheidenentzündung kommt dir ja teuer zu stehen.

  3. 26. Januar 2009 10:02 pm

    Hallo David, ja, ich werde mich definitiv an die Annehmlichkeiten der Software gewöhnen können. Ich bin gespannt, wie gut es mir gelingen wird die Software an mich zu gewöhnen.

    Hallo Matthias, Ja und Nein. Ich wollte schon länger mal wieder auf dunkle Seite Computer wechseln, nur um zu wissen, wie es ist. Letztlich finde ich, dass es sich nicht lohnt zu sparen, wenn man seine Gesundheit dadurch schonen kann.

    Alles Gute!

  4. stefan permalink
    26. Januar 2009 10:04 pm

    tja, das ist echt schon lange her, dass man sich am Anfang des Satzes schon drüber klar sein musste, wie er enden würde.

  5. 26. Januar 2009 10:07 pm

    Ja, Genau darum geht es. Wann war das zum letzten Male so? In der dritten Klasse grundschule?

  6. 26. Januar 2009 11:12 pm

    Ich habe vor 10 Jahren oder so meine letzte Spracherkennungssoftware installiert gehabt. Ist spannend, wie sich das Ganze weiter entwickelt hat. Daher ist auch dein Beitrag nicht so fad, wie du vielleicht denkst.
    Vielleicht magst du auch mal diktieren, wie denn die generelle Bedienung des PCs mit dem Programm funktioniert – oder machst du das dann doch händisch?

  7. 27. Januar 2009 12:32 am

    Habe es kurz ausprobiert, war aber mit den Ergebnissen nicht zufrieden. Weniger die Erkennungsgenauigkeit, sondern mehr die Art der Formulierungen. Wenn man fünfzehn Jahre sein Gehirn ans schreiben trainiert hat und dann plötzlich umsteigt, fühlt man, zumindest ich, sich wieder in das Grundschulalter zurückversetzt. Dennoch glaube ich, dass man sich umtrainieren kann und dann so spricht wie man schreiben würde. Hat man das gelernt, kann die Software tatsächlich viel Zeit sparen.

    Aber ersteinmal geht es um deine Gesundheit. Freut mich, dass du damit arbeiten kannst.

  8. 27. Januar 2009 7:40 am

    Guten Morgen, Robert, im Moment bediene ich den Rechner noch manuell, ich muss mich zunächst noch einmal mit dem Benutzerhandbuch auseinandersetzen. Ab und zu benutze ich jedoch zufällig Wörter, die auch in Menü-Punkten vorkommen und dann dazu führen, dass diese aufgerufen werden.prinzipiell ist das bedienen mit der Stimme also möglich; ich berichte in den folgenden Tagen.

    Hallo Luca, für mich liegt das Problem im Moment ebenfalls weniger bei der Software, sondern darin, dass man nicht daran gewohnt ist, das vom Gedanken bis zur Niederschrift lediglich eine halbe Sekunde vergeht. Aber ich habe dir ja mal von Orri Erling erzählt, dessen ganzer Art zu sprechen mittlerweile vom bedienen solcher Software geprägt ist. Warte nur ab, wie ich mich in einem halben Jahr anhören werde!

    Auch dieser Kommentar wurde natürlich wieder eingesprochen.

  9. 27. Januar 2009 9:01 am

    Das klappt ja anscheinden überraschend gut!

    Wie sinnvoll schätzt du, ist es DNS für das Transkribieren von Aufnahmen von z.B. Interviews oder gar Konferenzen einzusetzen?
    Da kann man ja nicht alle Teilnehmer vorher bitten einem ein Märchen vorzulesen🙂

  10. 27. Januar 2009 9:28 am

    ganz einfach: man hört sich die aufnahmen an und spricht nach:)

  11. 27. Januar 2009 5:36 pm

    Nette Idee🙂
    Cooler wärs noch wenn andere Dateien mit ihren Märchenaufnahmen veröffentlichen, und man so die Sprachprofile von Interviewpartner ins DNS reinladen kann (wird’s natürlich net spielen).

  12. 27. Januar 2009 5:42 pm

    die Idee ist aber ziemlich gut!

  13. 2. Februar 2009 11:55 pm

    Bleib auf jeden Fall lieber bei Vista, als Windows 7 beta auszuprobieren:
    http://xkcd.com/528/

  14. 2. Februar 2009 11:56 pm

    deine empfehelung ist mir befehl

  15. 12. Februar 2009 12:53 pm

    Hallo,
    ich habe gerade DNS 10 Preffered wieder de-installiert, weil ich noch ein wenig damit experimentiere. Ich werde es definitiv wieder installieren und weiter nutzen (wollen).
    So habe ich festgestellt, dass die ERkennung der Sprache sehr stark von der Installation abhängig ist: unterschiedliche Mikrofonstellung, unterschiedliches „erstes Sprechen“.
    Bei der 1. Installation habe ich bei der Spracherkennung am Anfang klar und deutlich sowie betont langsam gesprochen.
    Bei der 2. Installation habe ich bewusst „normal“ und flüssig gesprochen. Der Einfluss auf die Erkennung ist in jedem Fall zu merken.

    Arge Probleme habe ich mit der Steuerung von Programmen. Das Handbuch ist „schwach“, das Befehlscenter unübersichtlich.

    Das Diktat in eine offene Textbox ist sehr gut. Man lernt sehr schnell damit umzugehen, die Befehle wie „markiere“ oder „sag das“ lassen sich erlernen und können eingeübt weren.

    Aber mit der Software-Erkennung komme ich überhaupt nicht klar, und im Support habe ich nicht wirklich Hilfe gefunden.

    Zum Beispiel:
    „öffne Word“ macht bei mir WordPad auf.
    „öffne WinWord“, „öffne Microsoft Word“, „öffne Microsoft Word 2003“ … da passiert überhaupt nichts.
    Habe ich WinWord offen kann ich das Programm prima steuern.

    Noch habe ich keine Ahnung wo ich denn solche Befehle implementieren kann.
    Zwar heisst es, man solle „intuitiv“ Programme aufrufen, also z.B. so wie sie in der Prgrammleiste selbst dann angezeigt werden, aber was mache ich wenn das nicht funktioniert (wie bei meinem Beispiel WinWord) ?

    Habt Ihr mehr herausgefunden, vielleicht sogar gute Internet-Links (doof: man ist auf der deutschen Seite von DNS, aber sobald man Support braucht wird man in das englische Portal geswitcht“) ?

    Ich bin gespannt was von Euch kommt.

    MyHugole

  16. 12. Februar 2009 1:22 pm

    das handbuch ist ein witz, wirklich! ich bin soweit zufrieden, ich habe derzeit keine lust,das programm auf extrem klare aussprache zu trainieren – märchenerzählerstimme muss reichen:)

    es ist schon eine schande, dass man das potenzial des ganzen nicht ausschöpfen kann, nur weil die ihr prog nicht gescheit dokumentieren.

  17. 12. Februar 2009 11:31 pm

    Das liest sich als hättest Du auch noch nicht mehr hin- bzw. herausbekommen als ich.

    Wo bekommt man denn nun die nötigen Infos um Programme wie WinWord mit DNS öffnen zu können ?

    Übrigens: bei „öffne Excel“ macht mir DNS XFire auf. lol.

    MyHugole

  18. 12. Februar 2009 11:50 pm

    ja, wo? ich fürchte nur durch learning by doing . wollte nämlich vor allem auch die apps per stimme bedienen können.

  19. 14. Februar 2009 12:51 am

    Nun, ich bin einen Schritt weitergekommen:

    so habe ich immer versucht „Mirosoft Word“ oder „WinWord“ aufzurufen.
    So sind mir die Programme halt namentlich „bekannt“.

    Tatsächlich ist es aber wichtig, den „echten“ Namen zu sagen.
    „Microsoft Office Word 2003“ und blob, das Programm startet.

    Tipp: das Programm auf den Desktop verknüpfen, umbenennen und schwupp es läuft.

    MyHugole

  20. 14. Februar 2009 9:14 am

    Ah, cool, werde ich ausprobieren. Dass DNS einfach auf die verfügbaren Begriffe reagiert ist mir schon aufgefallen – ich habe etwa Blogposts direkts in WordPress diktiert, jetzt verwende ich Wordpad: wenn ich näcmlich zum Beispiel „Twitter“ sage und es ist grad ein Twitter-Fenster offen, wird die Seite geladen. Das gleich passierte auch,w enn man eine Mail in Gmail diktiert und versehentlich ein Wort verwendet, das in einem der Google Ads Texte aufscheint;-P

  21. 3. August 2010 6:07 pm

    Mehr Zeit spare ich beim Diktieren, wenn ich längere Textbausteine mithilfe Spracherkennung einfüge. Meine Grußformel mit allen Angaben wird per Aufruf z.b. „Abitz Grußformel bitte“ eingefügt. Insbesonders baue ich verschiedene Geburtstagsgrüsse in die Spracherkennung Dragon NaturallySpeaking ein. Übrigens freue ich mich schon auf die Version 11. Sie soll sehr präziser als die Dragon NaturallySpeaking 10 sein. Die Einstiegsübung soll nur noch 7 min. dauern. Man hat mehrere Auswahl an Texte zum Vorlesen. Man muß nicht immer Märchen vorlesen. @MyHugole & @digiom: Wenn man die Befehle kennt und versteht, wie sie bewirken, kann man solche Probleme vermeiden.

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: