Neue Serverlösungen für Spracherkennungssysteme optimieren die Dokumentenerstellung in Kanzleien

von Dipl.-Kfm. Roland Hollstein

Die Digitalisierung ist längst in Anwaltskanzleien angekommen. Cloudbasierte Aktenverwaltung, virtuelles Anwaltssekretariat und mobile Mandatsarbeit machen die Arbeit leichter. Moderne Sozietäten rüsten ihre IT-Infrastruktur um und setzen bei der Dokumentenerstellung auf serverbasierte Lösungen. Jetzt gibt es auch für Spracherkennung die passenden Lösungen – egal, ob im Büro gearbeitet wird oder unterwegs.

Künstliche Intelligenz optimiert die Spracherkennung

Die Technologie der Spracherkennung hat sich in den letzten Jahren rasant weiterentwickelt. Was für das menschliche Ohr kein Problem darstellt, ist für Maschinen wesentlich schwieriger. Sie müssen einerseits relevante von nicht relevanten Audioinformationen trennen (beispielsweise Nebengeräusche und Rauschen), und zum zweiten diese Informationen richtig interpretieren. Durch die Anwendung „Künstlicher Intelligenz“ in Form sogenannter neuronaler Netzwerke wird es möglich, die für gute Ergebnisse in der Spracherkennung riesigen Datenmengen schnell zu erkennen und richtig zu deuten. Moderne Spracherkennungssysteme liefern mittlerweile – ohne angelernt werden zu müssen – eine Erkennungsgenauigkeit von 99 Prozent, und können Dialekte, Akzente und Nebengeräusche in unterschiedlichen Aufnahmesituationen bewältigen. Speziell für Anwälte wird bereits ein entsprechender Rechtswortschatz hinterlegt. So erspart sich der Anwender das Anlernen der Software und erhält optimale Erkennungsqualität von Anfang an.

Hohes Einsparpotential im Schreibbereich

Die schnelle Erstellung von Dokumenten war noch nie so einfach wie heute. Denn durch die Kombination von digitalem Diktat und Spracherkennung lassen sich sowohl der Workflow in der Kanzlei als auch der Einsatz von Arbeitskräften wesentlich effizienter gestalten, die Produktivität erhöhen und somit schnellere Durchlaufzeiten erzielen. Der Posten mit dem größten Optimierungs- und Einsparungspotential ist dabei die Schreibarbeit.

Serverbasierte Spracherkennung im Anwaltsbüro

Die Verarbeitung der Sprachinformationen und ihre Transformation in Text benötigen entsprechende Rechnerressourcen. Eine gute Alternative, um die Kapazitäten auf den Rechnern der jeweiligen Anwender nicht unnötig zu beanspruchen, ist daher das serverbasierte Arbeiten. Bisher war dies bei professionellen Spracherkennungslösungen nicht möglich. Erst jetzt kam ein Produkt auf den Markt, das diese Lücke schließt. Die Software ist gerade für Anwender sehr einfach zu bedienen. Man diktiert mittels PC-Mikrofon direkt in eine Anwendung auf dem Rechner. Die Sprache wird unmittelbar in Text umgesetzt und steht quasi in Echtzeit auf dem Bildschirm zur Verfügung. Jeder Benutzer kann sein eigenes Sprachprofil einrichten und von jedem Rechner aus darauf zugreifen. Besonders praktisch ist dies für das Arbeiten von verschiedenen Standorten oder im Homeoffice.

Spracherkennung auf dem Server auch bei mobilem Diktat

Für Anwälte, die viel unterwegs arbeiten, empfiehlt es sich, Diktate mobil aufzunehmen und erst im Nachgang in Text umzuwandeln. Auch für diesen Einsatzzweck wurde eine Serverlösung entwickelt. Der Prozess zur Dokumentenerstellung ist denkbar einfach: Die Anwälte diktieren wie gewohnt mobil ihre Schriftsätze und geben die fertigen Aufzeichnungen an das Netzwerk weiter. Das Diktat wird mittels Serverspracherkennung in ein Textdokument umgewandelt und zur Fertigstellung an das Sekretariat geleitet. Die Schreibkräfte müssen lediglich noch kleine Korrekturen vornehmen, zum Beispiel bei Eigennamen oder unbekannten Wörtern. Nach der Finalisierung erhält die Software auf dem Server automatisch Feedback über die erfolgten Änderungen und speichert diese ab. So lernt die Spracherkennung dazu und wird von Mal zu Mal besser. Um die sensiblen Daten vor unbefugtem Zugriff zu schützen, werden die Audio-Dateien beim Versand verschlüsselt.

Einrichtung des Systems durch Experten empfohlen

So einfach die Lösung für die Anwender sich darstellt, so komplex ist die richtige Einrichtung der Server. Der Autor empfiehlt daher, sich vorab von Spracherkennungsexperten beraten zu lassen und den Aufwand für Installation und Roll-Out in die Hände von Profis zu legen.

Investition amortisiert sich schnell

Egal für welche Variante man sich auch entscheidet – mobil oder am Arbeitsplatz – Spracherkennungssysteme bieten auf jeden Fall einen großen Mehrwert in den administrativen Abläufen einer Kanzlei. Die kurze Eingewöhnungsphase gewährleistet die hohe Akzeptanz der Nutzer. Die Entscheidung für eine Spracherkennungslösung macht sich in einer Zeitersparnis von mindestens 50 Prozent bei der Schreibarbeit bezahlt. Die Investition amortisiert sich daher erfahrungsgemäß innerhalb von ein bis zwei Jahren. Sollten einzelne Anwälte weiterhin lieber beim klassischen Diktat ohne Spracherkennung bleiben wollen, können sie das ebenfalls tun – die Audio-Datei wird in diesem Fall im Sekretariat auf dem herkömmlichen Weg transkribiert.

Über den Autor:

Dipl.-Kfm. Roland Hollstein
Geschäftsführer der
Grundig Business Systems GmbH

Quelle NJW 47/2018