Das Digitalisierungsprojekt Spracherkennung – eine nicht ganz alltägliche Herausforderung
«Spracherkennung» etablierte sich in den letzten Jahren zu einem Begriff für Effizienz, Flexibilität und Genauigkeit. Damit ein Spracherkennungsprojekt zum Erfolg wird, gilt es nicht nur das richtige Produkt zu finden und einzuführen, sondern auch mit den Erwartungen umzugehen, welche in die Technologie gesetzt werden.
Obwohl Konzept und Technologie der medizinischen Spracherkennung keineswegs neu sind, beansprucht die Einführung oft mehr Zeit als geplant. Einige Gründe dafür sind falsche Erwartungen und fehlendes Verständnis für die Technologie. Andererseits, wenn diese Aspekte initial berücksichtigt werden, verläuft das Projekt erfahrungsgemäss speditiv und zur Zufriedenheit der Beteiligten. So steigert Spracherkennung nach kurzer Zeit die Effizienz massiv und ist bereits in wenigen Monaten amortisiert.
Nachdem der Entscheid für Spracherkennung gefallen ist, bilden sich bei Projektteam und Anwendern häufig zwei Lager: Die einen erwarten eine sofortige, massive Beschleunigung der medizinischen Dokumentation mit fehlerfreier Erkennung, ohne je etwas korrigieren zu müssen. Bei anderen bildet sich Widerstand, da Digitalisierungsvorhaben ja scheinbar viele Gefahren mit sich bringen würden und Ärzte mit Spracherkennung sowieso nicht zurechtkämen. Die Wahrheit liegt dazwischen. Es gilt, mit Erwartungen und Bedenken richtig umzugehen, wobei die Projektverantwortlichen häufig mit folgenden Fragen konfrontiert sind:
Versteht die Software verschiedene Akzente?
Spracherkennung hat auch in diesem Bereich enorme Fortschritte gemacht. Dabei gilt es, Dialekt und Akzent zu unterscheiden. Selbstverständlich diktiert man in Hochdeutsch, so wie der Text geschrieben wird. Ob der Diktierende aber einen schweizerischen oder ausländischen Akzent hat, aus Zürich oder Bern stammt, spielt keine signifikante Rolle. Auch bei einer Erkältung oder etwas lauterer Umgebung versteht die Software, was diktiert wird.
Versteht die Software medizinische Fachbegriffe?
Medizinische Begriffe werden nicht nur erkannt, sondern auch orthografisch korrekt geschrieben. Das Vokabular beinhaltet medizinische Wortschätze für verschiedenste Fachbereiche. Zusätzliche Wörter können hinzugefügt oder formatiert werden. Wichtig ist, dass das gewählte System sowohl medizinische als auch allgemeinsprachliche Texte mit demselben Vokabular richtig versteht – hier unterscheiden sich die auf dem Markt verfügbaren Produkte deutlich voneinander.
Welches sind die Auswirkungen auf die Prozesse?
Es bieten sich grundsätzlich zwei Arbeitsweisen an, welche sich je nach Prozessanforderungen kombinieren lassen:
1. Vordergrund-Spracherkennung:
Bei diesem Szenario erstellen Anwender wie beispielsweise Ärzte oder Therapeuten den Text direkt im KIS oder einer anderen Applikation. Der Umweg über das Sekretariat entfällt, womit sich die Durchlaufzeit deutlich verkürzt.
2. Hintergrund-Spracherkennung:
Dieser Prozess ist dem digitalen Diktieren ohne Spracherkennung sehr ähnlich: Die Anwender diktieren auf ein mobiles Diktiergerät oder Smartphone und senden die Audiodateien auf den Server. Das Sekretariat erhält nicht nur die Audiodatei, sondern den vom Spracherkennungsserver erkannten Text dazu. Dies entlastet das Sekretariat, da der Text nur noch korrigiert anstatt geschrieben werden muss.
Welches sind die Auswirkungen auf Qualität und Prozess?
Sowohl bei der Vordergrund- als auch bei der Hintergrund-Spracherkennung werden die Texte auf deren Qualität geprüft und falls nötig korrigiert, entweder durch den Arzt oder das Sekretariat. Dies ist bedeutend effizienter, als die Texte eigenhändig zu tippen oder auf herkömmliche Weise zu diktieren und via Sekretariat schreiben zu lassen. Spracherkennung reduziert weder die Qualität der Inhalte, noch macht sie Prozessänderungen zwingend nötig.
Was erreichen wir mit diesem Projekt konkret?
Laut einer aktuellen Studie des Herstellers Nuance diktieren Ärzte durchschnittlich 120 Wörter, tippen aber nur deren 40 pro Minute. Medizinische Textbearbeiter im Sekretariat können durchschnittlich 192 Zeilen pro Stunde schreiben, aber 559 lesen und korrigieren. Dadurch führen sowohl Vordergrund- als auch Hintergrund-Spracherkennung in der Regel zu einer deutlichen Produktivitätssteigerung.
Vordergrund-Spracherkennung ermöglicht Ärztinnen und Ärzten den Text direkt in der Patientenakte zu erfassen. Es entfallen Medienbrüche und Schnittstellen. Hintergrund-Spracherkennung hingegen ändert im Vergleich zum digitalen Diktieren und Schreiben den Prozess nicht, entlastet aber das Sekretariat.
Letztlich resultieren signifikante Zeitgewinne und Kosteneinsparungen, wie Projekte in verschiedenen Kliniken und Spitälern zeigen. Reto Heusser, Mitglied der Geschäftsleitung von Voicepoint, fasst zusammen: «Erfolgreich eingeführt, reduziert Spracherkennung die Zeit zwischen Abschluss der Untersuchung und Fertigstellung des Berichts sehr deutlich. Verschiedene Kunden von uns erreichen Effizienzsteigerungen von durchschnittlich 60 Prozent».
Voicepoint begleitet zahlreiche Spracherkennungsprojekte in Spitälern, Kliniken und Arztpraxen und legt dabei grosses Augenmerk auf die spezifischen Erwartungen und die dafür geeignete Arbeitsweise. Das stellt sicher, eine auf den Kunden zugeschnittene Lösung erarbeiten zu können und diese mittels sorgfältiger Projektplanung erfolgreich einzuführen.
Haben Sie Fragen zu unseren Produkten oder Dienstleitungen oder möchten Sie Spracherkennung einen Monat lang gratis testen? Kontaktieren Sie uns – wir beraten Sie gerne.