Wirtschaft

Jan Würzebesser und Andreas Mohr (r.) von Indocma. (Foto: Lappe)

30.08.2013

„Wir halten uns den Kopf frei für das Wichtige“

Unternehmen aus Erlangen bietet Diktiersysteme, die nicht nur in der Baubranche gefragt sind

Wer auf Baustellen arbeitet, ist dankbar, wenn er die Hand frei hat und seine Statusinformationen sicher an die Firma übermittelt weiß. Das geht mit einer Spracherkennungssoftware. Ein Erlanger Unternehmen hat hierzu eine innovative Lösung.

Fünf Minuten sind’s, dann ist das sprachliche Profil eines Menschen erfasst. Fünf Minuten, die das Fachvokabular, seinen beruflichen „Wortschatz“ abbilden helfen.
Spracherkennung gibt’s schon seit 1958, doch mit der heutigen ist sie nicht vergleichbar. „Das sind Quantensprünge“, sagt Geschäftsführer Andreas Mohr, der sich seit 20 Jahren damit beschäftigt, in Erlangen studierte und dort 2004 seine Indocma GmbH gründete.
Diese arbeitet seit Juli 2013 mit der Friedrichshafener Systempartner Computervertrieb GmbH unter dem Markennamen „Comforts“ zusammen an gemeinsamen Projekten – an IT-Netzwerken für kleine und mittlere Unternehmen (KMU), ausgerichtet auf modernste Spracherkennung.

Es muss intuitiv sein


Jim Baker entwickelte 1996 eine Spracherkennung für den freien Markt, doch auch die konnte Fachsprache noch nicht erkennen. Allerdings sollte schon damals Spracherkennung der Datenbanksteuerung dienen – das gilt heute, im Zeitalter von Kundenbindung per Computer (CRM) umso mehr. Nur, die Zeiten wandeln sich, die Rechner, die einst so groß wie Kühlschränke waren, passen heute in Smartphones.
Spracherkennung muss sich diesem Standard anpassen, intuitiv sein, unkompliziert, verlässlich – und sie muss die Sprache des Benutzers kompetent abbilden können. Seinen eigenen Wortschatz, seine Lautbildung, sein individuelles Sprechen.
„Wir nennen das Prosodie. Damit sind die Artikulation gemeint, das Frequenzband, die Sprechpausen, die Intonation“, sagt Mohr. Jeder Sprecher habe sein eigenes Profil. Das sei wie ein Fingerabdruck. Die Spracherkennungssoftware vermag diesen Fingerabdruck zu erkennen. Notwendig ist ein bloß wenige Minuten dauernder Trainingstext, eine „Anlernphase“, in der die Software die Prosodie des Sprechers analysiert und mit einem Algorithmensystem erfasst.
Die branchenunabhängige Software erkennt also automatisch den individuellen Wortschatz (Lexeme und Phoneme) und schließt per Wahrscheinlichkeits-Algorithmus ähnlich lautende aus. Je mehr das System im Vorfeld „gelernt“ hat, umso eindeutiger erkennt es das verwendete Vokabular.
Kommen dann noch mehrere dutzend Seiten (bau-)fachsprachlicher Basistexte hinzu, werden diese – mit den typischen Redewendungen – mit der jeweiligen Prosodie verknüpft. Fertig. Der Indocma-Chef: „Wir erzeugen als erstes aus dem Fundus vorhandener Arbeitstexte eine anonymisierte, zuweilen riesige Datendatei. Je größer am Anfang, desto besser. Diese Riesendatei vermittelt quasi dem System das Vokabular bzw. den Wortschatz. Und fortan“, erklärt Mohr weiter, „erkennt unsere Software zu 97 Prozent die diktierten Sätze. Korrekturen sind so gut wie keine mehr nötig.“
Dies gilt für Diktate im medizinischen Bereich ebenso wie zum Beispiel für die Baubranche. Denn: „Jeder Berufsstand benutzt im Alltag fast immer dieselben Begriffe und Redewendungen. Der Baugutachter ebenso wie zum Beispiel ein Geschäftsleiter, Vertriebler, Qualitätskontrolleur, Außendienstler, Arzt oder Rechtsanwalt.“ Ein Korrekturprogramm überläuft den diktierten Text und konvertiert Erkennungsdefizite zusätzlich. Diese Fehler wiederum „merkt“ sich die Software für die Zukunft in der eigenen Datenbank.
Die Software samt Computer-Mikrophon oder Headset oder kleinem Diktiergerät (möglich auch per App auf ein iPhone oder Android-Handy) ist ohnehin „nur“ ein praktisches, simples Vehikel, ein Hilfsmittel für den Alltag. Ziel ist es letzlich, erklärt der Geschäftsführer, „zeitaufwändige und nervige Korrekturen langer Diktattexte zu vermeiden. Solche Dauerschleifen sind heutzutage unnötig. Ein Handy etwa mit unserer automatischen Verschriftungssoftware überträgt sogar die gesprochenen Infos direkt in die firmeneigene CRM-Datenbank, ins Outlook oder zum Beispiel in ein Patientenverwaltungsystem.“
Das Besondere der anfangs erwähnten Firmen-Kooperation von Indocma und Comforts ist, dass erstens beim Kundenunternehmen inhouse und zweitens auch im Comforts-Rechenzentrum in Friedrichshafen dem Kunden einen Server zur Verfügung gestellt wird.
Mohr stolz: „Spracherkennung via Server ist bislang in Deutschland einmalig. Es ist also nicht mehr nötig, dass unser Auftraggeber wie früher die eigene PC-Hardware gegebenenfalls teuer aufrüstet, oder gar einen eigenen Server anschafft. Das nehmen wir ihm ab.“
Und Jan Würzebesser erklärt: „Dank der Synergie unserer unterschiedlichen Geschäftsfehler IT-Netzwerke und Spracherkennung ergibt sich: Wir sind imstande, kleine und große Unternehmen mit Spracherkennungssoftware auszustatten. Teure neue Hardware oder fehlende Serverstrukturen sind für Unternehmen kein Hinderungsgrund mehr.“


Datentransfer via Server


Der Sprach-Datentransfer wird via Server somit im gesamten Firmennetzwerk des Kunden verankert – und dient der Geschäftsleitung und dem Bauleiter ebenso wie dem Vertrieb, der Materialbeschaffung, dem CRM-Marketing oder dem Außendienst.
Blitzschnelle Kommunikation allein durch Spracherkennung via Diktat ist möglich. Zeit- und Wegeersparnis sind groß, Kommunikationsfehler werden minimiert. Der Clou: Die objektbezogenen Texte werden dem jeweiligen Kunden bzw. Kontaktpartner zugeordnet (zum Beispiel direkt ins „Outlook“), automatisch aktualisiert und allerorten abrufbar vorgehalten. Einfach per Spracheingabe. Passwortgeschützt. Und alle Texte sind stets sofort der Kundendatei zugeordnet. Jeder im Unternehmen hat sofort Zugriff auf die aktuellsten Kundendaten; fast in Echtzeit. Die Texte – Ergänzungen sind natürlich jederzeit möglich –sind dann auf jedem Rechner der Firma überall ablesbar, alle Korrekturen werden auf alle Netzwerkrechner übertragen.
„Schneller und sicherer geht’s nicht“, sagt Mohr, „der Anwender hat sofort wieder den Kopf frei für die wichtigen Dinge. Er muss nichts eingeben oder später abtippen lassen. In vielen Berufen zum Beispiel der Baubranche, in denen sehr schnell sehr viel diktiert wird und sich Situationen blitzschnell ändern, unerlässlich und super bequem.“ Diktiert werden kann immer und von jedem Ort aus – papierlos sozusagen.
Aus all diesen Gründen sei das „Voice2Process“-System keines „von der Stange“ oder aus dem Supermarkt, betont Mohr. „Die dortigen Produkte können nicht ,lernen’ oder individuell angepasst werden.“ Daran, sagt er schulterzuckend, „verzweifeln viele Anwender. Sie glauben, ein billiges Sprachprogramm genüge völlig, aber der Berufsalltag beweist das Gegenteil. Leider glauben sie dann oft, Spracherkennung insgesamt tauge nichts. Das ist falsch.“
Für das „Voice2Process“ werde, nennt der Geschäftsführer, rund 3000 Euro pro Lizenz investiert werden müssen. Darin seien die Spracherkennung, die aufwändige Vokabularerfassung, die Client- und die Serverlizenz sowie die Netzwerkfähigkeit enthalten. „Natürlich,“ schließt Mohr, „ist das mit einem 99-Euro-Angebot nicht zu vergleichen. Aber wer sich mit Spracherkennung richtig befasst, wird Äpfel und Birnen schnell unterscheiden können. Und zwar gerne, denn die Amortisation kommt schnell und zuverlässig. Jede Stunde, mit der ich mich mit einem bereits diktierten Text nicht mehr befassen muss, gibt mir Zeit für Neues.“ (Thomas Lappe)

Einen Online-Kommentar verfassen - so geht's

Scrollen Sie einfach ans Ende des Artikels, den Sie kommentieren wollen und geben Sie Ihre E-Mail-Adresse und einen nickname an. Die Nennung Ihres Namens ist freiwillig. Für die Nutzer sichtbar ist in jedem Fall NUR der nickname. Sie müssen sich auch nicht auf unserer Homepage anmelden. Aber unsere Netiquette akzeptieren. Und schon können Sie loslegen!

Kommentare (0)

Es sind noch keine Kommentare vorhanden!

Neuen Kommentar schreiben

Die Frage der Woche

Frage der Woche KW 42 (2017)

Sollen Arbeitnehmer das Recht haben, auf eine 28-Stunden-Woche zu reduzieren?

Umfrage Bild
 

Lesen Sie dazu in der Bayerischen ­Staatszeitung vom 20. Oktober 2017 auch die Standpunkte unserer Diskutanten:

Jürgen Wechsler, Bezirksleiter IG-Metall Bayern

(JA)

Bertram Brossardt, Hauptgeschäftsführer der vbw – Vereinigung der Bayerischen Wirtschaft

(NEIN)

arrow
Facebook
Vergabeplattform
Vergabeplattform

Staatsanzeiger eServices
die Vergabeplattform für öffentliche
Ausschreibungen und Aufträge Ausschreiber Bewerber

E-Paper
Unser Bayern

Die kunst- und kulturhistorische Beilage der Bayerischen Staatszeitung

Unser Bayern

LesenNachbestellen

Nur für Abonnenten

Shopping
Anzeigen Mediadaten
eaper
E-Paper
ePaper
zum ePaper
Abo Anmeldung

Benutzername

Kennwort

Bei Problemen: Tel. 089 – 290142-59 und -69 oder vertrieb@bsz.de.