Prinzip und Anwendung der Spracherkennungstechnologie

- Jun 10, 2019-


Die Spracherkennung, eine Art biometrischer Technologie, die auch als Sprechererkennung bezeichnet wird, ist eine Technik zur Unterscheidung der Identität eines Sprechers anhand des Tons. Es gibt zwei Arten von Spracherkennungstechnologien, nämlich die Sprechererkennung und die Sprecherbestätigung. Unterschiedliche Spracherkennungstechniken werden für unterschiedliche Aufgaben und Anwendungen verwendet. Wenn Sie beispielsweise den Umfang der strafrechtlichen Ermittlungen einschränken, müssen Sie möglicherweise die Technologie identifizieren und die Banküberweisung muss die Technologie bestätigen. Die People's Bank of China hat offiziell den Standard der Finanzbranche für "Mobile Finance Based Security Specification für die Spracherkennung" veröffentlicht. Dies bedeutet, dass die Spracherkennungstechnologie von den Finanzaufsichtsbehörden anerkannt wurde. Dies löst auch das Standardproblem der Spracherkennungs-Technologie für den Einstieg in das mobile Finanzwesen.


voiceprint recognition technology


Prinzip


Der sogenannte Voiceprint ist ein Schallwellenspektrum, das Sprachinformationen enthält, die von einem elektroakustischen Instrument angezeigt werden.
Die Erzeugung der menschlichen Sprache ist ein komplexer physiologischer und physikalischer Prozess zwischen dem menschlichen Sprachzentrum und den Stimmorganen. Die Stimmorgane der Menschen in der Sprache - Zunge, Zähne, Rachen, Lunge und Nasenhöhle - unterscheiden sich in Größe und Form erheblich. Die Soundprints von zwei Personen sind also unterschiedlich. Die sprachakustischen Eigenschaften jeder Person sind sowohl relativ stabil als auch variabel, nicht absolut und unveränderlich. Diese Variation kann aus der Physiologie, Pathologie, Psychologie, Simulation, Tarnung und auch im Zusammenhang mit Umweltstörungen stammen. Da jedoch die Stimmorgane jeder Person unterschiedlich sind, können Menschen im Allgemeinen immer noch die Stimmen verschiedener Menschen unterscheiden oder beurteilen, ob es sich um die Stimme derselben Person handelt.
Einstufung
Je nach Anwendungsszenario kann die Spracherkennung in Sprecheridentifikation (SI) und Sprecherüberprüfung (SV) unterteilt werden. SI bezieht sich auf die Tatsache, dass wir eine zu testende Rede haben. Wir müssen diese Rede mit einem trockenen Sprecher in einem Satz vergleichen, den wir kennen. Die Auswahl der besten Übereinstimmung ist ein Eins-zu-Viele-Problem. SV bedeutet, dass wir eine unbekannte Stimme haben, und dann können wir feststellen, ob die Stimme von diesem Zielbenutzer stammt. Es ist ein Eins-zu-Eins-Binärklassifizierungsproblem.


Anwendung


In der Anwendung liegt die Anwendungsperspektive der Spracherkennung im Sicherheitsbereich, z. B. bei strafrechtlichen Ermittlungen, Zugangskontrollen, Bankgeschäften usw. Darüber hinaus hat die Spracherkennungstechnologie im Bereich intelligenter Häuser im Interesse der Sicherheit und einer besseren intelligenten Erfahrung, beispielsweise der genauen Identifizierung, welcher Satz der Befehl des Eigentümers im Zusammenhang mit der Vokalisierung ist, allmählich Beachtung gefunden .
   

Aufgabe


Die Hauptaufgaben der Spracherkennung umfassen: Sprachsignalverarbeitung, Extraktion von Sprachdruckfunktionen, Sprachdruckmodellierung, Sprachdruckvergleich und Entscheidungsfindung.

Vorteil


1. Die Spracherkennung mit Sprachausgabe-Funktionen ist bequem und natürlich.
2, die Kosten für die Erlangung von Sprache ist niedrig, einfach zu bedienen, wie ein Mikrofon, Kommunikationsausrüstung, etc .;
3. Geeignet für die Fernüberprüfung der Identität;
4. Der Algorithmus zur Spracherkennung und Bestätigung ist wenig komplex.
B. die Inhaltsidentifikation durch Spracherkennung, kann die Genauigkeit verbessern.


Ein paar:Sondensensor zur Erkennung von Ultraschallfehlern für Generatorrotorhaltering Der nächste streifen:Methode und Prinzip des Ultraschallsensors zur Detektion von Beton