v., het verstaan van het gesproken woord door een computer.
© Voor spraakherkenning is het noodzakelijk dat het geluidssignaal van een uitgesproken woord of zin wordt omgezet in een of meer instructies die door het informatieverwerkend systeem (gewoonlijk een computer) kunnen worden verwerkt en geïnterpreteerd op een wijze als door de spreker is bedoeld. Een spraakherkenner is dus een randapparaat van een computersysteem dat het gesproken woord omzet in voor de computer begrijpelijke taal, d.w.z. machine-instructies. Het proces van spraakherkenning is dermate ingewikkeld dat een spraakherkenner zelf al een (mini)computer nodig heeft om zijn taak uit te voeren. Spraakherkenning begint met de omzetting van het geluidssignaal in een elektrisch signaal (met behulp van een microfoon). Dit elektrische signaal ondergaat dan een gedetailleerde analyse van de in het signaal voorkomende frequenties. Deze analyse moet resulteren in een classificatie van woord- en zinsonderdelen en zo uiteindelijk tot een interpretatie van het geheel. Uiteraard moet het apparaat dat deze handelingen uitvoert, beschikken over een geheugen waarin het noodzakelijke vergelijkingsmateriaal ligt opgeslagen, en waarin men ook die taalregels kan opslaan die een rol spelen bij het selecteren van de mogelijke betekenissen van het ingevoerde signaal.
In een eenvoudige vorm kan spraakherkenning geschieden aan de hand van losse woorden, waarbij de spreker verplicht is de boodschap in te spreken met behulp van een beperkte woordenschat waarbij tussen opeenvolgende woorden steeds even moet worden gepauzeerd. Veel moeilijker wordt het echter om normaal uitgesproken zinnen te herkennen omdat daarin de woorden meestal akoestisch verbonden zijn, zodat het apparaat zelf moet achterhalen wanneer een woord begint en wanneer het eindigt. Ter controle van de spraakherkenning wordt de tekst op een beeldscherm zichtbaar gemaakt.
Naast spraakherkenning (Eng. speech recognition), waarbij het er om te doen is om het gesproken woord te herkennen op de omschreven wijze, bestaat de variant waarin het er om te doen is de bedoeling van de spreker te achterhalen (b.v. de opdracht die de computer moet uitvoeren) zonder dat het direct nodig is alles woord voor woord te herkennen. In dit geval spreekt de, voornamelijk Engelstalige, litteratuur van speech understanding. Spraakherkenning, als mogelijkheid om gegevens in een informatieverwerkend systeem in te voeren, heeft uiteraard het voordeel van het grote bedieningsgemak voor de gebruiker, maar is daarnaast van groot belang in situaties dat de gebruiker niet in staat is op andere wijze informatie in te voeren (b.v. iemand die intussen de handen niet vrij heeft). Spraakherkenning bevindt zich voor het grootste deel nog in de ontwikkelingsfase. Naast spraakherkenning kent men ook sprekersherkenning. Daarbij gaat het niet om de inhoud van het gesproken woord, maar om de identificatie van de spreker. De wijze waarop woorden of zinnen worden uitgesproken is dermate typerend voor de spreker dat zijn ‘stemafdruk’ kan worden gebruikt door een automaat om na te gaan wie de spreker is.