Speech Recognition

182 benchmarks6433 papers

Speech Recognition is the task of converting spoken language into text. It involves recognizing the words spoken in an audio recording and transcribing them into a written format. The goal is to accurately transcribe the speech in real-time or from recorded audio, taking into account factors such as accents, speaking speed, and background noise.

<span style="color:grey; opacity: 0.6">( Image credit: SpecAugment )</span>

Speech Recognition

Benchmarks

Speech Recognition on LibriSpeech test-clean

Speech Recognition on LibriSpeech test-other

Speech Recognition on Switchboard + Hub500

Speech Recognition on TIMIT

Speech Recognition on AISHELL-1

Speech Recognition on Jam-ALT English

Speech Recognition on WSJ eval92

Speech Recognition on Jam-ALT

Speech Recognition on Jam-ALT French

Speech Recognition on Jam-ALT German

Speech Recognition on Jam-ALT Spanish

Speech Recognition on LibriTTS

Speech Recognition on IndicTTS

Speech Recognition on swb_hub_500 WER fullSWBCH

Speech Recognition on LRS2

Speech Recognition on LRS3-TED

Speech Recognition on MediaSpeech

Speech Recognition on SLUE

Speech Recognition on VietMed

Speech Recognition on WenetSpeech

Speech Recognition on North American English

Speech Recognition on CHiME real

Speech Recognition on EasyCom

Speech Recognition on GigaSpeech DEV

Speech Recognition on GigaSpeech TEST

Speech Recognition on CHiME-6 dev_gss12

Speech Recognition on Hub5'00 SwitchBoard

Speech Recognition on LJSpeech

Speech Recognition on Tedlium

Speech Recognition on WSJ dev93

Speech Recognition on CHiME-6 eval

Speech Recognition on Common Voice vi

Speech Recognition on DIRHA English WSJ

Speech Recognition on Europarl-ASR EN Guest-test

Speech Recognition on Fongbe audio

Speech Recognition on Libri-Light test-clean

Speech Recognition on Libri-Light test-other

Speech Recognition on Mandarin Chinese

Speech Recognition on SPGISpeech

Speech Recognition on Speech Commands

Speech Recognition on VIVOS

Speech Recognition on WSJ eval93

Speech Recognition on AISHELL-2

Speech Recognition on AMI IMH

Speech Recognition on AMI SDM1

Speech Recognition on Blizzard Challenge 2013

Speech Recognition on CHiME clean

Speech Recognition on CHiME-4 real 6ch

Speech Recognition on Europarl-ASR EN MEP-test

Speech Recognition on GRID corpus (mixed-speech)

Speech Recognition on LibriCSS

Speech Recognition on Lip2Wav (Chem)

Speech Recognition on Lip2Wav (Chess)

Speech Recognition on Lip2Wav (DL)

Speech Recognition on Lip2Wav (EH)

Speech Recognition on Lip2Wav (HS)

Speech Recognition on RealMAN

Speech Recognition on Sagalee

Speech Recognition on TED-LIUM

Speech Recognition on VoxForge American-Canadian

Speech Recognition on VoxForge Commonwealth

Speech Recognition on VoxForge European

Speech Recognition on VoxForge Indian

Speech Recognition on AISHELL-2 Test Android

Speech Recognition on AISHELL-2 Test IOS

Speech Recognition on AISHELL-2 Test Mic

Speech Recognition on CALLHOME En

Speech Recognition on CALLHOME Spanish Speech

Speech Recognition on CAS-VSR-S101

Speech Recognition on GigaSpeech

Speech Recognition on Google Speech Commands - Musan

Speech Recognition on Hub5'00 CallHome

Speech Recognition on Hub5'00 FISHER-SWBD

Speech Recognition on LRW

Speech Recognition on LibriSpeech 100h test-clean

Speech Recognition on LibriSpeech 100h test-other

Speech Recognition on LibriSpeech train-clean-100 test-clean

Speech Recognition on LibriSpeech train-clean-100 test-other