Speech Recognition on Jam-ALT French

Metric: Word Error Rate (WER) (lower is better)

LeaderboardDataset

Loading chart...

Results

Sort:

#	Model↕	Word Error Rate (WER)▲	Extra Data	Paper	Date↕	Code
1	AudioShake v3	20.8	No	Lyrics Transcription for Humans: A Readability-A...	2024-07-30	Code
2	Whisper v2 +lang	27.1	No	Lyrics Transcription for Humans: A Readability-A...	2024-07-30	Code
3	Whisper v2	27.7	No	Jam-ALT: A Formatting-Aware Lyrics Transcription...	2023-11-23	Code
4	Whisper v2	27.7	No	Jam-ALT: A Formatting-Aware Lyrics Transcription...	2023-11-23	Code
5	Whisper v3	34.7	No	Jam-ALT: A Formatting-Aware Lyrics Transcription...	2023-11-23	Code
6	Whisper v3 +lang	34.7	No	Lyrics Transcription for Humans: A Readability-A...	2024-07-30	Code
7	Whisper v3	34.7	No	Jam-ALT: A Formatting-Aware Lyrics Transcription...	2023-11-23	Code
8	AudioShake v1	34.9	No	Jam-ALT: A Formatting-Aware Lyrics Transcription...	2023-11-23	Code
9	Whisper v2 +demucs +lang	38.2	No	Lyrics Transcription for Humans: A Readability-A...	2024-07-30	Code
10	Whisper v2 +demucs	43.3	No	Jam-ALT: A Formatting-Aware Lyrics Transcription...	2023-11-23	Code
11	Whisper v2 +demucs	43.3	No	Jam-ALT: A Formatting-Aware Lyrics Transcription...	2023-11-23	Code
12	Whisper v3 +demucs	44.9	No	Jam-ALT: A Formatting-Aware Lyrics Transcription...	2023-11-23	Code
13	Whisper v3 +demucs +lang	44.9	No	Lyrics Transcription for Humans: A Readability-A...	2024-07-30	Code
14	Whisper v3 +demucs	44.9	No	Jam-ALT: A Formatting-Aware Lyrics Transcription...	2023-11-23	Code
15	OWSM v3.1 +lang	71.6	No	Lyrics Transcription for Humans: A Readability-A...	2024-07-30	Code
16	OWSM v3.1 +demucs +lang	78.5	No	Lyrics Transcription for Humans: A Readability-A...	2024-07-30	Code

#1AudioShake v3SOTA
20.8
Word Error Rate (WER)· 2024-07-30
Lyrics Transcription for Humans: A Readability-Aware Benchmark Code
#2Whisper v2 +langSOTA
27.1
Word Error Rate (WER)· 2024-07-30
Lyrics Transcription for Humans: A Readability-Aware Benchmark Code
#3Whisper v2SOTA
27.7
Word Error Rate (WER)· 2023-11-23
Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark Code
#4Whisper v2
27.7
Word Error Rate (WER)· 2023-11-23
Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark Code
#5Whisper v3SOTA
34.7
Word Error Rate (WER)· 2023-11-23
Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark Code
#6Whisper v3 +lang
34.7
Word Error Rate (WER)· 2024-07-30
Lyrics Transcription for Humans: A Readability-Aware Benchmark Code
#7Whisper v3
34.7
Word Error Rate (WER)· 2023-11-23
Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark Code
#8AudioShake v1SOTA
34.9
Word Error Rate (WER)· 2023-11-23
Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark Code
#9Whisper v2 +demucs +lang
38.2
Word Error Rate (WER)· 2024-07-30
Lyrics Transcription for Humans: A Readability-Aware Benchmark Code
#10Whisper v2 +demucsSOTA
43.3
Word Error Rate (WER)· 2023-11-23
Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark Code
#11Whisper v2 +demucs
43.3
Word Error Rate (WER)· 2023-11-23
Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark Code
#12Whisper v3 +demucsSOTA
44.9
Word Error Rate (WER)· 2023-11-23
Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark Code
#13Whisper v3 +demucs +lang
44.9
Word Error Rate (WER)· 2024-07-30
Lyrics Transcription for Humans: A Readability-Aware Benchmark Code
#14Whisper v3 +demucs
44.9
Word Error Rate (WER)· 2023-11-23
Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark Code
#15OWSM v3.1 +lang
71.6
Word Error Rate (WER)· 2024-07-30
Lyrics Transcription for Humans: A Readability-Aware Benchmark Code
#16OWSM v3.1 +demucs +lang
78.5
Word Error Rate (WER)· 2024-07-30
Lyrics Transcription for Humans: A Readability-Aware Benchmark Code