Speaker Diarization

23 benchmarks328 papers

Speaker Diarization is the task of segmenting and co-indexing audio recordings by speaker. The way the task is commonly defined, the goal is not to identify known speakers, but to co-index segments that are attributed to the same speaker; in other words, diarization implies finding speaker boundaries and grouping segments that belong to the same speaker, and, as a by-product, determining the number of distinct speakers. In combination with speech recognition, diarization enables speaker-attributed speech-to-text transcription.

<span class="description-source">Source: Improving Diarization Robustness using Diversification, Randomization and the DOVER Algorithm </span>

Benchmarks

Speaker Diarization

Benchmarks

Speaker Diarization on CALLHOME

Speaker Diarization on NIST-SRE 2000

Speaker Diarization on AMI Lapel

Speaker Diarization on AMI MixHeadset

Speaker Diarization on CH109

Speaker Diarization on DIHARD

Speaker Diarization on ETAPE

Speaker Diarization on AMI

Speaker Diarization on CALLHOME-109

Speaker Diarization on AliMeeting

Speaker Diarization on DIHARD II

Speaker Diarization on Hub5'00 CallHome

Speaker Diarization

Benchmarks

Speaker Diarization on CALLHOME

Speaker Diarization on NIST-SRE 2000

Speaker Diarization on AMI Lapel

Speaker Diarization on AMI MixHeadset

Speaker Diarization on CH109

Speaker Diarization on DIHARD

Speaker Diarization on ETAPE

Speaker Diarization on AMI

Speaker Diarization on CALLHOME-109

Speaker Diarization on AliMeeting

Speaker Diarization on DIHARD II

Speaker Diarization on Hub5'00 CallHome