Tasks SotA Datasets Papers Methods Submit About

Papers With Code 2

A community resource for machine learning research: papers, code, benchmarks, and state-of-the-art results.

Explore

Notable Benchmarks All SotA Datasets Papers Methods

Community

Submit Results About

Data sourced from the PWC Archive (CC-BY-SA 4.0). Built by the community, for the community.

Models/ZerAuCap

ZerAuCap

Reported on 12 benchmarks across 1 task · 1 paper · 8 SOTA

Note: results are matched by exact model name. Different papers may use the same name for different model variants.

Audio12 results

Audio captioningonAudioCaps
CIDEr· uses extra data· 2023-11-14
28.1
best: 50.2 (Audio Flamingo)
SOTA
Zero-shot audio captioning with audio-language model guidance and audio context keywords arXiv:2311.08396
Audio captioningonAudioCaps
METEOR· uses extra data· 2023-11-14
12.3
best: 20.5 (Audio Flamingo)
SOTA
Zero-shot audio captioning with audio-language model guidance and audio context keywords arXiv:2311.08396
Audio captioningonAudioCaps
ROUGE-L· uses extra data· 2023-11-14
33.1
best: 40.8 (Audio Flamingo)
SOTA
Zero-shot audio captioning with audio-language model guidance and audio context keywords arXiv:2311.08396
Audio captioningonAudioCaps
SPICE· uses extra data· 2023-11-14
8.6
best: 15.1 (Audio Flamingo)
SOTA
Zero-shot audio captioning with audio-language model guidance and audio context keywords arXiv:2311.08396
Audio captioningonAudioCaps
SPIDEr· uses extra data· 2023-11-14
18.3
best: 32.6 (Audio Flamingo)
SOTA
Zero-shot audio captioning with audio-language model guidance and audio context keywords arXiv:2311.08396
Audio captioningonClotho
CIDEr· 2023-11-14
14
SOTA
Zero-shot audio captioning with audio-language model guidance and audio context keywords arXiv:2311.08396
Audio captioningonClotho
SPICE· 2023-11-14
5.3
SOTA
Zero-shot audio captioning with audio-language model guidance and audio context keywords arXiv:2311.08396
Audio captioningonClotho
SPIDEr· 2023-11-14
9.7
SOTA
Zero-shot audio captioning with audio-language model guidance and audio context keywords arXiv:2311.08396
Audio captioningonAudioCaps
BLEU-4· uses extra data· 2023-11-14
6.8
best: 14.3 (Audio Flamingo)
Zero-shot audio captioning with audio-language model guidance and audio context keywords arXiv:2311.08396
Audio captioningonClotho
BLEU-4· 2023-11-14
2.9
best: 19 (VAST)
Zero-shot audio captioning with audio-language model guidance and audio context keywords arXiv:2311.08396
Audio captioningonClotho
METEOR· 2023-11-14
9.4
best: 19.3 (VAST)
Zero-shot audio captioning with audio-language model guidance and audio context keywords arXiv:2311.08396
Audio captioningonClotho
ROUGE-L· 2023-11-14
25.4
best: 40.8 (VAST)
Zero-shot audio captioning with audio-language model guidance and audio context keywords arXiv:2311.08396