Tasks SotA Datasets Papers Methods Submit About

Papers With Code 2

A community resource for machine learning research: papers, code, benchmarks, and state-of-the-art results.

Explore

Notable Benchmarks All SotA Datasets Papers Methods

Community

Submit Results About

Data sourced from the PWC Archive (CC-BY-SA 4.0). Built by the community, for the community.

Models/MQ-Cap

MQ-Cap

Reported on 10 benchmarks across 1 task · 1 paper

Note: results are matched by exact model name. Different papers may use the same name for different model variants.

Audio10 results

Audio captioningonClotho
BLEU-4· 2024-10-14
18.1
best: 19 (VAST)
Enhancing Retrieval-Augmented Audio Captioning with Generation-Assisted Multimodal Querying and Progressive Learning arXiv:2410.10913
Audio captioningonClotho
CIDEr· 2024-10-14
0.496
best: 14 (ZerAuCap)
Enhancing Retrieval-Augmented Audio Captioning with Generation-Assisted Multimodal Querying and Progressive Learning arXiv:2410.10913
Audio captioningonClotho
METEOR· 2024-10-14
0.192
best: 19.3 (VAST)
Enhancing Retrieval-Augmented Audio Captioning with Generation-Assisted Multimodal Querying and Progressive Learning arXiv:2410.10913
Audio captioningonClotho
SPICE· 2024-10-14
0.143
best: 5.3 (ZerAuCap)
Enhancing Retrieval-Augmented Audio Captioning with Generation-Assisted Multimodal Querying and Progressive Learning arXiv:2410.10913
Audio captioningonClotho
SPIDEr· 2024-10-14
0.319
best: 9.7 (ZerAuCap)
Enhancing Retrieval-Augmented Audio Captioning with Generation-Assisted Multimodal Querying and Progressive Learning arXiv:2410.10913
Audio captioningonAudioCaps
BLEU-4· uses extra data· 2024-10-14
0.301
best: 14.3 (Audio Flamingo)
Enhancing Retrieval-Augmented Audio Captioning with Generation-Assisted Multimodal Querying and Progressive Learning arXiv:2410.10913
Audio captioningonAudioCaps
CIDEr· uses extra data· 2024-10-14
0.845
best: 50.2 (Audio Flamingo)
Enhancing Retrieval-Augmented Audio Captioning with Generation-Assisted Multimodal Querying and Progressive Learning arXiv:2410.10913
Audio captioningonAudioCaps
METEOR· uses extra data· 2024-10-14
0.266
best: 20.5 (Audio Flamingo)
Enhancing Retrieval-Augmented Audio Captioning with Generation-Assisted Multimodal Querying and Progressive Learning arXiv:2410.10913
Audio captioningonAudioCaps
SPICE· uses extra data· 2024-10-14
0.194
best: 15.1 (Audio Flamingo)
Enhancing Retrieval-Augmented Audio Captioning with Generation-Assisted Multimodal Querying and Progressive Learning arXiv:2410.10913
Audio captioningonAudioCaps
SPIDEr· uses extra data· 2024-10-14
0.519
best: 32.6 (Audio Flamingo)
Enhancing Retrieval-Augmented Audio Captioning with Generation-Assisted Multimodal Querying and Progressive Learning arXiv:2410.10913