Tasks SotA Datasets Papers Methods Submit About

Papers With Code 2

A community resource for machine learning research: papers, code, benchmarks, and state-of-the-art results.

Explore

Notable Benchmarks All SotA Datasets Papers Methods

Community

Submit Results About

Data sourced from the PWC Archive (CC-BY-SA 4.0). Built by the community, for the community.

Models/LOAE

LOAE

Reported on 13 benchmarks across 1 task · 1 paper · 5 SOTA

Note: results are matched by exact model name. Different papers may use the same name for different model variants.

Audio13 results

Audio captioningonClotho
FENSE· uses extra data· 2024-06-19
0.538
best: 0.54 (SLAM-AAC)
SOTA
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding arXiv:2406.13275
Audio captioningonClotho
SPIDEr-FL· uses extra data· 2024-06-19
0.33
SOTA
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding arXiv:2406.13275
Audio captioningonClotho
Sentence-BERT· uses extra data· 2024-06-19
0.538
SOTA
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding arXiv:2406.13275
Audio captioningonAudioCaps
FENSE· uses extra data· 2024-06-19
0.664
best: 0.668 (SLAM-AAC)
SOTA
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding arXiv:2406.13275
Audio captioningonAudioCaps
Sentence-BERT· uses extra data· 2024-06-19
0.664
SOTA
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding arXiv:2406.13275
Audio captioningonClotho
CIDEr· uses extra data· 2024-06-19
0.513
best: 14 (ZerAuCap)
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding arXiv:2406.13275
Audio captioningonClotho
METEOR· uses extra data· 2024-06-19
0.197
best: 19.3 (VAST)
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding arXiv:2406.13275
Audio captioningonClotho
SPICE· uses extra data· 2024-06-19
0.147
best: 5.3 (ZerAuCap)
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding arXiv:2406.13275
Audio captioningonClotho
SPIDEr· uses extra data· 2024-06-19
0.33
best: 9.7 (ZerAuCap)
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding arXiv:2406.13275
Audio captioningonAudioCaps
CIDEr· uses extra data· 2024-06-19
0.816
best: 50.2 (Audio Flamingo)
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding arXiv:2406.13275
Audio captioningonAudioCaps
METEOR· uses extra data· 2024-06-19
0.267
best: 20.5 (Audio Flamingo)
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding arXiv:2406.13275
Audio captioningonAudioCaps
SPICE· uses extra data· 2024-06-19
0.193
best: 15.1 (Audio Flamingo)
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding arXiv:2406.13275
Audio captioningonAudioCaps
SPIDEr· uses extra data· 2024-06-19
0.505
best: 32.6 (Audio Flamingo)
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding arXiv:2406.13275