Visual Question Answering (VQA) on VLM2-Bench

Metric: GC-mat (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

#	Model↕	GC-mat▼	Extra Data	Paper	Date↕	Code
1	GPT-4o	37.45	No	GPT-4o System Card	2024-10-25	-
2	Qwen2.5-VL-7B	35.91	No	Qwen2.5-VL Technical Report	2025-02-19	Code
3	InternVL2.5-26B	30.5	No	Expanding Performance Boundaries of Open-Source ...	2024-12-06	Code
4	Qwen2-VL-7B	27.8	No	Qwen2-VL: Enhancing Vision-Language Model's Perc...	2024-09-18	Code
5	InternVL2.5-8B	21.24	No	Expanding Performance Boundaries of Open-Source ...	2024-12-06	Code
6	LLaVA-Video-7B	18.53	No	Video Instruction Tuning With Synthetic Data	2024-10-03	-
7	mPLUG-Owl3-7B	17.37	No	mPLUG-Owl3: Towards Long Image-Sequence Understa...	2024-08-09	Code
8	LLaVA-OneVision-7B	16.6	No	LLaVA-OneVision: Easy Visual Task Transfer	2024-08-06	Code
9	LongVA-7B	14.29	No	Long Context Transfer from Language to Vision	2024-06-24	Code