DINO-CXR: A self supervised method based on vision transformer for chest X-ray classification

Mohammadreza Shakouri, Fatemeh Iranmanesh, Mahdi Eftekhari

2023-08-01Self-Supervised Image Classification Image Classification Pneumonia Detection Self-Supervised Learning COVID-19 Diagnosis Medical Image Classification Medical Image Analysis

Paper PDF

Abstract

The limited availability of labeled chest X-ray datasets is a significant bottleneck in the development of medical imaging methods. Self-supervised learning (SSL) can mitigate this problem by training models on unlabeled data. Furthermore, self-supervised pretraining has yielded promising results in visual recognition of natural images but has not been given much consideration in medical image analysis. In this work, we propose a self-supervised method, DINO-CXR, which is a novel adaptation of a self-supervised method, DINO, based on a vision transformer for chest X-ray classification. A comparative analysis is performed to show the effectiveness of the proposed method for both pneumonia and COVID-19 detection. Through a quantitative analysis, it is also shown that the proposed method outperforms state-of-the-art methods in terms of accuracy and achieves comparable results in terms of AUC and F-1 score while requiring significantly less labeled data.

Results

Task	Dataset	Metric	Value	Model
Image Classification	Chest X-ray images	Accuracy	95.66	DINO-CXR
Pneumonia Detection	Chest X-ray images	Accuracy	95.65	DINO-CXR
COVID-19 Diagnosis	COVIDGR	Accuracy	76.47	DINO-CXR
Classification	COVIDGR	Accuracy	76.47	DINO-CXR
Medical Image Classification	COVIDGR	Accuracy	76.47	DINO-CXR
1 Image, 2*2 Stitchi	Chest X-ray images	Accuracy	95.65	DINO-CXR

Related Papers

Automatic Classification and Segmentation of Tunnel Cracks Based on Deep Learning and Visual Explanations2025-07-18 Adversarial attacks to image classification systems using evolutionary algorithms2025-07-17 Efficient Adaptation of Pre-trained Vision Transformer underpinned by Approximately Orthogonal Fine-Tuning Strategy2025-07-17 Federated Learning for Commercial Image Sources2025-07-17 MUPAX: Multidimensional Problem Agnostic eXplainable AI2025-07-17 A Semi-Supervised Learning Method for the Identification of Bad Exposures in Large Imaging Surveys2025-07-17 Hashed Watermark as a Filter: Defeating Forging and Overwriting Attacks in Weight-based Neural Network Watermarking2025-07-15 Transferring Styles for Reduced Texture Bias and Improved Robustness in Semantic Segmentation Networks2025-07-14