Hattusas 2nd International Conference on Applied Sciences, Çorum, Türkiye, 1 - 03 Ağustos 2025, ss.30-41, (Tam Metin Bildiri)
Ahşap türlerinin otomatik tanımlanması amacıyla Vision Transformer (ViT) tabanlı derin öğrenme modelleri kullanılmıştır. Ahşap çekirdek görüntüleri üzerinden gerçekleştirilen sınıflandırma görevinde, farklı ViT model yapılandırmaları ve veri artırma tekniklerinin performansları karşılaştırılmıştır. Özellikle Facebook tarafından geliştirilen DeiT (Data-efficient Image Transformer) modelleri tercih edilmiş ve DeiT Small ile DeiT Tiny modellerinin veri artırma uygulamalı ve uygulamasız halleri incelenmiştir. Deneysel çalışmalar, Kaggle’ın çoklu GPU (4x2 GPU) destekli ortamında gerçekleştirilmiş ve modellerin eğitim süreleri, kesinlik, duyarlılık, F1-skoru ve doğruluk gibi metrikler üzerinden değerlendirilmiştir. Elde edilen sonuçlar, veri artırma tekniklerinin model performansına olan etkisinin model mimarisine göre farklılık gösterdiğini ortaya koymuştur. DeiT Small”modelinde veri artırma uygulanması, doğruluk ve diğer sınıflandırma metriklerinde belirgin iyileşmeler sağlamış ve %96,68 doğruluk oranı ile en yüksek başarı elde edilmiştir. Buna karşın, DeiT Tiny modelinde veri artırma uygulaması performansta düşüşe neden olmuştur. Sonuçlar, veri artırmanın derin öğrenme modellerinin genelleme yeteneğini artırmada önemli olduğunu, ancak her model mimarisi için uygun veri artırma stratejisinin dikkatle seçilmesi gerektiğini göstermektedir. Ayrıca, model karmaşıklığı ile eğitim süresi arasında doğrudan bir ilişki olduğu ve daha karmaşık modellerin daha uzun eğitim sürelerine ihtiyaç duyduğu gözlemlenmiştir. Bu çalışma, ViT tabanlı modellerin ahşap türü tanıma alanında etkin bir şekilde kullanılabileceğini göstermiş olup, ileri çalışmalarda farklı veri artırma yöntemleri ve model mimarileriyle performansın daha da iyileştirilebileceğini önermektedir.