Sürdürülebilir Perakende Yönetimi için Gıda İsrafı Riskinin Özellik Mühendisliği ve Açıklanabilir Yapay Zekâ Destekli Modellenmesi


Dağıstanlı Ö., Yurttakal A. H., Şevik R.

Kahramanmaraş Sütçü İmam Üniversitesi Tarım ve Doğa Dergisi, sa.Advanced Online Publication, ss.1295-1306, 2026 (ESCI, TRDizin)

Özet

Bu çalışmanın temel amacı, süpermarket ürünlerinin envanter, satış ve tedarikçi verilerini kullanarak israf edilme olasılığını tahmin etmektir. Bu tahmin görevi için Yapay Sinir Ağları (ANN) ve lojistik regresyon modelleri kullanılmıştır. Çalışma, gıda israfının azaltılması, doğal kaynakların korunması ve çevresel etkilerin minimize edilmesi yoluyla sürdürülebilir gıda yönetimine katkı sunmayı ve süpermarketlerin hangi ürünleri öncelikli olarak izlemesi gerektiğine dair veri temelli bir rehberlik sağlamayı hedeflemektedir. Çalışmada, 990 gözlem ve 16 özellik içeren "Grocery Inventory and Sales Dataset" adlı bir süpermarket envanter veri seti kullanılmıştır. Veri setinde doğrudan israf bilgisi bulunmadığından, satış hacmi, stok devir hızı ve raf ömrü gibi değişkenlere dayalı mantıksal kurallarla israf adında bir hedef değişken ve Raf Ömrü adında yeni bir özellik türetilmiştir. Veri ön işleme aşamasında kategorik değişkenler sayısal formata dönüştürülmüş ve tüm sayısal özellikler ölçeklendirilmiştir. Ürünlerin israf olasılıklarını saptamak amacıyla Yapay Sinir Ağı (ANN) ve Lojistik Regresyon (LR) modelleri tasarlanmış ve performansları 5 katlı çapraz doğrulama ile değerlendirilmiştir. 5 katlı çapraz doğrulama sonuçlarına göre, Yapay Sinir Ağı (ANN) modeli (%92-%93 doğruluk) Lojistik Regresyon (LR) modeline (%79-%84 doğruluk) kıyasla daha yüksek ve kararlı bir sınıflandırma performansı sergilemiştir. Performansı en yüksek 4. kat (fold 4) üzerinde yapılan değerlendirmede, ANN modeli ROC eğrisi altında kalan alan (AUC) değeri 0.98 olarak hesaplanırken, LR modeli 0.92 AUC değerine ulaşmıştır. ANN modelinin Kappa istatistiği (0.87) ve %95 AUC güven aralığı [0.969–0.994], LR modelinin Kappa (0.68) ve güven aralığı [0.886–0.956] ile karşılaştırıldığında, ANN modelinin daha güvenilir sonuçlar ürettiğini ortaya koymuştur. ANN modeli için 4. kat verileri üzerinden yapılan SHAP analizi, Raf Ömrü değişkeninin model kararlarındaki en baskın faktör olduğunu göstermiştir. ANN modelinin (AUC=0.98) karmaşık ve doğrusal olmayan veri ilişkilerini yakalamada üstün olduğu, lojistik regresyonun (AUC=0.92) ise lineer ilişkiler üzerinden daha yorumlanabilir tahminler sunduğu görülmüştür. ANN için yapılan SHAP analizi lojistik regresyon katsayılarının, raf ömrünün ve stok-satış ilişkilerinin model kararlarında belirleyici olduğunu doğrulamıştır. Özellik mühendisliği adımları, özellikle israf hedef değişkeninin ve raf ömrü özelliğinin türetilmesi, her iki modelin de performansını artırmada kritik bir rol oynamıştır. Çalışma, gıda israfını tahmin etmede yapay sinir ağlarının (AUC=0.98) lojistik regresyondan (AUC=0.92) daha başarılı olduğunu ve süpermarketlerin müdahale önceliklerini belirlemesi için veri temelli bir rehber sunduğunu göstermiştir. Gelecek çalışmalarda, modelin genellenebilirliğini ve istatistiksel geçerliliğini artırmak için farklı veri kaynaklarından elde edilen doğrudan gözlemsel israf verilerinin kullanılması önerilmektedir. Geliştirilen modelin uygulama potansiyelinin yalnızca perakende ile sınırlı olmadığı; hasat sonrası kayıplar ve tarımsal lojistik süreçleri gibi tarımsal üretim zincirinin erken aşamalarına da uyarlanabileceği belirtilmiştir. Bu veri temelli yaklaşımlar, su ve toprak gibi doğal kaynakların verimli kullanımını destekleyerek, karbon ayak izini azaltarak ve BM Sürdürülebilir Kalkınma Amacı 12 ile uyumlu olarak sürdürülebilir tarım politikalarına katkı sağlama potansiyeline sahiptir.