Uyku Sağlığı ve Yaşam Tarzı Verilerinin Makine Öğrenmesi Yöntemleriyle Analizi


Yılmaz T., Jolaq A. S. A., Tekin U., Dener M.

YOBU International Middle Anatolian Symposium, Yozgat, Türkiye, 16 - 18 Mayıs 2024, cilt.1, sa.1, ss.1

  • Yayın Türü: Bildiri / Özet Bildiri
  • Cilt numarası: 1
  • Basıldığı Şehir: Yozgat
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.1
  • Yozgat Bozok Üniversitesi Adresli: Evet

Özet

Uyku, genel olarak insan sağlığı, yaşam tarzı ve hayat standardını korumaya yönelik hayati bir önem taşımaktadır. Nitekim, pek çok faktör uyku kalitesini ve süresini önemli ölçüde etkileyebilmektedir. Bu faktörlerin en başında iş yükü, kişinin yaşadığı stres düzeyi gibi parametreler gelmektedir. Çalışmada kullanılan uyku sağlığı ve yaşam tarzı veri seti, günlük alışkanlıklarla ilgili çok çeşitli değişkenleri kapsayan bir veri setinden oluşmaktadır. Veri kümesinin temel özellikleri; (I) Kapsamlı uyku metrikleri: veri kümesi uyku süresi, kalitesi ve uyku düzenini etkileyen faktörlerle ilgili değişkenleri içerir. Bu ölçümler uykuyla ilgili hususların ayrıntılı bir analizine olanak tanır. (II) Yaşam tarzı faktörleri: çeşitli meslek grupları, fiziksel aktivite düzeyleri ve stres seviyeleri gibi çeşitli yaşam tarzı faktörleri hakkında bilgi sağlar. Bu değişkenler, yaşam tarzı seçimlerinin uyku sağlığını nasıl etkilediğinin araştırılmasına olanak tanır. (III) Kalp ve Damar Sağlığı: Kan basıncı ve kalp atış hızı ölçümleri veri setinde yer almaktadır. Bu değişkenler kalp-damar sağlığı ile uyku ile ilişkili faktörler arasındaki ilişkinin incelenmesine olanak sağlamaktadır. (IV) Uyku Bozukluğu Analizi: Uykusuzluk ve Uyku Apnesi gibi uyku bozukluklarının varlığı veya yokluğu veri setinde belirtilir. Bu bilgi, uyku bozukluklarının diğer değişkenler bağlamında tanımlanmasına ve analiz edilmesine olanak sağlar. Analiz sonucunda; Kimin uyku kalitesi daha kötü, erkekler mi yoksa kadınlar mı? İnsanların uyku kalitesi ile meslekleri arasında bir ilişki var mı? Uyku süresi ve kalitesi en kötü olan meslek grupları nelerdir? Uyku süresi ve kalitesi en iyi olan meslekler nelerdir? En stresli olanlar, erkekler mi yoksa kadınlar mı? En çok uyku düzensizliği yaşayan meslek grubu hangisidir? soruları yanıt bulmuş olacaktır. Bu çalışmada, veri seti analizi için Logistic Regression (LR), Gaussian Naive Bayes (GNB), Decision Tree (DT) ve Support Vector Machine (SVM) öğrenme algoritmaları kullanılmış ve sırasıyla %96,77, %93,54, %90,32 ve %96,77 başarı oranı elde edilmiştir. Modellerin eğitim sürelerine bakıldığında ise LR’nin 0,02 sn., GNB’nin 0,009 sn., DT’nin 0,009 sn., SVM’nin 0,005 sn olduğu görülmüştür. Bu çalışma sonucunda en başarılı sonuç veren algoritmanın Logistic Regression ve Support Vector Machine, en hızlı çalışan algoritmanın ise Support Vector Machine olduğu tespit edilmiştir.

Sleep is of vital importance for maintaining human health, lifestyle and standard of living in general. As a matter of fact, many factors can significantly affect the quality and duration of sleep. The most important of these factors are parameters such as workload and the stress level experienced by the person. The sleep health and lifestyle dataset used in the study consists of a dataset that covers a wide range of variables related to daily habits. The main features of the dataset; (I) Comprehensive sleep metrics: the dataset includes variables related to sleep duration, quality, and factors that affect sleep patterns. These measurements allow for a detailed analysis of sleep-related considerations. (II) Lifestyle factors: provides information on various lifestyle factors, such as various occupational groups, physical activity levels, and stress levels. These variables allow for the investigation of how lifestyle choices affect sleep health. (III) Cardiovascular Health: Blood pressure and heart rate measurements are included in the dataset. These variables allow the relationship between cardiovascular health and sleep-related factors to be examined. (IV) Sleep Disorder Analysis: The presence or absence of sleep disorders such as Insomnia and Sleep Apnea is indicated in the dataset. This information allows sleep disorders to be identified and analyzed in the context of other variables. As a result of the analysis; Who has worse sleep quality, men or women? Is there a relationship between people's sleep quality and their occupation? What are the occupational groups with the worst sleep duration and quality? What are the professions with the best sleep duration and quality? Are men or women the most stressed? Which occupational group has the most sleep disorders? Their questions will be answered. In this study, Logistic Regression (LR), Gaussian Naive Bayes (GNB), Decision Tree (DT) and Support Vector Machine (SVM) learning algorithms were used for data set analysis and 96.77%, 93.54%, 90.32% and 96.77% success rates were obtained, respectively. When the training times of the models were examined, it was seen that LR was 0.02 s., GNB was 0.009 s., DT was 0.009 s., SVM was 0.005 s. As a result of this study, it was determined that the algorithm that gave the most successful results was Logistic Regression and Support Vector Machine, and the fastest running algorithm was Support Vector Machine.