Özet:
Sürekli İzleme Merkezi (SİM) istasyonlarının mekânsal dağılımlarının yetersizliği nedeniyle açık kaynak veri setleri kullanılarak yersel NO2 kirleticisinin dağılımının belirlenme hassasiyetini artırmak amacıyla modelleme çalışması yapılmıştır. Çalışmada veri mevcudiyeti en yüksek 2021 yılı Ankara merkezindeki 15 adet SİM istasyonun (Bahçelievler, Demetevler, Etimesgut, Keçiören-Sanatoryum, Ostim, Sincan, Siteler, Törekent, Yaygınlaştırma-Mamak, Yaygınlaştırma-Çankaya, Polatlı, Çubuk, Ulus-Trafik, Sıhhiye ve Yaşamkent) aylık NO2 yersel ölçüm verisi, Sentinel5P Tropomi'nin NO2 uydu görüntüsü, alınan bulut optik derinliği, Terraclimate'in en düşük sıcaklık, en yüksek sıcaklık, buhar basıncı, buhar basıncı açığı, rüzgar hızı ile NOAA/VIIRS'in Ortalama Işık Parlaklık Değeri verileri makine öğrenme teknikleri kullanılarak NO2 yersel ölçüm verisi tahmin modeli oluşturulmuştur. Çalışmanın istatistiki değerlendirmesinde Çoklu Doğrusal Regresyonu (ÇDR), Temel Bileşen Regresyonu (TBR) ve En Küçük Kareler Regresyonu (KEKKR) metotları kullanılmıştır. ÇDR değişkenler arasındaki ilişkiyi doğrudan irdelemek temelinde iken TBR ve KEKKR yüksek ilişkili tahmin değişkenleri içeren modellerde başarı gücü nedeniyle tercih edilmiş ve uygulanmıştır. Aylık NO2 yersel ölçüm, NO2 uydu bazlı ölçüm, optik derinlik, en düşük sıcaklık, en yüksek sıcaklık, buhar basıncı açığı, rüzgar hızı ile ortalama ışık parlaklık parametreleri ÇDR, TBR ve KEKKR gibi tahmin modeli çalışmalarında kullanılmıştır. Her bir tekniğin model performans belirlenmesi amaçlanmış ve elde edilen modelin tahmin değerlerinin gerçek ölçüm değerleri ile istatiksel analiz parametreleri hesaplanmış ve karşılaştırması yapılmıştır. Çalışma sonucunda ÇDR'nin değişkenler arasındaki ilişkiyi doğrudan ele alamadığı, çoklu bağlantı sorunu yaşanma riski bulunduğu bulgular ile elde edilmiştir. TBR ve KEKKR'nin ise yüksek ilişkili değişkenlerin ortaya çıkardığı çoklu bağlantı sorununa çözüm getirdiği ve başarılarının ÇDR'ye göre daha yüksek olduğu çalışma bulguları ile elde edilmiştir. Elde edilem model ile daha az hata ve yüksek korelasyon olan model oluşturulmuştur. ÇDR, TBR ve KEEKR metot uygulamalarında sırasıyla 0.27, 0.48, 0.49 Düzeltilmiş R kare değerleri elde edilmiştir. Çoklu doğrusallık problem etkisinin giderilmesi ile ÇDR'ye oranla yüksek ilişki oranları elde edilmiştir. TBR ve KEKKR makine öğrenme metotları ile oluşturulan modelin NO2 yersel ölçüm değişkenini sırasıyla %87 , %85 açıkladığı tespiti yapılmıştır.