BİLDİRİLER

BİLDİRİ DETAY

Osman Ufuk EKİZ
REGRESYON ANALİZİNDE KALDIRAÇ VE AYKIRI GÖZLEMLER İLE ÇOKLU BAĞLANTI ARASINDAKİ ETKİLEŞİMLERE BAĞLI TAHMİN EDİCİ TERCİHİ
 
Giriş: Regresyon, istatistikte bağımlı değişken(ler) ile açıklayıcı değişken(ler) arasındaki ilişkinin modellenmesi yöntemidir. Bu yöntem, mühendislik, fizik, kimya, biyoloji, eğitim ve sosyal bilimler gibi hemen hemen tüm alanlarda farklı amaçlarla kullanılmaktadır. Bu yöntemde açıklayıcı değişkenler arasındaki yüksek ilişki olarak tanımlanan çoklu bağlantının varlığı, En Küçük Kareler (EKK) tahmin edicisinin ters işaretli olabilmesine ve varyansının şişmesine(inflate) sebep olmaktadır. Çoklu bağlantının istenmeyen bu etkilerinden kurtulmak için önerilen bir yaklaşım ridge regresyondur (Hoerl and Kennard (1970a)). Bir ya da daha fazla kaldıraç gözlemin varlığı çoklu bağlantının şiddetini etkileyebilmektedir. Bu çalışmada, çoklu bağlantıyı etkileyen gözlemler çoklu bağlantıya ne yönde etki ettiklerine göre "çoklu bağlantıyı-maskeleyen", "çoklu bağlantıya-neden olan" ve "çoklu bağlantıyı-şiddetlendiren" şeklinde üç gruba ayrılmıştır. Bunlar sırasıyla veriye eklemlendiklerinde çoklu bağlantı yokmuş, varmış ve olduğundan daha şiddetliymiş gibi gösteren gözlemler anlamına gelmektedir. Aykırı gözlemlerin EKK ve ridge yöntemler üzerindeki negatif etkilerinden kurtulmak için de literatürde önerilmiş pek çok robust tahmin edici yer almaktadır Rousseeuw, P. J. and Leroy, A. M. (1987)). Bu tahmin edicilerin özellikleri aykırı gözlemlerin , veya hem X hem Y yönünde olmasına bağlı olarak farklılık gösterebilmektedir. Veride çoklu bağlantı ve aykırı gözlemlerin birlikte bulunması durumunda ise ridge ve Liu tipi robust tahmin ediciler önerilmektedir(Olcay Arslan & Nedret Billor (2000), R. A. Maronna (2011), Silvapulle, M.J. (1991). Biz bu durum için bu çalışmada daha etkin oldukları bilinen robust tahmin ediciler RLS ve S'ye dayalı yeni ridge tipi robust tahmin edicileri önerdik. Ancak, çoklu bağlantı üzerinde etkili kaldıraç gözlemler ile , veya hem X hem Y yönünde aykırı gözlemlerin pek çok farklı kombinasyonlarının veride yer alması durumlarında, hangi tahmin edicinin daha iyi sonuç verdiğinin ayrımını yapmak pek kolay olmamaktadır. Bu ayrımı hata kare ortalaması (HKO), varyans(Var) ve sapmalar bakımından yapabilmek, aykırı ve kaldıraç gözlemlerin verideki oranlarına, kaldıraç gözlemin çoklu bağlantıya etkisinin ne yönde olduğuna("çoklu bağlantıyı-maskeleyen", "çoklu bağlantıya-neden olan" ve "çoklu bağlantıyı-şiddetlendiren"), çoklu bağlantının şiddetine ve aykırı gözlemlerin türüne (veride , veya hem hem yönünde bulunan aykırı gözlemler) bağlı olarak farklılık göstermektedir. Yöntem: Bu kombinasyonların her biri için, üzerinden tahmin edicilerin HKO, Varyans ve Sapmalarının Monte-Carlo tahminleri elde edilir. Elde edilen simülasyon sonuçlarında, tüm kombinasyonlardan hangisinde hangi tahmin edicinin daha iyi sonuç verdiği gözlemlenebilir olmaktadır. Bulgular: Veri setinde sadece çoklu bağlantı, sadece aykırı gözlem veya çoklu bağlantı ile aykırı gözlemlerin birlikte yer alması durumlarına göre hangi tahmin edicilerin daha iyi olduğu şeklinde bir sınıflama yapmanın doğru olmayacağı, bunun üzerinde çoklu bağlantının şiddetinin, kaldıraç çoklu bağlantı ilişkisinin, aykırı gözlem oranının ve aykırı gözlemlerin hangi yönde olduklarının çok önemli olduğu yapılan simülasyon çalışmasına dayalı elde edilmiş HKO, Varyans ve Sapma değerleri üzerinden görülmüştür. Sonuç: Tüm bu tahmin ediciler içerisinde varyansları bakımından bir inceleme yapıldığında, veride sadece kaldıraç gözlem olması durumunda RR3, çoklu bağlantı ve aykırı gözlem varlığında sapmasız olanlar içinde RLS ve S, sapmalı olanlar içinde ise RTS 'nin daha öne çıktığı görülmektedir. Çoklu bağlantının gizlenmiş, neden olunmuş veya şiddetlendirilmiş olmasına ve aykırı gözlem oranına bağlı olarak farklı tahmin edicilerin varyanslarının daha küçük çıktığı gözlemlenmiştir. Veride "çoklu bağlantıya neden olan kaldıraç" varken sırasıyla X, Y ve hem X hem Y yönünde aykırı gözlemlerinde olması durumların da varyanslar bakımından Ridge tipi robust tahmin edicilerin aksine robust tahmin edici olan RLS'nin öne plana çıktığı görülmektedir. Buda veride çoklu bağlantı ve aykırı gözlem varken ridge tipi robust tahmin edicilerin kullanılması önerisine ters düşmektedir. Hawkins et. al. (1984) verisi üzerinde yapılan uygulamadan elde edilen sonuçlar bu bulgularla uyum göstermektedir.

Anahtar Kelimeler: Regresyon Analizi, Çoklu Bağlantı, Kaldıraç, Aykırı Değer, Ridge, Robust



 


Keywords: