SUBMISSIONS

SUBMISSION DETAIL

Osman Ufuk EKÝZ
 


Keywords:



REGRESYON ANALÝZÝNDE KALDIRAÇ VE AYKIRI GÖZLEMLER ÝLE ÇOKLU BAÐLANTI ARASINDAKÝ ETKÝLEÞÝMLERE BAÐLI TAHMÝN EDÝCÝ TERCÝHÝ
 
Giriþ: Regresyon, istatistikte baðýmlý deðiþken(ler) ile açýklayýcý deðiþken(ler) arasýndaki iliþkinin modellenmesi yöntemidir. Bu yöntem, mühendislik, fizik, kimya, biyoloji, eðitim ve sosyal bilimler gibi hemen hemen tüm alanlarda farklý amaçlarla kullanýlmaktadýr. Bu yöntemde açýklayýcý deðiþkenler arasýndaki yüksek iliþki olarak tanýmlanan çoklu baðlantýnýn varlýðý, En Küçük Kareler (EKK) tahmin edicisinin ters iþaretli olabilmesine ve varyansýnýn þiþmesine(inflate) sebep olmaktadýr. Çoklu baðlantýnýn istenmeyen bu etkilerinden kurtulmak için önerilen bir yaklaþým ridge regresyondur (Hoerl and Kennard (1970a)). Bir ya da daha fazla kaldýraç gözlemin varlýðý çoklu baðlantýnýn þiddetini etkileyebilmektedir. Bu çalýþmada, çoklu baðlantýyý etkileyen gözlemler çoklu baðlantýya ne yönde etki ettiklerine göre "çoklu baðlantýyý-maskeleyen", "çoklu baðlantýya-neden olan" ve "çoklu baðlantýyý-þiddetlendiren" þeklinde üç gruba ayrýlmýþtýr. Bunlar sýrasýyla veriye eklemlendiklerinde çoklu baðlantý yokmuþ, varmýþ ve olduðundan daha þiddetliymiþ gibi gösteren gözlemler anlamýna gelmektedir. Aykýrý gözlemlerin EKK ve ridge yöntemler üzerindeki negatif etkilerinden kurtulmak için de literatürde önerilmiþ pek çok robust tahmin edici yer almaktadýr Rousseeuw, P. J. and Leroy, A. M. (1987)). Bu tahmin edicilerin özellikleri aykýrý gözlemlerin , veya hem X hem Y yönünde olmasýna baðlý olarak farklýlýk gösterebilmektedir. Veride çoklu baðlantý ve aykýrý gözlemlerin birlikte bulunmasý durumunda ise ridge ve Liu tipi robust tahmin ediciler önerilmektedir(Olcay Arslan & Nedret Billor (2000), R. A. Maronna (2011), Silvapulle, M.J. (1991). Biz bu durum için bu çalýþmada daha etkin olduklarý bilinen robust tahmin ediciler RLS ve S'ye dayalý yeni ridge tipi robust tahmin edicileri önerdik. Ancak, çoklu baðlantý üzerinde etkili kaldýraç gözlemler ile , veya hem X hem Y yönünde aykýrý gözlemlerin pek çok farklý kombinasyonlarýnýn veride yer almasý durumlarýnda, hangi tahmin edicinin daha iyi sonuç verdiðinin ayrýmýný yapmak pek kolay olmamaktadýr. Bu ayrýmý hata kare ortalamasý (HKO), varyans(Var) ve sapmalar bakýmýndan yapabilmek, aykýrý ve kaldýraç gözlemlerin verideki oranlarýna, kaldýraç gözlemin çoklu baðlantýya etkisinin ne yönde olduðuna("çoklu baðlantýyý-maskeleyen", "çoklu baðlantýya-neden olan" ve "çoklu baðlantýyý-þiddetlendiren"), çoklu baðlantýnýn þiddetine ve aykýrý gözlemlerin türüne (veride , veya hem hem yönünde bulunan aykýrý gözlemler) baðlý olarak farklýlýk göstermektedir. Yöntem: Bu kombinasyonlarýn her biri için, üzerinden tahmin edicilerin HKO, Varyans ve Sapmalarýnýn Monte-Carlo tahminleri elde edilir. Elde edilen simülasyon sonuçlarýnda, tüm kombinasyonlardan hangisinde hangi tahmin edicinin daha iyi sonuç verdiði gözlemlenebilir olmaktadýr. Bulgular: Veri setinde sadece çoklu baðlantý, sadece aykýrý gözlem veya çoklu baðlantý ile aykýrý gözlemlerin birlikte yer almasý durumlarýna göre hangi tahmin edicilerin daha iyi olduðu þeklinde bir sýnýflama yapmanýn doðru olmayacaðý, bunun üzerinde çoklu baðlantýnýn þiddetinin, kaldýraç çoklu baðlantý iliþkisinin, aykýrý gözlem oranýnýn ve aykýrý gözlemlerin hangi yönde olduklarýnýn çok önemli olduðu yapýlan simülasyon çalýþmasýna dayalý elde edilmiþ HKO, Varyans ve Sapma deðerleri üzerinden görülmüþtür. Sonuç: Tüm bu tahmin ediciler içerisinde varyanslarý bakýmýndan bir inceleme yapýldýðýnda, veride sadece kaldýraç gözlem olmasý durumunda RR3, çoklu baðlantý ve aykýrý gözlem varlýðýnda sapmasýz olanlar içinde RLS ve S, sapmalý olanlar içinde ise RTS 'nin daha öne çýktýðý görülmektedir. Çoklu baðlantýnýn gizlenmiþ, neden olunmuþ veya þiddetlendirilmiþ olmasýna ve aykýrý gözlem oranýna baðlý olarak farklý tahmin edicilerin varyanslarýnýn daha küçük çýktýðý gözlemlenmiþtir. Veride "çoklu baðlantýya neden olan kaldýraç" varken sýrasýyla X, Y ve hem X hem Y yönünde aykýrý gözlemlerinde olmasý durumlarýn da varyanslar bakýmýndan Ridge tipi robust tahmin edicilerin aksine robust tahmin edici olan RLS'nin öne plana çýktýðý görülmektedir. Buda veride çoklu baðlantý ve aykýrý gözlem varken ridge tipi robust tahmin edicilerin kullanýlmasý önerisine ters düþmektedir. Hawkins et. al. (1984) verisi üzerinde yapýlan uygulamadan elde edilen sonuçlar bu bulgularla uyum göstermektedir.

Anahtar Kelimeler: Regresyon Analizi, Çoklu Baðlantý, Kaldýraç, Aykýrý Deðer, Ridge, Robust