Stata ile Ekonometrik Analiz Yöntemleri
Stata Programında Ekonometrik Analiz Yaptırma
Stata, verileri saklamanıza ve yönetmenize, verileriniz üzerinde istatistiksel analizler yapmanıza ve anlaşılır görselliğe sahip grafikler oluşturmanıza olanak sağlayan bir yazılımdır. Genel amaçlı bir yazılım programı olan Stata, StataCrop tarafından 1985 yılında geliştirilmiştir. Program, istatistiksel analiz, veri yönetimi, grafik, simülasyon ve özel programlama gibi alanlarda kullanılmaktadır. Günümüz dünyası artık çok daha hızlı veri üretir hale gelmiştir. Bu verilerin analiz edilmesi bireyler, şirketler ve ülkeler için stratejik kararlarını almak noktasında çok önemlidir. Panel veri zaman serileri ve kesit verilerinin kombinasyonundan oluşan veriyi ifade eder. Bu panel veri setlerinin stratejik kararlar açısından analiz edilmesi ve politika oluşturulması anlamlı sonuçlar vermektedir. Böylece panel veri analizi ile yalnızca yatay kesit veya zaman serisi analizi kullanılarak ele alınamayan dinamikleri ele almak mümkün hale gelmektedir. Panel veri analizi, farklı birimlerarası farklılıkları anlamak için bir yol gösterici olabilmektedir. Ekonometrik analizleri gerçekleştirmek için Stata,SPSS, SAS, Eviews, R, Matlab ve Gauss programları kullanılmaktadır. Bu durumda aklınıza gelen ilk soru neden Stata’yı tercih ediyoruz olacaktır. Stata’yı tercih etmemizin başlıca nedenleri arasında büyük veri setlerinin kullanımına ve düzenlenmesine izin vermesi ve panel ve zaman serisi regresyon analizleri için sürekli gelişme göstermesidir. Ayrıca Stata belirli bir ihtiyacı olan kullanıcılar tarafından sürekli olarak güncellenmekte veya geliştirilmektedir. Veri Girişi Stata xls, xlsx, csv, dta, txt ve bazı istatistik programlarının kendi uzantılı dosyalarında yer alan veri setlerini çekebilmektedir. Veri Setine Ait Tanımlayıcı İstatistikler: Ekonometrik analize başlamadan önce, elinizdeki veri setini tanımanız gereklidir. Ekonometrik analize başlamadan önce, her zaman tüm değişkenlerin frekanslarını, kategorik değişkenlerin nasıl kodlandığını, minimum, maksimum değerleri ve kayıp gözlem sayısını kontrol etmelisiniz. Bu, veri setindeki uç noktaları ve olası hataları ortaya çıkarmanın en iyi yoludur. Veri Seti ile Yapılan Temel İşlemler: Stata, veriyi numerik veya metin (string) olmak üzere iki şekilde saklar. Stata’nın metin olarak sakladığı veriler belirli bilgiler vermek için kullanılır. Stata’da eğer bir veri metin olarak saklanmıyorsa o veri mutlaka numerik olarak saklanmaktadır. Grafik Çizme: Değişkenler arasında nasıl bir ilişki olduğunu görmek için tercih edilen yollardan biri grafik çizmektir. Stata’da bar, nokta, kutu, pasta ve dağılım grafikleri çizilebilmektedir. Stata çizilen grafikler üzerinde değişiklik yapmak, not ve başlık eklemek açısından oldukça esnektir.
Ekonometrik modelleme ekonomi ve finans alanında çok önemlidir. Birçok ekonomik ve finansal araştırma ve makale panel verisi de dahil olmak üzere ekonometrik modeller kullanılarak yapılmıştır. Ekonometrik analizlerinde en çok kullanılan model Panel veri analizidir.
Panel veri analizi, çapraz kesit verilerinin ve zaman serisi verilerinin avantajlarını birleştirerek daha kesin sonuçlar elde edilmesini sağlar. Bu yöntem, bireyler, firmalar veya ülkeler gibi farklı birimler arasındaki değişiklikleri ve zaman içindeki değişiklikleri gözlemlemeye olanak tanır. Böylelikle, analiz edilen verilerin doğruluğu ve güvenilirliği artar.
Ekonometrik analizlerinde, bu model çok boyutlu ve farklı zamanlarda ölçülen bilgilerden oluşmaktadır.
Panel (veri), gözlemlerin belirli bir zaman diliminde (T) sıklıkla rastgele seçilen çok sayıda yatay kesit değişkeni (N) tarafından incelendiği bir veri setilerin analiz modelidir. Başka bir deyişle, yatay kesit veri özellikleri iki yıl veya daha uzun süre inceleniyorsa, ortaya çıkan gözlem yapısına bileşik panel seti veya boylamsal panel veri seti adı verilir. Bu veri seti, özellikleri zaman içinde tekrarlanan herhangi bir nesne, canlı vb. kümesini içerir, çünkü birleştirilmiş veriler, uygun istatistiksel açıklayıcı modeller kullanılarak hem zaman serilerinin hem de kesit verilerinin özelliklerini içerir.
Panel ekonometrisinde panel veriler üzerinde yapılan analizlere panel analizleri (Panel data analysis) de denmektedir. Panel analizi yönteminde öncelikle ülke, bölge, eyalet vb. gibi belirli bir bölüm ele alınır ve bu değişkenlerin özellikleri istenilen zaman dilimindeki tüm bölümler için incelenir. Veri sayısının her zaman noktasında eşit olması gerekli değildir; incelenen zaman dilimi için bir zaman noktasında sabit olan değişkenlerin olması da mümkündür. Bileşik veri seti kullanmanın, zaman serisi ve kesitsel verilere göre birçok avantajı vardır ve bu avantajlar, daha büyük veri hacmine ve zaman serisi ile kesitsel verilerin özelliklerinin birleşimine dayanır.
Panel Veri Analizi ve Uygulama Alanları
Zamana göre değişen veriler ile hayatımızın her noktasında karşılaşıyoruz. Firmaların, ülkelerin, hastanelerin; kısacası çok sayıda birimin farklı zamanlarına ait değişkenlerini analiz etmek istiyoruz. Panel veri analizi, zamana göre elde ettiğimiz değişkenler üzerinden analiz yapmamızı sağlayan ekonometrik yöntemler topluluğunu içeriyor. Yalnızca tek bir zaman periyoduna ait verilerimiz çapraz kesitsel verilerdir. Zamana göre çapraz kesitsel verilerin birleşiminden oluşan veri türlerine panel veri; bu tür verileri analiz etmek için kullandığımız ekonometrik-istatistiksel analiz tekniklerinin birleştiği alana da panel veri analizi diyoruz.
Panel veri analizi hangi alanlarda uygulanıyor?
Ekonomi, finans, sağlık, endüstri, işletme gibi alanlarda da panel veri analizi karşımıza çıkıyor. Panel Veri Analizi ve Yazılımları: Panel veri analizini uygulamak için farklı ekonometrik analiz programlarından yararlanabiliriz. Yaygın olarak kullanılan yazılımdan söz edebiliriz: Stata yazılımı E-Views yazılımı R Programı Stata yazılımında çok sayıda farklı seçenek bulunuyor. Programda hem sayısal, hem de kategorik bağımlı değişkene sahip olan panel veriler için analiz seçenekleri bulunuyor. Kategorik bağımlı değişkenlerin yer aldığı panel veri analizi yaklaşımları için Stata’da Probit tahminci seçeneği mevcut olmaktadır. Stata programında ister kod yazarak, ister menüler üzerinden panel verilerimizi analiz edebiliyoruz. Stata’da kod yazarak alternatif modellere yönelik panel veri analizlerini uygulamak mümkün olmaktadır. E-Views programında da farklı analiz seçeneklerini kullanabiliyoruz. Sabit etki modeli, rassal etki modeli, birleştirilmiş (pooled) tahmin modeli gibi alternatif teknikleri kullanabiliriz. R Programında da panel verilerimizi analiz edebilmek için kullanacağımız onlarca farklı yaklaşım bulunuyor. Diğer programlarda olan tahmin teknikleri, varsayımsal sınamaları ve alternatif modelleri R programı sayesinde kolaylıkla uygulayabiliyoruz. R programında bağımlı değişkenin farklı dağılımları için Genelleştirilmiş Lineer Modeller kapsamında panel veri analizi yöntemleri bulunuyor. Bu tür farklı teknikler için tasarlanmış plm, pglm gibi muhteşem R paketlerini kullanabiliyoruz. Ancak R programı henüz yaygın olarak kullanılmadığı için araştırmacılar tarafından pek tanındığını söyleyemeyiz. Türkçe yayınlanan makalelerin büyük çoğunluğunda, panel veri analizi sonuçlarının Stata tarafından alındığını gözlemliyoruz. Stata ile panel veri analizi, özellikle akademik makalelerde dikkat çekiyor. Stata, E-Views ve R dışında Gauss gibi farklı yazılımları da kullanabiliriz. Stata ile panel veri analizi tekniklerinin uygulanması, en sık başvurulan yolların başında geliyor. Ancak Minitab, SPSS gibi klasik istatistiksel analiz programlarında panel verilere özgü yaklaşımlar mevcut değil. Bu tür klasik yazılımlar için sentaks kullanmak da faydasız… Panel veri analizi oldukça kapsamlı bir konu ve model seçiminden varsayımların test edilmesine değin uzanan farklı konu başlıkları bu analiz kapsamında yer alıyor. Panel veri analizine başlamadan önce durağanlık, otokorelasyon, değişen varyans gibi çeşitli varsayımların da test edilmesi gerekiyor. Söz konusu varsayımların sağlanmadığı durumlar için de ekonometri literatüründe özel dayanıklı (robust) tahmin teknikleri öneriliyor. Dayanıklı teknikler kapsamında Driscoll-Kraay gibi mükemmel sonuçlar verebilen tekniklere başvurabiliyoruz. Etki türünün seçimi de panel veri analizinde önemli bir yer tutuyor. Hausman testi, Lagrange Çapranı testi gibi farklı test isimleri bu noktada bilimsel yayınlar içerisinde görülebiliyor. Panel verilerin dengeli mi, dengesiz mi olduğu da analiz noktasında önem arz ediyor. Özetle zamana bağlı kesitsel veriler ile çalıştığımızda, dikkat etmemiz gereken çok nokta var. Bu yazımızda panel veri analizine ilişkin kısa bir giriş yapmak istedik ve bu analiz teknikleri ile ilgili başlıca ekonometrik analiz programlarını tanıtmaya çalıştık. Panel veri analizinin başlı başına bir analiz dünyasına sahip olduğunu söylesek, abartmış sayılmayız. Gelecek yazılarımızda Haussman testi, Breusch-Pagan testi, en uygun modelin seçimi ve modellerin yorumlanması üzerine farklı içerikleri paylaşmaya devam edeceğiz.
Stata ile Regresyon Analizi
- Tek Değişkenli Regresyon Analizi: Regresyon analizi bağımlı değişken ile bir veya daha fazla bağımsız değişken arasındaki ilişkiyi inceleyen bir analiz yöntemidir. Analiz bir bağımsız değişkenle gerçekleşirse tek değişkenli regresyon analizi olarak adlandırılır.
- Hata Terimleri İçin Normallik Testi: Hata terimlerinin normal dağılıp dağılmadığını test etmek için Jarque-Bera testi kullanılmaktadır. Stata’da bu testi yapmak için hazır bir komut bulunmamaktadır.
- Yapısal Farklılaşma için Chow Testi: Stata’da Chow testi yapmak için yine hazır bir komut bulunmamaktadır. Bu test birkaç adımda yapılabilmektedir.
- Çok Değişkenli Regresyon Analizi: Analiz birden fazla bağımsız değişken ile gerçekleşirse çok değişkenli regresyon analizi olarak adlandırılır.
Tahmin Sonrası Testler
- Çoklu Doğrusallık: Çoklu doğrusallık sorunu ekonometrik bir modelde açıklayıcı değişkenler arasındaki ilişkinin derecesi yüksek olduğunda ortaya çıkar. Çoklu doğrusallığın varlığı Korelasyon Katsayıları ve Varyans Şişirme Faktörü ile araştırılmaktadır.
- Korelasyon Katsayısı: Açıklayıcı değişkenler arasındaki ilişkinin derecesini gösteren korelasyon katsayısı 1’e eşit ise tam çoklu doğrusallık, 0.8 ve 1 arasında değer alıyorsa tam olmayan çoklu doğrusallık sorununun var olduğu anlamına gelmektedir.
- Varyans Şişirme Faktörü: Varyans şişirme faktörü çoklu doğrusallık sorununun varlığını araştırmak için kullanılan diğer bir yöntemdir. Her bir değişken için hesaplanan VIF değerleri 10’dan yüksek değer alıyorsa bu çoklu doğrusallık sorununun olduğunu gösterir. VIF değerlerini elde etmek için önce ele alınan model tahmin edilir.
- Değişen Varyans Testi: Değişen varyans, hata terimlerinin varyanslarının birbirinden farklı olmasıdır, Değişen varyansın belirlenmesi için Grafik İncelemesi’ne gidilebileceği gibi White ve ARCH-LM testleri de kullanılabilmektedir.
- Grafik İnceleme: Değişen varyansın varlığını belirlemek için kullanılabilecek bir yöntem hata terimleri ile bağımlı değişkenin tahmini değerleri arasındaki ilişkinin incelenmesidir.
- White Testi: White testi asıl denklem ve bağımlı değişkeni, hata terimlerinin tahmini değerlerinin karesi açıklayıcı değişkenleri ise asıl denklemde kullanılan açıklayıcı değişkenlerin kendisi, karesi ve çarpımlarından oluşan bir yardımcı denklem ile gerçekleştirilir. Değişen varyans testlerini gerçekleştirmeden önce Stata’ya elimizdeki veri setinin zaman serisi olduğunu tanıtmamız gerekmektedir.
- ARCH-LM Testi: Değişen varyansın varlığını tespit etmek için kullanlan bir diğer test ARCH-LM Testi’dir. Bu test yöntemi regresyon denkleminin yanında bağımlı değişkeni, hata terimlerinin tahmini değerlerinin karesi açıklayıcı değişkenleri ise hata terimlerinin tahmini değerlerinin gecikmeli değerlerinden oluşan bir denklem yardımıyla değişen varyansı test etmektedir.
- Genelleştirilmiş En Küçük Kareler (GEKK): Genelleştirilmiş En Küçük Kareler, değişen varyansın formunun tam olarak bilindiği takdirde, değişen varyans sorununu ortadan kaldırmak için kullanılan bir tahmin yöntemidir. GEKK yöntemi ile asıl denklemden dönüştürülmüş bir denklem elde edilir ve daha sonra bu dönüştürülmüş denklem EKK ile tahmin edilir. Dönüştürülmüş denkleme EKK uygulanması Ağırlıklı EKK (weighted least squares) olarak adlandırılır.
- Ardışık Bağımlılık Testi: Ardışık bağımlılığın nasıl tespit edileceği hakkında bilgi vermeye geçmeden önce ardışık bağımlılığın ne olduğunu tanımlayalım. Ardışılık bağımlılık, hata terimleri arasında ilişki olması (E(ui , uj ) ̸= 0, i ̸= j) durumudur. Burada ardışık bağımlılığın varlığı Grafik İncelemesi ve iki farklı ardışık bağımlılık testi kullanılarak araştırılacaktır. Bu testlerden ilki Durbin-Watson, ikincisi ise Breusch-Godfrey LM testidir.
- Grafik İnceleme: Hata terimlerinin zaman içindeki seyri ardışık bağımlılığın varlığı hakkında bizlere bilgi verebilmektedir. Bu doğrultuda aşağıdaki adımlar takip edilerek hata terimlerinin zamana karşı grafiği çizdirilebilir. Durbin-Watson Testi Durbin-Watson testi, hata terimlerinde birinci sıra AR(1) ardışık bağımlılık olup olmadığını kontrol etmek için kullanılan bir testtir. Bu testler bir takım varsayımlar altında çalışmaktadır. Breusch-Godfrey LM Testi Breusch-Godfrey LM testi, Durbin-Watson testindeki sınırlamaları aşan daha yüksek derecede ve AR sürecinin yanında MA sürecini de dikkate alan bir testtir. Bu testi gerçekleştirmek için yine öncelikle ele alınan modelin tahmin edilmesi gereklidir.
Zaman Serisi Analizi
Zaman serileri nedir?
Günümüz ekonomik ortamında, geleceğe yönelik sağlam tahminler yapmak işletmeler ve araştırmacılar için hayati öneme sahiptir. Ekonometride zaman serileri en çok kullanılan veri türlerinden biridir. Zaman serileri, zaman sırasına göre dizine alınan (veya listelenen veya işaretlenen) bir veri noktaları dizisidir. Dolayısıyla, bu tür veri ayrık zamanlı bir veri dizisidir. Zaman serisi modeller Eviews ve Stata yazılımlarıyla yapılır ve özellikle finans ve ekonomi alanlarında yoğunlukla kullanılır.
Zaman serisi modelleri nedir?
Bir zaman serisinin modellenmesi, içindeki süreçlerin türünü ve sırasını belirlemek anlamına gelir. Zaman serisi modellenmesinde Eviews ve Stata yazımlarını kullanabilirsiniz. Modelleme sürecinde aşağıdaki adımların yapılması gerekir:
- Modelin tanımlanması
- Model uyumu
- Uyumlu modelin değerlendirilmesi
- Gözlenen serinin davranışını açıklayacak ve geleceğini tahmin edecek bir modelin uygun olduğu düşünülmektedir.
Zaman (serisi) durağan olduğunda; Kapsamlı ARMA modeli serinin değişikliklerini açıklayabilir ancak zaman (serisi) durağan olmadığında öncelikle birikim derecesi (d) belirlenmeli, daha sonra ARIMA süreci ile zaman serisi modellemesi yapılmalıdır. Yani kısaca bir zaman serisini modellemenin aşağıdaki soruların yanıtlanmasını gerektirdiği söylenebilir:
- Seri durağan mıdır? Kaç tane farklılaştırmayla durağan olacaktır?
- Süreç bir Otoregresif Modeli midir? Eğer öyleyse, derecesi nedir? Süreç hareketli bir ortalama modeli midir? Eğer öyleyse, derecesi nedir?
EViews ile Panel Veri Analizin Avantajları
Panel veri analizlerin kullanmasının başlıca avantajları şunlardır: Bileşik verilerde gözlem ve veri sayısı genellikle çok daha fazla olup tahminlere olan güveni artırır. Araştırmacıların daha gelişmiş modelleri daha az bağlayıcı hipotezlere sahip olacak şekilde açıklamasına ve test etmesine olanak tanır. Gözlem sayısının fazla olması ekonometrideki eşdoğrusallık (kolinearite) sorununu büyük ölçüde çözmektedir. Veriler hem zamanla hem de insanlar arasında değiştiğinden, değişkenlerin birbirleriyle aynı doğrultuda olma olasılığı daha düşüktür. Bireysel heterojenliği kontrol etmek. Uyum dinamiklerini çalışmak daha kolay. Daha gelişmiş modeller oluşturmak ve test etmek daha kolay. Panel veri tahminlerinde kullanılan iki tip etki modeli vardır: sabit efektler ve rastgele efekt modelleri. Verilere bağlı olarak, panel veri regresyonlarında kullanım için farklı yöntemler uygundur.
Bu, yalnızca etkileri ölçmek değil, aynı zamanda nihai politika başarısını veya başarısızlığını yönlendiren etiyolojik mekanizmaları bilmek de önemli olduğundan, “kara kutu” sonuçlarından kaçınma umuduyla yapılmaktadır.
Uygun bir nicel değerlendirme tasarımı, en az üç temel nitel yönü dikkate almalıdır: (1) politikanın uygulandığı siyasi, kurumsal ve normatif bağlam (çevre); (2) ilgili kamu ve özel kuruluşların davranışlarının altında yatan motivasyonların ve teşvik mekanizmalarının net bir şekilde anlaşılması; (3) müdahalenin yarattığı doğrudan ve potansiyel olarak dolaylı etkilerin net bir şekilde tanımlanması. Ekonometrik etki değerlendirmesinin etkili olabilmesi için ayrıca şu ön koşullar da önemlidir: (1) ilan edilen politika hedeflerine dayalı uygun bir değerlendirme tasarımı; (2) ayrıntılı ve iyi belgelenmiş veri ve bilgiler; (3) yararlanıcıların ve yararlanmayanların geniş ve uygun bir şekilde kapsanması; ve (4) politikalar coğrafi temelli olduğunda mekansal bağlamın geniş bir şekilde kapsanması. Son yirmi yılda, program değerlendirmesinin ekonometrisi üzerine literatür gelişmiş ve yeni ekonometrik teknikler, hem ekonomi hem de diğer sosyal bilimlerde birçok araştırma alanında temel bir analiz aracı haline gelmiştir (Millimet vd. 2008; Imbens ve Wooldridge 2009). Bunlar arasında işgücü ekonomisi, endüstriyel örgütlenme, kalkınma çalışmaları ve sosyolojik ve demografik ampirik araştırmalar yer almaktadır. Bu kitap, sosyoekonomik programların etkisinin ekonometrik değerlendirilmesi için modern araçların bir açıklamasını sunmakta olup, bu çalışma alanında doğru ve titiz bir ampirik araştırma sağlamak amacıyla pratik konulara ve uygulamalara öncelikli olarak odaklanmaktadır.
Anka Danışmanlık ile Akademik Danışmanlık Hizmetinde Profesyonel Destek
Akademik yazım, zaman alıcı ve zor bir süreç olabilmektedir. Anka Danışmanlık olarak, uzman danışman kadromuzla size akademik danışmanlık sürecinde profesyonel destek sunuyoruz. Anka Danışmanlık olarak, size güvenilir ve profesyonel akademik danışmanlık hizmeti sunarak akademik başarıya ulaşmanıza yardımcı oluyoruz. Detaylı bilgi ve fiyat teklifi almak için hemen bizimle +90 (506) 694 04 39 numaralı hattan iletişime geçin.


