Zaman Serisi Analizi ve Tahmin Teknikleri: Trend, Mevsimsellik ve Modelleme
Zaman serisi analizi, zamana bağlı olarak sıralanan gözlem değerlerinin sistematik biçimde incelenmesini, bu verilerdeki örüntülerin belirlenmesini ve geleceğe yönelik tahminlerin yapılmasını amaçlayan istatistiksel bir yöntemdir. Ekonomi, meteoroloji, mühendislik, sağlık bilimleri ve sosyal bilimlerde yaygın kullanılan bu yöntem, verilerdeki trend, mevsimsellik, döngüsellik ve düzensiz dalgalanmaları ayrıştırarak anlamlı çıkarımlar yapılmasına olanak tanır. Kothari (2004), zaman serisi analizinin hem tanımlayıcı hem de tahmin edici amaçlarla kullanılabileceğini belirterek, araştırmacıların bu tekniğe hâkim olması gerektiğini vurgular.
Zaman Serisi Nedir?
Zaman serisi, belirli zaman aralıklarıyla (günlük, haftalık, aylık, yıllık vb.) ölçülen ve kronolojik sıraya dizilen bir veri kümesidir. Bu veri kümesinde her gözlem, belirli bir zaman noktasına karşılık gelir. Bhome ve diğerleri (2013), zaman serisinin temel özelliklerini şöyle sıralar:
- Sıralılık: Gözlemler zamana göre doğal bir sıraya sahiptir ve bu sıra değiştirilemez
- Bağımlılık: Ardışık gözlemler arasında genellikle istatistiksel bağımlılık (otokorelasyon) vardır
- Eşit aralık: Gözlemler ideal olarak eşit zaman aralıklarıyla elde edilir
- Tek değişkenli veya çok değişkenli: Tek bir değişkenin zaman içindeki değişimi (tek değişkenli) veya birden fazla değişkenin eşzamanlı izlenmesi (çok değişkenli) mümkündür
Zaman serisi verileri, kesitsel verilerden temel olarak gözlemler arası bağımsızlık varsayımının sağlanmaması bakımından ayrılır. Bugünkü değer, dünkü değerden etkilenir; bu nedenle standart regresyon teknikleri doğrudan uygulanamaz.
Zaman Serisinin Bileşenleri
Klasik zaman serisi ayrıştırma yaklaşımına göre, bir zaman serisi dört temel bileşenden oluşur. Kothari (2004), bu bileşenleri ayrıntılı biçimde açıklar:
1. Trend (Eğilim) Bileşeni
Trend, zaman serisinin uzun dönemli yönelimini ifade eder. Veri setindeki genel artış veya azalış eğilimini gösterir. Doğrusal (linear) veya doğrusal olmayan (nonlinear) olabilir:
| Trend Türü | Açıklama | Örnek |
|---|---|---|
| Doğrusal artış | Sabit oranda yükselme | Nüfus artışı (kısa dönem) |
| Doğrusal azalış | Sabit oranda düşüş | Geleneksel gazete tirajı |
| Üstel artış | Giderek hızlanan yükselme | İnternet kullanıcı sayısı |
| S-eğrisi | Başta yavaş, ortada hızlı, sonda yavaşlayan artış | Teknoloji benimseme oranları |
| Durağan | Belirgin bir yön yok | Stabil bir ekosistemde tür sayısı |
Trend bileşenini belirlemek için en küçük kareler yöntemi, hareketli ortalamalar veya filtreleme teknikleri kullanılır.
2. Mevsimsel Bileşen
Mevsimsellik, zaman serisinde sabit periyotlarla tekrarlayan düzenli dalgalanmaları ifade eder. Bu periyot genellikle bir yıl, bir hafta veya bir gündür. Bhome ve diğerleri (2013) mevsimsel bileşenin tanımlanmasında şu özelliklerin arandığını belirtir:
- Dalgalanmalar belirli bir takvim dönemine bağlıdır
- Her yıl (veya periyot) benzer biçimde tekrar eder
- Genliği (amplitude) ve periyodu nispeten sabittir
Mevsimsellik, yalnızca doğa olaylarıyla sınırlı değildir. Okul tatilleri, vergi dönemleri, kültürel etkinlikler ve ekonomik takvim de mevsimsel dalgalanmalara neden olabilir.
3. Döngüsel (Konjonktürel) Bileşen
Döngüsel bileşen, mevsimsel bileşene benzer şekilde dalgalanmaları ifade eder; ancak periyodu sabit değildir ve genellikle birkaç yıldan on yıla kadar uzanan sürelerde gözlenir. Ekonomik genişleme ve daralma döngüleri bunun en tipik örneğidir. Döngüsel bileşeni mevsimsel bileşenden ayıran temel fark, döngüsel dalgalanmaların periyodunun önceden bilinmemesi ve düzensiz olmasıdır.
4. Düzensiz (Rastgele) Bileşen
Düzensiz bileşen, trend, mevsimsellik ve döngüsellik ile açıklanamayan rastgele dalgalanmaları kapsar. Doğal afetler, siyasi krizler, beklenmedik olaylar gibi faktörlerin etkisiyle ortaya çıkar. Bu bileşen, modelin hata terimi olarak değerlendirilir.
Ayrıştırma Modelleri
Zaman serisi bileşenlerini ayırmak için iki temel model kullanılır:
Toplamsal (Additive) Model
Bileşenlerin bağımsız olduğu ve sabit genlikte dalgalanma gösterdiği varsayılır: Y = T + S + C + I (Y: gözlem, T: trend, S: mevsimsel, C: döngüsel, I: düzensiz). Mevsimsel dalgalanmaların büyüklüğü serinin düzeyinden bağımsız olduğunda uygundur.
Çarpımsal (Multiplicative) Model
Bileşenlerin birbirine bağımlı olduğu varsayılır: Y = T × S × C × I. Mevsimsel dalgalanmalar serinin düzeyiyle orantılı olarak büyüdüğünde tercih edilir. Kothari (2004), pratikte çoğu ekonomik ve sosyal zaman serisinin çarpımsal modele daha uygun olduğunu belirtir.
Trend Analizi Yöntemleri
Hareketli Ortalamalar (Moving Averages)
Hareketli ortalama, zaman serisindeki kısa vadeli dalgalanmaları yumuşatarak altta yatan trendi ortaya çıkarmak için kullanılır. Belirli sayıda ardışık gözlemin ortalaması alınarak yeni bir seri oluşturulur:
- Basit hareketli ortalama (SMA): Son k gözlemin eşit ağırlıklı ortalamasıdır. k değeri arttıkça seri daha düzgün hale gelir ancak gecikme artar
- Ağırlıklı hareketli ortalama (WMA): Yakın gözlemlere daha fazla ağırlık verilir. Güncel verilerin daha etkili olduğu durumlarda tercih edilir
- Merkezlenmiş hareketli ortalama: Çift sayıda dönemli serilerde hareketli ortalamanın merkeze kaydırılmasıdır
Bhome ve diğerleri (2013), hareketli ortalama dönem sayısının (k) mevsimsel periyoda eşit seçilmesi durumunda mevsimsel bileşenin tamamen elimine edilebileceğini vurgular.
En Küçük Kareler Trend Çizgisi
Doğrusal trend varsayımı altında, Ŷ = a + bt denklemiyle trend çizgisi tahmin edilir. Burada t zaman değişkeni, a kesim noktası ve b eğimdir. En küçük kareler yöntemi, gözlenen değerlerle tahmin edilen değerler arasındaki farkların karelerinin toplamını minimize eder.
Üstel Düzeltme (Exponential Smoothing)
Üstel düzeltme, hareketli ortalamadan farklı olarak tüm geçmiş gözlemleri dikkate alır; ancak yakın gözlemlere üstel olarak daha fazla ağırlık verir. Temel formül şöyledir:
F(t+1) = αY(t) + (1-α)F(t)
Burada α (0 ile 1 arası) düzeltme katsayısıdır. α değeri büyüdükçe model güncel verilere daha duyarlı hale gelir; küçüldükçe daha düzgün tahminler üretir.
| Üstel Düzeltme Türü | Bileşenler | Uygun Olduğu Durum |
|---|---|---|
| Basit (Brown) | Düzey | Trend ve mevsimsellik olmayan seriler |
| Holt | Düzey + Trend | Trendi olan ama mevsimselliği olmayan seriler |
| Holt-Winters (Toplamsal) | Düzey + Trend + Mevsimsel | Sabit genlikli mevsimsel seriler |
| Holt-Winters (Çarpımsal) | Düzey + Trend + Mevsimsel | Orantılı genlikli mevsimsel seriler |
Mevsimsel Düzeltme ve Mevsim Endeksi
Mevsimsel dalgalanmaları kontrol altına almak ve verileri karşılaştırılabilir hale getirmek için mevsimsel düzeltme uygulanır. Bu işlemde ilk adım, mevsim endekslerinin hesaplanmasıdır:
- Hareketli ortalama ile trend-döngü bileşeni hesaplanır
- Orijinal seriden trend-döngü çıkarılır (toplamsal) veya bölünür (çarpımsal)
- Her mevsim için ortalama oran/fark hesaplanır
- Endeksler normalize edilir (toplamları dönem sayısına veya 100'e eşit olmalıdır)
- Orijinal seri mevsim endeksine bölünerek (çarpımsal) veya çıkarılarak (toplamsal) düzeltilir
Mevsimsel düzeltme yapılmış seriler, farklı dönemlerin doğrudan karşılaştırılmasına imkân tanır.
Otokorelasyon ve Durağanlık
Otokorelasyon Fonksiyonu (ACF)
Otokorelasyon, bir zaman serisinin kendi gecikmeli değerleriyle korelasyonunu ölçer. k gecikmeli otokorelasyon katsayısı r(k), serinin t anındaki değeri ile t-k anındaki değeri arasındaki korelasyondur. Otokorelasyon fonksiyonu grafiği (korelogram), serinin yapısını anlamak için kritik bir araçtır:
- Yavaşça azalan ACF: Trend varlığını gösterir
- Belirli gecikmelerde yükselen ACF: Mevsimsellik varlığını gösterir
- Hızla sıfıra düşen ACF: Durağan bir seriyi işaret eder
Kısmi Otokorelasyon Fonksiyonu (PACF)
PACF, aradaki gecikmelerin etkisini kontrol ettikten sonra belirli bir gecikmedeki doğrudan korelasyonu ölçer. PACF, ARIMA modellerinde AR (otoregresif) derecesini belirlemek için kullanılır.
Durağanlık Kavramı
Bir zaman serisi, ortalaması, varyansı ve otokorelasyon yapısı zaman içinde sabit kalıyorsa durağandır. Çoğu zaman serisi analiz tekniği durağanlık varsayımına dayanır. Durağan olmayan serilere fark alma (differencing) işlemi uygulanarak durağanlık sağlanır:
- Birinci fark: Y'(t) = Y(t) - Y(t-1) → doğrusal trendi giderir
- İkinci fark: Y''(t) = Y'(t) - Y'(t-1) → kuadratik trendi giderir
- Mevsimsel fark: Y*(t) = Y(t) - Y(t-s) → mevsimselliği giderir (s: mevsim uzunluğu)
Durağanlığı test etmek için Augmented Dickey-Fuller (ADF) testi ve KPSS testi kullanılır.
ARIMA Modeli
ARIMA (AutoRegressive Integrated Moving Average), Box ve Jenkins tarafından geliştirilen ve zaman serisi analizinin en güçlü araçlarından biri olan modeldir. ARIMA(p,d,q) olarak gösterilir:
| Parametre | Anlam | Belirleme Yöntemi |
|---|---|---|
| p (AR derecesi) | Otoregresif terimlerin sayısı | PACF grafiğinden belirlenir |
| d (Fark derecesi) | Durağanlık için gereken fark alma sayısı | ADF testi ve ACF incelemesiyle belirlenir |
| q (MA derecesi) | Hareketli ortalama terimlerinin sayısı | ACF grafiğinden belirlenir |
Box-Jenkins Metodolojisi
ARIMA modeli oluşturma süreci dört aşamadan oluşur:
- Tanımlama: ACF ve PACF grafikleri incelenerek p, d, q değerleri belirlenir
- Tahmin: Model parametreleri en çok olabilirlik veya en küçük kareler yöntemiyle tahmin edilir
- Doğrulama: Artıklar (residuals) incelenir; beyaz gürültü özelliği göstermesi beklenir. Ljung-Box testi uygulanır
- Tahmin: Doğrulanmış model gelecek değerleri tahmin etmek için kullanılır
Mevsimsel ARIMA (SARIMA)
Mevsimsel bileşen içeren seriler için SARIMA modeli kullanılır: ARIMA(p,d,q)(P,D,Q)s. Büyük harfler mevsimsel parametreleri, s ise mevsim uzunluğunu ifade eder.
Tahmin Doğruluğu Ölçütleri
Zaman serisi modellerinin performansını değerlendirmek için çeşitli doğruluk ölçütleri kullanılır:
| Ölçüt | Formül Mantığı | Avantajı |
|---|---|---|
| MAE (Ortalama Mutlak Hata) | Hataların mutlak değerlerinin ortalaması | Yorumlaması kolay, orijinal birimde |
| MSE (Ortalama Karesel Hata) | Hataların karelerinin ortalaması | Büyük hatalara daha fazla ceza verir |
| RMSE (Kök Ortalama Karesel Hata) | MSE'nin karekökü | Orijinal birimde, büyük hatalara duyarlı |
| MAPE (Ort. Mutlak Yüzde Hata) | Yüzde hatalarının ortalaması | Ölçekten bağımsız, karşılaştırmaya uygun |
| Theil U İstatistiği | Tahmin hatasını naif modelle karşılaştırır | Göreli performans değerlendirmesi |
Kothari (2004), model seçiminde tek bir ölçüte güvenilmemesi ve birden fazla doğruluk kriterinin birlikte değerlendirilmesi gerektiğini vurgular.
Uygulama Alanları ve Dikkat Edilecek Hususlar
Zaman serisi analizi, son derece geniş bir uygulama alanına sahiptir:
- Ekonomi: GSYH tahmini, enflasyon öngörüsü, borsa analizi, işsizlik oranları
- Sağlık: Hastalık yayılım tahmini, hastane başvuru yoğunluğu, epidemiyolojik izleme
- Eğitim: Öğrenci sayısı öngörüsü, sınav başarı trendleri, kayıt oranları
- Çevre: İklim değişikliği modelleme, hava kalitesi tahmini, su seviyesi izleme
- Mühendislik: Kalite kontrol, süreç izleme, sinyal işleme
Araştırmacıların dikkat etmesi gereken başlıca hususlar şunlardır:
- Veri kalitesi: Eksik gözlemler uygun yöntemlerle tamamlanmalıdır (interpolasyon, son gözlem taşıma)
- Aykırı değerler: Aykırı gözlemler tespit edilmeli ve kaynağı araştırılmalıdır
- Yapısal kırılmalar: Serideki ani değişimler (politika değişikliği, kriz) modellemede dikkate alınmalıdır
- Tahmin ufku: Uzun vadeli tahminlerin belirsizliği artar; güven aralıkları genişler
- Aşırı uyum: Çok karmaşık modeller eğitim verisine aşırı uyum sağlayıp genelleme yapamayabilir
Sonuç
Zaman serisi analizi, zamana bağlı verilerin anlaşılması ve geleceğin tahmin edilmesi için vazgeçilmez bir araçtır. Trend, mevsimsellik, döngüsellik ve düzensiz bileşenlerin ayrıştırılması, verinin yapısını anlamak için ilk adımdır. Hareketli ortalamalar ve üstel düzeltme gibi klasik yöntemler basit ama etkili tahmin araçları sunarken, ARIMA ailesindeki modeller daha karmaşık yapıların modellenmesine olanak tanır. Kothari'nin (2004) belirttiği gibi, iyi bir zaman serisi analizi, verilerin dikkatli incelenmesiyle başlar ve model seçiminde tek bir doğruluk ölçütüne değil, birden fazla kritere dayanır. Bhome ve diğerlerinin (2013) vurguladığı gibi, zaman serisi analizinin gücü, verinin geçmişindeki örüntüleri keşfetme ve bu örüntüleri geleceğe yansıtma yeteneğinde yatar. Araştırmacılar bu tekniği öğrenerek, alanlarındaki dinamik süreçleri daha iyi anlayabilir ve kanıta dayalı tahminler üretebilirler.
Kaynaklar
Yorumlar (0)
Yorum yapmak için giriş yapmalısınız.
