Video: İleri Analitiklere Giriş 2024
Doğrusal regresyon , iki değişken arasındaki ilişkileri analiz eden ve bulan istatistiksel bir yöntemdir. Tahmini analitikte, bir değişkenin gelecekteki sayısal değerini tahmin etmek için kullanılabilir.
İki değişkeni içeren bir veri örneğini düşünün: bir trenin varış zamanlarını ve buna karşılık gelen gecikme zamanını içeren geçmiş veriler. Bir sonraki tren için gecikmenin ne olacağını tahmin etmek istediğinizi varsayalım. Doğrusal regresyonu bu iki değişkene (varış ve gecikme süreleri) uygularsanız,
Gecikme = a + (b * Varış süresi) + d
Bu denklem gecikme zamanı ve varış zamanı arasındaki ilişkiyi ifade eder. Sabitler a ve b modelin parametreleridir. gecikme değişkeninin arasındaki yanlış eşleşmeyi temsil eden sayısal bir değer olan d hata terim (aynı zamanda geri kalan olarak da bilinir) 'dir > ve varış süresi . Hata sıfıra eşit değilse, bu, gecikme değişkenini etkileyen ölçütlerin bulunduğunu gösterebilir.
Eğer tren istasyonunda oturuyorsanız, varış zamanını bir önceki denklemin içine basitçe ekleyebilirsiniz ve doğrusal regresyon modelinin verilen parametreleri a kullanarak beklenen gecikmeyi hesaplayabilir, b, ve d .
Lineer regresyon doğrusal veriler için en uygun (tahmin edebileceğiniz gibi). Ancak, veri noktalarındaki aykırı değerlere karşı çok hassas. Verilerinizdeki aykırı değerler model üzerinde önemli bir etkisi olabilir. Akıllı tahrik modeliniz için doğrusal gerileme kullanmayı planlıyorsanız, bu belirsizlikleri eğitim setinden kaldırmanız önerilir.