Ev Kişisel Finans R Regresyonlu Tahmin Edici Bir Analitik Model Nasıl Oluşturulur - kuklalar

R Regresyonlu Tahmin Edici Bir Analitik Model Nasıl Oluşturulur - kuklalar

Video: 11) Regresyon Analizi, En Küçük Kareler Yöntemi, Standart Hata Terimi | İSTATİSTİK | XDERS 2024

Video: 11) Regresyon Analizi, En Küçük Kareler Yöntemi, Standart Hata Terimi | İSTATİSTİK | XDERS 2024
Anonim

Bilinen çıktıları kullanarak değerlendirebileceğiniz bir tahmini analitik model oluşturmak istiyorsunuz. Bunu yapmak için, veri setimizi iki gruba ayıracağız: biri modeli eğitmek için ve diğeri modeli test etmek için. Eğitim ve test veri kümeleri arasında 70/30 bölünmüşlük yeterli olacaktır. Sonraki iki kod satırı, her kümenin boyutlarını hesaplar ve depolar: >> trainSize testSize <- nrow (autos) - trainSize

Değerleri çıktılamak için değeri depolamak için kullanılan değişkenin adını yazın ve Enter'a bas. İşte çıktı:

>> trainSize [1] 279> testSize [1] 119

Bu kod, eğitim ve test veri kümelerimizi yapmak istediğiniz veri kümelerinin boyutlarını belirler. Hâlâ bu setleri yaratmadınız. Ayrıca, yalnızca ilk 279 gözlemi eğitim seti olarak adlandırmak ve son 119 gözlemi test setini çağırmak istemiyorsunuz. Veri seti sipariş edildiği için bu kötü bir model oluşturur. Özellikle, model Yıl sütunu en küçükten en büyük sipariş verilir.

Verileri inceledikten sonra, ağır, sekiz silindirli, daha büyük hacimli, daha yüksek beygir gücü otomobillerinin çoğunun veri setinin üstünde olduğunu görebilirsiniz. Bu gözlemden, veriler üzerinde herhangi bir algoritma çalıştırmaya gerek duymadan, eski arabaların yeni arabalara kıyasla (genel olarak bu veri kümesi için) şu şekilde olduğunu söyleyebilirsiniz:

Daha ağır

Sekiz silindir

  • Var daha büyük yer değiştirme

  • Daha büyük beygir gücüne sahip

    Pekala, açıkçası birçok kişi otomobiller hakkında bir şey biliyor, bu nedenle verileri gördükten sonra korelasyonların ne olduğu konusunda çok fazla bilgi bulunmayacak. Birçok otomobil bilgisine sahip bir kişi, verileri bile bakmadan bunu zaten biliyor olabilir.
  • Bu, birçok insanın bağlantı kurabileceği basit bir alan adının (arabalar) bir örneğidir. Ancak bu kanser hakkında bir veri olsaydı, çoğu insan hemen her özellikten ne anlama geldiğini anlamazdı.

Burada, bir alan uzmanı ve veri modelleyicisi modelleme süreci için hayati önem taşıyor. Etki alanı uzmanları hangi niteliklerin en (veya en az) önemli olabileceği ve birbirleriyle nasıl ilişkilendirileceği konusunda en iyi bilgiye sahip olabilirler.

Deney yapacak olan değişkenleri veri modelleyicisine önerebilirler. Daha önemli niteliklere ve / veya en az önem taşıyan özelliklere göre daha küçük ağırlıklara (veya tamamen kaldırmaya) ağırlık verebilirler.

Bu nedenle, tüm seti gerçekten temsil eden bir eğitim veri seti ve bir test veri seti hazırlamanız gerekir. Bunu yapmanın bir yolu, tüm veri kümesinin rasgele bir seçiminden eğitim seti oluşturmaktır.Ayrıca, aynı örneğe bakabilmeniz için bu testi tekrarlanabilir hale getirmek istiyorsunuz.

Böylece rastgele üreticinin tohumunu ayarlayın, böylece aynı "rastgele" eğitim setine sahip olacağız. Aşağıdaki kod bu görevi yapar: >> set. trainSet testSet <- autos [-training_indices,]

Eğitim seti, 279 gözlemin yanı sıra sonuç (299 gözlem) içermektedir (mpg). Regresyon algoritması, tahmin değişkenleri (yedi özellikten herhangi biri) ve tepki değişkeni (mpg) arasındaki ilişkilere bakarak modeli eğitmek için sonucu kullanır.

Test seti, verilerin geri kalanını (yani eğitim setine dahil edilmeyen kısmı) içerir. Test setinin yanıt (mpg) değişkenini de içerdiğini fark etmeniz gerekir.

Test grubuyla birlikte tahmin fonksiyonunu (modelden) kullandığınızda, yanıt değişkenini yok sayar ve yalnızca kolon adları eğitim setindeki ile aynı olduğu sürece tahmini değişkenleri kullanır. 

Yanıt değişkeni olarak mpg özniteliğini ve tahmini değişkenleri olarak diğer tüm değişkenleri kullanan doğrusal bir regresyon modeli oluşturmak için aşağıdaki kod satırını yazın: >> model

R Regresyonlu Tahmin Edici Bir Analitik Model Nasıl Oluşturulur - kuklalar

Editörün Seçimi

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Fotoğraf bir sanat biçimidir. İyi fotoğrafçılar, insanların bakmak isteyeceği çekici bir fotoğraf oluşturmak için kompozisyon kurallarını kullanırlar. Resminizi nasıl görselleştireceğinizi, çerçevede olanı düzenleyebileceğinizi ve ardından ilginç bir fotoğraf oluşturmak için kompozisyon kurallarını nasıl kullanacağınız. Doğal çerçeveleri kullanma Doğal çerçeveleri çizmek için kullanabilirsiniz ...

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital fotoğraf makineniz size yol göstermez panoramik bir fotoğraf çekmek için. Ancak, kesintisiz bir panoramik çekim oluşturmak için çakışan birkaç resim çekebilir ve onları birbirine dikebilirsiniz. Fotoğraf panoramasını oluşturmak için işinize bakalım:

Ham Dosyaları dönüştürme - mankenler

Ham Dosyaları dönüştürme - mankenler

Birçok dijital fotoğraf makinesi, görüntüleri Camera Raw dosya biçiminde veya sadece Ham olarak yakalayabilir. Bu format, JPEG formatında çekim yaparken oluşan olağan post-processing'leri uygulamadan herhangi bir görüntü sensöründen elde edilen ham görüntü verilerini depolar. Ham formatta çekim, bir takım avantajlar sunar. Fakat olumsuz ...

Editörün Seçimi

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Sabahınıza enerji artışı sağlayan krep düşünün endişesizsiniz. Bu tarif, bir sabah herkesin sevebileceği bir Karbonhidrat Diyeti (SCD) versiyonudur.

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

Bu aperitif, pumpernickel ekmeği konusunda harika, fakat ayrıca buğdaydan kaçınırsanız, filizlenmiş ekmeği denemek istersiniz. Sardalya, iyi bir kalsiyum ve D vitamini kaynağı olduğu kadar, iltihap düzeylerini azaltmaya yardımcı olduğu bilinen omega-3 yağ asitleri. Kredi: © Digiphoto, 2006 Caroline Nation bunu geliştirdi ...

Editörün Seçimi

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB'da göreceğiniz alt testlerden bir tanesi Kelime Bilgi testi. Test gününde soruların ve biçimin neye benzeyeceği hakkında bir fikir edinmek için aşağıdaki soruları inceleyin. Örnek sorular Kelime Bilgi Zamanı: 35 soru için 11 dakika Talimatlar: Kelime Bilgisi alt testi üçüncü alt testtir ...

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

Kelime Bilgisi ASVAB üzerinde alt test, bu tür soru, bir kelimeyi pasaj bağlamında kullanılan şekilde tanımlamanızı gerektirir. Sorunun doğru tanımı, sözcüğün en yaygın anlamı olabilir veya daha az bilinen bir anlam olabilir ...

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sayı problemleri ASVAB üzerinde bulacağınız sayı problemleri oldukça basittir. Sorular, sayıları temel ekleme, çıkarma, çarpma veya bölme ile değiştirmenizi ister. Çoğu kişi bu tür kelime problemlerini oldukça kolay buluyor. Birkaç tane denemek ister misiniz, sadece ayağınızı ıslatmak için mi? Elbette. Jesse ...