Ev Kişisel Finans R Sınıflamalı Tahmin Edilebilir Analitik Model Sonuçlarını Açıklama Nasıl Yapılır? AYAKLAR

R Sınıflamalı Tahmin Edilebilir Analitik Model Sonuçlarını Açıklama Nasıl Yapılır? AYAKLAR

Video: Curious and Genius Bilişsel Beceriler Geliştirme Aktiviteleri - Profil Analiz Testi 2024

Video: Curious and Genius Bilişsel Beceriler Geliştirme Aktiviteleri - Profil Analiz Testi 2024
Anonim

Tahmini analitikteki bir diğer görev bağımsız verilerin bir kümesi göz önüne alındığında, bir hedef verinin hangi sınıfın ait olduğunu tahmin ederek yeni verileri sınıflandırmaktır. Örneğin, karar ağacını kullanarak, bir müşteriyi türe göre, örneğin yüksek değerli bir müşteri, normal bir müşteri veya bir rakibe geçiş yapmaya hazır bir müşteri olarak sınıflandırabilirsiniz.

R Sınıflandırma modeli hakkında bazı yararlı bilgileri görmek için aşağıdaki kodu yazın:

>> özet (model) Boy Sınıfı Modu 1 BinaryTree S4
Sınıf sütunu size bir karar ağacı oluşturduğunuzu bildirir. Bölmelerin nasıl tespit edildiğini görmek için, modeli atadığınız değişken adını, bu durumda bu gibi modelde şöyle yazabilirsiniz: >> modeli 6 terminal düğümlü koşullu çıkarım ağacı Yanıt: seedType Girişleri: alan, çevre, kompaktlık, uzunluk, genişlik, asimetri, uzunluk2 Gözlem sayısı: 147 1) alan <= 16. 2; kriter = 1, istatistik = 123. 423 2) alan <= 13. 37; kriter = 1, istatistik = 63. 549 3) uzunluk2 4. 914 5) * ağırlıkları = 45 2) alan> 13. 37 6) uzunluk2 5. 396 8) * ağırlıkları = 8 1) alan> 16 2.9) uzunluk2 5. 877 11) * weight = 40

Daha da iyisi, bu kodu kullanarak karar ağacını bir arsa oluşturarak modelinizi görselleştirebilirsiniz:> plot (model)


Bu bir karar ağacının grafiksel bir temsilidir. Genel şeklin gerçek bir ağacın şeklini taklit ettiğini görebilirsiniz.

düğümleri

(daireler ve dikdörtgenler) ve bağlantılar veya kenarları (bağlantı çizgileri) 'den oluşur. İlk düğüm (üstten başlayarak) kök düğümü

olarak adlandırılır ve ağacın en altındaki düğümlere (dikdörtgenler) terminal düğümleri adı verilir. Beş karar düğümü ve altı terminal düğümü vardır.

Her düğümde model, çevre ve bağlantıların ölçütlerini temel alan bir karar verir ve bir yol seçer. Model bir terminal düğümüne geldiğinde, bir karara veya nihai bir karara varılmıştır. Bu durumda, iki öznitelik, ve, verilen bir tohum türünün sınıf 1, 2 veya 3'te olup olmadığına karar vermek için kullanılır.

Örneğin, veri kümesinden gözlem # 2 alın. Bir 4.956 ve bir 14.88'dir. Oluşturduğunuz ağacı bu gözlemin hangi tohum türüne ait olduğuna karar vermek için kullanabilirsiniz. Adımların sırası:

Düğüm 1 olan kök düğümden başlayın (sayı, çemberin üst kısmındaki küçük karede gösterilir). Özniteliğe göre karar verin: Gözlem # 2, (<= ile gösterilir) eşit veya daha küçük 16 mı?2? cevap evet, bu nedenle düğüm 2 yolu boyunca hareket ettirin.

Düğüm 2'de model şunu sorar: Alan 13. 37 mi? Cevap evet, bu nedenle düğüm 6 yolu boyunca ilerleyin. Bu düğümde model sorar: Uzunluk2 <= 5. 396 mı? öyle ve terminal düğüm 7'ye geçiyorsunuz ve karara bakınız: 2. gözlem, tohum türü 1'dir. Ve aslında, tohum türü 1'dir.

  1. Model, diğer gözlemlerin hepsini tahmin etmesi için bu işlemi yapar sınıflar.

  2. İyi bir modeli eğitip yetiştirmediğinizi öğrenmek için eğitim verilerine karşı kontrol edin. Sonuçları aşağıdaki kodla bir tabloda görebilirsiniz: >> tablosu (tahmin (model), trainSet $ ​​seedType) 1 2 3 1 45 4 3 2 3 47 0 3 1 0 44

    Sonuçlar göstermektedir ki, hata (veya yanlış sınıflandırma oranı) 147'den 11'dir veya yüzde 7,48'dir.

  3. Sonuçlar hesaplandıktan sonra, bir sonraki adım tabloyu okumaktır.

    Sütun ve sıra numaralarını aynı şekilde gösteren doğru öngörülerdir. Bu sonuçlar, sol üstten sağa doğru çapraz bir çizgi olarak ortaya çıkıyor; Örneğin, [1, 1], [2, 2], [3, 3] o sınıf için doğru tahminlerin sayısıdır.
    

    Yani tohum türü 1 için, model tohumun 7 kez yanlış sınıflandırılması sırasında 45 kez tahmin etmişti (tohum türü 2 olarak 4 kez ve tür 3 olarak 3 kat). Tohum türü 2 için, model doğruca 47 kez, ancak 3 kez yanlış sınıflandırırken onu öngördü. Tohum türü 3 için, model bir kez yalnızca bir kez yanlış sınıflandırırken 44 kez doğru tahmin etti.

  4. Bu, bunun iyi bir model olduğunu gösterir. Şimdi bunu test verileri ile değerlendiriyorsunuz. Test verilerini daha sonra kullanmak üzere bir değişkende (testPrediction) tahmin etmek ve depolamak için kullanan kod şöyledir: >> testPrediction <- predict (model, newdata = testSet)

    Modelin test verilerini bir tabloya bakınız ve kodu aşağıdaki gibi görünen hatayı hesaplayınız: >> tablosu (testPrediction, testSet $ ​​seedType) testPrediction 1 2 3 1 23 2 1 2 1 19 0 3 1 0 17

R Sınıflamalı Tahmin Edilebilir Analitik Model Sonuçlarını Açıklama Nasıl Yapılır? AYAKLAR

Editörün Seçimi

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Fotoğraf bir sanat biçimidir. İyi fotoğrafçılar, insanların bakmak isteyeceği çekici bir fotoğraf oluşturmak için kompozisyon kurallarını kullanırlar. Resminizi nasıl görselleştireceğinizi, çerçevede olanı düzenleyebileceğinizi ve ardından ilginç bir fotoğraf oluşturmak için kompozisyon kurallarını nasıl kullanacağınız. Doğal çerçeveleri kullanma Doğal çerçeveleri çizmek için kullanabilirsiniz ...

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital fotoğraf makineniz size yol göstermez panoramik bir fotoğraf çekmek için. Ancak, kesintisiz bir panoramik çekim oluşturmak için çakışan birkaç resim çekebilir ve onları birbirine dikebilirsiniz. Fotoğraf panoramasını oluşturmak için işinize bakalım:

Ham Dosyaları dönüştürme - mankenler

Ham Dosyaları dönüştürme - mankenler

Birçok dijital fotoğraf makinesi, görüntüleri Camera Raw dosya biçiminde veya sadece Ham olarak yakalayabilir. Bu format, JPEG formatında çekim yaparken oluşan olağan post-processing'leri uygulamadan herhangi bir görüntü sensöründen elde edilen ham görüntü verilerini depolar. Ham formatta çekim, bir takım avantajlar sunar. Fakat olumsuz ...

Editörün Seçimi

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Sabahınıza enerji artışı sağlayan krep düşünün endişesizsiniz. Bu tarif, bir sabah herkesin sevebileceği bir Karbonhidrat Diyeti (SCD) versiyonudur.

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

Bu aperitif, pumpernickel ekmeği konusunda harika, fakat ayrıca buğdaydan kaçınırsanız, filizlenmiş ekmeği denemek istersiniz. Sardalya, iyi bir kalsiyum ve D vitamini kaynağı olduğu kadar, iltihap düzeylerini azaltmaya yardımcı olduğu bilinen omega-3 yağ asitleri. Kredi: © Digiphoto, 2006 Caroline Nation bunu geliştirdi ...

Editörün Seçimi

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB'da göreceğiniz alt testlerden bir tanesi Kelime Bilgi testi. Test gününde soruların ve biçimin neye benzeyeceği hakkında bir fikir edinmek için aşağıdaki soruları inceleyin. Örnek sorular Kelime Bilgi Zamanı: 35 soru için 11 dakika Talimatlar: Kelime Bilgisi alt testi üçüncü alt testtir ...

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

Kelime Bilgisi ASVAB üzerinde alt test, bu tür soru, bir kelimeyi pasaj bağlamında kullanılan şekilde tanımlamanızı gerektirir. Sorunun doğru tanımı, sözcüğün en yaygın anlamı olabilir veya daha az bilinen bir anlam olabilir ...

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sayı problemleri ASVAB üzerinde bulacağınız sayı problemleri oldukça basittir. Sorular, sayıları temel ekleme, çıkarma, çarpma veya bölme ile değiştirmenizi ister. Çoğu kişi bu tür kelime problemlerini oldukça kolay buluyor. Birkaç tane denemek ister misiniz, sadece ayağınızı ıslatmak için mi? Elbette. Jesse ...