Ev Kişisel Finans Tahmin Edilebilir Analytics İçin Rasgele Ormanlı Denetlenen Öğrenme Modeli Nasıl Yapılır - mankenler

Tahmin Edilebilir Analytics İçin Rasgele Ormanlı Denetlenen Öğrenme Modeli Nasıl Yapılır - mankenler

İçindekiler:

Video: Data Analysis 4: Data Transformation - Computerphile 2024

Video: Data Analysis 4: Data Transformation - Computerphile 2024
Anonim

Rasgele orman modeli, tahmini analitikte kullanılabilir; modelini oluşturmak için karar ağaçlarının bir topluluğunu (seçimi) alır. Fikir, rasgele bir zayıf öğrenci örneklemini (eğitim verilerinin rasgele bir alt kümesi) alıp en güçlü ve en iyi modeli seçmek için oy kullanmalarını sağlamaktır. Rastgele orman modeli ya sınıflandırma ya da regresyon için kullanılabilir. Aşağıdaki örnekte, rasgele orman modeli Iris türünün sınıflandırılması için kullanılır.

Verilerinizi yükleniyor

Bu kod listesi, iris veri kümesini oturumun içine yükleyecek: >>>> sklearn. veri setleri import load_iris >>>> iris = load_iris ()

Sınıflandırıcının bir örneğini oluşturma

Aşağıdaki iki kod satırı sınıflandırıcı örneğini oluşturur. İlk satır, rasgele orman kitaplığını içe aktarır. İkinci satır, rasgele orman algoritmasının bir örneğini oluşturur:

>>>> sklearn'dan. topluluk içe aktarma RandomForestClassifier >>>> rf = RandomForestClassifier (n_estimators = 15,

random_state = 111)

Yapıcıdaki

n_estimators

parametresi rasgele orman modeli için yaygın olarak kullanılan bir ayarlama parametresidir. Değer, ormandaki ağaç sayısını oluşturmak için kullanılır. Genellikle veri kümesinin yüzde 10 ila 100'ü arasında, ancak kullandığınız verilere bağlı. Burada, değer 15, verinin yüzde 10'u olarak ayarlanır. Daha sonra, parametre değerinin 150 (yüzde 100) olarak değiştirilmesinin aynı sonuçları verdiğini göreceksiniz.

n _estimatörler , model performansını ve aşırı uygunluğu ayarlamak için kullanılır. Değer ne kadar yüksek olursa, performans da o kadar iyi olur, ancak aşırı uyumsuzluk pahasına. Değer ne kadar küçük olursa, overfitting değil de düşük performans pahasına olur. Ayrıca, sayının artırılması genellikle doğruluk iyileştirmesinde düşüş gösterecek ve ihtiyaç duyulan hesaplama gücünü önemli ölçüde artırabilecek bir nokta var. Yapıcıda atlanırsa, parametre varsayılan değeri 10'dur.

Eğitim verilerini çalıştırma Rasgele orman sınıflandırıcısının bir örneğini yaratmadan önce veri setini eğitim ve test setlerine bölmeniz gerekecek. Aşağıdaki kod bu görevi gerçekleştirecektir: >>>> sklearn import cross_validation >>>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (iris verileri, iris hedefi, test_size = 0.10, random_state = 111) >>>> rf = rf. sığdır (X_train, y_train)

Satır 1, veri kümesini iki parçaya ayırmanıza izin veren kitaplığı içe aktarır.

Satır 2, veri kümesini iki parçaya bölen kitaplıktaki işlevi çağırır ve şimdi bölünmüş veri kümelerini iki çift değişken için atar.

Satır 3, yeni oluşturduğunuz rasgele orman sınıflandırıcısının örneğini alır ve modeli eğitim veri setiyle birlikte eğitmek için fit yöntemini çağırır.

Test verisinin çalıştırılması

Aşağıdaki kodda, ilk satır test veri kümesini modeline gönderir, ardından üçüncü satır çıktı görüntüler: >>>> tahmini = rf. tahmin (X_test) >>>> tahmin

dizi ([0, 0, 2, 2, 2, 0, 0, 2, 2, 1, 2, 0, 1, 2, 2]) > Modelin değerlendirilmesi

Tahmin sonucunu,

  • y_test
  • dizisine karşı çapraz referans verebilirsiniz. Sonuç olarak, iki test veri noktasının yanlış bir şekilde tahmin edildiğini görebilirsiniz. Dolayısıyla rasgele orman modelinin doğruluğu yüzde 86,67'dir.
  • Kod: >>>> Sklearn içe aktarma metriklerinden >>>> tahmin edilen

dizisine ([0, 0, 2, 2, 2, 0, 0, 2, 2, 0, 2, 2, 1, 0, 2, 2, 1, 2, 2, 2] 2, 2]) >>>> metrikleri. accuracy_score (y_test, öngörülen)

0. 8666666666666667 # 1. 0, yüzde 100 doğruluk >>>> tahmini == y_test

dizi ([Doğru, Doğru, Doğru, Yanlış, Doğru, Doğru,

Doğru, Doğru, Doğru, Doğru, True, False, True,

True], dtype = bool)

n_estimators parametresini 150'ye değiştirirseniz, rastgele orman modeli nasıl performans gösterir? Bu küçük veri kümesi için bir fark yaratmayacakmış gibi görünüyor. Aynı sonuca yol açar: >>>> rf = RandomForestClassifier (n_estimators = 150, random_state = 111) >>>> rf = rf. uygun (X_train, y_train) >>>> tahmin = rf. tahmin (X_test) >>>> tahmin

dizi ([0, 0, 2, 2, 2, 0, 0, 2, 2, 1, 2, 0, 1, 2, 2]) >

Tahmin Edilebilir Analytics İçin Rasgele Ormanlı Denetlenen Öğrenme Modeli Nasıl Yapılır - mankenler

Editörün Seçimi

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Fotoğraf bir sanat biçimidir. İyi fotoğrafçılar, insanların bakmak isteyeceği çekici bir fotoğraf oluşturmak için kompozisyon kurallarını kullanırlar. Resminizi nasıl görselleştireceğinizi, çerçevede olanı düzenleyebileceğinizi ve ardından ilginç bir fotoğraf oluşturmak için kompozisyon kurallarını nasıl kullanacağınız. Doğal çerçeveleri kullanma Doğal çerçeveleri çizmek için kullanabilirsiniz ...

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital fotoğraf makineniz size yol göstermez panoramik bir fotoğraf çekmek için. Ancak, kesintisiz bir panoramik çekim oluşturmak için çakışan birkaç resim çekebilir ve onları birbirine dikebilirsiniz. Fotoğraf panoramasını oluşturmak için işinize bakalım:

Ham Dosyaları dönüştürme - mankenler

Ham Dosyaları dönüştürme - mankenler

Birçok dijital fotoğraf makinesi, görüntüleri Camera Raw dosya biçiminde veya sadece Ham olarak yakalayabilir. Bu format, JPEG formatında çekim yaparken oluşan olağan post-processing'leri uygulamadan herhangi bir görüntü sensöründen elde edilen ham görüntü verilerini depolar. Ham formatta çekim, bir takım avantajlar sunar. Fakat olumsuz ...

Editörün Seçimi

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Sabahınıza enerji artışı sağlayan krep düşünün endişesizsiniz. Bu tarif, bir sabah herkesin sevebileceği bir Karbonhidrat Diyeti (SCD) versiyonudur.

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

Bu aperitif, pumpernickel ekmeği konusunda harika, fakat ayrıca buğdaydan kaçınırsanız, filizlenmiş ekmeği denemek istersiniz. Sardalya, iyi bir kalsiyum ve D vitamini kaynağı olduğu kadar, iltihap düzeylerini azaltmaya yardımcı olduğu bilinen omega-3 yağ asitleri. Kredi: © Digiphoto, 2006 Caroline Nation bunu geliştirdi ...

Editörün Seçimi

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB'da göreceğiniz alt testlerden bir tanesi Kelime Bilgi testi. Test gününde soruların ve biçimin neye benzeyeceği hakkında bir fikir edinmek için aşağıdaki soruları inceleyin. Örnek sorular Kelime Bilgi Zamanı: 35 soru için 11 dakika Talimatlar: Kelime Bilgisi alt testi üçüncü alt testtir ...

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

Kelime Bilgisi ASVAB üzerinde alt test, bu tür soru, bir kelimeyi pasaj bağlamında kullanılan şekilde tanımlamanızı gerektirir. Sorunun doğru tanımı, sözcüğün en yaygın anlamı olabilir veya daha az bilinen bir anlam olabilir ...

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sayı problemleri ASVAB üzerinde bulacağınız sayı problemleri oldukça basittir. Sorular, sayıları temel ekleme, çıkarma, çarpma veya bölme ile değiştirmenizi ister. Çoğu kişi bu tür kelime problemlerini oldukça kolay buluyor. Birkaç tane denemek ister misiniz, sadece ayağınızı ıslatmak için mi? Elbette. Jesse ...