Ev Kişisel Finans Yeni bir programlama dili öğrenirken mankenler

Yeni bir programlama dili öğrenirken mankenler

İçindekiler:

Video: 5.1: Doodle Classifier: Introduction - Intelligence and Learning 2024

Video: 5.1: Doodle Classifier: Introduction - Intelligence and Learning 2024
Anonim

Yeni bir programlama dili öğrenirken, "merhaba dünya" programını yazmanız alışageldir. Makine öğrenimi ve tahmini analitik için, Iris veri kümesini sınıflandırmak için bir model oluşturmak "merhaba dünya" eşdeğeri bir programdır. Bu oldukça basit bir örnektir, ancak makine öğrenimi ve tahmini analitik temellerini öğretmede çok etkilidir.

Örnek veri kümesi nasıl elde edilir

Tahmini modelimizi oluşturmak için, örnek Iris veri kümesini indirmeniz gerekecektir. Bu veri seti, özellikle makine öğrenme bölümlerine sahip akademik kurumlarda, birçok kaynaktan serbestçe temin edilebilir. Neyse ki, millet, bazı örnek veri kümelerini ve veri yükleme işlevlerini paketleriyle birlikte verecek kadar güzeldi. Bu örneklerin amaçları için, yalnızca verileri yüklemek için birkaç basit kod satırı çalıştırmanız yeterlidir.

Verilerinizi etiketleme yöntemi

İşte Iris Flower veri kümesinin her sınıftan bir gözlem ve özellikleri.

Sepal Uzunluk Sepal Genişlik Petal Uzunluk Petal Genişlik Hedef Sınıf / Etiket
5. 1 3. 5 1. 4 0. 2 Setosa (0)
7. 0 3. 2 4. 7 1. 4 Versikolor (1)
6. 3 3. 3 6. 0 2. 5 Virginica (2)

Iris Çiçek veri kümesi tarafından tanıtılan Iris çiçeğinin ( Iris virginica, ve Iris versicolor ) üç sınıfının gerçek çok değişkenli bir veri kümesidir Ronald Fisher 1936'da yayınlanan "Taksonomik Sorunlarda Birden Fazla Ölümün Kullanımı" adlı makalesinde. "Bu veri kümesi en iyi akademik alanda makine öğrenimi ve istatistikleri için yaygın olarak kullanıldığı için biliniyor.

Veri seti, Iris çiçeğinin 3 sınıftan her biri 50 örnekle toplam 150 örnekten oluşur. Örnekte, sepals ve yaprakları uzunluk ve genişlik ölçümleri olan 4 özellik bulunmaktadır (ayrıca yaygın olarak nitelikler olarak anılır).

Bu veri kümesinin ilginç kısmı, üç sınıfın doğrusal olarak ayrılabilir olmasıdır. Setosa sınıfı, aralarındaki grafikte düz bir çizgi çizerek diğer iki sınıfdan ayrılabilir. Virginica ve Versicolor sınıfları düz bir çizgiyle mükemmel bir şekilde ayrılmaz - yakınsa da. Bu, sınıflandırma analizini yapmak için mükemmel bir aday veri kümesi yapar, ancak kümeleme analizi için o kadar da iyi değildir.

Örnek veri zaten etiketlendi. Yukarıdaki sağ sütun (Label) Iris çiçeğinin her sınıfının adlarını gösterir.Sınıf adına bir etiket veya bir hedefi denir; genellikle y adlı bir değişkene atanır. Temelde sonuç veya tahmin edilenin sonucudur.

İstatistik ve modellemede genellikle bağımlı değişken olarak anılır. Sepal uzunluk ve genişliğe ve yaprak uzunluğuna ve genişliğine karşılık gelen girdilere bağlıdır.

Orijinal veri kümesiyle karşılaştırıldığında scikit önişlem Iris veri kümesi hakkında neyin farklı olduğunu bilmek isteyebilirsiniz. Öğrenmek için orijinal veri dosyasını edinmeniz gerekir. iris veri kümesi için bir Google araması yapabilirsiniz ve onu indirip herhangi bir akademik kurumdan görüntüleyebilirsiniz.

Genellikle ilk önce ortaya çıkan sonuç, California Üniversitesi Irvine'in (UCI) makine kümesi öğrenen veri kümesi deposudur. UCI makine-öğrenme deposundan orijinal halindeki Iris veri seti UCI web sitesinde bulunabilir.

Dosyayı indirirseniz, herhangi bir metin düzenleyicisiyle görüntüleyebilirsiniz. Dosyadaki verileri görüntülerken, her satırda beş sütun olduğunu fark etmiş olursunuz. İlk dört sütun ölçümlerdir ( özellikler olarak anılır) ve son sütun etikettir. Etiket Iris veri kümesinin orijinal ve scikit sürümleri arasında farklılık gösterir.

Başka bir fark veri dosyasının ilk satırıdır. Scikit veri yükleme fonksiyonu tarafından kullanılan bir başlık satırı içerir. Algoritmaların kendisi üzerinde hiçbir etkisi yoktur.

Numaraları normal olarak metin olarak tutmak yerine normalleştirmek, algoritmaların daha kolay işlenmesini sağlar - ve daha bellek verimlidir. Özellikle gerçek senaryolarda olduğu gibi çok sayıda veri kümesi birçok özellikle çalıştırırsanız, bu durum özellikle belirgindir.

İşte her iki dosyanın örnek verileri. Col5 dışında tüm veri sütunları aynıdır. Scikit'in sayısal etiketli sınıf adlarına sahip olduğunu unutmayın; orijinal dosyanın metin etiketleri var.

Kaynak Col1 Süt2 Col3 Süt4 Col5
scikit 5. 1 3. 5 1. 4 0. 2 0
orijinal 5. 1 3. 5 1. 4 0. 2 İris setosa
scikit 7. 0 3. 2 4. 7 1. 4 1
orijinal 7. 0 3. 2 4. 7 1. 4 İris Versicolor
scikit 6. 3 3. 3 6. 0 2. 5 2
orijinal 6. 3 3. 3 6. 0 2. 5 İris-virginica
Yeni bir programlama dili öğrenirken mankenler

Editörün Seçimi

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Fotoğraf bir sanat biçimidir. İyi fotoğrafçılar, insanların bakmak isteyeceği çekici bir fotoğraf oluşturmak için kompozisyon kurallarını kullanırlar. Resminizi nasıl görselleştireceğinizi, çerçevede olanı düzenleyebileceğinizi ve ardından ilginç bir fotoğraf oluşturmak için kompozisyon kurallarını nasıl kullanacağınız. Doğal çerçeveleri kullanma Doğal çerçeveleri çizmek için kullanabilirsiniz ...

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital fotoğraf makineniz size yol göstermez panoramik bir fotoğraf çekmek için. Ancak, kesintisiz bir panoramik çekim oluşturmak için çakışan birkaç resim çekebilir ve onları birbirine dikebilirsiniz. Fotoğraf panoramasını oluşturmak için işinize bakalım:

Ham Dosyaları dönüştürme - mankenler

Ham Dosyaları dönüştürme - mankenler

Birçok dijital fotoğraf makinesi, görüntüleri Camera Raw dosya biçiminde veya sadece Ham olarak yakalayabilir. Bu format, JPEG formatında çekim yaparken oluşan olağan post-processing'leri uygulamadan herhangi bir görüntü sensöründen elde edilen ham görüntü verilerini depolar. Ham formatta çekim, bir takım avantajlar sunar. Fakat olumsuz ...

Editörün Seçimi

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Sabahınıza enerji artışı sağlayan krep düşünün endişesizsiniz. Bu tarif, bir sabah herkesin sevebileceği bir Karbonhidrat Diyeti (SCD) versiyonudur.

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

Bu aperitif, pumpernickel ekmeği konusunda harika, fakat ayrıca buğdaydan kaçınırsanız, filizlenmiş ekmeği denemek istersiniz. Sardalya, iyi bir kalsiyum ve D vitamini kaynağı olduğu kadar, iltihap düzeylerini azaltmaya yardımcı olduğu bilinen omega-3 yağ asitleri. Kredi: © Digiphoto, 2006 Caroline Nation bunu geliştirdi ...

Editörün Seçimi

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB'da göreceğiniz alt testlerden bir tanesi Kelime Bilgi testi. Test gününde soruların ve biçimin neye benzeyeceği hakkında bir fikir edinmek için aşağıdaki soruları inceleyin. Örnek sorular Kelime Bilgi Zamanı: 35 soru için 11 dakika Talimatlar: Kelime Bilgisi alt testi üçüncü alt testtir ...

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

Kelime Bilgisi ASVAB üzerinde alt test, bu tür soru, bir kelimeyi pasaj bağlamında kullanılan şekilde tanımlamanızı gerektirir. Sorunun doğru tanımı, sözcüğün en yaygın anlamı olabilir veya daha az bilinen bir anlam olabilir ...

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sayı problemleri ASVAB üzerinde bulacağınız sayı problemleri oldukça basittir. Sorular, sayıları temel ekleme, çıkarma, çarpma veya bölme ile değiştirmenizi ister. Çoğu kişi bu tür kelime problemlerini oldukça kolay buluyor. Birkaç tane denemek ister misiniz, sadece ayağınızı ıslatmak için mi? Elbette. Jesse ...