Video: BLUE STACKS 3 İNCELEMESİ 2024
Destek Vektör Makinesi (SVM) sınıflandırıcısını tahmini analitik için yüklenen verilerle besleyebilmeniz için önce tam veri kümesini bir eğitim kümesine bölmeniz ve Deneme seti.
Neyse ki, scikit-learn, tam veri kümesini kolayca bölmenize yardımcı olacak bir işlev gerçekleştirdi. Train_test_split işlevi, girdi olarak tek bir veri kümesi ve yüzde değeri alır. Yüzde değeri, test kümesinin boyutunu belirlemek için kullanılır. İşlev, iki veri kümesi döndürür: test veri kümesi (boyutu belirtilmiş) ve eğitim veri seti (kalan verileri kullanır).
Genellikle birisi eğitim seti olarak kullanmak için verinin yaklaşık yüzde 70-80'ini alabilir ve kalan verileri test seti olarak kullanabilir. Ancak Iris veri kümesi çok küçük (yalnızca 150 örnek), dolayısıyla modeli eğitmek için yüzde 90'ı alabilir ve tahmini modelinizin nasıl performans göstereceğini görmek için diğer yüzde 10'u test verileri olarak kullanabilirsiniz.
Veri kümenizi ayırmak için aşağıdaki kodu yazın: >>>> sklearn import cross_validation >>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (iris veri, iris hedefi, test_size = 0.10, random_state = 111)
İlk satır, çapraz doğrulama kitaplığını oturumunuza içe aktarır. İkinci satır, örneklemin yüzde 10'undan test setini oluşturur.
y_train 135 gözlem ile aynı sırada 135 etiket içerecektir.
x_test, 15 (veya yüzde 10) gözlem ve özellik içerecektir.
y_test, 15 gözlem ile aynı sırada 15 etiket içerecektir.
Aşağıdaki kod, bölmenin beklediğiniz gibi olduğunu doğrular:
Tahminlü analitik alanında birçok yeni başlayanlar, veri kümelerini bölmeyi unutuyor; bu da, projeye ciddi bir tasarım hatası getiriyor. Eksiksiz 150 örneği eğitim verisi olarak makineye yüklediyse, bu, modeli test etmek için hiç görünmeyen verileri bırakacaktır. Öyleyse, tahmini modeli test etmek için bazı eğitim örneklerini tekrar kullanmaya başvurmanız gerekir.
Böyle bir durumda, modelin her zaman doğru sınıfı öngördüğünü göreceksiniz - çünkü modeli eğitmek için kullandığınız aynı verileri kullanıyorsunuz demektir.Model daha önce bu deseni gördü; sadece gördüklerini tekrarlamak hiç problem yaşamaz. Çalışan bir tahmini model, henüz görmediği veriler için tahmin yapmalıdır.
SVM sınıflandırıcısının, eğitim veri setinin ve bir test veri kümesinin örneğine sahip olduğunuzda, eğitim verisi ile modeli eğitmeye hazırsınız demektir. Aşağıdaki kodu yorumlayıcıya yazarak tam olarak bunu yapabilirsiniz: >>>> svmClassifier. fit (X_train, y_train)
Bu kod satırı, tahminleri yapmak için bir çalışma modeli oluşturur. Özellikle, Iris sınıfının yeni bir etiketlenmemiş veri kümesinin ne olacağını tahmin edecek tahmini bir model. SvmClassifier örneğinde, çeşitli şeyler yapmak için arayabileceğiniz çeşitli yöntemler bulunur.
Örneğin, fit yöntemini çağırdıktan sonra, çağırmak için en kullanışlı yöntem predict yöntemidir. Yeni veriyi besleyeceğiniz yöntem budur; bunun karşılığında, sonucu öngörür.