Video: Sınıflandırma Classification 1 (Veri Madenciliği Teorik 3) 2024
Akıllı tahliller için, kullanmanız gereken algoritmalar için veri yüklemeniz gerekir. Ikın veri kümesini scikit'e yüklemek, birkaç kod satırı basmak kadar basittir, çünkü scikit zaten veri kümesini yüklemek için bir işlev yarattı.
Sepal Uzunluk | Sepal Genişlik | Petal Uzunluk | Petal Genişlik | Hedef Sınıf / Etiket |
---|---|---|---|---|
5. 1 | 3. 5 | 1. 4 | 0. 2 | Setosa (0) |
7. 0 | 3. 2 | 4. 7 | 1. 4 | Versikolor (1) |
6. 3 | 3. 3 | 6. 0 | 2. 5 | Virginica (2) |
-
Yeni bir Python interaktif kabuk oturumu açın.
Yeni bir Python oturumu kullanın, böylece hafızasında bırakılan hiçbir şey yoktur ve sizinle birlikte çalışmak için temiz bir şeye sahipsiniz.
-
Sorguya aşağıdaki kodu girin ve çıktıyı izleyin: >>>> sklearn. veri kümeleri import load_iris >>> iris = load_iris ()
Bu iki deyimi çalıştırdıktan sonra tercümandan gelen mesajları görmemelisiniz. Değişken iris, irisdeki tüm verileri içermelidir. csv dosyası.
Çıktı, irisin tüm içeriği olacak. csv dosyası ve load_iris işlevinin değişkene yüklediği veri kümesiyle ilgili bazı bilgiler. Değişken, dört temel özelliğe sahip bir sözlük veri yapısıdır. Iris'in önemli özellikleri aşağıda listelenmiştir.
Özellik Adı
Açıklamadata | Gözlemlerin tüm ölçümlerini içerir. |
---|---|
feature_name | Özellikin adını (özellik adı) içerir. |
target | Gözlemlerin tüm hedeflerini (etiketleri) içerir. |
target_names | Sınıfların adlarını içerir. |
Değişken adını yazdıktan sonra nokta ile ardından mülk adı yazarak değerleri yorumlayıcıda yazdırabilirsiniz. Buna bir örnek iris kullanmaktır. veri gibi, iris özelliklerine erişmek için: >>>> iris. data | Bu, birçok programlama dilinde bir nesnenin özelliklerine erişmenin standart bir yoludur. |
SVM sınıflandırıcısının bir örneğini oluşturmak için aşağıdaki kodu tercümeciye yazın: >>>> sklearn. svm import LinearSVC >>> svmClassifier = LinearSVC (random_state = 111)
İlk kod satırı Linear SVC kütüphanesini oturuma aktarır. Doğrusal Destek Vektör Sınıflayıcı (SVC), doğrusal sınıflandırma için SVM'nin bir uygulamasıdır ve çoklu sınıf desteğine sahiptir.Veri kümesi lineer olarak ayrılabilir ve üç sınıfı vardır, bu nedenle nasıl performans gösterdiğini görmek için Linear SVC'yi denemek iyi bir fikir olacaktır.
İkinci satır, örneği svmClassifier değişkenini kullanarak oluşturur. Bu hatırlanması gereken önemli bir değişkendir. Random_state parametresi, bu örnekleri çoğaltmanızı ve aynı sonuçları elde etmenizi sağlar. Random_state parametresini girmediyseniz sonuçlarınız burada gösterilenlerden farklı olabilir.