Video: Data Analysis 0: Introduction to Data Analysis - Computerphile 2024
Tahmin yapmak için analiz ettiğimiz veri seti, UCI makine-öğrenme deposunda bulunan Tohumlar veri kümesidir. Bu veri kümesi 210 gözlem ve 7 öznitelik artı etiket içeriyor. Etiket beklenen sonuçtur ve tahmini modeli doğrulamak için kullanılır.
Tahmin etmeye çalıştığınız sonuç, yedi özelliğin değerleri göz önüne alındığında, olduğu tohum türüdür (özellik 8). Tohum tipi için üç olası değer 1, 2 ve 3 olarak etiketlenmiştir ve Kama, Rosa ve Kanada buğday çeşitlerini temsil etmektedir.
alan-
çevre
-
sıkıştırma
-
çekirdeğin uzunluğu
-
çekirdeğin genişliği
-
asimetri katsayısı - 1 ->
-
Sağlanan sütun sırasındaki öznitelikler: > çekirdek yiv uzunluğu
-
buğday sınıfı
-
UCI deposundan veri kümesini almak ve belleğe yüklemek için konsola aşağıdaki komutu yazın:
Görüyorsunuz ki veri kümesi, çalışma alanı bölmesine bakarak (sağ üst) veri çerçevesi değişkenitohumları
olarak belleğe yüklendi. Kaynaktaki veri değerlerini görmek için tohumlar değişkenini tıklayın