Video: The future we're building -- and boring | Elon Musk 2024
destek vektör makinesi (SVM), yeni bir veri sınıflandırma algoritmasıdır Veri öğelerini etiketli kategorilerden birine ekleyin. SVM çoğu durumda ikili sınıflandırıcıdır; söz konusu verilerin iki olası hedef değeri içerdiğini varsayar.
SVM algoritmasının bir başka sürümü olan çok sınıflı SVM, , birden fazla sınıf (gruplama veya kategori) içeren bir veri kümesindeki sınıflandırıcı olarak kullanılmak üzere SVM'yi arttırır. SVM, görüntü tanıma, tıbbi teşhis ve metin analizi gibi birçok uygulamada başarıyla kullanılmıştır.
Bir resimdeki bir nesnenin adını otomatik olarak algılayıp tahmin edeceğiniz tahmini bir analitik model tasarladığınızı varsayalım. Bu aslında resim tanıma sorunudur - veya daha özel olarak, yüz tanıma: Sınıflandırıcının bir fotoğrafdaki bir kişinin adını tanımasını istiyorsunuz.
Bu karmaşıklığın üstesinden gelmeden önce, aynı sorunun daha basit bir versiyonunu düşünün: Tek tek meyve parçalarının resimlerini aldınız ve sınıflandırıcınızın resimde ne tür meyve türünü öngördüğünü varsayalım. Sadece iki çeşit meyvenin olduğunu varsayalım: elma ve armut, resim başına bir tane.
Yeni bir resim verildiğinde, resme bakmadan meyvenin elma mı yoksa armut olduğunu öngörmek istersiniz. SVM'nin her bir resmi elma veya armut olarak sınıflandırmasını istiyorsunuz. Diğer tüm algoritmalarda olduğu gibi, ilk adım klasörü eğitmektir.
Diyelim ki 200 elma elma ve 200 armut fotoğrafı var. Öğrenme aşaması, bu resimlerin sınıflandırıcıya beslenmesinden oluşur; böylece bir elmanın nasıl göründüğünü ve bir armutun neye benzediğini öğrenir. Bu ilk adıma geçmeden önce, her bir görüntüyü, (örneğin) R istatistik paketini kullanarak bir veri matrisine dönüştürmeniz gerekir.
Bir görüntüyü bir matriste sayı olarak temsil etmek için basit bir yol, resim içindeki geometrik formları (daire, çizgi, kareler veya dikdörtgenler gibi) aramak ve her örneğinin konumlarını bulmaktır her geometrik form. Bu rakamlar, bir koordinat sisteminde çizilen gibi, görüntü içindeki nesnelerin koordinatlarını da temsil edebilir.
Tahmin edebileceğiniz gibi, bir görüntüyü bir matris matrisi olarak göstermek, basit bir görev değildir. Görüntü sunumuna ayrı bir araştırma alanı ayrılmıştır.
Aşağıdaki, bir destek vektör makinesinin, algoritmanın geçmişte öğrendiği şeylere dayanarak bir meyvenin sınıfını (matematiksel olarak elma veya armut olarak etiketleme) nasıl öngörebileceğini göstermektedir.
Bütün görüntüleri veri matrislerine dönüştürdüğünüzü varsayalım. Daha sonra destek vektör makinesi iki ana girdi alır:
-
Önceki (eğitim) verileri: Bu matris seti daha önce görülen elma ve armut görüntülerine karşılık gelir.
-
Yeni (görünmeyen) veriler bir matriste dönüştürülen bir görüntüyü kapsar. Amaç resimdeki neyi otomatik olarak tahmin etmektir - elma veya armut.
Destek vektörü, çoğu zaman çekirdek işlevi olarak adlandırılan, bilinmeyen resmin etiketini (elma) tahmin etmek için yeni veriyi eğitim verisinden en iyi görüntüye eşleyen bir matematik işlevi olan bir matematiksel işlev kullanır veya armut).
Diğer sınıflayıcılara kıyasla, destek vektör makineleri, sağlam, doğru tahminler üretir, gürültülü verilerin en azından etkilenir ve fazla uyumluluk eğilimi daha az olur. Bununla birlikte, destek vektör makinelerinin, yalnızca iki kategoriye (elma veya armut gibi) sahip olduğunuzda ikili sınıflandırma için en uygun olduğunu aklınızda bulundurun.