Ev Kişisel Finans Makine Öğrenimi İçin Vektörler arasındaki benzerliği ölçme - mankenler

Makine Öğrenimi İçin Vektörler arasındaki benzerliği ölçme - mankenler

İçindekiler:

Video: 11. Introduction to Machine Learning 2024

Video: 11. Introduction to Machine Learning 2024
Anonim

Her birini bir vektör olarak düşündüğünüz hesaplamaları kullanarak verilerinizdeki örnekleri kolayca karşılaştırabilirsiniz. Aşağıdaki bilgiler, öğrenme amaçları için vektörler arasındaki mesafenin hesaplanması gibi görevleri yerine getirmek için vektörler arasındaki benzerliğin nasıl ölçüleceğini açıklamaktadır.

Benzerliği anlama

Vektörel bir formda, örneklerdeki her değişkeni bir koordinat dizisi olarak görebilirsiniz; her biri farklı bir alan boyutundaki bir konumu işaret etmektedir. Bir vektör iki öğeye sahipse, yani yalnızca iki değişkene sahipse, onunla çalışmak, sadece bir öğenin konumunu, Doğu-Batı ekseni üzerindeki konum için ilk numarayı ve diğerini Kuzey- Güney ekseni.

Değerlerin örnekleri bir grafik üzerinde puan olarak çizilir.

Örneğin, parantezler arasındaki sayılar (1, 2) (3, 2) ve (3, 3) tüm puan örnekleri. Her örnek, x'in (yatay eksen) ve i'nin y (dikey eksende) için listenin ilk değerini kullanarak bir haritada kolaylıkla bulunup basılabilen sıralı bir değer listesi (bir takım olarak adlandırılır) 'dir. Sonuç dağınıklıktır.

Matris formundaki veri setiniz birçok sayısal özelliğe sahipse (sütunlar), ideal olarak sayıların veri alanı boyutlarını temsil eden satırlar (örnekler) her birini temsil eder matematiksel olarak bir vektör olan nokta. Vektörünüz ikiden fazla öğeye sahip olduğunda, görselleştirme zahmetli hale gelir; ünkü üçüncü boyutların temsil edilmesi kolay değildir (sonuçta üç boyutlu bir dünyada yaşarız).

Ancak, diğer boyutlar için boyut, şekil veya renk kullanarak gibi daha uygun boyutlarda boyutlar taşımaya çalışabilirsiniz. Açıkçası, bu kolay bir iş değildir ve genellikle sonuç sezgisel olmaktan uzaktır. Bununla birlikte, iki ile ik boyutları göz önüne alırken birçok grafiği sistematik olarak basarak, veri alanınızdaki noktaların nerede olacağı fikrini kavrayabilirsiniz. Bu tür arazilere dağılım çizgisi matrisleri denir.

Çok boyutluluk bakımından endişelenmeyin. Öğrendiğiniz kuralları iki veya üç boyutta birden çok boyuta genişletiyorsunuz, bu nedenle bir kural iki boyutlu bir alanda çalışıyorsa, birden çok alanda da çalışır. Dolayısıyla, tüm örnekler ilk önce iki boyutlu örneklere değinmektedir.

Öğrenme mesafelerinin hesaplanması

Bir algoritma, mesafe ölçümlerini kullanan sayıların vektörleri kullanarak öğrenebilir. Genellikle vektörleriniz tarafından ifade edilen alan, uzaklıkları belirli belirli koşullara uyan mesafeli bir metrik boyutudur:

  • Negatif mesafeler yok ve yalnızca başlangıç ​​noktası ve bitiş noktası çakıştığında mesafeniz sıfır (" negatif olmayan" olarak adlandırılır)).
  • Mesafe, bir noktadan diğerine (ve bunun tersi de geçerlidir) (simetri olarak adlandırılır).
  • Bir başlangıç ​​noktası ile sonuncu arasındaki mesafe, başlangıçtan üçüncü bir noktaya ve oradan da son bir mesafeye (üçgen eşitsizliği olarak adlandırılan) kadar olan mesafeden her zaman daha büyük veya daha kötüdür, - yani kısayollar yok demektir). Metrik alanı ölçen uzaklıklar Öklid mesafesi, Manhattan mesafesi ve Chebyshev mesafesidir. Bunlar, sayısal vektörlere uygulanabilen tüm mesafelerdir.

Öklid uzaklığı

En yaygın olanı, iki vektörün l2 normu olarak da tanımlanan Öklid mesafesidir (ll, l2 ve linfinity normlarının bu tartışmasını okuyun). bir iki boyutlu bir düzlemde, bir Öklid mesafe iki noktayı birleştiren düz bir çizgi olarak refigures ve iki vektörün elemanları arasındaki karesi fark toplamının kare kökü olarak hesaplayın. Önceki çizimde, noktalar (1, 2) ve (3, 3) arasındaki Öklid uzaklığı, R'de sqrt ((1-3) ^ 2 + (2-3) ^ 2) olarak hesaplanabilir; yaklaşık 2 236. mesafesi

Manhattan mesafe

faydalı başka bir ölçüsü (aynı zamanda iki vektörün l1 norm olarak tarif edilmiştir) Manhattan mesafedir. Manhattan mesafesini, vektörlerin elemanları arasındaki farkın mutlak değerini toplayarak hesaplarsınız. Euclidean mesafesi en kısa rota işaret ediyorsa, Manhattan uzaklığı, bir şehirde hareket eden bir taksi yönüne benzeyen en uzun rotayı işaretler. Örneğin, (1, 2) ve (3, 3) noktaları arasındaki Manhattan mesafesi abs (1-3) ve abs (2-3) arasındadır. (Bu mesafe, taksici veya şehir blok mesafesi olarak da bilinir.)

), 3.

Chebyshev mesafe

Chebyshev mesafe veya en metrik ile sonuçlanan vektörlerin elemanları arasında mutlak farkın maksimum alır. Bir kral depo lojistik, satranç oyununda hamle ya da nasıl temsil edebilir bir mesafe ölçüsüdür, üstten vinçle gerekli işlemler bir yerden bir yere bir sandık taşımak için.

Makine öğrenmede, Chebyshev mesafesi, göz önüne alınması gereken birçok boyuta sahip olduğunuzda ve çoğu ilgisiz veya gereksiz olduğunda (Chebyshev'de, mutlak farkları en büyük olanı seçerseniz) yararlı olabilir. Yukarıda kullanılan örnekte, mesafe sadece 2, (1-3) ile abs (2-3) arasındaki maksimum.

Makine Öğrenimi İçin Vektörler arasındaki benzerliği ölçme - mankenler

Editörün Seçimi

Excel 2016 Çalışma Kitabı Tasarlamak - kuklalar

Excel 2016 Çalışma Kitabı Tasarlamak - kuklalar

Tüm Excel 2016 çalışma sayfaları şablonlardan gelmemektedir. Çoğu zaman, belirli çalışma kitaplarının türlerinin üretildiği standart modeller olarak işlev göreceği düşünülen oldukça eşsiz elektronik tablolar oluşturmanız gerekir. Aslında, Excel'de oluşturduğunuz e-tabloların çoğu, bu türden olabilir, özellikle işiniz güvenmiyorsa ...

Excel 2013'teki Veri Formundaki Kayıtları Düzenleme - Veriler

Excel 2013'teki Veri Formundaki Kayıtları Düzenleme - Veriler

Veritabanından sonra yolda gidiyorsanız ve Excel 2013'te kayıt girmekle yetiniyorsanız, veritabanında düzenli bakım yapmak ve düzenlemek için veri formunu kullanmaya başlayabilirsiniz. Örneğin, değiştirmek istediğiniz bir kaydı bulmak için veri formunu kullanabilirsiniz ve sonra düzenlemeleri yapın ...

Bir Excel 2010 Tablosundaki Kayıtları Düzenleme - mankenler

Bir Excel 2010 Tablosundaki Kayıtları Düzenleme - mankenler

Kayıtları düzenlemeye veya silmeye ve masada rutin bakım yapmaya ihtiyaç duyarsınız. Kayıtları el ile çalışma sayfasında düzenleyebilir veya gerekli değişiklikleri yapmak için bir veri formu kullanabilirsiniz. Örneğin, bir veri dosyasını bulmak için veri formunu kullanabilirsiniz ...

Editörün Seçimi

Excel 2010 Grafiğine Veri Tablosu Ekleme - Excel 2010'da çekimser

Excel 2010 Grafiğine Veri Tablosu Ekleme - Excel 2010'da çekimser

Veri tabloları, grafiğin değerlerini grafiğin altındaki bir tabloda görüntüler. 3B grafik kullanırken olduğu gibi, grafiksel bir ekranla birlikte kesin değerleri görmeniz gerekirse yardımcı olurlar. Ayrıca, bazı çizelgelerde okunması zor olan veri etiketlerinden daha uygun olabilirler.

Excel Pivot Tablosuna Hesaplanan Öğe Ekleme - mankenler

Excel Pivot Tablosuna Hesaplanan Öğe Ekleme - mankenler

ÖğEleri bir Excel pivot tabloya ekler. Şimdi, açıkçası, hesaplanan bir öğe eklemek genelde mantıklı değil. Pivot tablolarınız için, eksiksiz, zengin bir Excel listesinden veya bazı veritabanlarından veri aldıysanız, öğe miktarlarını hesaplayarak veriler oluşturmak, biraz goofy'den daha fazlasını gerektirir. Ancak, ...

Editörün Seçimi

Ağınızı bir Güvenlik Testi için Nasıl Eşleştirilir - daha önce ağınızı haritalamanın parçası olarak mankenler

Ağınızı bir Güvenlik Testi için Nasıl Eşleştirilir - daha önce ağınızı haritalamanın parçası olarak mankenler

Güvenlik testi veya etik bir kesmek gerçekleştirirken, halka açık veritabanlarını ve kaynaklarını arayarak başkalarının sisteminiz hakkında ne bildiğini öğrenebilirsiniz. WHOIS aramaları En iyi başlangıç ​​noktası İnternet'te bulunan araçlardan herhangi birini kullanarak bir WHOIS araması gerçekleştirmektir. Içinde ...

Bir Ağdaki Spam'i En Düşük Düzeye Getirme - AYAKLAR

Bir Ağdaki Spam'i En Düşük Düzeye Getirme - AYAKLAR

Hiçbir antispam programı mükemmel değildir; belirli bir miktarda spam'ın gelen kutunuza geçmesini bekleyin. Alınmayan spam miktarını en aza indirgemek için siz (ve kullanıcılarınızın) aklınızda tutmanız gereken bazı ipuçları: Şifrenizi isteyen veya ...

Güvenlik Testi Sonuçlarını Birlikte Götürmek İçin - Güvenlik testi verileriniz olduğunda yalanlar

Güvenlik Testi Sonuçlarını Birlikte Götürmek İçin - Güvenlik testi verileriniz olduğunda yalanlar

- Belgelenen ekran görüntülerinden ve manuel gözlemlerden, kullandığınız çeşitli güvenlik açığı tarayıcıları tarafından üretilen detaylı raporlara kadar - ne yapıyorsunuz? Belgelerinizi ince dişli bir tarakla incelemeniz ve öne çıkan tüm alanları vurgulam