Video: TÜRKİYE ÖNLEM ALMAZSA, 2050 DE SURİYE HARİTASINI BÖYLE YAPACAKLAR! 2024
En Yakın Komşular, küme tahmini analizinde, diğer öğelerin kendisine en çok benzeyen şeyleri belirleyerek bir kümeye bir öğe atayarak yaygın şekilde kullanılan basit bir algoritma. En Yakın Komşular algoritmasının tipik bir kullanımı aşağıdaki adımları izlemektedir:
-
Veri kümesindeki öğelerden bir benzerlik matrisi türetme.
uzaklık matrisi olarak anılan bu matris, veri kümesindeki her bir öğe için benzerlik değerlerini alacaktır. (Bu değerler bir sonraki örnekte ayrıntılı olarak ele alınmıştır.)
-
Matris yerinde olduğunda, veri kümesindeki her bir maddeyi diğer her öğeyle karşılaştırın ve benzerlik değerini hesaplayın.
-
Mesafe matrisini kullanarak komşularına olan uzaklığın tanımladığınız bir değerden düşük olup olmadığını görmek için her maddeyi inceleyin.
Bu değere eşiği denir.
-
Algoritma, her bir öğeyi ayrı bir kümeye yerleştirir, öğeleri analiz eder ve hangi öğelerin benzer olduğuna karar verir ve aynı kümeye benzer öğeleri ekler.
-
Tüm öğeler incelendiğinde algoritma durur.
Bireylerin yaşadığı sekiz coğrafi konumdan oluşan bir veri seti düşünün. Amaç, bu kişileri, Küresel Konumlandýrma Sistemi tarafýndan belirlenen coðrafi yerlere göre gruplara bölmektir.
Bu grafik, bireylerin coğrafi verilere ilişkin basit bir veri kümesini göstermektedir. Sekiz kişi hakkında toplanan tüm verilerin zaman içindeki belirli bir noktada toplandığını varsayalım.
->Bireysel Kimlik | GPS - Coğrafi Boylam | GPS - Coğrafi Enlem |
---|---|---|
1 | 2 | 10 |
2 | 2 | 5 < 3 |
8 | 4 | 4 |
5 | 8 | 5 |
7 | 5 | 6 |
6 | 4 | 7 |
1 | 2 | 8 |
4 | 9 | K-araçları ile olduğu gibi, ilk ön adım her bir çift çifti için benzerlik değerlerini hesaplamaktır. İki madde arasındaki benzerliği hesaplamanın bir yolu, Öklid uzaklıklarını belirlemektir. İki nokta arasındaki benzerlik değerleri daha önce gösterildiği gibi hesaplanır. |
Madde A ile Madde B arasındaki benzerlik =
√ (f
a, 1 - f b, 1 ) 2 + (f - - b - f -, - f -, > 2 Burada, f a, 1 , A Maddesinin ilk özelliğidir, f a, 2 , A Maddesinin ikinci özelliğidir ve ilgili değerler etiketli b
B Maddesinin özelliklerini temsil eder. n değişkeni, özelliklerin sayısıdır. Bu örnekte, n 2'dir. Örneğin, Madde 1 ile Madde 2 arasındaki benzerlik şu şekilde hesaplanır: Madde 1 ile Madde 2 arasındaki benzerlik = √ (2-2) 2 + (10-5) 2 = 5