Video: E-PERAKENDECİLİK Ü5 - S1 2024
Kümeleme ve sınıflandırma algoritmalarının amacı, yapılandırılmış ve yapılandırılmamış verilerin büyük kümelerinden değer almak ve bunlardan çıkarmaktır. Çok miktarda yapılandırılmamış verilerle çalışıyorsanız, verileri analiz etmeden önce mantıksal gruplamaya ayırmaya çalışmak mantıklı olur.
Kümeleme ve sınıflandırma, verilerinizi topluca süpürüp sonra somut cıvata analizine girmeden önce orada buldumlarınıza dayalı bazı mantıksal yapılar oluşturmanıza olanak tanır.
kümeler benzer nitelikleri paylaşan veri noktaları grubudur ve kümeleme algoritmaları bu veri noktalarını farklı kılan gruplandırmadır benzerliklerine dayalı kümeler. Tıp biliminde hastalık sınıflaması için kullanılan kümeleme algoritmalarını göreceksiniz, ancak bunları pazarlama araştırmasında müşteri sınıflaması ve çevre mühendisliği çevresel sağlık risk değerlendirmesi için de kullandığını göreceksiniz.Hiyerarşik:
-
Algoritmalar, her biri kendi hiyerarşik düzeyinde iç içe geçmiş kümeler ayrı kümeler oluşturur. Bölümlü:
-
Algoritmalar yalnızca tek bir küme kümesi oluşturur. Hiyerarşik kümeleme algoritmalarını, yalnızca veri setinizdeki veri noktaları arasındaki uzaklıkları biliyorsanız kullanabilirsiniz. Bu bölümde açıklanan k-en yakın komşuluk algoritması, kümeleme algoritmalarının hiyerarşik sınıfına aittir.
Diğer taraftan, kümeleme algoritmalarını kullanırken, verileriniz için kaç tane küme olduğuna ilişkin önceden tanımlanmış bir konsepte sahip değilsiniz ve verileri en uygun şekilde sıralamak ve kümelemek için kümeleme algoritmalarına güveniyorsunuz. Kümeleme teknikleriyle, etiketlenmemiş verilerden öğreniyorsunuzdur.
Bununla birlikte, sınıflandırmanın doğasını daha iyi göstermek için Twitter ve hash etiketleme sistemine bir göz atın.Diyelim ki dünyadaki en sevdiğiniz içkiyi tuttunuz: Starbucks'tan buzlu bir karamel latte. Bir fotoğrafta tweet etmeye karar verdiğiniz içki içmekten mutlu ve "Bu şimdiye kadarki en güzel latte!" Deyimi! #StarbucksRocks. "Elbette, tweet'inizin #StarbucksRocks akışına girmesi ve #StarbucksRocks olarak etiketlenmiş diğer tüm tweetler ile birlikte sınıflandırılması için tweetinize" #StarbucksRocks "ekliyorsunuz. Tweetinde hashtag etiketini kullanmanız, Twitter'a verilerinizi tanınabilir ve erişilebilir bir grup veya
küme olarak sınıflandırmayı anlattı.