Video: EEG ile hafızadaki yüzleri hatırlama 2024
Derecelendirme verilerinin makine öğrenmesindeki sınırlamaları vardır. Önerilen sistemlerin iyi çalışabilmesi için hem sizin hem de başkalarıyla ve derecelendirme verilerini edinmek, bir öneri sisteminin birden çok müşterinin deneyimlerinden öğrenmesini sağlar.Ödeme verileri, bir yargıya (bir ürünü yıldızlar veya sayılar kullanarak derecelendirmek gibi) veya bir gerçeğe (bir ikili 1/0,
Veri kaynağı veya türü ne olursa olsun, derecelendirme verileri her zaman davranışlarla alakalıdır. Bir filmi derecelendirmek için, filmi izlemeye, izlemeye ve filmi seyretme deneyiminize bağlı olarak derecelendirmeye karar vermeniz gerekir. Gerçek önerici sistemler puanlama verilerinden farklı şekillerde öğrenirler:
- İşbirlikçi filtreleme: Maçlar Geçmişte kullanılan film veya ürün benzerliklerine dayalı değerlendiriciler. Öğelere dayalı tavsiyeler elde edebilirsiniz sana benzer kişilere veya beğendiğiniz öğelere benzer öğelerden hoşlandı.
- İçerik tabanlı filtreleme: Bir film seyrettiğinizin ötesine geçiyor. Bu, özelliklerin temsil ettiği daha büyük kategorilere dayalı olarak bir eşleşme olup olmadığını belirlemek için sizinle ve filmle ilgili özellikleri inceler. Örneğin, aksiyon filmlerinden hoşlanan bir kadınsanız, önerici bu iki kategorinin kesişimini içeren önerileri arayacaktır.
- Bilgi temelli öneriler: Kullanıcılar tarafından ifade edilen tercihler ve ürün açıklamaları gibi meta verilere dayalıdır. Makine öğrenmeye dayanır ve kullanıcı veya ürün özelliklerini belirlemek için yeterli davranış verilerine sahip olmadığınızda etkindir. Bu, soğuk başlatma olarak anılır ve birlikte çalışılan filtrelemeye veya içeriğe dayalı filtrelemeye erişime sahip olmadığınız için en zorlu öneri görevlerinden birini temsil eder.
Ortak filtreleme kullanırken, benzerliği hesaplamanız gerekir. Öklid, Manhattan ve Chebyshev mesafelerinin dışında kalan bu bilgiler kosinüs benzerliğini tartışıyor. Kosinüs benzerliği, iki vektör arasındaki açısal kosinüs mesafesini ölçer; bu, kavramak zor bir kavram gibi görünse de, veri alanlarındaki açıları ölçmenin bir yoludur.
Özelliklerden oluşan ve iki puan alan bir boşluk düşünün. Noktalar arasındaki mesafeyi ölçebilirsiniz. Örneğin, Öklid uzunluğunu kullanabilirsiniz, bu, birkaç boyutunuz olduğunda mükemmel bir seçimdir, ancak boyutsallığın laneti nedeniyle birden fazla boyuta sahipseniz perişan olur.
Kosinüs mesafesinin arkasındaki fikir, uzay kökenine bağlı iki noktanın (tüm boyutların sıfır olduğu nokta) yarattığı açıyı kullanmaktır. Noktalar yakınsa, kaç tane boyut mevcut olursa olsun açı dar. Uzaktaysa açı çok büyüktür.
Kosinüs benzerliği, kosinüs mesafesini yüzde olarak uygular ve bir kullanıcının başka birine benzeyip benzemediğini veya bir filmin başka bir filmle ilişkilendirilip eşlenemeyeceğini söylemede oldukça etkilidir; çünkü aynı kullanıcılar bunu tercih eder. Aşağıdaki örnek, film 50, Star Wars'a en çok benzeyen filmleri bulur.
benzerleri (MovieLense [50],
MovieLense [-50])
print (colnames (MovieLense [50]))
[1] "Yıldız Savaşları (1977)"
similar_movies <
[1] "Oyuncak Hikayesi (1995)"
=================================================================================================
"Jedi'nin Dönüşü (1983)"