Ev Kişisel Finans Büyük Veri için Veri Madenciliği - mankenler

Büyük Veri için Veri Madenciliği - mankenler

Video: Geleceğin Mesleği: Veri Madenciliği 2025

Video: Geleceğin Mesleği: Veri Madenciliği 2025
Anonim

Veri madenciliği, büyük verilerin kalıplarını bulmak için büyük miktarda veriyi keşfetmek ve analiz etmektir. Teknikler istatistik ve yapay zeka (AI) alanlarından çıktı ve biraz karışımı veri tabanı yönetimine bırakıldı.

Genellikle, veri madenciliğinin amacı ya sınıflandırma ya da tahmindir. Sınıflamada, fikir veri gruplarına ayırmaktır. Örneğin, bir pazarlamacı, yanıtlayanların özelliklerine, bir tanıtıma kimin tepki vermediğine ilgi duyabilir.

Bunlar iki sınıftır. Tahminlerde, fikir sürekli bir değişkenin değerini tahmin etmektir. Örneğin, bir pazarlamacı, bir promosyona cevap vereceğini tahmin etmeyle ilgilenebilir.

Veri madenciliğinde kullanılan tipik algoritmalar arasında şunlar bulunur:

  • Sınıflandırma ağaçları: Bir veya daha fazla tahmini değişkenlerin ölümlerine dayalı bağımlı bir kategorik değişkeni sınıflandırmak için kullanılan popüler bir veri madenciliği tekniği. Sonuç, düğümler ve düğümler arasındaki bağlantıları içeren bir ağaçtır ve eğer if-then kuralları oluşturmak için okunabilir.

  • Lojistik regresyon: Standart regresyonun bir varyantı olan ancak kavramı sınıflandırmayla başa çıkmak için genişleten istatistiksel bir teknik. Olay oluşma ihtimalini bağımsız değişkenlerin bir fonksiyonu olarak öngören bir formül üretir.

  • Sinir ağları: Hayvan beyinlerinin paralel mimarisinden sonra modellenen bir yazılım algoritması. Ağ, giriş düğümleri, gizli katmanlar ve çıktı düğümlerinden oluşur. Her birimin ağırlığı vardır. Veriler giriş düğümüne verilir ve deneme yanılma sistemi ile algoritma belirli bir durma ölçütlerini karşılayana kadar ağırlıkları ayarlar. Bazıları bunu kara kutu yaklaşımına benzetmiştir.

  • K-en yakın komşuları gibi kümeleme teknikleri: Benzer kayıt gruplarını tanımlayan bir tekniktir. K-en yakın komşu tekniği, tarihsel (eğitim) verinin kayıt ve noktalar arasındaki mesafeleri hesaplar. Daha sonra bu kaydı, bir veri kümesindeki en yakın komşusu sınıfına atar.

İşte bir sınıflandırma ağacı örneği. Bir telefon şirketinin hangi konut müşterilerinin hizmetlerinden çıkarabileceklerini belirlemek istediğini göz önünde bulundurun.

Telefon şirketi şu özelikleri içeren bilgileri içerir: kişinin ne kadar süreyle hizmet ettiği, serviste ne kadar harcadığı, hizmetin sorunlu olup olmadığı, ihtiyaç duyduğu en iyi arama planına sahip olup olmadığı, nerede bulunduğu yaşlandığını, yaşını kaç yaşında, birlikte paketlenmiş başka hizmetleri olup olmadığını, diğer taşıyıcı planlarıyla ilgili rekabetçi bilgileri ve halen hizmetiniz olup olmadığını öğrenir.

Elbette bundan çok daha fazla özellik bulabilirsiniz. Son öznitelik çıktı değişkenidir; yazılımın, müşterileri iki grubun birine sınıflandırmak için kullanacağı şey budur - belki de kalıcılar ve uçuş riskleri.

Veri kümesi eğitim verisine ve bir test veri setine ayrılmıştır. Eğitim verileri, gözlem (öznitelik olarak adlandırılır) ve bir sonuç değişkeninden (bir sınıflandırma modelinde ikili) - bu durumda kalışçılardan veya uçuş risklerinden oluşur.

Algoritma, eğitim verileri üzerinden yürütülür ve bir dizi kural gibi okunabilen bir ağaç ortaya çıkar. Örneğin, müşteriler on yıldan fazla bir süre şirkette bulunmuşsa ve 55 yaşın üzerindeyse, sadık müşteriler olarak kalma ihtimalleri yüksektir.

Sonra bu kurallar, bu modelin "yeni veriler" üzerinde ne kadar iyi olduğunu belirlemek için test verileri kümesi üzerinde yürütülür. "Model için doğruluk önlemleri sağlanmaktadır. Örneğin, popüler bir teknik, karışıklık matrisidir. Bu matris, kaç kasa doğru doğru yanlış sınıflandırılmış hakkında bilgi sağlayan bir tablodur.

Model iyi görünüyorsa, mevcut olduğu için (diğer bir deyişle, yeni uçuş riskini tahmin etmek için kullanıldığında) başka verilere dağıtılabilir. Model, örneğin, uçuş riskleri olduğunu düşündüğü müşterilere özel teklifler göndermeye karar verebilir.

Büyük Veri için Veri Madenciliği - mankenler

Editörün Seçimi

Doktor Asistan Sınavı: Skleroderma - mankenler

Doktor Asistan Sınavı: Skleroderma - mankenler

Skleroderma, aynı zamanda ilerleyici sistemik skleroz (PSS) olarak da bilinir, otoimmün bir hastalıktır bağ dokularını etkiler, Doktor Asistan Sınavında (PANCE) kapsanacaktır. Akciğerler ve böbrekler de dahil olmak üzere çeşitli organlar da etkilenebilir, ancak cilt ağırlıklı olarak dahil edilir. Kolajen oluşması nedeniyle cilt aslında sıkılaşır. Skleroderma neden olabilir ...

Doktor Asistan Sınavı: Deri veya Saç Dökülmesi Tıbbi Durumlar - Hayvan Maskesi

Doktor Asistan Sınavı: Deri veya Saç Dökülmesi Tıbbi Durumlar - Hayvan Maskesi

Doktor Asistanlığı Sınavı için (PANCE) için, çok ciddi ve potansiyel olarak hayatı tehdit eden bazı maddeleri gözden geçirmeniz gerekecektir: dış tabakayı kaybedebileceğiniz cilt koşulları, derinin epidermisi. Dökülme hastalıkları, yanıklar ve çok fatal olmayan bir cilt rahatsızlığı, alopesi gözden geçirdiğinizden emin olun. Desquamating diseases Desquamation, Despamating diseases Dizinin kaybolması ya da dökülmesidir ...

Hekim Yardımcısı Sınav: Kişilik Bozuklukları - mankenleri

Hekim Yardımcısı Sınav: Kişilik Bozuklukları - mankenleri

Hekim Yardımcısı Sınav (Pance) tanıdık olmasını bekliyoruz olacak kişilik bozukluklarıyla birlikte. Bir kişilik bozukluğunun izlerinden biri, toplumsal normlardan çok farklı olan davranışlar veya düşünce süreçleridir. Kişi hayatta değil. Buna ek olarak, kişi davranışları uygunsuz görmemektedir. Nasıl teşhis ve ...

Editörün Seçimi

Neden Çevrimiçi Topluluk Yarışmasını Yavaş ve Kararlı Kazanır - canavarlar

Neden Çevrimiçi Topluluk Yarışmasını Yavaş ve Kararlı Kazanır - canavarlar

Çevrimiçi topluluklar belirlenmemiştir - Bu ve unutun, işler. En iyi senaryo, istikrarlı, organik büyüme sağlamak olsa da, gerçek şu ki, bir gecede olmaz. İlk bakışta hayal kırıklığına uğrayabilirsiniz, çünkü aynı anda yalnızca birkaç üyeniz var ve işvereniniz topluluğunuzun yeterince hızlı büyüdüğünü düşünmüyor olabilir, ancak gerçek şu ki ...

Blog Sitenizin Fontları Nerede Bulacaksınız - AYRINTILILAR

Blog Sitenizin Fontları Nerede Bulacaksınız - AYRINTILILAR

Web'de pek çok yeri bulmaya çalışıyor yazı tipleri, en iyi siteleri bulmak zor olabilir. Google Web Fontları'na ek olarak, aşağıdaki listeler, ücretsiz ya da ücret karşılığında yazı tiplerini aramak için en sevdiğim yerlerden bazılarına işaret ediyor. Yazı tipi bulma macerasına devam ederken, tanıdık olmanız gerekir ...

Editörün Seçimi

Photoshop CS6'daki Yeni Bulanıklaştırma Galerisi ile Nasıl Çalışılır - mankenler

Photoshop CS6'daki Yeni Bulanıklaştırma Galerisi ile Nasıl Çalışılır - mankenler

Photoshop CS6'daki üç yeni Blur filtresinden, seçeneklerinizi içeren Blur Tools ve Blur Effects gibi ilgili kontrol panellerine de erişeceksiniz. Her üç filtre de özel efektler oluşturmanızı sağlar. Alan Bulanıklığı: Resminiz üzerinde genel bir bulanıklık oluşturur. Ek kontrol noktaları veya pimler ekleyerek ...

Photoshop CS6'daki Özellikler Paneli ile Çalışma - mankenler

Photoshop CS6'daki Özellikler Paneli ile Çalışma - mankenler

Adobe, kısa ömürlü , şimdi Maskeler ve Ayarlar panellerinin özelliklerini içeren Özellikler paneli lehine Photoshop CS6'daki Bağımsız Maskeler panelinde. Ancak endişelenmeyin. Daha önce Maskeler paneli tarafından sağlanan özelliklerin hiçbiri kayboldu. Yeni Özellikler paneli, katmanını eklemenize, düzenlemenize ve yönetmenize olanak tanır ...

Photoshop CS6'da Ufuk Noktası ile Çalışma - mankenler

Photoshop CS6'da Ufuk Noktası ile Çalışma - mankenler

Photoshop CS6'daki Ufuk Noktası komutunu etkinleştirir perspektif uçaklarına sahip görüntülerde gerçekçi düzenlemeler yapmanız gerekir. Ufuk Noktası ile, resimlerinizdeki düzlemleri belirlediniz ve daha sonra çeşitli teknikler kullanarak bu düzlemler üzerinde nesneler ekleyip yok ettiniz. Düzenlenmesi gereken bir resmi açın. Yapıştırmanız gerekiyorsa ...