Ev Kişisel Finans Büyük Veri için Veri Madenciliği - mankenler

Büyük Veri için Veri Madenciliği - mankenler

Video: Geleceğin Mesleği: Veri Madenciliği 2024

Video: Geleceğin Mesleği: Veri Madenciliği 2024
Anonim

Veri madenciliği, büyük verilerin kalıplarını bulmak için büyük miktarda veriyi keşfetmek ve analiz etmektir. Teknikler istatistik ve yapay zeka (AI) alanlarından çıktı ve biraz karışımı veri tabanı yönetimine bırakıldı.

Genellikle, veri madenciliğinin amacı ya sınıflandırma ya da tahmindir. Sınıflamada, fikir veri gruplarına ayırmaktır. Örneğin, bir pazarlamacı, yanıtlayanların özelliklerine, bir tanıtıma kimin tepki vermediğine ilgi duyabilir.

Bunlar iki sınıftır. Tahminlerde, fikir sürekli bir değişkenin değerini tahmin etmektir. Örneğin, bir pazarlamacı, bir promosyona cevap vereceğini tahmin etmeyle ilgilenebilir.

Veri madenciliğinde kullanılan tipik algoritmalar arasında şunlar bulunur:

  • Sınıflandırma ağaçları: Bir veya daha fazla tahmini değişkenlerin ölümlerine dayalı bağımlı bir kategorik değişkeni sınıflandırmak için kullanılan popüler bir veri madenciliği tekniği. Sonuç, düğümler ve düğümler arasındaki bağlantıları içeren bir ağaçtır ve eğer if-then kuralları oluşturmak için okunabilir.

  • Lojistik regresyon: Standart regresyonun bir varyantı olan ancak kavramı sınıflandırmayla başa çıkmak için genişleten istatistiksel bir teknik. Olay oluşma ihtimalini bağımsız değişkenlerin bir fonksiyonu olarak öngören bir formül üretir.

  • Sinir ağları: Hayvan beyinlerinin paralel mimarisinden sonra modellenen bir yazılım algoritması. Ağ, giriş düğümleri, gizli katmanlar ve çıktı düğümlerinden oluşur. Her birimin ağırlığı vardır. Veriler giriş düğümüne verilir ve deneme yanılma sistemi ile algoritma belirli bir durma ölçütlerini karşılayana kadar ağırlıkları ayarlar. Bazıları bunu kara kutu yaklaşımına benzetmiştir.

  • K-en yakın komşuları gibi kümeleme teknikleri: Benzer kayıt gruplarını tanımlayan bir tekniktir. K-en yakın komşu tekniği, tarihsel (eğitim) verinin kayıt ve noktalar arasındaki mesafeleri hesaplar. Daha sonra bu kaydı, bir veri kümesindeki en yakın komşusu sınıfına atar.

İşte bir sınıflandırma ağacı örneği. Bir telefon şirketinin hangi konut müşterilerinin hizmetlerinden çıkarabileceklerini belirlemek istediğini göz önünde bulundurun.

Telefon şirketi şu özelikleri içeren bilgileri içerir: kişinin ne kadar süreyle hizmet ettiği, serviste ne kadar harcadığı, hizmetin sorunlu olup olmadığı, ihtiyaç duyduğu en iyi arama planına sahip olup olmadığı, nerede bulunduğu yaşlandığını, yaşını kaç yaşında, birlikte paketlenmiş başka hizmetleri olup olmadığını, diğer taşıyıcı planlarıyla ilgili rekabetçi bilgileri ve halen hizmetiniz olup olmadığını öğrenir.

Elbette bundan çok daha fazla özellik bulabilirsiniz. Son öznitelik çıktı değişkenidir; yazılımın, müşterileri iki grubun birine sınıflandırmak için kullanacağı şey budur - belki de kalıcılar ve uçuş riskleri.

Veri kümesi eğitim verisine ve bir test veri setine ayrılmıştır. Eğitim verileri, gözlem (öznitelik olarak adlandırılır) ve bir sonuç değişkeninden (bir sınıflandırma modelinde ikili) - bu durumda kalışçılardan veya uçuş risklerinden oluşur.

Algoritma, eğitim verileri üzerinden yürütülür ve bir dizi kural gibi okunabilen bir ağaç ortaya çıkar. Örneğin, müşteriler on yıldan fazla bir süre şirkette bulunmuşsa ve 55 yaşın üzerindeyse, sadık müşteriler olarak kalma ihtimalleri yüksektir.

Sonra bu kurallar, bu modelin "yeni veriler" üzerinde ne kadar iyi olduğunu belirlemek için test verileri kümesi üzerinde yürütülür. "Model için doğruluk önlemleri sağlanmaktadır. Örneğin, popüler bir teknik, karışıklık matrisidir. Bu matris, kaç kasa doğru doğru yanlış sınıflandırılmış hakkında bilgi sağlayan bir tablodur.

Model iyi görünüyorsa, mevcut olduğu için (diğer bir deyişle, yeni uçuş riskini tahmin etmek için kullanıldığında) başka verilere dağıtılabilir. Model, örneğin, uçuş riskleri olduğunu düşündüğü müşterilere özel teklifler göndermeye karar verebilir.

Büyük Veri için Veri Madenciliği - mankenler

Editörün Seçimi

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Fotoğraf bir sanat biçimidir. İyi fotoğrafçılar, insanların bakmak isteyeceği çekici bir fotoğraf oluşturmak için kompozisyon kurallarını kullanırlar. Resminizi nasıl görselleştireceğinizi, çerçevede olanı düzenleyebileceğinizi ve ardından ilginç bir fotoğraf oluşturmak için kompozisyon kurallarını nasıl kullanacağınız. Doğal çerçeveleri kullanma Doğal çerçeveleri çizmek için kullanabilirsiniz ...

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital fotoğraf makineniz size yol göstermez panoramik bir fotoğraf çekmek için. Ancak, kesintisiz bir panoramik çekim oluşturmak için çakışan birkaç resim çekebilir ve onları birbirine dikebilirsiniz. Fotoğraf panoramasını oluşturmak için işinize bakalım:

Ham Dosyaları dönüştürme - mankenler

Ham Dosyaları dönüştürme - mankenler

Birçok dijital fotoğraf makinesi, görüntüleri Camera Raw dosya biçiminde veya sadece Ham olarak yakalayabilir. Bu format, JPEG formatında çekim yaparken oluşan olağan post-processing'leri uygulamadan herhangi bir görüntü sensöründen elde edilen ham görüntü verilerini depolar. Ham formatta çekim, bir takım avantajlar sunar. Fakat olumsuz ...

Editörün Seçimi

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Sabahınıza enerji artışı sağlayan krep düşünün endişesizsiniz. Bu tarif, bir sabah herkesin sevebileceği bir Karbonhidrat Diyeti (SCD) versiyonudur.

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

Bu aperitif, pumpernickel ekmeği konusunda harika, fakat ayrıca buğdaydan kaçınırsanız, filizlenmiş ekmeği denemek istersiniz. Sardalya, iyi bir kalsiyum ve D vitamini kaynağı olduğu kadar, iltihap düzeylerini azaltmaya yardımcı olduğu bilinen omega-3 yağ asitleri. Kredi: © Digiphoto, 2006 Caroline Nation bunu geliştirdi ...

Editörün Seçimi

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB'da göreceğiniz alt testlerden bir tanesi Kelime Bilgi testi. Test gününde soruların ve biçimin neye benzeyeceği hakkında bir fikir edinmek için aşağıdaki soruları inceleyin. Örnek sorular Kelime Bilgi Zamanı: 35 soru için 11 dakika Talimatlar: Kelime Bilgisi alt testi üçüncü alt testtir ...

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

Kelime Bilgisi ASVAB üzerinde alt test, bu tür soru, bir kelimeyi pasaj bağlamında kullanılan şekilde tanımlamanızı gerektirir. Sorunun doğru tanımı, sözcüğün en yaygın anlamı olabilir veya daha az bilinen bir anlam olabilir ...

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sayı problemleri ASVAB üzerinde bulacağınız sayı problemleri oldukça basittir. Sorular, sayıları temel ekleme, çıkarma, çarpma veya bölme ile değiştirmenizi ister. Çoğu kişi bu tür kelime problemlerini oldukça kolay buluyor. Birkaç tane denemek ister misiniz, sadece ayağınızı ıslatmak için mi? Elbette. Jesse ...