İçindekiler:
- Veri madenciliği işine odaklanma
- Veri madencilerinin zamanlarını nasıl harcadıklarını anlamak
- Veri madenciliği sürecini tanıma
- Model yapma
- Matematiksel modelleri anlama
- Bilgileri faaliyete geçirme
Video: Closing the Loop (Full Film) - English with Multi-Language Subtitles 2024
Verileri ham madde olarak düşündüğünüzde ve veriden değerli ve nispeten rafine edilmiş bir şey olarak alabileceğiniz bilgiler varsa, bilgi çıkarma süreci Kirten cevher veya taşlardan metal çıkarma ile karşılaştırıldığında. veri madenciliği terimi nasıl ortaya çıkmıştı.
Veri madenciliği işine odaklanma
Veri madencileri, ilginç bir şeyler bulmayı umarak, veriyi amaçsızca düşünmezler. Her veri madenciliği projesi, belirli bir ticari problem ve eşleme hedefiyle başlar.
Veri madenciliği yaparken, muhtemelen nihai iş kararlarını verme yetkiniz olmayacak, bu nedenle kararınızı verenlerinizin ihtiyaçlarıyla uyumlu hale getirmeniz önemlidir. Sorunlarını, ihtiyaçlarını ve tercihlerini anlamalı ve çabalarınızı iyi iş kararlarını destekleyen bilgi sağlamaya odaklanmalısınız.
Kendi iş bilgileriniz çok önemlidir. Yöneticiler, çalışırken keşiflerinizin endişeleriyle alaka düzeyiyle ilgili geribildirim sağlayarak yanınıza oturmayacaktır. Çalışırken kendiniz için yargılamak için kendi deneyimlerinizi ve zekânızı kullanmalısınız.
Veri madencilerinin zamanlarını nasıl harcadıklarını anlamak
Veri madencileri, bütün gün hayat-değişen keşifler yaparak, değerli modeller inşa ederek ve bunları günlük iş alanlarına entegre ederek harcamış olsaydı çok iyi olurdu. Ancak sporcu gün boyu turnuva kazanıp kazanamayacağının harika bir şey olduğunu söylemek gibi. O zafer anlarına kadar bir sürü hazırlık gerekir. Bu nedenle, sporcu gibi, veri madencileri hazırlık konusunda çok zaman harcıyorlar.
Veri madenciliği sürecini tanıma
İyi bir iş süreci, zamanınızı, verilerinizi ve diğer tüm kaynaklarınızı en iyi şekilde kullanmanıza yardımcı olur. Bu kitapta, en popüler veri madenciliği sürecini (CRISP-DM) keşfedeceksiniz. Birçok endüstriden gelen veri madencileri konsorsiyumu ve herkesin kullanabileceği açık bir standart tarafından oluşturulan altı aşamalı keşif ve eylem döngüsüdür.
CRISP-DM sürecinin aşamaları
-
İş Anlayışı
-
Veri Anlama
-
Veri Hazırlama
-
Modelleme
-
Değerlendirme
-
Dağıtım (günlük işlerde model kullanan)
Her biri Aşama, sonuçların kalitesine ve işletmenin değerine önem verir. Ancak, gerekli zaman açısından, veri hazırlığı hakimdir. Veri hazırlama işlemi, veri madenciliği sürecinin tüm diğer aşamalarını birleştiren rutin olarak daha fazla zaman alır.
Model yapma
Hedefler anlaşıldığında ve veriler temizlenip kullanıma hazır olduğunda dikkatinizi tahmini modeller oluşturmaya dönüştürebilirsiniz.Modeller raporların yapamayacağı şeyleri yapar; Eylemi destekleyen bilgileri size veriyorlar.
Bir rapor, satışların azaldığını söyleyebilir. Satışların nerede reddedildiğini ve bu düşüşlerin yalnızca belirli alanlarda yaygın mı yoksa sadece etkilenip etkilenmediğini bilen satışları bölgelere, ürünlere ve kanallara göre değiştirebilir. Ancak size neden satışları reddedildi veya hangi eylemlerin iş hayatını kurtarmak için yardımcı olabileceği konusunda ipucu vermiyorlar.
Modeller, satışları etkileyen faktörleri, satışları artırma ya da azaltma eğilimindeki eylemleri ve işletmenizi sorunsuz bir şekilde tutan stratejileri ve taktikleri anlamanıza yardımcı olur. Bu çok heyecan verici, değil mi? Belki de bu yüzden çoğu veri madencisi modellemeyi işin eğlenceli kısmı olarak görmektedir.
Matematiksel modelleri anlama
Matematiksel modeller veri madenciliğinin merkezinde yer alır, ancak bunlar nedir? Ne yapıyorlar, nasıl çalışıyorlar ve nasıl yaratılıyorlar?
Bir matematiksel model basit ve basit, iki veya daha fazla şey arasındaki ilişkiyi tanımlayan bir denklem veya denklem kümesidir. Bu denklemler, doğanın ve toplumun işleyişine ilişkin kuramlar için kısadır. Teori, önemli bir delil kitlesi tarafından desteklenebilir ya da sadece bir vahşi tahmin olabilir. Her iki durumda da matematiğin dili aynıdır.
Tahmini model, istatistiksel model, veya doğrusal model gibi terimler, belirli matematiksel model tiplerini, amaçlanan kullanımını, formunu veya türetme yöntemini yansıtan isimleri ifade eder belirli bir model. Bu üç örnek, bu tür birçok terimden sadece birkaçı.
Bir iş ortamında bir model belirtildiğinde, büyük olasılıkla tahmin yapmak için kullanılan bir modeldir. Modeller, diğer pek çok şey arasında, hisse senedi fiyatlarını, ürün satışlarını ve işsizlik oranlarını önceden tahmin etmek için kullanılır.
Bu tahminler doğru olabilir veya olmayabilir, ancak modelde yer alan herhangi bir değer grubu için (bunlara bilinen faktörlere bağımsız değişkenler veya girdiler denir) (ayrıca bağımlı değişken, çıktı, veya sonuç olarak da adlandırılır) iyi tanımlanmış bir tahmini bulmak. Matematiksel modeller, işin diğer amaçları için de kullanılır; örneğin, belirli bir işlemi yönlendiren çalışma mekanizmalarını tanımlamak için kullanılır.
Veri madenciliğinde, makine öğrenimi veya istatistiksel yöntemler kullanarak veri modelleri bularak modeller oluşturursunuz. Veri madencileri, klasik istatistikçilerin yaptığı gibi titiz yaklaşımı takip etmez, ancak tüm modeller gerçek verilerden ve tutarlı matematiksel modelleme tekniklerinden türetilmektedir. Tüm veri madenciliği modelleri bir dizi kanıt tarafından desteklenmektedir.
Neden matematiksel modeller kullanıyorsunuz? Aynı ilişkiler sözcükleri kullanarak açıklanamaz mıydı? Bu mümkün, ancak denklemlerin kullanımında bazı avantajlar buluyorsunuz. Bunlara şunlar dahildir:
-
Kolaylık: Cümlelerde yazılmış eşdeğer tanımlarla karşılaştırıldığında, denklemler kısadır. Matematiksel sembolizm, özellikle matematiksel ilişkileri göstermek amacıyla geliştirildi; İngilizce gibi diller değil.
-
Berraklık: Denklemler fikirleri kısaca aktarır ve netleşir.Kültüre dayalı farklı yorumlara tabi değildirler ve matematiğin sembolizmi dünyada yaygın olarak kullanılan bir tür ortak dildir.
-
Tutarlılık: Matematiksel gösterimler açıkça anlaşıldığından belirli herhangi bir durumun sonuçları bir matematiksel modelle açıkça tanımlanmıştır.
Bilgileri faaliyete geçirme
Bir model yalnızca işletmede kullandığınızda değer katmaktadır. Bir modelin tahminleri, karar vermeyi çeşitli şekillerde destekleyebilir.
-
Belirli bir karar verirken kullanılacak bir rapora veya sunuma tahminler koyabilirsiniz.
-
Modeli, günlük kullanım için gerçek zamanlı tahminler sağlamak için operasyonel bir sisteme (müşteri hizmetleri sistemi gibi) entegre edin. (Örneğin, acil ödeme, derhal reddetme veya daha ileri araştırmalar için sigorta taleplerini iptal edebilirsiniz.)
-
Toplu öngörüler için modeli kullanın. (Örneğin, hangi müşterilerin belirli bir teklif almaları gerektiğine karar vermek için şirket içi müşteri listesini puanlayabilirsiniz.)