İçindekiler:
- Görev: İş hedeflerinizi belirleme
- Görev: Durumunuzu değerlendirin
- Görev: Veri madenciliği hedeflerinizi tanımlama
- Görev: Proje planınızı oluşturma
Video: Data Science for Business: Data Mining Process and CRISP DM 2024
). Veri Madenciliği için Sanayi Öncesi Standart Süreç ( CRISP-DM ) hakim süreç çerçevesidir Veri madenciliği için Bir veri madenciliği projesinin ilk aşamasında, verilere veya araçlara yaklaşmadan önce neyin başarısız olduğunu tanımlarsın ve bu hedefe ulaşmak isteyen nedenlerini tanımlarsın.
İşletme anlayışı aşamasında (her biri daha az sayıda küçük parça içerebilen birincil etkinlikler)
Görev: İş hedeflerinizi belirleme
Yapmanız gereken ilk şey herhangi bir projede ne yapmak istediğinizi tam olarak öğrenmektir! Bu, göründüğünden daha az açıktır. Birçok veri madencisi, yalnızca yönetimlerinin, konuyla ilgilenmediğini bulmak için, veri analizine zaman ayırmışlardır.
-
konusunda net bir anlayışla başlamak zorundasınız> Yönetiminizin ele alması gereken bir sorun
-
iş hedefleri
-
Kısıtlamalar (ne yapabileceğinizle ilgili sınırlamalar, kullanılabilecek çözüm türleri, işin ne zaman tamamlanması gerektiği vb.)
-
Etki (problemin ve olası çözümlerin işle nasıl uyuştuğu)
Bu görev için teslimatlar üç öğe içerir (genellikle ana noktalara odaklanan kısa raporlar):
-
Arka plan: Projeyi yönlendiren iş durumunu açıklayın. Bu madde, takip eden pek çok şey gibi yalnızca birkaç paragrafa denk gelmektedir.
-
İş hedefleri: Kuruluşunuzun proje ile neyi amaçladığını tanımlayın. Bir veri madencisi olarak, bu, genellikle sizden daha geniş bir hedeftir, bağımsız olarak başarabilir. Örneğin, işletme amacı, bir tatil reklam kampanyasındaki satışları, yıldan yıla yüzde 10 artırmak olabilir.
-
İş başarısı kriterleri: Sonuçların nasıl ölçüleceğini tanımlayın. Niceliksel başarı ölçütleri tanımlamaya çalışın. Subjektif kriterleri kullanmanız gerekiyorsa (ipucu: kazanç içgörüsü veya üzerinde işlem yaparak öznel ölçütleri ima edin), en azından bu kriterlere uyup uymayacağına kimin karar vereceğine dair anlaşma sağlayın yerine getirildi.
Görev: Durumunuzu değerlendirin
Burada iş hedeflerinizle ilgili konular hakkında daha ayrıntılı bilgiye girdiniz. Artık iş hedefleri bölümünde özetlenen sorunların çok daha etli bir açıklaması yapılarak, gerçek bulma işlemine daha da derinleşeceksiniz.
Bu görev için sağlanan ürünler arasında beş kapsamlı rapor bulunur:
-
Kaynaklar listesi: Projeyle ilgili mevcut tüm kaynakların bir listesi.Bunlar, yalnızca veri madencileri değil, aynı zamanda işletme problemi, veri yöneticileri, teknik destek ve diğerleri hakkında uzman bilgisi olan kişiler, veri, donanım ve yazılım da içerebilir.
-
Koşullar, varsayımlar ve kısıtlamalar: Koşullara tamamlanma, yasal ve güvenlik zorunluluğu ve kabul edilebilir bitmiş iş için şartlar dahildir. İşte bu, uygun verilere erişebildiğinizi doğrulamak için bir noktadır!
-
Riskler ve olasılıklar: Projenin tamamlanmasını erteleyebilecek nedenleri belirleyin ve her biri için bir acil durum planı hazırlayın. Örneğin, ofisinizdeki bir İnternet kesintisi bir sorun teşkil ediyorsa, belki de olasılığınız, kesintiye kadar başka bir ofiste çalışmak olabilir.
-
Terminoloji: Projenizle alakalı olan iş sözleşmelerinin ve veri madenciliği terimlerinin bir listesini oluşturun ve bunları tanımlarla (ve belki de örneklerle) birlikte bir sözlüğe yazın böylece böylece projedeki herkesin Bu terimlerin ortak bir anlayışı.
-
Maliyetler ve faydalar: Proje için bir maliyet-fayda analizi hazırlayın. Dolar (euro, pound, yen vb.) Cinsinden tüm maliyetleri ve kazancı belirtmeye çalışın. Avantajlar maliyetleri önemli ölçüde aşmazsa, bu analiz ve projenizi durdurun ve yeniden düşünün.
Karar vericiler genellikle maliyetleri düşüren projelere, kaynaklarını daha rahat bir şekilde tahsis ederek kazancınızı artırmayı amaçlayan projelere daha rahat eder, bu nedenle her zaman maliyet tasarrufu potansiyelini ararlar ve maliyet ve fayda raporunuzda önce devlet tasarrufu fırsatlarını değerlendirin.
Görev: Veri madenciliği hedeflerinizi tanımlama
İş hedefine ulaşmak genellikle çoğu veri madencisi değil, birçok insandan gelen eylem gerektirir. Şimdi küçük parçasını daha büyük resim içinde tanımlamalısın. Örneğin, işletme amacı müşteri memnuniyetini azaltmaksa, veri madenciliği hedefleriniz birkaç müşteri segmentinin yıpranma oranlarını belirlemek ve hangi müşterilerin en çok risk altındadır tahmin etmek için modeller geliştirmek olabilir.
Bu görev için sağlanan sonuçlar iki raporu içerir:
-
Veri madenciliği hedefleri: Modeller, raporlar, sunular ve işlenmiş veri kümeleri gibi veri madenciliği çıktılarını tanımlayın.
-
Veri madenciliği başarı kriteri: İş başarısı kriterlerini desteklemek için gerekli olan veri madenciliği teknik kriterlerini tanımlayın. Bunları niceliksel terimlerle (örneğin, model doğruluğu veya mevcut yöntemle karşılaştırıldığında öngörülen iyileşme) tanımlamaya çalışın. Ölçütlerin niteliksel olması gerekiyorsa, değerlendirmeyi yapan kişiyi belirtin.
Görev: Proje planınızı oluşturma
Artık, veri madenciğinizin, proje tamamlanıncaya ve sonuçların sunulması ve gözden geçirilene kadar atması niyetinde olan her adımı belirtiyorsunuz.
Bu görev için sunumlar iki rapor içerir:
-
Proje planı: Projeyle ilgili adım adım eylem planınızı ana hatlarıyla çizin. Her adımın tamamlanması, gerekli kaynaklar, girdiler (veri ya da konu uzmanı ile bir toplantı gibi) ve çıktıların (temizlenmiş veriler, model veya rapor gibi) her adım için bir çizelgeyle ana hatlarını genişletin ve bağımlılıklar (bu adım tamamlanıncaya kadar başlayamayacak adımlar).Belirli adımların tekrarlanması gerektiğini açıkça belirtin (örneğin, modelleme ve değerlendirme genellikle ileri ve geri tekrarların birçoğunu gerektirir).
-
Araç ve teknikler için ilk değerlendirme: Veri madenciliği hedeflerinizi karşılamak için gerekli olanakları belirleyin ve sahip olduğunuz araçları ve kaynakları değerlendirin. Eksik bir şey varsa, bu endişeyi sürecin çok erken bir aşamasında ele almalısınız.