Ev Kişisel Finans CRISP-DM Süreç Modeli 3. Aşama: Veri Hazırlama - mankenler

CRISP-DM Süreç Modeli 3. Aşama: Veri Hazırlama - mankenler

İçindekiler:

Video: Data Science for Business: Data Mining Process and CRISP DM 2024

Video: Data Science for Business: Data Mining Process and CRISP DM 2024
Anonim

Veri madencileri zamanlarının çoğunu Veri Madenciliği (CRISP-DM) işlem modeli için Çapraz Endüstri Standardı Süreci'nin üçüncü aşamasına geçirir: veri hazırlama. Veri madenciliği için kullanılan çoğu veri toplanmış ve başka amaçlar için korunmuştur ve modelleme için kullanılmaya hazır hale getirilmeden önce bazı ayrıntılara ihtiyaç duyulmaktadır.

Veri hazırlık aşamasında beş adet görev bulunur. Bunlar

  • Veri seçiliyor

  • Veri temizleme

  • Verilerin yapılandırılması

  • Verilerin birleştirilmesi

  • Verilerin biçimlendirilmesi

CRISP-DM adım adım kılavuz, veri kümelerini her biri için veri olarak belirtmemektedir Veri hazırlama görevleri, ancak bu veri kümeleri iyi var daha iyi var ve düzgünce arşivlenmiş ve belgelenmiş. Veri kümeleri görevlerle bire bir karşılık gelmez, ancak kullanılan verilere ilişkin bilgiler her bir teslim edilebilir rapora dahil edilmelidir.

Görev: Verileri seçme

Şimdi sahip olduğunuz verilerin hangi bölümünün veri madenciliği için kullanılacağına karar vereceksiniz.

Bu göreve verilen, içerme ve dışlanma mantığıdır. İçinde hangi verilerin daha fazla veri madenciliği çalışması için kullanılacağını ve kullanılamayacağını açıklayacaksınız.

Elde ettiğiniz verilerin her bir parçasını hedeflerinizle, veri kalitesiyle ve teknik sorunlarınızla (ör. Araçlarınızın yapabileceği alanların veya satırların sınırları gibi) esas alarak veya hariç tutmanın nedenlerini açıklayacaksınız tutamaç veya ihtiyaçlarınıza göre veri formatlarının uygunluğu.

Görev: Veri temizleme

Kullanmayı seçtiğiniz veriler mükemmel bir şekilde temizlenmeyebilir (hatasız). Belirli bir veri düzeltmesi yapmak, bazı durumlarda veya tek tek hücreler (veri öğeleri hariç) yapmak veya bazı verilerin varsayılan değerlerle veya daha karmaşık bir modelleme tekniği ile seçilen yerine koyarak bazı kaynakları değiştirerek belki de değişiklikleri yapacaksınız. Veri madenciliği çalışmalarınızın tamamı veya bir kısmı için yalnızca veri alt gruplarını kullanmayı seçebilirsiniz.

Bu görevi, verilerini temizlemek için kullanılan her kararı ve eylemi ayrıntılı olarak belgeleyen veri temizleme raporudur. Bu rapor, sürecin veri-anlama aşamasında doğrulama veri kalitesi görevinde tanımlanan her veri kalitesi problemini kapsamalı ve bunlara atıfta bulunmalıdır. Ayrıca, rapor veri temizleme sırasında yaptığınız seçeneklerin sonuçlarına olan potansiyel etkiyi de bildirmelidir.

Görev: Verileri yapılandırma

Bazı yeni alanlar türetmeniz gerekebilir (örneğin, teslim tarihini ve bir müşterinin siparişin verildiğini tarihi belirlemek için müşterinin siparişini ne kadar beklediğini hesaplamak için), toplama verilerini, aksi takdirde yeni bir veri formu oluşturabilir.

Bu görev için sunumlar iki raporu içerir:

  • Türetilmiş öznitelikler: Hangi yeni alanları (sütunları) oluşturduğunuzu, nasıl uyguladığınızı ve nedenini anlatan bir rapor.

  • Oluşturulan kayıtlar: Oluşturduğunuz yeni vakaların (satırların) hangisini oluşturduğunu, bunu nasıl yaptığınızı ve nedenini anlatan bir rapor.

Birleştirme veri ve biçim verileri görevleri işlemin bu evresinde son olarak listelenmiş olsa da, her zaman en son gelmezler ve yalnızca bir kez ortaya çıkmayabilirler. Veri hazırlığı aşamasının başlarında bir miktar birleştirme veya yeniden formatlama yapmanız gerekebilir.

Görev: Verilerin birleştirilmesi

Verileriniz şimdi birbirinden farklı birkaç veri kümesinde olabilir. Modelleme aşamasına hazırlanmak için bu farklı veri kümelerinin tümünü veya bir bölümünü birleştirmeniz gerekecek.

Bu göreve verilen sonuç birleştirilmiş verilerdir. (Birleştirmenin nasıl yapıldığını belgelemek de incinmez.)

Görev: Biçimlendirme verileri

Veriler genellikle modelleme için en uygun biçimlerden farklı biçimlerde gelir. (Biçim değişiklikleri genellikle araçlarınızın tasarımına dayanır.) Dolayısıyla şu anda bu biçimleri dönüştürün.

Bu göreve verilen, yeniden biçimlendirilmiş verilerinizdir. (Ve yaptığınız değişiklikleri açıklayan küçük bir rapor, eklemek için akıllıca bir şey olur.)

Modelleme için hazırlanmış bir veri seti ve veri setini açıklayan kapsamlı bir raporla veri madenciliği sürecinin veri hazırlama aşamasını bitirmelisiniz.

CRISP-DM Süreç Modeli 3. Aşama: Veri Hazırlama - mankenler

Editörün Seçimi

Ile Web Sunucusunda Drupal Yükleme Softaculous ile Bir Web Sunucusuna Drupal Yükleme

Ile Web Sunucusunda Drupal Yükleme Softaculous ile Bir Web Sunucusuna Drupal Yükleme

Birçok web barındırma şirketi, Fantastico veya Softaculous adlı programları kullanarak kolay Drupal kurulumu. Barındırma şirketiniz Softaculous'u kullanıyorsa, işte böyle çalışır. Drupal topluluğu, Softaculous veya Fantastico gibi üçüncü parti yazılımlarla Drupal'ın yüklenmesini önermez. Bunu yapmak, yükseltmeyi zorlaştırabilir ve veritabanlarınızdaki sorunlara potansiyel olarak neden olabilir ...

Drupal Bahçe Site Kullanıcılarını Yönetme - mankenler

Drupal Bahçe Site Kullanıcılarını Yönetme - mankenler

Drupal Gardens'daki People sayfası, kullanıcıları, düzenli bir Drupal kurulumunda olurdunuz. Kullanıcıları bulabilir, rolleri engelleyebilir ve engelini kaldırabilir, silebilir ve atayabilirsiniz. Kullanıcıları yönetmek için Kişiler bağlantısını tıklayın. Liste sekmesi varolan kullanıcıları bulmanıza yardımcı olur ve İzinler sekmesi rolleri oluşturmanıza izin verir ve ...

Drupal kurulumu: Yazılım Alma - mankenler

Drupal kurulumu: Yazılım Alma - mankenler

Web barındırıcınız Fantastico veya Softaculous kullanmıyorsa, ilk Drupal'ı yüklemek için adım Drupal'ın en son sürümünün bir kopyasını alıyor ve web sunucunuza taşıyor. Paketi indirmek Drupal yazılımının kopyasını almak özgür ve kolaydır. Şu adımları izleyin: Drupal'a göz atın. org ve tıklayın ...

Editörün Seçimi

OAuth Kodlarını Android Uygulamanızla Twitter Sunucusuyla Görüşecek - aumlalar

OAuth Kodlarını Android Uygulamanızla Twitter Sunucusuyla Görüşecek - aumlalar

Android uygulamanızın Twitter sunucularıyla iletişim kurması için kendi OAuth kodlarınıza ihtiyacınız var. Onları almak için, aşağıda listelenen basit adımları uygulayın ve kendi Twitter uygulamasını geliştirmeye gideceksiniz. Twitter, herhangi bir zamanda önceden bildirimde bulunmaksızın web sitesinin tasarımını değiştirebilir. Twitter'da oturum açın ...

Xcode Kaynak Düzenleyici ile Başlarken - mankenler

Xcode Kaynak Düzenleyici ile Başlarken - mankenler

Yazarken kullandığınız ana araç bir iPad uygulaması için kod, Proje gezgini içinde bir kaynak kodu dosyası seçtikten sonra Xcode Çalışma Alanı penceresinin sağ tarafındaki Düzenleyici alanında Standart düzenleyici bölmesi olarak görünen Xcode kaynak editörüdür. Ayrıca Asistan editörü gibi görünür ...

Editörün Seçimi

App'unuzu Geliştirmek İçin Android Animasyon Nasıl Kullanılır

App'unuzu Geliştirmek İçin Android Animasyon Nasıl Kullanılır

Android uygulamanızda biraz süslü animasyona ihtiyacımız var. Bu, umut veren bir hırsı gösteriyor! Android, uygulamanızın geliştirilmesinde kullanabileceğiniz iki tür animasyona sahiptir: Animasyonu görüntüle: Bu listede açıklandığı üzere ya arayı doldurarak veya kare kare animasyonla canlandırdığınız eski bir sistem: Arası doldurma: ...

IPad Uygulamalarınızda Çerçeveler Nasıl Kullanılır - AYDINLATMALAR

IPad Uygulamalarınızda Çerçeveler Nasıl Kullanılır - AYDINLATMALAR

Genel işlevsellik. IPad için iPhone OS, uygulamalarınıza teknolojileri, hizmetleri ve özellikleri dahil etmek için bir dizi çerçeve sunmaktadır. Örneğin, UIKit çerçevesi, uygulamanızda kullanabileceğiniz destek olayları, çizim desteği, pencereler, görünümler ve denetimler sağlar. Bir çerçeve, aşağıdakileri yapmak üzere tasarlanmıştır ...