Video: VERİ MADENCİLİĞİ - Ünite1 Özet 2024
Veri madencileri hızlı çalışırlar. Hız kazanmak için, uygun araçları kullanmanız ve ticaretin hilelerini keşfetmeniz gerekir. En iyi veri madenciliği aracı biraz bilgi birikimi ile beyninizdir. İkinci en iyi araç, görsel programlama arabirimli bir veri madenciliği uygulamasıdır.
Görsel programlama ile, çalışma sürecinizdeki adımlar, işinizdeki akışın ve mantığın resmini oluşturmak için ekranda düzenlediğiniz küçük resimlerle temsil edilir. Görsel programlama, komutlarla (programlama) veya geleneksel menülerde olduğundan çok daha fazla adımda ne yaptığınızı görmek için daha kolay hale getirir.
Bu örnekte, çalışma sürecini veri madenciliği uygulamasının ana alanından görebilirsiniz. Çevresinde, son projelerin menüleri, veri madenciliği işlevleri için araçlar, karmaşık süreçlerde gezinmenize yardımcı olan bir görüntüleyici ve bir günlük var. Bu ayrıntılar, bir üründen diğerine biraz değişiklik göstermektedir.
Süreci daha yakından inceleyin. Bir veri madenciliği arayışınızda olsanız da, muhtemelen aşağıdaki şemayı inceleyerek neler olup bittiğini çok fazla anlayabilirsiniz:
-
CSV Reader'ı görebilirsiniz. Sen de biliyorsan. csv (virgülle ayrılmış değerler) veri formatı, muhtemelen zaten bu veri içe aktarımı olduğunu biliyorum. (Ve ilk adımdır, başka bir şey yapmak için verilerinize ihtiyacınız vardır.)
-
Sonra, Sütun Rename ve String Manipülasyonu gibi işlevlerle açıkça etiketlenmiş araçları görürsünüz. Bunlar veri hazırlama adımlarıdır.
-
Modelleme konusunda yeniyseniz Ağaç Öğrenci gizemli olabilir, ancak bu araç verilerin bir alt kümesinden bir karar ağacı modeli oluşturur.
-
Son adımlar, modelin test için ayrı tutulduğu verilere uygulanması ve bazı değerlendirme teknikleri uygulanması.