Video: The future of money | Neha Narula 2024
Veri madenciliği deneme yanılma ile yapılır ve bu nedenle veri madencileri için hata yapma doğaldır. Hatalar, diğer bir deyişle, en azından belirli koşullar altında değerli olabilir. Bununla birlikte, tüm hatalar eşit olarak oluşturulmaz. Bazılarından kaçınılması daha iyi. Aşağıdaki liste on hata sunuyor. Onları dikkatli bir şekilde okursanız ve hafızaya alırsanız, öğrenme eğrisinde birkaç darbe önleyebilirsiniz:
-
Veri kalite kontrollerini atlama: Çoğu veri madencisi tahmin modeli geliştirmenin kalite sorununun incelenmesinden daha eğlenceli olduğunu düşünüyor. Ancak, veri kalitesi sorunlarını tespit edip etmede başarısız olursanız, değersiz tahminlere neden olabilirsiniz.
-
Nokta eksik: Büyüleyici bir şey keşfettiniz! Bu güzel, ama çözmek için yola koyduğunuz iş problemiyle de alakalı değilse, hiç de ilgisizdir. Takip olun.
-
Verilerdeki bir modelin neden-sonuç ilişkisini kanıtladığına inanarak: Bir veri setini araştırıyorsunuz ve Değişken A arttığında Değişken B de arttığını fark ettiniz. Bu, Değişken A Değişken B'yi etkilediğinden veya Değişken B, Değişken A'yı etkilediğinden ortaya çıkabilir. Öte yandan, her ikisinin de dikkate almadığınız başka bir değişkenden etkilenebileceği düşünülür. Ya da bir kerelik tesadüf olabilir. Kim söyleyebilir?
-
Sonuçların çok uzatılması: Verilerde gözlemlediğiniz ilişkilerin farklı koşullar altında tekrarlayacağını düşünmeyin. Verilerinizi serin bir ortamda topladıysanız, işlerin sıcak bir fabrika ortamında aynı şekilde gerçekleşeceğini düşünmeyin.
-
Anlamlı olmayan sonuçlarla ilgili bahis yapma: Veri madenciliği yöntemleri gayriresmi ve genellikle bilimsel yöntem ve teori ile yedeklenmemektedir, bu nedenle sonuçlarınız en azından iş mantıklı hale gelmiştir. Sunulan sonuçlar için mantıklı bir açıklama yoksa, üst yönetiminiz muhtemelen ciddiye almayacaktır ve yapmamalıdır.
-
Belli bir modelleme yöntemine aşık: Her duruma uyan tek bir veri madenciliği modeli yoktur.
-
Bir modeli yeterli test olmadan üretime geçirme: İşletmenizi, öngörülebilir bir veri ile test etmeden ve sahada küçük ölçekli bir modüle kadar, tahmini bir modele yatırmayın.
-
Sevmediğiniz sonuçları gözardı etmek: Verilerinizi şimdi görmezden gelirseniz, bir gün geri gelip "Sana söyledim" der. "
-
Her veri analizi gereksinimini karşılamak için veri madenciliği kullanmak: Veri madenciliği muazzam bir değere sahiptir, ancak bazı uygulamalar halen sıkı veri toplama yöntemleri, resmi istatistiksel analiz ve bilimsel yöntem gerektirmektedir.
-
Geleneksel veri analiz tekniklerinin artık önemli olmadığı varsayılarak: Önceki mermiye bakınız.