İçindekiler:
- Tahmini analitik modelinin sınırlamaları nasıl anlatılır
- Modelinizin çıktısında hatalar veya önyargılar kırılırsa, bunları
- Bugün büyük veriler ucuz, bol ve büyüyor. Aslında, başka bir potansiyel problem ortaya çıkıyor: Halihazırda mevcut müthiş veri hacmi, modeli olumsuz etkileyebilir ve performansını düşürebilir ve modeli nispeten kısa sürede eski haline getirir. Düzgün bir şekilde uygulanmış ölçeklenebilirlik, modelinizin "gelecekteki dayanıklılığı" na yardımcı olabilir.
Video: 186th Knowledge Seekers Workshop - August 24, 2017 2024
Tahminci modelleme, işin birçok yönünü yönetmek için bir araç olarak popülerlik kazanıyor. Veri analizinin doğru yapılmasının sağlanması, istihdam edilen modellere olan güvenini artıracaktır; bu da, organizasyonunuzun standart araç kitinin parçası olmak için tahmine dayalı analizler için gerekli satın alımı üretebilir.
Belki de bu artan popülerlik, tahmin kümesi analizi projesinin, veri kümelerini tanımlayan, olası yeni kalıpları ve eğilimleri (verilerle gösterildiği gibi) keşfederek ve daha güvenilir bir şekilde sonuçları öngörerek karar vermeyi destekleyebileceği yollardan gelmektedir.
Bu hedefi gerçekleştirmek için, tahmini bir analitik projesi, karar değişkenlerini doğru ve etkili bir şekilde seçerek verilere en iyi uyan bir model sunmalıdır. Bu amaca giden yolda bazı hayati sorular yanıtlanmalıdır:
-
Modelin verilere en iyi uyumu sağlayacak minimum varsayımlar ve karar değişkenleri nelerdir?
-
Yapım aşamasındaki model, uygulanabilir diğer modellere kıyasla ne gibi bir farkı var?
-
Bu modeli değerlendirmek ve puanlamak için hangi ölçütler en iyisidir?
Bir kez daha deneyimin sesini kurtarmaya çağırsınız: Alan bilgisi uzmanları bu soruları tartışabilir, verilerin gizli kalıplarını gösteren sonuçları yorumlayabilir ve model çıktısını doğrulamanıza ve doğrulamaya yardımcı olabilir.
Tahmini analitik modelinin sınırlamaları nasıl anlatılır
Herhangi bir tahmini analitik model kullandığı algoritmalara ve üzerinde çalışan veri kümesine dayalı belirli sınırlamalara sahiptir. Bu kısıtlamaların farkında olmalısınız ve bunları avantajınıza getirmelisiniz; algoritmalarla ilgili olanlar
Örnek verilerinin kapsamının modelin aşırı uygunluğa sahip olma olasılığına sahip olması
Modelinizin sınırlamalarını aşmak için, modellerinizi test etmek için sesli
çapraz doğrulama
tekniklerini kullanın. Verilerinizi eğitim ve test veri setlerine bölerek başlayın ve modeli tahminlerini değerlendirmek ve puanlamak için bu veri setlerinin her birine ayrı ayrı modeli çalıştırın.
Tahmini analitik modelinizi test etme ve değerlendirme yöntemi Hiçbir model% 100 doğru tahminler üretemez; Herhangi bir modelin hatalı sonuçlar üretme potansiyeli vardır. Modelinizin ürettiği tahminler ve gözlemlenen veriler arasında, özellikle de modelin çıktıları sağduyu ile çelişiyorsa, önemli bir varyasyon ararken dikkatli olun.Eğer gerçek olamayacak kadar iyi, kötü veya aşırı görünüyorsa, muhtemelen doğru değildir (gerçekte zaten). Değerlendirme sürecinde test ettiğiniz modellerin çıktılarını iyice inceleyin ve bunları girdi değişkenleriyle karşılaştırın. Modelinizin öngörme yeteneği, oluşturulmasını ilk etapta sürdürecek belirtilen tüm işletme hedeflerine cevap vermelidir.
Modelinizin çıktısında hatalar veya önyargılar kırılırsa, bunları
ya kadar geriye çekmeyi deneyin. Verilerin geçerliliği, güvenirliliği ve göreli mevsimsellik
Modelde kullanılan varsayımlar
Dahil edilen veya hariç tutulan değişkenler Analizde
-
Modelinizin sürecinin her adımını değerlendirmek için iş kullanıcılarıyla birlikte çalışın; model çıktılarının gerçek dünyadaki iş dünyasında kolayca yorumlanabileceğini ve kullanılabileceğinden emin olun. Modelin doğruluğunu ve güvenilirliğini, model çıktılarının ne kadar kolay yorumlanıp pratikte kullanılabileceği ile dengeleyin.
-
Ölçeklenebilir olmayan tahmini analitik modellerden nasıl kaçınma
-
Bir model oluştururken, her zaman ölçeklenebilirliği aklınızda tutun. Çeşitli ölçeklerde modelin performansını, doğruluğunu ve güvenilirliğini daima kontrol edin. Modeliniz parçalanmadan veya kötü tahminler çıkarmadan ölçeğini değiştirebilmelidir - gerekirse büyük ölçekte - ölçeklenebilir.
Ölçeklenebilirlik, geçmişte oldukça zorlandı. Tahminen modellerin kurulması ve çalıştırılması uzun zaman aldı. Modellerin koştuğu veri kümeleri küçüktü ve veriler toplamak, depolamak ve aramak için pahalıydı. Fakat hepsi, "büyük veri öncesi" dönemindeydi.
Bugün büyük veriler ucuz, bol ve büyüyor. Aslında, başka bir potansiyel problem ortaya çıkıyor: Halihazırda mevcut müthiş veri hacmi, modeli olumsuz etkileyebilir ve performansını düşürebilir ve modeli nispeten kısa sürede eski haline getirir. Düzgün bir şekilde uygulanmış ölçeklenebilirlik, modelinizin "gelecekteki dayanıklılığı" na yardımcı olabilir.
Gelecek tek tehdit değil. Mevcut çevrimiçi dönemde bile, akışlı veriler bir modele zarar verebilir - özellikle de veri akışı bir sel gibi artarsa.
Yalnızca veri hacmi, karar değişkenlerinin ve tahmin faktörlerinin, modele sürekli güncellenmesini gerektiren dev sayılara ulaşmasına neden olabilir. Öyleyse evet, modeliniz ölçeklenebilir olmalı - hızlı ölçeklenebilir.