Video: Zeitgeist Addendum 2024
Tahmin edici bir analitik görev yapmak için teknoloji veya enstrümantasyona güveniyorsanız, burada veya orada bir aksaklık, bu araçların aşırı veya olağandışı değerleri kaydetmesine neden olabilir. Sensörler, temel kalite kontrol standartlarını karşılamayan gözlemsel değerleri kaydediyorsa, verilere yansıyan gerçek aksamalara neden olabilirler.
Örneğin, veri girişi yapan birisi yanlışlıkla bir değerin sonuna ek 0 ekleyebilir, girdiyi aralık dışına çıkarabilir ve bir aykırı değer üretebilir.
Baltimore Limanına monte edilen bir su sensörü tarafından toplanan gözlemsel verilere bakarsanız ve ortalama deniz seviyesinden 20 fit yükseklik bir su derinliği bildiriyorsa, bir sapıklığınız var demektir. Baltimore tamamen suyla kaplı değilse, sensör açıkça yanlıştır.
Veri, harici olaylar nedeniyle veya bir kişi veya bir enstrüman tarafından bir hata nedeniyle aşırı derecede ortaya çıkabilir.
Eğer sistemde bir flaş çarpması gibi gerçek bir olay izlenirse, bunun sonuçları hala gerçek - ancak sorunun kaynağını biliyorsanız, modeliniz değil, verilerin bir kusuruna varabilirsiniz, modeliniz olayı öngörmediyse suçlamaktı.
Aykırı kaynağın kaynağını bilmek, bununla başa çıkma konusundaki kararınızı yönlendirecektir. Veri girişi hatalarının sonucunda ortaya çıkan belirsizlikler, veri kaynağına danıştıktan sonra kolayca düzeltilebilir. Bir değişim gerçeğini yansıtan aykırı değerler, modelinizi değiştirmenizi ister.
Hata ya da aksaklık olmayan aşırı verilerin eklenip eklenmeyeceğini dikkate almayacağınıza karar verirken, tek boyutlu uyarılar yoktur. Yanıtınız yaptığınız analizin niteliğine ve bina modeli türüne bağlıdır. Birkaç durumda, bu belirsizliklerin üstesinden gelmenin yolu açıktır:
-
Veri kaynağına başvururken aşırı yükseğinizi bir veri girişi hatasına göre izlerseniz, verileri kolayca düzeltebilir ve (muhtemelen) modeli sağlam tutabilirsiniz.
-
Baltimore Limanı'ndaki su sensörü, ortalama deniz seviyesinden 20 fit derinliğe kadar su bildiriyorsa ve pencerenizde dışarı bakınız:
-
Baltimore suyla tamamen kaplı değilse, sensör Açıkçası yanlış.
-
Sana bakan bir balık görürseniz, gerçeklik değişti; modelinizi gözden geçirmeniz gerekebilir.
-
-
Flaş krizi, bir kerelik bir olay olabilir (kısa vadede zaten), ancak etkileri gerçek - ve uzun vadede piyasayı incelediyseniz, benzer bir şeyin tekrarlanacağını da biliyorsunuz.İşletmeniz finanse edilmişse ve borsa ile her zaman uğraşıyorsanız, modelinizin bu tür sapmalara neden olmasını istiyorsunuz.
Genel olarak, normalde bir sapma olarak düşünülen bir olayın sonucunun işiniz üzerinde önemli bir etkisi olabilirse, analizinizde bu olaylarla nasıl başa çıkacağınızı düşünün. Dışarıda kalanlar hakkında şu genel noktaları aklınızda bulundurun:
-
Küçük veri kümesi olağandışılığın analiz üzerinde olağandışı derecede önemli olduğunu gösterir.
-
Modelinizi geliştirirken, aykırı değerler bulmaya yönelik teknik geliştirdiğinizden ve işiniz üzerindeki etkilerini sistematik olarak anladığınızdan emin olun.
-
Aykırı değerlerin saptanması karmaşık bir süreç olabilir; onları tanımlamanın basit bir yolu yoktur.
-
Bir alan uzmanı () (modellediğiniz alanı bilen biri), bir veri noktasının geçerli olup olmadığını, göz ardı edebileceğiniz bir çarpıtıcıyı veya sahip olduğunuz bir çarpıklığı doğrulamak için en iyi kişidir dikkate almak. Alan uzmanı, hangi faktörlerin aşırı yük oluşturduğu, değişkenlik aralığı ve iş üzerindeki etkisi hakkında açıklama yapabilmelidir.
-
Görselleştirme araçları, verilerdeki belirsizlikleri bulmanıza yardımcı olabilir. Ayrıca, beklenen değer aralığını biliyorsanız, o aralığın dışına çıkan verileri kolayca sorgulayabilirsiniz.