Ev Kişisel Finans Makina Öğrenmesinde Örnek Eğilimler ve Sızıntı Tuzaklarından kaçınmak - mankenler

Makina Öğrenmesinde Örnek Eğilimler ve Sızıntı Tuzaklarından kaçınmak - mankenler

Video: Bill Schnoebelen Interview with an Ex Vampire (6 of 9) Multi Language 2024

Video: Bill Schnoebelen Interview with an Ex Vampire (6 of 9) Multi Language 2024
Anonim

Makine öğrenimine onaylama yaklaşımı, numune alma önyargılarına yönelik muhtemel bir çare incelenmesidir. Makine öğrenmesi harekete geçirilmeden önce verilerinizde numune alma yanlılığı olabilir ve aşağıdaki tahminlerin yüksek varyansına neden olur. Buna ek olarak, numunenin dışındaki bazı bilgiler örnek içi verilere geçtiğinde ortaya çıkabilecek kaçak tuzakları farkında olmalısınız. Bu sorun, verileri hazırlarken veya makine öğrenme modeli hazır olduktan sonra çalışabilir.

Tahmin edicilerin bir araya getirilmesi olarak adlandırılan çözüm, eğitim örneğiniz tamamen bozulmadığında ve dağılımı numunenin dışındakinden farklıysa, ancak çözümlenemez bir şekilde, örneğin tüm dersleriniz var olduğu halde, doğru orantılı değilken (örnek olarak). Bu gibi durumlarda, sonuçlarınız, muhtemelen birkaç yoldan birinde dengeleyebileceğiniz tahminlerin belirli bir varyansından etkilenir: önyükleme sırasında olduğu gibi yeniden örnekleme; subsampling (örneklemin bir örneği alınarak); veya daha küçük numuneler (önyargı artar) kullanarak.

Toplulukların bu kadar etkili bir şekilde nasıl işlediğini anlamak için boğa gözünün görüntüsünü görselleştirin. Örnekiniz tahminleri etkiliyorsa, bazı öngörüler kesin olacak ve diğerleri rastgele bir şekilde yanlıştır. Örnekinizi değiştirirseniz, doğru öngörüler doğru olmaya devam eder, ancak yanlış olan tahminler farklı değerler arasında varyasyonlar oluşturmaya başlar. Aradığınız kesin tahmin bazı değerlerdir; diğerleri sadece doğru olanın etrafında salınacaklardır.

Sonuçları karşılaştırarak, tekrar eden şeylerin doğru cevabı olduğunu tahmin edebilirsiniz. Ayrıca, ortalama bir cevap alabilir ve doğru cevabın değerlerin tam ortasında olduğunu tahmin edebilirsiniz. Boğa gözü oyunu ile, farklı oyunların üstüste binen fotoğraflarını görselleştirebilirsiniz: Sorun varyansa, sonuçta hedefin en sık karşılaşılan alanda olduğunu veya en azından tüm çekimlerin merkezinde olduğunu tahmin edeceksiniz.

Çoğu durumda, böyle bir yaklaşım kanıtlar ve makinenizin öğrenme tahminlerini çok geliştirir. Sorununuz yanlıştır ve varyans değilse, çok az numune alt örneklemediğiniz takdirde, topluluğu kullanma gerçekten zarar vermez. Alt örneklemeyle ilgili iyi bir kural, bir örneklemin orijinal örnek verilerle karşılaştırıldığında yüzde 70 ila yüzde 90 arasında olmasıdır. Topluluk çalışması yapmak istiyorsanız, aşağıdakileri yapmalısınız:

  • Verileriniz ve modelleriniz boyunca çok sayıda tekrarlayın (en azından üç iterasyondan, ideal olarak yüzlerce kez tekrarlanabilir).
  • Her tekrarladığınızda örnek verilerinizi alt örnek olarak (veya başka bir şekilde önyükleme yaparak) uygulayın.
  • Yeniden örneklenmiş veriler üzerinde model için makine öğrenimi kullanın ve örnek dışı sonuçları tahmin edin. Sonuçları daha sonra kullanmak üzere saklayın.
  • Yinelemelerin sonunda, tahmin etmek istediğiniz tüm örnek olaylar için, tüm tahminlerini yapın ve gerileme yapıyorsanız bunları ortalama alın. Sınıflandırma yapıyorsanız, en sık dersi alın.

Sızıntı tuzakları sizi şaşırtabilir, çünkü makine öğrenme süreçlerinizde bilinmeyen ve tespit edilmemiş bir problem kaynağı olduğunu kanıtlayabilirler. Sorun gizlice soruluyor veya örnek dışı verilerin çok fazla gözlemlenmesi ve ona çok fazla uyum sağlaması. Kısacası, gözetleme, birtakım gereğinden fazla uyuşma özelliğidir - yalnızca eğitim verisi değil, aynı zamanda test verisi üzerinde olduğundan, aşırı alım sorunu kendisini yeni veriler elde edilene kadar algılamak zorlaştırır.

Genellikle, makine öğrenme algoritmasını işinize veya bir servise herkese açık bir şekilde uyguladığınızda sorunun dikkatini çektiğini ve problemin herkes tarafından görülebileceği bir sorun haline geldiğini anlarsınız.

Snooping'i iki şekilde önleyebilirsiniz. İlk olarak, veriler üzerinde çalışırken, eğitim, doğrulama ve test verilerini düzgün şekilde ayırmaya dikkat edin. Ayrıca, işlerken hiçbir zaman doğrulama veya test, hatta en basit ve masum görünüşlü örneklerden hiçbir bilgi almayın. Daha da kötüsü, tüm verileri kullanarak karmaşık bir dönüşüm uygulamaktır.

Finans, örneğin, tüm eğitim ve test verilerinden ortalama ve standart sapmanın (piyasa koşulları ve risk hakkında çok şey söyleyebilen) hesaplanmasıyla, modelleriniz hakkında değerli bilgiler sızdırılabileceği iyi bilinmektedir. Sızıntı meydana geldiğinde, makine öğrenme algoritmaları piyasadaki örnek dışı verilerden ziyade test setinde öngörüler yapar; bu, hiç çalışmadığı, dolayısıyla bir para kaybına neden olduğu anlamına gelir.

Örnek dışı örneklerinizin performansını kontrol edin. Aslında, bazı parametrelerin diğerlerinden daha iyi olduğunu belirlemenize yardımcı olması veya başka bir makine öğrenme algoritması yerine bir makine öğrenme algoritması seçmenize yardımcı olması için, test sonuçlarındaki snoopinginizden bazı bilgileri geri getirebilirsiniz. Her model veya parametre için, çapraz doğrulama sonuçlarına veya doğrulama örneğine dayalı olarak seçiminizi uygulayın. Örnek verilerinizin dışına çıkmak için asla düşmeyin ya da daha sonra pişman olmalısınız.

Makina Öğrenmesinde Örnek Eğilimler ve Sızıntı Tuzaklarından kaçınmak - mankenler

Editörün Seçimi

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Fotoğraf bir sanat biçimidir. İyi fotoğrafçılar, insanların bakmak isteyeceği çekici bir fotoğraf oluşturmak için kompozisyon kurallarını kullanırlar. Resminizi nasıl görselleştireceğinizi, çerçevede olanı düzenleyebileceğinizi ve ardından ilginç bir fotoğraf oluşturmak için kompozisyon kurallarını nasıl kullanacağınız. Doğal çerçeveleri kullanma Doğal çerçeveleri çizmek için kullanabilirsiniz ...

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital fotoğraf makineniz size yol göstermez panoramik bir fotoğraf çekmek için. Ancak, kesintisiz bir panoramik çekim oluşturmak için çakışan birkaç resim çekebilir ve onları birbirine dikebilirsiniz. Fotoğraf panoramasını oluşturmak için işinize bakalım:

Ham Dosyaları dönüştürme - mankenler

Ham Dosyaları dönüştürme - mankenler

Birçok dijital fotoğraf makinesi, görüntüleri Camera Raw dosya biçiminde veya sadece Ham olarak yakalayabilir. Bu format, JPEG formatında çekim yaparken oluşan olağan post-processing'leri uygulamadan herhangi bir görüntü sensöründen elde edilen ham görüntü verilerini depolar. Ham formatta çekim, bir takım avantajlar sunar. Fakat olumsuz ...

Editörün Seçimi

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Sabahınıza enerji artışı sağlayan krep düşünün endişesizsiniz. Bu tarif, bir sabah herkesin sevebileceği bir Karbonhidrat Diyeti (SCD) versiyonudur.

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

Bu aperitif, pumpernickel ekmeği konusunda harika, fakat ayrıca buğdaydan kaçınırsanız, filizlenmiş ekmeği denemek istersiniz. Sardalya, iyi bir kalsiyum ve D vitamini kaynağı olduğu kadar, iltihap düzeylerini azaltmaya yardımcı olduğu bilinen omega-3 yağ asitleri. Kredi: © Digiphoto, 2006 Caroline Nation bunu geliştirdi ...

Editörün Seçimi

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB'da göreceğiniz alt testlerden bir tanesi Kelime Bilgi testi. Test gününde soruların ve biçimin neye benzeyeceği hakkında bir fikir edinmek için aşağıdaki soruları inceleyin. Örnek sorular Kelime Bilgi Zamanı: 35 soru için 11 dakika Talimatlar: Kelime Bilgisi alt testi üçüncü alt testtir ...

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

Kelime Bilgisi ASVAB üzerinde alt test, bu tür soru, bir kelimeyi pasaj bağlamında kullanılan şekilde tanımlamanızı gerektirir. Sorunun doğru tanımı, sözcüğün en yaygın anlamı olabilir veya daha az bilinen bir anlam olabilir ...

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sayı problemleri ASVAB üzerinde bulacağınız sayı problemleri oldukça basittir. Sorular, sayıları temel ekleme, çıkarma, çarpma veya bölme ile değiştirmenizi ister. Çoğu kişi bu tür kelime problemlerini oldukça kolay buluyor. Birkaç tane denemek ister misiniz, sadece ayağınızı ıslatmak için mi? Elbette. Jesse ...