Ev Kişisel Finans Makina Öğrenmesinde Örnek Eğilimler ve Sızıntı Tuzaklarından kaçınmak - mankenler

Makina Öğrenmesinde Örnek Eğilimler ve Sızıntı Tuzaklarından kaçınmak - mankenler

Video: Bill Schnoebelen Interview with an Ex Vampire (6 of 9) Multi Language 2024

Video: Bill Schnoebelen Interview with an Ex Vampire (6 of 9) Multi Language 2024
Anonim

Makine öğrenimine onaylama yaklaşımı, numune alma önyargılarına yönelik muhtemel bir çare incelenmesidir. Makine öğrenmesi harekete geçirilmeden önce verilerinizde numune alma yanlılığı olabilir ve aşağıdaki tahminlerin yüksek varyansına neden olur. Buna ek olarak, numunenin dışındaki bazı bilgiler örnek içi verilere geçtiğinde ortaya çıkabilecek kaçak tuzakları farkında olmalısınız. Bu sorun, verileri hazırlarken veya makine öğrenme modeli hazır olduktan sonra çalışabilir.

Tahmin edicilerin bir araya getirilmesi olarak adlandırılan çözüm, eğitim örneğiniz tamamen bozulmadığında ve dağılımı numunenin dışındakinden farklıysa, ancak çözümlenemez bir şekilde, örneğin tüm dersleriniz var olduğu halde, doğru orantılı değilken (örnek olarak). Bu gibi durumlarda, sonuçlarınız, muhtemelen birkaç yoldan birinde dengeleyebileceğiniz tahminlerin belirli bir varyansından etkilenir: önyükleme sırasında olduğu gibi yeniden örnekleme; subsampling (örneklemin bir örneği alınarak); veya daha küçük numuneler (önyargı artar) kullanarak.

Toplulukların bu kadar etkili bir şekilde nasıl işlediğini anlamak için boğa gözünün görüntüsünü görselleştirin. Örnekiniz tahminleri etkiliyorsa, bazı öngörüler kesin olacak ve diğerleri rastgele bir şekilde yanlıştır. Örnekinizi değiştirirseniz, doğru öngörüler doğru olmaya devam eder, ancak yanlış olan tahminler farklı değerler arasında varyasyonlar oluşturmaya başlar. Aradığınız kesin tahmin bazı değerlerdir; diğerleri sadece doğru olanın etrafında salınacaklardır.

Sonuçları karşılaştırarak, tekrar eden şeylerin doğru cevabı olduğunu tahmin edebilirsiniz. Ayrıca, ortalama bir cevap alabilir ve doğru cevabın değerlerin tam ortasında olduğunu tahmin edebilirsiniz. Boğa gözü oyunu ile, farklı oyunların üstüste binen fotoğraflarını görselleştirebilirsiniz: Sorun varyansa, sonuçta hedefin en sık karşılaşılan alanda olduğunu veya en azından tüm çekimlerin merkezinde olduğunu tahmin edeceksiniz.

Çoğu durumda, böyle bir yaklaşım kanıtlar ve makinenizin öğrenme tahminlerini çok geliştirir. Sorununuz yanlıştır ve varyans değilse, çok az numune alt örneklemediğiniz takdirde, topluluğu kullanma gerçekten zarar vermez. Alt örneklemeyle ilgili iyi bir kural, bir örneklemin orijinal örnek verilerle karşılaştırıldığında yüzde 70 ila yüzde 90 arasında olmasıdır. Topluluk çalışması yapmak istiyorsanız, aşağıdakileri yapmalısınız:

  • Verileriniz ve modelleriniz boyunca çok sayıda tekrarlayın (en azından üç iterasyondan, ideal olarak yüzlerce kez tekrarlanabilir).
  • Her tekrarladığınızda örnek verilerinizi alt örnek olarak (veya başka bir şekilde önyükleme yaparak) uygulayın.
  • Yeniden örneklenmiş veriler üzerinde model için makine öğrenimi kullanın ve örnek dışı sonuçları tahmin edin. Sonuçları daha sonra kullanmak üzere saklayın.
  • Yinelemelerin sonunda, tahmin etmek istediğiniz tüm örnek olaylar için, tüm tahminlerini yapın ve gerileme yapıyorsanız bunları ortalama alın. Sınıflandırma yapıyorsanız, en sık dersi alın.

Sızıntı tuzakları sizi şaşırtabilir, çünkü makine öğrenme süreçlerinizde bilinmeyen ve tespit edilmemiş bir problem kaynağı olduğunu kanıtlayabilirler. Sorun gizlice soruluyor veya örnek dışı verilerin çok fazla gözlemlenmesi ve ona çok fazla uyum sağlaması. Kısacası, gözetleme, birtakım gereğinden fazla uyuşma özelliğidir - yalnızca eğitim verisi değil, aynı zamanda test verisi üzerinde olduğundan, aşırı alım sorunu kendisini yeni veriler elde edilene kadar algılamak zorlaştırır.

Genellikle, makine öğrenme algoritmasını işinize veya bir servise herkese açık bir şekilde uyguladığınızda sorunun dikkatini çektiğini ve problemin herkes tarafından görülebileceği bir sorun haline geldiğini anlarsınız.

Snooping'i iki şekilde önleyebilirsiniz. İlk olarak, veriler üzerinde çalışırken, eğitim, doğrulama ve test verilerini düzgün şekilde ayırmaya dikkat edin. Ayrıca, işlerken hiçbir zaman doğrulama veya test, hatta en basit ve masum görünüşlü örneklerden hiçbir bilgi almayın. Daha da kötüsü, tüm verileri kullanarak karmaşık bir dönüşüm uygulamaktır.

Finans, örneğin, tüm eğitim ve test verilerinden ortalama ve standart sapmanın (piyasa koşulları ve risk hakkında çok şey söyleyebilen) hesaplanmasıyla, modelleriniz hakkında değerli bilgiler sızdırılabileceği iyi bilinmektedir. Sızıntı meydana geldiğinde, makine öğrenme algoritmaları piyasadaki örnek dışı verilerden ziyade test setinde öngörüler yapar; bu, hiç çalışmadığı, dolayısıyla bir para kaybına neden olduğu anlamına gelir.

Örnek dışı örneklerinizin performansını kontrol edin. Aslında, bazı parametrelerin diğerlerinden daha iyi olduğunu belirlemenize yardımcı olması veya başka bir makine öğrenme algoritması yerine bir makine öğrenme algoritması seçmenize yardımcı olması için, test sonuçlarındaki snoopinginizden bazı bilgileri geri getirebilirsiniz. Her model veya parametre için, çapraz doğrulama sonuçlarına veya doğrulama örneğine dayalı olarak seçiminizi uygulayın. Örnek verilerinizin dışına çıkmak için asla düşmeyin ya da daha sonra pişman olmalısınız.

Makina Öğrenmesinde Örnek Eğilimler ve Sızıntı Tuzaklarından kaçınmak - mankenler

Editörün Seçimi

YouTube Hesabınızı Kişiselleştirmek - masallar

YouTube Hesabınızı Kişiselleştirmek - masallar

Bir YouTube hesabı oluşturduktan sonra, bunu kişiselleştirebilirsiniz Merakınızı pırıltılı videolar arıyor. Gelecekteki görüntüleme için favori olarak kaydettiğiniz şeyi kaydederek YouTube hesabınızı kişiselleştirin. Oluşturan video oynatma listeleri oluşturabilir ve istediğiniz videoları yükleyen kullanıcılar için yorumları bırakabilirsiniz. Şansınız onlar olacak ...

Nasıl bir YouTube Hesabı Oluşturulur - Bir YouTube hesabı oluşturmak için canavarlar

Nasıl bir YouTube Hesabı Oluşturulur - Bir YouTube hesabı oluşturmak için canavarlar

ÜCretsiz, hızlı ve acısızdır. Bir YouTube hesabı oluşturmak için birkaç bitlik temel bilgi gönderin ve bir kullanıcı adı ve şifre oluşturun. İşte bu - sokak adresinizi veya telefon numaranızı eklemenize gerek yok, YouTube sizden bir kredi kartı numarası istemiyor.

YouTube Hesabını Silme - mankenler

YouTube Hesabını Silme - mankenler

Eğer kullanıcı adınız YouTube'daki kimliğinizse, hesap bu kimliğin sonu anlamına gelir. YouTube hesabınızı kapatmanız, hesabınızın (gruplarınız, abonelikleriniz, arama geçmişleriniz vb.) Tüm eşsiz niteliklerinin artık kullanımınıza sunulmayacağı anlamına gelir. YouTube ile bölmek oldukça acı vericidir - ...

Editörün Seçimi

Boyutlar Matematik 3 Boyutlu Baskı Eskiz Modelleri - mankenler

Boyutlar Matematik 3 Boyutlu Baskı Eskiz Modelleri - mankenler

Her 3B yazıcıda minimum ve maksimum boyutta nesne var inşa edebilir. Bu boyutlar genellikle malzemeyi basan araç boyutuna ve yazıcının genel boyutuna göre ayarlanır. Daha büyük bir şey inşa etmek için yaratıcı olmanız gerekir. Daha küçük bir şey yapmak için, daha pahalı bir 3D'ye ihtiyacınız olacak ...

SketchUp'un Bitişik Yüzler Eğrilere Doku Ekleme Yöntemi - mankenler

SketchUp'un Bitişik Yüzler Eğrilere Doku Ekleme Yöntemi - mankenler

Bir görüntüyü üzerine SketchUp'ta yalnızca tek bir yönde eğri (silindir gibi) olan bir yüzey varsa, bu tekniği kullanabilirsiniz. Nasıl olduğunu öğrenmek ve işlemin gerçekleştiğini gösteren şekle bakmak için şu adımları izleyin: Gizli seçeneğini etkinleştirmek için Görünüm → Gizli Geometri'yi seçin ...

SketchUp'ın Bileşen Seçenekleri İletişim Kutusu - mankenler

SketchUp'ın Bileşen Seçenekleri İletişim Kutusu - mankenler

SketchUp 7, Pencere menüsünde Bileşen Seçenekleri iletişim kutusunu ekledi. Açılır listelerden seçenekler seçerek, boyut yazarak ve diğer basit görevleri gerçekleştirerek bu iletişim kutusuna bağlanan dinamik bileşenleri (DC'ler) yapılandırabilirsiniz. Bileşen Seçenekleri'ndeki bir ayarı değiştirdiğinizde, seçtiğiniz DC güncelleştirir ...

Editörün Seçimi

Excel Pivot Şeması ve Eksen Başlıklarınızı Özelleştirme - AYDINLATMALAR

Excel Pivot Şeması ve Eksen Başlıklarınızı Özelleştirme - AYDINLATMALAR

Grafik Başlığı ve Eksen Başlıkları Excel'de Tasarım sekmesinin Grafik Öğelerini Ekle komut düğmesini tıklattığınızda görünen komutları kullanarak, grafik başlıklarınızın başlığının, grafiğinizin dikey, yatay ve derinlik eksenlerine bir başlık eklemesine izin verin. Excel 2007 ve Excel 2010'da, Grafik Başlığı ve Eksen Başlıkları'nı kullanırsınız ...

'De nasıl özelleştireceksiniz? Excel Pivot Grafik Veri Etiketleri'ni Özelleştirme - Tasarımcı sekmesindeki Veri Etiketleri komutunda mankenler

'De nasıl özelleştireceksiniz? Excel Pivot Grafik Veri Etiketleri'ni Özelleştirme - Tasarımcı sekmesindeki Veri Etiketleri komutunda mankenler

Excel'de Grafik Öğesi ekle menüsü, veri işaretleyicilerini pivot tablolarınızdaki değerlerle etiketlemenize izin verir. Komut düğmesini tıklattığınızda Excel, veri etiketleri için konumlara karşılık gelen komutları içeren bir menü görüntüler: None, Center, Left, Right, Above, and below. Yok ...

Excel'de İleti Kutuları özelleştirme nasıl 2016 VBA - mankenleri

Excel'de İleti Kutuları özelleştirme nasıl 2016 VBA - mankenleri

VBA düğmeleri argüman markadan esneklik Excel mesaj kutularınızı kolaylıkla özelleştirebilirsiniz. Görüntülenecek düğmeleri seçebilir, bir simgenin görüp görmediğini belirleyebilir ve hangi düğmenin varsayılan olduğunu belirleyebilirsiniz (kullanıcı Enter tuşuna basarsa, varsayılan düğme "tıklanır"). Düğmeler argümanı için yerleşik sabitler kullanabilirsiniz. Varsa, ...