Ev Kişisel Finans Makina Öğrenmesinde Çapraz Doğrulama Seçeneklerini Eniyileştirme Makina Öğrenmesinde Çapraz Doğrulama Seçeneklerini En İyi Şekilde Kullanma

Makina Öğrenmesinde Çapraz Doğrulama Seçeneklerini Eniyileştirme Makina Öğrenmesinde Çapraz Doğrulama Seçeneklerini En İyi Şekilde Kullanma

Video: Kevin Richard - How to rank on Google Turkey? A machine learning-based ranking factor study 2025

Video: Kevin Richard - How to rank on Google Turkey? A machine learning-based ranking factor study 2025
Anonim

Bir makine öğrenme hipotezini etkin bir şekilde doğrulamak, seçtiğiniz algoritmanın daha da optimize edilmesini sağlar. Algoritma, verilerden gelen sinyalleri algılama yeteneği ve tahmini işlevin gerçek fonksiyonel formuna uyumsuzluk getirmeksizin ve tahminlerin çok fazla varyans göstermeden veriniz üzerindeki öngörülü performansın çoğunu sağlar. Her makine öğrenme algoritması verilerinize en uygun değil ve her soruna tek bir algoritma uygun olamaz. Belirli bir sorunun doğru olanını bulmak size kalmış.

Tahmini performansın ikinci bir kaynağı, seçilen algoritmanın öğrenme kabiliyetlerini arttırmak için uygun şekilde dönüştürülüp seçildiğinde verinin kendisidir.

Performansın nihai kaynağı, öğrenmeden önce karar verdiğiniz ve veriden öğrenilemeyen parametreler olan algoritmanın hiper parametrelerini ince ayarlamanızdan kaynaklanır. Onların rolü a priori bir hipotezi tanımlarken, diğer parametreler algoritma verilerle etkileşime geçtikten ve bir optimizasyon işlemi kullanıldıktan sonra onu belirli parametre değerlerini bulur (posteriori,) iyi tahminler elde etmek için daha iyi çalışın.

Tüm makine öğrenme algoritmaları çok fazla parametre ayarı gerektirmez, ancak en karmaşık olanları yapar ve bu algoritmalar kutudan çıkmaya devam etse de, sağ kolları çekmek büyük fark yaratabilir tahminlerin doğruluğunda. Hiper parametreler verilerden öğrenilse bile, hiper parametrelere karar verirken üzerinde çalıştıkları verileri düşünmelisiniz ve olasılıkların çapraz doğrulama ve dikkatli değerlendirilmesine dayalı olarak seçim yapmalısınız.

Karmaşık makine öğrenme algoritmaları, tahminlerin varyansına en çok maruz kalanlar, çok sayıda parametrede ifade edilen birçok seçenek sunar. Onlarla oynamaları, öğrenmekte oldukları verilere az ya da çok uyum sağlamasına neden olur. Bazen çok fazla parametre döndürme, algoritmayı verilerden yanlış sinyal saptamasını bile sağlayabilir. Bu, bir test kümesi veya tekrarlanan çapraz doğrulama şeması gibi bazı sabit referanslara dayalı olarak çok fazla değiştirilmeye başlanırsa, hiper parametrelerin kendilerini keşfedilmemiş bir varyasyon kaynağı haline getirir.

Hem R hem de Python, giriş matrisinizi tren, test ve geçerlilik bölümlerine ayıran dilimleme işlevleri sunar. Çapraz doğrulama veya önyükleme gibi daha karmaşık test prosedürleri için, Scikit öğrenme paketi tüm bir modül sunar ve R, veri bölme, ön işleme ve test işlevleri sunan özel bir pakete sahiptir.Bu pakete "caret" denir.

Hiper parametrelerin oluşturabileceği olası değer kombinasyonları, optimizasyonların nereden kesileceğine karar vermenizi sağlar. Eğim açılımını tartışırken açıklandığı gibi, bir optimizasyon alanı daha iyi veya daha kötü performans gösteren değer kombinasyonları içerebilir. İyi bir kombinasyon bulduktan sonra bile en iyi seçenek olduğundan emin değilsiniz. (Bu, hatayı en aza indirirken yerel minimale sıkışmanın problemidir.)

Bu sorunun çözümü için pratik bir yöntem olarak, belirli verilere uygulanan bir algoritmanın hiper parametrelerini doğrulamanın en iyi yolu hepsini test etmektir çapraz doğrulama ve en iyi kombinasyonu seçmek. Izgara arama adı verilen bu basit yaklaşım, sistematik olarak algoritmaya girmek için olası değer aralığını örneklemenize ve genel minimum gerçekleştiğinde nokta belirlemenize izin vererek tartışmasız avantajlar sunmaktadır.

Öte yandan, grid arama aynı zamanda ciddi hesaplamalara sahiptir çünkü hesaplama yoğunluğu vardır (bu görevi modern çok çekirdekli bilgisayarlarda paralel olarak kolayca gerçekleştirebilirsiniz) ve oldukça zaman alıcıdır. Dahası, sistematik ve yoğun testler, hataya neden olma ihtimalini arttırır çünkü bazı iyi fakat sahte doğrulama sonuçları, veri kümesindeki gürültüye bağlı olabilir.

Şebeke arama için bazı alternatifler mevcuttur. Her şeyi test etmek yerine, hesaplamalı olarak ağır ve matematiksel olarak karmaşık doğrusal olmayan optimizasyon teknikleriyle (Nelder-Mead yöntemi gibi) yönlendirilen olası hiper parametre değerlerinin alanını, Bayesci bir yaklaşımı kullanarak keşfetmeyi deneyebilirsiniz (test sayısını önceki sonuçların avantajı) veya rasgele arama kullanıyor.

Şaşırtıcı bir şekilde, rasgele arama inanılmaz derecede iyi çalışıyor, anlaşılması basit ve başlangıçta görünmesine rağmen yalnızca kör şansa dayanmıyor. Aslında, tekniğin temel noktası, yeterli sayıda rasgele testi seçerseniz, benzer şekilde performans gösteren kombinasyonların biraz farklı kombinasyonlarını test etmek için enerjiyi harcamaksızın doğru parametreleri bulmak için yeterli imkana sahip olduğunuzdur.

Aşağıdaki grafiksel gösterim, rastgele aramanın niçin işe yaradığını açıklar. Sistematik bir keşif, yararlı olmakla birlikte, her kombinasyonu test etme eğilimindedir; bu, bazı parametreler sonucu etkilemiyorsa, enerji israfına dönüşür. Rastgele arama aslında daha az sayıda kombinasyonu denemekle birlikte, her hiper parametrenin aralığında daha fazla test ederse, sıklıkla olduğu gibi belirli parametrelerin diğerlerinden daha önemli olması durumunda kazandığı ispatlanmış bir strateji.

Şebeke arama ile rastgele aramayı karşılaştırma.

Rasgele arama iyi performans için, en fazla 60 test yapmalısınız. Izgara araştırması daha fazla deneme gerektiriyorsa, rasgele aramaya başvurmak mantıklı olur.
Makina Öğrenmesinde Çapraz Doğrulama Seçeneklerini Eniyileştirme Makina Öğrenmesinde Çapraz Doğrulama Seçeneklerini En İyi Şekilde Kullanma

Editörün Seçimi

Islam Aptallar Hile Sheet - Aptallar

Islam Aptallar Hile Sheet - Aptallar

İSlam temel inançların bakarak başlar anlamak (İmanın Beş Şartı) ve Müslümanlara ait farklı rivayetler (Beş İbadet Sütunları) ve Müslümanların ait olabileceği farklı İslam mezhepleri. İslam'ın Beş İbadet Sütunları ve Beş İmanın Sütun bir Müslüman'ın günlük manevi hayatının desteklerini sağlar. Her ne kadar tüm ...

Hinduism Aptallar için Hile Kitabı - mankenler

Hinduism Aptallar için Hile Kitabı - mankenler

Hindu dini binlerce yıl önce Hindistan'da doğmuştur. Diğer inançlarda yetişen insanlara Hinduizm çok karmaşık görünebilir, ancak Hinduizmin esas inançları aslında anlaşılması oldukça kolaydır. Örneğin Hindular, yalnızca bir Yüce Varlığın, Brahman olduğuna inanır; onlar Hakikat ve Gerçek hakkında bilgi edinir; manevi uğraşı veriyorlar ...

Kur'an-ı kehanet için İzleyici tanımlamak

Kur'an-ı kehanet için İzleyici tanımlamak

Kur'an izleyicileri evrenseldir, cinsiyet, kültür veya dini inançlar. Bununla birlikte, Kur'an, özellikle çeşitli pasajlarda ve çeşitli uzunluklarda altı genel gruba hitap etmektedir: İnsanoğlu: Bu ayetler genelde evrensel öğretiler, uyarılar ve müjdeler taşımaktadır. Bu pasajlar genellikle "Ey insanlık" ya da "Adem O Çocukları" ile başlar. "Buluyorsunuz ...

Editörün Seçimi

Basketbolda Oyuncu Pozisyonlarını anlamak - basketbolda

Basketbolda Oyuncu Pozisyonlarını anlamak - basketbolda

, Beş kişilik bir takım, topu çember. Her basketbol oyuncusunun belirli bir konumu ve sorumlulukları vardır. İki gardiyandan, iki öne ve bir merkezden oluşan pozisyonlar farklı fiziksel gereklilikleri ve becerileri gerektirir: Nokta Koruması: Genellikle takımdaki en kısa oyuncu.

Keyifli Basketbol Uygulama Eğitimi İçin İpuçları

Keyifli Basketbol Uygulama Eğitimi İçin İpuçları

Hayatboyu yapmak, basketbolculuğunuzu eğlenceli hale getirmek ve zamanı en üst düzeye çıkarmaktır oyuncularınızla. Bunu, beceri geliştirirken çocuklarınızı sürekli meydan okur, eğlendirir ve motive eden uygulamaları çalıştırarak başarabilirsiniz. Oyuncularınızın basketbol keyfini arttırmak ve pratikte eğlenmek için şu ipuçlarını deneyin: Her çocuğa bol bol verin ...

Basketbol Hall of Fame ziyareti - mankenler

Basketbol Hall of Fame ziyareti - mankenler

Bunların hepsi büyükbabası olan Springfield, Massachusetts'deki Naismith Anma Basketbol Şöhretler Salonu'na atıfta bulunarak. Ancak bu spor için ayrılmış diğer şöhret salonları ziyaret etmekten daha az eğlenceli. İlk önce, Springfield'e sanal bir hac alın: Naismith Basketball Hall of Fame ...

Editörün Seçimi

ACT Matematik Testinde Neyin ve Kapatılamadığı - AYDINLATMALAR

ACT Matematik Testinde Neyin ve Kapatılamadığı - AYDINLATMALAR

ACT'nin dört testinden biri, bir saatlik Matematik Testidir. İşte, kapsadığı konular yanı sıra olmayan konuları. Bu 60 dakikalık test, 60 soruyu içeriyor (sorun başına zamanınızı rahatça buluyor, öyle değil mi?). Sorular oldukça standart kategorilere ayrılıyor: Pre-cebir. (Normal insanlara bakın ...

ACT İngilizce Testi için Bilmeniz Gerekenler - canavar

ACT İngilizce Testi için Bilmeniz Gerekenler - canavar

ACT'nizi açtığınızda kitapçıkta gördüğünüz ilk şey İngiliz Testidir. Yavaş uykuda olan beyin ve gözlerindeki gözler 5 pasaj ve 75 soru ile karşılaşır. Her nasılsa, tüm pasajları okumalı ve tüm soruları 45 dakika içinde cevaplamalısınız. Bu, bir sürü soru gibi görünebilir ...

Ne zaman ACT'de Hesap Makinesi Kullanmalısınız? - mankenler

Ne zaman ACT'de Hesap Makinesi Kullanmalısınız? - mankenler

Bir hesap makinesi, ACT matematik problemlerini başınızda ya da kalem ve çizik kağıdından daha hızlı çözmek için mükemmel bir araçtır. Bununla birlikte, aynı zamanda kafanızda kolayca ve doğru bir şekilde yapabileceğiniz hesaplamalar için aşırı kullanmamak istiyorsunuz. Bir uygulamaya başladığınızda ...