Ev Kişisel Finans Makina Öğrenmesinde Çapraz Doğrulama Seçeneklerini Eniyileştirme Makina Öğrenmesinde Çapraz Doğrulama Seçeneklerini En İyi Şekilde Kullanma

Makina Öğrenmesinde Çapraz Doğrulama Seçeneklerini Eniyileştirme Makina Öğrenmesinde Çapraz Doğrulama Seçeneklerini En İyi Şekilde Kullanma

Video: Kevin Richard - How to rank on Google Turkey? A machine learning-based ranking factor study 2024

Video: Kevin Richard - How to rank on Google Turkey? A machine learning-based ranking factor study 2024
Anonim

Bir makine öğrenme hipotezini etkin bir şekilde doğrulamak, seçtiğiniz algoritmanın daha da optimize edilmesini sağlar. Algoritma, verilerden gelen sinyalleri algılama yeteneği ve tahmini işlevin gerçek fonksiyonel formuna uyumsuzluk getirmeksizin ve tahminlerin çok fazla varyans göstermeden veriniz üzerindeki öngörülü performansın çoğunu sağlar. Her makine öğrenme algoritması verilerinize en uygun değil ve her soruna tek bir algoritma uygun olamaz. Belirli bir sorunun doğru olanını bulmak size kalmış.

Tahmini performansın ikinci bir kaynağı, seçilen algoritmanın öğrenme kabiliyetlerini arttırmak için uygun şekilde dönüştürülüp seçildiğinde verinin kendisidir.

Performansın nihai kaynağı, öğrenmeden önce karar verdiğiniz ve veriden öğrenilemeyen parametreler olan algoritmanın hiper parametrelerini ince ayarlamanızdan kaynaklanır. Onların rolü a priori bir hipotezi tanımlarken, diğer parametreler algoritma verilerle etkileşime geçtikten ve bir optimizasyon işlemi kullanıldıktan sonra onu belirli parametre değerlerini bulur (posteriori,) iyi tahminler elde etmek için daha iyi çalışın.

Tüm makine öğrenme algoritmaları çok fazla parametre ayarı gerektirmez, ancak en karmaşık olanları yapar ve bu algoritmalar kutudan çıkmaya devam etse de, sağ kolları çekmek büyük fark yaratabilir tahminlerin doğruluğunda. Hiper parametreler verilerden öğrenilse bile, hiper parametrelere karar verirken üzerinde çalıştıkları verileri düşünmelisiniz ve olasılıkların çapraz doğrulama ve dikkatli değerlendirilmesine dayalı olarak seçim yapmalısınız.

Karmaşık makine öğrenme algoritmaları, tahminlerin varyansına en çok maruz kalanlar, çok sayıda parametrede ifade edilen birçok seçenek sunar. Onlarla oynamaları, öğrenmekte oldukları verilere az ya da çok uyum sağlamasına neden olur. Bazen çok fazla parametre döndürme, algoritmayı verilerden yanlış sinyal saptamasını bile sağlayabilir. Bu, bir test kümesi veya tekrarlanan çapraz doğrulama şeması gibi bazı sabit referanslara dayalı olarak çok fazla değiştirilmeye başlanırsa, hiper parametrelerin kendilerini keşfedilmemiş bir varyasyon kaynağı haline getirir.

Hem R hem de Python, giriş matrisinizi tren, test ve geçerlilik bölümlerine ayıran dilimleme işlevleri sunar. Çapraz doğrulama veya önyükleme gibi daha karmaşık test prosedürleri için, Scikit öğrenme paketi tüm bir modül sunar ve R, veri bölme, ön işleme ve test işlevleri sunan özel bir pakete sahiptir.Bu pakete "caret" denir.

Hiper parametrelerin oluşturabileceği olası değer kombinasyonları, optimizasyonların nereden kesileceğine karar vermenizi sağlar. Eğim açılımını tartışırken açıklandığı gibi, bir optimizasyon alanı daha iyi veya daha kötü performans gösteren değer kombinasyonları içerebilir. İyi bir kombinasyon bulduktan sonra bile en iyi seçenek olduğundan emin değilsiniz. (Bu, hatayı en aza indirirken yerel minimale sıkışmanın problemidir.)

Bu sorunun çözümü için pratik bir yöntem olarak, belirli verilere uygulanan bir algoritmanın hiper parametrelerini doğrulamanın en iyi yolu hepsini test etmektir çapraz doğrulama ve en iyi kombinasyonu seçmek. Izgara arama adı verilen bu basit yaklaşım, sistematik olarak algoritmaya girmek için olası değer aralığını örneklemenize ve genel minimum gerçekleştiğinde nokta belirlemenize izin vererek tartışmasız avantajlar sunmaktadır.

Öte yandan, grid arama aynı zamanda ciddi hesaplamalara sahiptir çünkü hesaplama yoğunluğu vardır (bu görevi modern çok çekirdekli bilgisayarlarda paralel olarak kolayca gerçekleştirebilirsiniz) ve oldukça zaman alıcıdır. Dahası, sistematik ve yoğun testler, hataya neden olma ihtimalini arttırır çünkü bazı iyi fakat sahte doğrulama sonuçları, veri kümesindeki gürültüye bağlı olabilir.

Şebeke arama için bazı alternatifler mevcuttur. Her şeyi test etmek yerine, hesaplamalı olarak ağır ve matematiksel olarak karmaşık doğrusal olmayan optimizasyon teknikleriyle (Nelder-Mead yöntemi gibi) yönlendirilen olası hiper parametre değerlerinin alanını, Bayesci bir yaklaşımı kullanarak keşfetmeyi deneyebilirsiniz (test sayısını önceki sonuçların avantajı) veya rasgele arama kullanıyor.

Şaşırtıcı bir şekilde, rasgele arama inanılmaz derecede iyi çalışıyor, anlaşılması basit ve başlangıçta görünmesine rağmen yalnızca kör şansa dayanmıyor. Aslında, tekniğin temel noktası, yeterli sayıda rasgele testi seçerseniz, benzer şekilde performans gösteren kombinasyonların biraz farklı kombinasyonlarını test etmek için enerjiyi harcamaksızın doğru parametreleri bulmak için yeterli imkana sahip olduğunuzdur.

Aşağıdaki grafiksel gösterim, rastgele aramanın niçin işe yaradığını açıklar. Sistematik bir keşif, yararlı olmakla birlikte, her kombinasyonu test etme eğilimindedir; bu, bazı parametreler sonucu etkilemiyorsa, enerji israfına dönüşür. Rastgele arama aslında daha az sayıda kombinasyonu denemekle birlikte, her hiper parametrenin aralığında daha fazla test ederse, sıklıkla olduğu gibi belirli parametrelerin diğerlerinden daha önemli olması durumunda kazandığı ispatlanmış bir strateji.

Şebeke arama ile rastgele aramayı karşılaştırma.

Rasgele arama iyi performans için, en fazla 60 test yapmalısınız. Izgara araştırması daha fazla deneme gerektiriyorsa, rasgele aramaya başvurmak mantıklı olur.
Makina Öğrenmesinde Çapraz Doğrulama Seçeneklerini Eniyileştirme Makina Öğrenmesinde Çapraz Doğrulama Seçeneklerini En İyi Şekilde Kullanma

Editörün Seçimi

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Fotoğraf bir sanat biçimidir. İyi fotoğrafçılar, insanların bakmak isteyeceği çekici bir fotoğraf oluşturmak için kompozisyon kurallarını kullanırlar. Resminizi nasıl görselleştireceğinizi, çerçevede olanı düzenleyebileceğinizi ve ardından ilginç bir fotoğraf oluşturmak için kompozisyon kurallarını nasıl kullanacağınız. Doğal çerçeveleri kullanma Doğal çerçeveleri çizmek için kullanabilirsiniz ...

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital fotoğraf makineniz size yol göstermez panoramik bir fotoğraf çekmek için. Ancak, kesintisiz bir panoramik çekim oluşturmak için çakışan birkaç resim çekebilir ve onları birbirine dikebilirsiniz. Fotoğraf panoramasını oluşturmak için işinize bakalım:

Ham Dosyaları dönüştürme - mankenler

Ham Dosyaları dönüştürme - mankenler

Birçok dijital fotoğraf makinesi, görüntüleri Camera Raw dosya biçiminde veya sadece Ham olarak yakalayabilir. Bu format, JPEG formatında çekim yaparken oluşan olağan post-processing'leri uygulamadan herhangi bir görüntü sensöründen elde edilen ham görüntü verilerini depolar. Ham formatta çekim, bir takım avantajlar sunar. Fakat olumsuz ...

Editörün Seçimi

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Sabahınıza enerji artışı sağlayan krep düşünün endişesizsiniz. Bu tarif, bir sabah herkesin sevebileceği bir Karbonhidrat Diyeti (SCD) versiyonudur.

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

Bu aperitif, pumpernickel ekmeği konusunda harika, fakat ayrıca buğdaydan kaçınırsanız, filizlenmiş ekmeği denemek istersiniz. Sardalya, iyi bir kalsiyum ve D vitamini kaynağı olduğu kadar, iltihap düzeylerini azaltmaya yardımcı olduğu bilinen omega-3 yağ asitleri. Kredi: © Digiphoto, 2006 Caroline Nation bunu geliştirdi ...

Editörün Seçimi

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB'da göreceğiniz alt testlerden bir tanesi Kelime Bilgi testi. Test gününde soruların ve biçimin neye benzeyeceği hakkında bir fikir edinmek için aşağıdaki soruları inceleyin. Örnek sorular Kelime Bilgi Zamanı: 35 soru için 11 dakika Talimatlar: Kelime Bilgisi alt testi üçüncü alt testtir ...

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

Kelime Bilgisi ASVAB üzerinde alt test, bu tür soru, bir kelimeyi pasaj bağlamında kullanılan şekilde tanımlamanızı gerektirir. Sorunun doğru tanımı, sözcüğün en yaygın anlamı olabilir veya daha az bilinen bir anlam olabilir ...

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sayı problemleri ASVAB üzerinde bulacağınız sayı problemleri oldukça basittir. Sorular, sayıları temel ekleme, çıkarma, çarpma veya bölme ile değiştirmenizi ister. Çoğu kişi bu tür kelime problemlerini oldukça kolay buluyor. Birkaç tane denemek ister misiniz, sadece ayağınızı ıslatmak için mi? Elbette. Jesse ...