Ev Kişisel Finans Makinenizi Geliştirmenin 10 Yolu Öğrenme Modelleri - makine öğrenme algoritması bittiğine göre mankenler

Makinenizi Geliştirmenin 10 Yolu Öğrenme Modelleri - makine öğrenme algoritması bittiğine göre mankenler

İçindekiler:

Video: Kolay Bir Reçeteyle Saçlarımı Çabucak Düzleştirdim 2024

Video: Kolay Bir Reçeteyle Saçlarımı Çabucak Düzleştirdim 2024
Anonim

Artık makine öğrenme algoritması Python veya R kullanılarak elde edilen verilerden öğrenmeyi tamamladı. test grubunuzdan elde edilen sonuçlar ve bunları iyileştirebilir mi veya gerçekten mümkün olan en iyi sonuca ulaştı mı merak ediyorum. Makine öğrenme performansını artırmak ve test setiniz veya yeni verilerinizle eşit derecede çalışabilecek daha genel bir öngörüye ulaşmak için kullanabileceğiniz yöntemleri ima eden bir takım kontroller ve eylemler vardır. On tekniğin bu listesi, makine öğrenme algoritmalarını kullanarak elde edilen sonucun iyileştirilmesi için fırsatlar sunar.

Öğrenme eğrilerinin incelenmesi

Sonuçlarınızı geliştirmenin ilk adımı olarak, modelinizle ilgili sorunları belirlemelisiniz. Öğrenme eğrileri, eğitim örneklerinin sayısını değiştirdikçe bir test setine karşı doğrulamanızı gerektirir. Örnekleme hatası ve numune dışı hatalar arasında çok fazla fark olup olmadığını anında fark edeceksiniz. Geniş bir başlangıç ​​farkı, tahmin varyansının bir işaretidir; Bunun tersine, hem yüksek hem de benzer hatalarınız, önyarılmış bir modelle çalıştığınızın bir işaretidir.

Python, Scikit-learn () fonksiyonunu kullanarak öğrenme eğrilerini kolayca çizmenize yardımcı olur. Devrimi analitiği blogunda tarif edildiği gibi aynı sonucu R'yi kullanarak özel işlevlerle kolayca elde edebilirsiniz.

Çapraz doğrulamayı doğru bir şekilde kullanma

Çapraz doğrulama (CV) tahminleri ve sonuç arasında büyük bir fark görmek, bir test setinde veya yeni verilerle ortaya çıkan yaygın bir sorundur. Bu sorunu yaşamak, çapraz doğrulama ile ilgili bir şeylerin yanlış gittiği anlamına gelir. Özgeçmiş, iyi bir performans belirleyicisi olmadığı gerçeğinin ötesinde, bu yanıltıcı bir göstergenin problemi yanlış bir şekilde modellemenize ve yetersiz sonuçlara ulaştıracağınız anlamına da gelmektedir.

Çapraz doğrulama, adımların doğru olduğunda ipuçları sağlar. CV tahminlerinin örnek dışı hata ölçümlerini tam olarak çoğaltması önemlidir, ancak kritik değildir. Bununla birlikte, CV tahminlerinin modelleme kararlarınızdan dolayı test aşamasındaki iyileşmeyi veya kötüleşmeyi doğru bir şekilde yansıtması önemlidir. Genel olarak, çapraz doğrulama tahminlerinin gerçek hata sonuçlarından farklı olmasının iki nedeni vardır:

  • Snooping
  • Yanlış örnekleme

Python, katmanlı k katlı CV örnekleyicisi sunar. R, y parametresini faktör olarak belirttiğinizde, şablon kitaplığının createFolds yöntemini kullanarak örnekleri katmanlayabilir.

Doğru hata veya puan metriğini seçme

Ortalama hataya dayalı bir öğrenme algoritması kullanarak ortanca hata temel alınarak bir hata metriğini optimize etmeye çalışmak, optimizasyon işlemini yöneteceğiniz sürece size en iyi sonucu vermeyecektir. seçtiğiniz metriğin lehine çalışan bir moda.Veri ve makine öğrenmeyi kullanarak bir sorunu çözerken, sorunu analiz etmeniz ve optimize etmek için ideal ölçümü belirlemeniz gerekir.

Örnekler çok yardımcı olabilir. Birçoğunu akademik kağıtlardan ve veri ve hata / puan metriği açısından belirli problemleri dikkatle tanımlayan genel makine öğrenme yarışmalarından alabilirsiniz. Amaç ve verileri sizininkine benzeyen bir yarışmaya bakın ve daha sonra istenen metriği kontrol edin.

En iyi hiper parametreleri aramak

Çoğu algoritma, varsayılan parametre ayarlarını kullanarak kutudan oldukça iyi performans gösterir. Bununla birlikte, her zaman farklı hiper parametreleri test ederek daha iyi sonuçlar elde edebilirsiniz. Yapmanız gereken tek şey, parametrelerinin alabileceği olası değerler arasında bir ızgara arama oluşturmak ve sonuçları doğru hata veya puan metriğini kullanarak değerlendirmektir. Arama zaman alır, ancak sonuçlarınızı artırabilirsiniz.

Bir aramanın tamamlanması çok uzun zaman alıyorsa, orijinal verilerinizden bir örnek üzerinde çalışarak çoğu kez aynı sonuçları elde edebilirsiniz. Rastgele seçilen daha az örnek daha az hesaplama gerektirir, ancak genellikle aynı çözümü ima eder. Zamandan ve emekten tasarruf ettirebilecek bir diğer hüner, randomize bir arama yapmak ve böylece test etmek için aşırı parametre kombinasyonlarının sayısını sınırlamaktır.

Birden fazla modelin test edilmesi

İyi bir uygulama olarak, birden fazla modeli, temel modellerden başlayıp, varyansa göre daha fazla önyargıya sahip modelleri test edin. Karmaşık olanlar üzerinde her zaman basit çözümleri tercih etmelisiniz. Basit bir çözümün daha iyi performans gösterdiğini keşfedebilirsiniz.

Aynı grafiği kullanarak farklı modellerin performansını temsil etmek, sorununuzu çözmek için en iyi modelin seçilmesinden önce yararlıdır. Tüketici davranışını tahmin etmek için kullanılan modelleri (örneğin, ticari bir teklife verilen yanıt) özel kazanç çizelgelerinde ve kaldırma çizelgelerinde yerleştirebilirsiniz. Bu çizelgeler, modelinizin sonuçlarını ondalıklar veya daha küçük parçalara bölütleyerek nasıl çalıştığını gösterir.

Yalnızca teklifinize cevap verme olasılığı yüksek olan tüketicilerle ilgilenebileceğiniz için tahminlerinizi en azından en azından sipariş etmek, modellerinizin en umut verici müşterileri tahmin etmede ne kadar iyi olduğunu vurgular. Bu Quora cevapları, grafiklerin nasıl işe yaradığını ve yükseldiğini görmenize yardımcı olur: ROC Eğrisi nedir? ve Asansör Eğrisi Nedir?.

Birden fazla modelin test edilmesi ve bunlara göz önüne alındığında

, özellik oluşturma işlemi için hangi özelliklerin dönüştürüleceği veya özellik seçimi yaptığınızda hangi özelliklerin bırakılacağı konusunda öneri de sağlayabilir.

Ortalama modelleme Makine öğrenimi, birçok beklenmedik hata performansıyla, pek çok model oluşturmayı ve birçok farklı tahmini yaratmayı içerir. Modelleri bir araya getirerek daha iyi sonuçlar alabileceğinizi bilmek sizi şaşırtabilir. İlke oldukça basit: Tahmin varyansı rasgele, bu nedenle birçok farklı modeli ortalaması alarak sinyalini

güçlendirebilir ve çoğunlukla kendini iptal edecek gürültüyü dışarıda bırakabilirsiniz.

Bazen, iyi performans gösteren bir algoritmanın sonuçları, daha basit bir algoritmanın sonuçlarıyla karıştırılarak işe yaramazsa, tek bir algoritmayı kullanmaktan daha iyi tahminler oluşturabilir.Gradyan artırma gibi daha karmaşık algoritmaların çıktısıyla sonuçlarını ortalama olarak belirlediğinizde, doğrusal modeller gibi daha basit modellerden gelen katkıları hafife almayın.

Yığınlanma modelleri

Ortalama işlemenin aynı nedenlerle istifleme de daha iyi bir performans sağlayabilir. İstiflemede, makine öğrenme modellerinizi iki aşamada oluşturursunuz. Başlangıçta bu teknik, farklı algoritmaları kullanarak birden fazla sonucu öngörür ve hepsi verilerinizdeki özelliklerden öğrenir. İkinci aşamada, yeni bir modelin öğreneceği özellikler sunmak yerine, bu modeli daha önceden eğitilmiş diğer modellerin tahminleriyle birlikte sağlıyorsunuz.

İki aşamalı bir yaklaşımın kullanılması, karmaşık hedef işlevlerini tahmin ederken haklıdır. Bunları sadece birkaç modeli birlikte kullanarak ve ardından çarpım sonucunu akıllı bir şekilde birleştirerek onları yaklaştırın. İkinci aşamalı model olarak basit bir lojistik regresyonu veya karmaşık bir ağaç topluluğu kullanabilirsiniz.

Netflix yarışması, heterojen modellerin daha güçlü modeller oluşturmak için nasıl bir araya getirilebileceğine dair kanıt ve ayrıntılı bir illüstrasyon sağlar. Bununla birlikte, bu çözümü bir çalışan uygulama olarak uygulamak oldukça hantal olabilir.

Özellik mühendisliği uygulamak

Önyargı hala modelinizi etkiliyor düşünüyorsanız, ancak modeli performansını artırmak için yeni özellikler oluşturmak için, ancak çok az seçeneğiniz var. Her yeni özellik, hedef yanıtın tahmin edilmesini kolaylaştırabilir.

Otomatik öğrenim özelliği oluşturma, polinom genişlemesi veya makine öğrenme algoritmalarının destek vektör makineleri sınıfını kullanarak mümkündür. Destek vektör makineleri, daha yüksek boyutlu özellik alanlarında, hesaplama açısından hızlı ve bellek optimal olan daha iyi özellikleri otomatik olarak arayabilir.

Bununla birlikte, hiçbir şey algoritmanın öğrenmeye çalıştığı veri problemini çözmek için gereken yöntemi uzmanlığınızdan ve anlayışınızın yerini alamaz. Bilginize ve işlerin dünyadaki işleyişi üzerine fikirler temelinde özellikler oluşturabilirsiniz. İnsanlar bunu yapmakta hala rakipsizdir ve makineler onları kolayca değiştiremez.

Özelliklerin ve örneklerin seçilmesi

Tahmin varyansı yüksekse ve algoritmanız birçok özelliğe dayanıyorsa, daha iyi sonuç almak için bazı özellikleri budamanız gerekir. Bu bağlamda, veri matrisinizdeki özellik sayısını, tahmin edici değeri en yüksek olanları belirleyerek azaltmanız önerilir.

Doğrusal modellerle, doğrusal destek vektör makineleri veya sinir ağları ile çalışırken, düzenli hale getirme daima bir seçenektir. Hem L1 hem de L2 gereksiz değişkenlerin etkisini azaltabilir veya hatta modelden çıkarabilir. Kararlılık seçimi, L1'in daha az kullanışlı değişkenleri hariç tutma kabiliyetini arttırır. Teknik, dışlama teyit etmek için eğitim verilerini yeniden örnekler.

Scikit-öğrenme web sitesinde örneği inceleyerek kararlılık seçimi hakkında daha fazla bilgi edinebilirsiniz. Buna ek olarak, linear_model modülündeki RandomizedLogisticRegression ve RandomizedLasso Scikit-learn işlevlerini kullanarak uygulama yapabilirsiniz.

Daha fazla veri aramak

Daha önceki tüm önerileri denedikten sonra, hala üstesinden gelinen öngörülerden yüksek bir farklılığa sahip olabilirsiniz. Bu durumda, tek seçeneğiniz eğitim setinizin boyutunu arttırmaktır. Yeni vakalara veya yeni özelliklere dönüşebilecek yeni veriler sağlayarak örnekleminizi artırmayı deneyin.

Daha fazla vakit eklemek istiyorsanız, benzeri verilere sahip olup olmadığınıza bakmak yeterlidir. Yeni özellikler eklemek isterseniz, verilerinizi girdileriyle eşleştirmek için mümkünse açık kaynaklı bir veri kaynağını bulun. Hem yeni vakaları hem de yeni özellikleri elde etmek için bir başka harika yol, verileri web'den kazıma yapmaktır. Çoğu zaman, farklı kaynaklar arasında veya bir uygulama programlama arabirimi (API) aracılığıyla veriler mevcuttur. Örneğin, Google API'ları birçok coğrafi ve ticari bilgi kaynağı sunar.

Makinenizi Geliştirmenin 10 Yolu Öğrenme Modelleri - makine öğrenme algoritması bittiğine göre mankenler

Editörün Seçimi

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Fotoğraf bir sanat biçimidir. İyi fotoğrafçılar, insanların bakmak isteyeceği çekici bir fotoğraf oluşturmak için kompozisyon kurallarını kullanırlar. Resminizi nasıl görselleştireceğinizi, çerçevede olanı düzenleyebileceğinizi ve ardından ilginç bir fotoğraf oluşturmak için kompozisyon kurallarını nasıl kullanacağınız. Doğal çerçeveleri kullanma Doğal çerçeveleri çizmek için kullanabilirsiniz ...

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital fotoğraf makineniz size yol göstermez panoramik bir fotoğraf çekmek için. Ancak, kesintisiz bir panoramik çekim oluşturmak için çakışan birkaç resim çekebilir ve onları birbirine dikebilirsiniz. Fotoğraf panoramasını oluşturmak için işinize bakalım:

Ham Dosyaları dönüştürme - mankenler

Ham Dosyaları dönüştürme - mankenler

Birçok dijital fotoğraf makinesi, görüntüleri Camera Raw dosya biçiminde veya sadece Ham olarak yakalayabilir. Bu format, JPEG formatında çekim yaparken oluşan olağan post-processing'leri uygulamadan herhangi bir görüntü sensöründen elde edilen ham görüntü verilerini depolar. Ham formatta çekim, bir takım avantajlar sunar. Fakat olumsuz ...

Editörün Seçimi

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Sabahınıza enerji artışı sağlayan krep düşünün endişesizsiniz. Bu tarif, bir sabah herkesin sevebileceği bir Karbonhidrat Diyeti (SCD) versiyonudur.

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

Bu aperitif, pumpernickel ekmeği konusunda harika, fakat ayrıca buğdaydan kaçınırsanız, filizlenmiş ekmeği denemek istersiniz. Sardalya, iyi bir kalsiyum ve D vitamini kaynağı olduğu kadar, iltihap düzeylerini azaltmaya yardımcı olduğu bilinen omega-3 yağ asitleri. Kredi: © Digiphoto, 2006 Caroline Nation bunu geliştirdi ...

Editörün Seçimi

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB'da göreceğiniz alt testlerden bir tanesi Kelime Bilgi testi. Test gününde soruların ve biçimin neye benzeyeceği hakkında bir fikir edinmek için aşağıdaki soruları inceleyin. Örnek sorular Kelime Bilgi Zamanı: 35 soru için 11 dakika Talimatlar: Kelime Bilgisi alt testi üçüncü alt testtir ...

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

Kelime Bilgisi ASVAB üzerinde alt test, bu tür soru, bir kelimeyi pasaj bağlamında kullanılan şekilde tanımlamanızı gerektirir. Sorunun doğru tanımı, sözcüğün en yaygın anlamı olabilir veya daha az bilinen bir anlam olabilir ...

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sayı problemleri ASVAB üzerinde bulacağınız sayı problemleri oldukça basittir. Sorular, sayıları temel ekleme, çıkarma, çarpma veya bölme ile değiştirmenizi ister. Çoğu kişi bu tür kelime problemlerini oldukça kolay buluyor. Birkaç tane denemek ister misiniz, sadece ayağınızı ıslatmak için mi? Elbette. Jesse ...