Ev Kişisel Finans Basit ve karmaşık eğitim için yeterli sayıda örneğe sahip olsanız bile, Makine Öğrenimi için Eksik Verileri belirleme - mankenler

Basit ve karmaşık eğitim için yeterli sayıda örneğe sahip olsanız bile, Makine Öğrenimi için Eksik Verileri belirleme - mankenler

Video: SAP Nedir - ERP Nedir - SAP Hakkında Herşey - Nasıl Öğrenilir - MedyaSoft 2024

Video: SAP Nedir - ERP Nedir - SAP Hakkında Herşey - Nasıl Öğrenilir - MedyaSoft 2024
Anonim

Hem basit hem de karmaşık makine öğrenme algoritmalarını eğitmek için yeterli sayıda örneğe sahip olsanız bile, özelliklerde tam değerler sunmak zorundasınız; eksik veri. Tamamlanmamış bir örneği olması, özelliklerin içindeki ve içindeki tüm sinyalleri birleştirmeyi imkansız hale getirir. Eksik değerler, algoritmanın eğitim sırasında öğrenilmesini zorlaştırıyor. Kayıp verilerle ilgili bir şeyler yapmalısınız.

Çoğu durumda, eksik değerleri göz ardı edebilir veya muhtemel değiştirme değerini tahmin ederek onarabilirsiniz. Bununla birlikte, çok eksik değerler daha belirsiz tahminlerde bulunur; çünkü eksik bilgiler herhangi bir olasılığı gizleyebilir; Dolayısıyla, özelliklerdeki eksik değerler ne kadar çok olursa, tahminler o kadar değişken ve net değildir.

İlk adım olarak, her değişkende eksik vakaların sayısını sayın. Bir değişkende çok fazla eksik kasa varsa, eğitim ve test veri kümesinden bırakmanız gerekebilir. Örneklemin yüzde 90'ından fazlası eksikse, bir değişkeni bırakmak iyi bir kuraldır.

Bazı öğrenme algoritmaları, eksik değerlerle nasıl başa çıkılacağını bilmemekte ve hem eğitim hem de test evrelerinde hataları raporlamaktadır; diğer modeller, onları sıfır değerler olarak kabul etmekte ve tahmin edilen değer veya olasılığın küçümsenmesine neden olmaktadır (Sanki formülün bir kısmı düzgün çalışmıyor gibi). Sonuç olarak, doğru gerçekleşmesi için makine öğrenimi için veri matrisindeki tüm eksik değerleri uygun bir değere değiştirmeniz gerekiyor.

Veri eksikliği için pek çok neden var, ancak temel nokta, verilerin rastgele veya belirli bir sırada eksik olup olmadığı. Rasgele eksik veri rastlantısal olmaksızın basit bir ortalama, medyan veya başka bir makine öğrenme algoritması kullanarak değerini tahmin edebildiğiniz için idealdir. Bazı vakalar, belirli örnek türlerine karşı güçlü bir önyargı içerir.

Örneğin, bir nüfusun gelirini incelemek konusunu düşünün. Zengin insanlar (vergi nedenleriyle, muhtemelen) bilmediklerini size bildirerek gerçek gelirlerini gizleme eğilimindedirler. Öte yandan, yoksul insanlar, olumsuz yargı korkusu nedeniyle gelirlerini bildirmek istemediklerini söyleyebilir. Nüfusun belirli katmanlarından bilgi almıyorsanız, eksik verilerin onarımı zor ve yanıltıcı olabilir, çünkü bu tür davaların diğerleri gibi olduğunu düşünebilirsiniz.

Bunun yerine, tamamen farklı. Bu nedenle, eksik değerleri değiştirmek için yalnızca ortalama değerleri kullanamazsınız - karmaşık yaklaşımları kullanmanız ve bunları dikkatle ayarlamanız gerekir.Dahası, veri kümesindeki rasgele eksik olmayan durumların tespit edilmesi zordur çünkü eksik değerlerin veri kümesindeki diğer değişkenlerle nasıl ilişkili olduğunun daha yakından incelenmesini gerektirir.

Veriler rastgele eksik olduğunda, diğer değişkenlerden gerçek değerlerine ipuçları verdiğinden boş değerleri kolayca onarabilirsiniz. Veriler rasgele eksik olmadığında, eksik kasa ile olan veri ilişkisini anlamadığınız sürece, mevcut bilgilerden iyi ipuçları alamazsınız.

Dolayısıyla, verilerinizde kayıp geliri bulmak zorundaysanız ve kişi varlıklı olduğundan eksikse, eksik bir değeri, onu orta gelir ile değiştireceğinizden basit bir ortalama ile değiştiremezsiniz. Bunun yerine, zengin insanların gelirinin bir ortalamasını yerine koymalısınız.

Veri rastgele eksik olmadığında, eksik grubun izini bulmasına yardımcı olması nedeniyle değerin eksik olması bilgilendirici olur. Bir değişkenin değeri eksik olduğunda rapor veren yeni bir ikili özellik oluşturarak, makine öğrenme algoritması için eksik olanı aramaya başlayabilirsiniz. Sonuç olarak, makine öğrenme algoritması kendiliğinden bir yedek olarak kullanılacak en iyi değeri bulacaktır.

Basit ve karmaşık eğitim için yeterli sayıda örneğe sahip olsanız bile, Makine Öğrenimi için Eksik Verileri belirleme - mankenler

Editörün Seçimi

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Fotoğraf bir sanat biçimidir. İyi fotoğrafçılar, insanların bakmak isteyeceği çekici bir fotoğraf oluşturmak için kompozisyon kurallarını kullanırlar. Resminizi nasıl görselleştireceğinizi, çerçevede olanı düzenleyebileceğinizi ve ardından ilginç bir fotoğraf oluşturmak için kompozisyon kurallarını nasıl kullanacağınız. Doğal çerçeveleri kullanma Doğal çerçeveleri çizmek için kullanabilirsiniz ...

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital fotoğraf makineniz size yol göstermez panoramik bir fotoğraf çekmek için. Ancak, kesintisiz bir panoramik çekim oluşturmak için çakışan birkaç resim çekebilir ve onları birbirine dikebilirsiniz. Fotoğraf panoramasını oluşturmak için işinize bakalım:

Ham Dosyaları dönüştürme - mankenler

Ham Dosyaları dönüştürme - mankenler

Birçok dijital fotoğraf makinesi, görüntüleri Camera Raw dosya biçiminde veya sadece Ham olarak yakalayabilir. Bu format, JPEG formatında çekim yaparken oluşan olağan post-processing'leri uygulamadan herhangi bir görüntü sensöründen elde edilen ham görüntü verilerini depolar. Ham formatta çekim, bir takım avantajlar sunar. Fakat olumsuz ...

Editörün Seçimi

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Sabahınıza enerji artışı sağlayan krep düşünün endişesizsiniz. Bu tarif, bir sabah herkesin sevebileceği bir Karbonhidrat Diyeti (SCD) versiyonudur.

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

Bu aperitif, pumpernickel ekmeği konusunda harika, fakat ayrıca buğdaydan kaçınırsanız, filizlenmiş ekmeği denemek istersiniz. Sardalya, iyi bir kalsiyum ve D vitamini kaynağı olduğu kadar, iltihap düzeylerini azaltmaya yardımcı olduğu bilinen omega-3 yağ asitleri. Kredi: © Digiphoto, 2006 Caroline Nation bunu geliştirdi ...

Editörün Seçimi

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB'da göreceğiniz alt testlerden bir tanesi Kelime Bilgi testi. Test gününde soruların ve biçimin neye benzeyeceği hakkında bir fikir edinmek için aşağıdaki soruları inceleyin. Örnek sorular Kelime Bilgi Zamanı: 35 soru için 11 dakika Talimatlar: Kelime Bilgisi alt testi üçüncü alt testtir ...

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

Kelime Bilgisi ASVAB üzerinde alt test, bu tür soru, bir kelimeyi pasaj bağlamında kullanılan şekilde tanımlamanızı gerektirir. Sorunun doğru tanımı, sözcüğün en yaygın anlamı olabilir veya daha az bilinen bir anlam olabilir ...

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sayı problemleri ASVAB üzerinde bulacağınız sayı problemleri oldukça basittir. Sorular, sayıları temel ekleme, çıkarma, çarpma veya bölme ile değiştirmenizi ister. Çoğu kişi bu tür kelime problemlerini oldukça kolay buluyor. Birkaç tane denemek ister misiniz, sadece ayağınızı ıslatmak için mi? Elbette. Jesse ...