Ev Kişisel Finans Veri Biliminde İstatistik, Makine Öğrenimi ve Matematiksel Yöntemlerin Temellerini İncelemek

Veri Biliminde İstatistik, Makine Öğrenimi ve Matematiksel Yöntemlerin Temellerini İncelemek

İçindekiler:

Video: Sınıflandırma Classification 1 (Veri Madenciliği Teorik 3) 2025

Video: Sınıflandırma Classification 1 (Veri Madenciliği Teorik 3) 2025
Anonim

Aptallar için Veri Bilgisi Bölümü Cheat Sheet > İstatistikler, verilerin içgörüler elde etme bilimi olarak tanımlandıysa, istatistikçi ile veri bilimcisi arasındaki fark nedir? İyi soru! Veri bilimindeki pek çok görev, istatistiksel olarak bilinçli bir şekilde yapılmasını gerektirse de, bir veri bilimcisinin bilgi ve beceri tabanının kapsamı ve genişliği bir istatistikçiden farklıdır. Çekirdek ayrımlar aşağıda özetlenmiştir.

Konunun uzmanlığı:
  • Veri bilimcilerinin temel özelliklerinden biri, analitik yöntemlerini uyguladıkları alanda karmaşık bir uzmanlık derecesi sunmasıdır. Veri bilimcileri, ürettikleri veri analizlerinin etkilerini ve uygulamalarını gerçekten anlayabilmeleri için buna ihtiyaç duyarlar. Bir veri bilimcisi, bulgularının önemini tanımlayabilmek ve analizde nasıl ilerleyeceğini bağımsız olarak seçebilmek için yeterli uzmanlığa sahip olmalıdır.

    Buna karşılık istatistikçiler istatistikler hakkında son derece derin bir bilgiye sahipken, istatistiksel yöntemleri uyguladıkları konularda çok az uzmanlığa sahiptirler. Çoğu zaman istatistikçiler, bulgularının önemi konusunda kesin bir kavrayış elde etmek ve bir analizde ilerlemenin en iyi yoluna karar verebilmek için dış konular uzmanlarıyla danışmalıdırlar.

    Matematiksel ve Makine Öğrenme Yaklaşımları:
  • İstatistikçiler verilerden alınan bilgiler elde ederken çoğunlukla istatistiksel yöntem ve süreçlere güvenirler. Buna karşılık, veri bilimcileri, veri analizlerini elde etmek için çok çeşitli tekniklerden çekilmelidir. Bunlar istatistiksel yöntemleri içerir, ancak istatistiklere dayanmayan - matematik, kümeleme, sınıflandırma ve istatistiksel olmayan makine öğrenme yaklaşımları gibi - yaklaşımları da içerir. İstatistiksel bilgi birikiminin önemini görme

Veri biliminde pratik yapmak için bir istatistik derecesine sahip olmana gerek yok, ancak en azından kullanılan daha temel yöntemlerden bazılarını bilmelisin. istatistiksel veri analizinde. Bunlar arasında:

Doğrusal regresyon

  • : Doğrusal gerileme, bağımlı bir değişken ile bir veya birkaç bağımsız değişken arasındaki ilişkilerin modellenmesi için kullanışlıdır. Doğrusal gerilemenin amacı bağımlı ve bağımsız değişkenler arasındaki önemli korelasyonları keşfetmek (ve gücünü ölçmektir). Zaman serisi analizi:

  • Zaman serisi analizi, geçmişteki gözlemsel verilere dayanılarak önlemin ilerideki örneklerini öngörmek için zamanla öznitelik değerleri hakkındaki bir veri kümesini analiz etmeyi içerir. Monte Carlo simülasyonları:

  • Monte Carlo yöntemi, hipotezleri test etmek, parametre tahminleri oluşturmak, senaryo sonuçlarını tahmin etmek ve modelleri doğrulamak için kullanabileceğiniz bir simülasyon tekniğidir. Bu yöntem, değerlendirmeye çalıştığınız tüm işlemler için 1 ila 10, 000 (veya daha fazla) simülasyon örneğinin her yerinde çok hızlı bir şekilde simüle etmek için kullanılabildiğinden güçlüdür. Uzamsal veriler için istatistikler:

  • Uzamsal verilerin temel ve önemli bir özelliği, rasgele değil olmasıdır. Mekansal olarak bağımlı ve kendine özerk. Uzamsal verileri modellerken, verilerinizin rastgele olduğunu varsayan istatistiksel yöntemlerden kaçının. Kriging ve krige, mekansal verileri modellemek için kullanabileceğiniz iki istatistiksel yöntemdir. Bu yöntemler, coğrafi alanda bilinen noktaların kümelerine dayalı olarak tüm çalışma alanları için öngörülü yüzeyler üretmenizi sağlar. Kümeleme, sınıflandırma ve makine öğrenme yöntemleri ile çalışma

Makine öğrenme, ham veri kümelerinden öğrenmek (veya desen çıkarmak) için hesaplama algoritmalarının uygulanmasıdır.

Kümeleşme belirli bir makine öğrenme türüdür - denetlenmemiş makine öğrenme, tam olarak, algoritmaların etiketsiz veriden öğrenmesi gerektiğini ve dolayısıyla keşfetmek için çıkarsama yöntemlerini kullanmaları gerektiğini belirtmek korelasyonlar. Diğer taraftan Sınıflandırma, denetimli makine öğrenimi olarak adlandırılır, yani algoritmaların etiketli verilerden öğrenilmesi anlamına gelir. Aşağıdaki tanımlamalar, daha temel bazı kümeleme ve sınıflandırma yaklaşımlarını tanıtmaktadır: k-aracı kümeleme:

  • Genellikle, bir veri kümesinin veri noktalarını en yakın ortalama değerlere dayalı olarak kümelere alt bölümlere ayırmak için k-aracı algoritmaları kullanıyorsunuz. Veri noktalarınızın kümelere bölünmesini belirlemek için, her kümedeki noktalar arasındaki uzaklık en aza indirilirse, k-aracı kümeleme yöntemini kullanabilirsiniz. En yakın komşu algoritmaları:

  • En yakın komşu analizinin amacı, karşılaştırma esasında kullandığınız özniteliğe bağlı olarak uzaydaki en yakın noktayı veya en yakın sayısal değeri aramak ve bulmaktır. Çekirdek yoğunluk tahmini:

  • Verilerinizdeki kümeleri tanımlamanın alternatif bir yolu yoğunluk yumuşatma işlevi kullanmaktır. Çekirdek yoğunluk tahmini (KDE), veri kümesindeki her veri noktasında yoğunluğu belirlemek için kullanışlı bir ağırlıklandırma fonksiyonu olan çekirdeği yerleştirerek ve daha sonra toplamları için bir çekirdek yoğunluk tahmini oluşturmak için çekirdekleri toplamak suretiyle çalışır bölgesi. Karışıklıkta matematiksel yöntemlerin tutulması

Veri bilimi uygulamalarında istatistiklerin değeri hakkında çok şey söylenir, ancak uygulanan matematiksel yöntemler nadiren belirtilir. Açıkçası, matematik, tüm niceliksel analizlerin temelini oluşturmaktadır. Önemi önemsenmemelidir. Aşağıdaki iki matematiksel yöntem, veri biliminde özellikle yararlıdır.

Çok kriterli karar verme (MCDM):

  • MCDM, karar verirken eşzamanlı olarak değerlendirmeniz gereken birkaç kritere veya seçeneğe sahipken kullanabileceğiniz bir matematiksel karar modelleme yaklaşımıdır. Markov zincirleri

  • : Bir Markov zinciri, mevcut durum değişkenlerinin gelecekteki durumları nasıl etkileyeceğini modellemek için mevcut durumu temsil eden bir dizi rastgele oluşturulmuş değişkenleri zincirleyen matematiksel bir yöntemdir.

Veri Biliminde İstatistik, Makine Öğrenimi ve Matematiksel Yöntemlerin Temellerini İncelemek

Editörün Seçimi

Photoshop CS6'da Katmanları Maskeye Kalıp Ekleme - mankenler

Photoshop CS6'da Katmanları Maskeye Kalıp Ekleme - mankenler

Photoshop Creative Suite 6 kullanırken (alt tabaka olarak da bilinir) üst katmanları için bir maske görevi görür. Grubun katmanları taban katmanın opak alanlarına klipslenir ve taban katmanının şeffaf alanlarının üzerinde gösterilmez. Bu noktada ...

Photoshop CS6'da renklendirme nasıl yapılır - mankenler

Photoshop CS6'da renklendirme nasıl yapılır - mankenler

Photoshop Creative Suite 6, size renklerinizi pompalamak için birçok seçenek sunar. Ton / Doygunluk Kontrolleri ve Canlılık Ayarı ile görüntü. Bu, resmini istediğiniz kadar parlak yapmak için bazı eğlenceli seçenekler sunar. Ton / Doygunlukta Renk Boyutlandırma seçeneği nasıl kullanılır Renk / Doygunluk iletişim kutusundaki Renk Boyama seçeneğini kullanın ...

Photoshop CS6'da Çoklu Görüntülerle Bileşikleştirme - katmanlar

Photoshop CS6'da Çoklu Görüntülerle Bileşikleştirme - katmanlar

Genellikle katmanlarla çalışırken tek bir resim kullanmakla sınırlı değil. Adobe Photoshop Creative Suite 6'da, istediğiniz bitmiş ürünü oluşturmak için birden fazla resimle bileşikleştirebilirsiniz. Birkaç resimle çalışmayı bıraktığınızda, sayısız yeni yaratıcı olanaklar bulacaksınız. Ve sadece sade bir görüntüle sınırlı değilsiniz ...

Editörün Seçimi

ÖFkenizi Kontrol Altına Almak İçin Stres Taşıyıcılarından Nasıl Uzak durun - Bazıları mumlar olan

ÖFkenizi Kontrol Altına Almak İçin Stres Taşıyıcılarından Nasıl Uzak durun - Bazıları mumlar olan

Stres taşıyıcılarıdır ve bir duruma stres getirebilir ve öfkeye neden olabilir. Odaya girerken etrafındaki her şeyi bozan birisini tanıyor musun? O kişi gelmeden önce insanlar iyi bir havadaydı ve bu kişi bütün bunları değiştirdi. Kahkahalar durdu, ruh halleri değişti ve gerginlik ...

ÖFkeyi yönetmek için minnettarlığı nasıl kullanacaksınız - mankenler

ÖFkeyi yönetmek için minnettarlığı nasıl kullanacaksınız - mankenler

ÖFke sizin duygu ile ilgisi vardır İstediğiniz şeyleri almıyor (ya da hakkınız olduğunda). İşyerinde tanınmamak ya da hissedeceğiniz parayı vermiyorsunuzdur. Çocuklarınız size, ebeveyn olarak hakkına sahip olduğunuzu düşündüğünüz saygı göstermiyor. Köpeğiniz ne zaman gelmez ...

Editörün Seçimi

Arabellek Taşması Hacks'a Karşı Nasıl Korunacaksınız - mankenler

Arabellek Taşması Hacks'a Karşı Nasıl Korunacaksınız - mankenler

RPC ve diğer savunmasız cinetler arabellek taşması için ortak hedeflerdir kesmek. Arabellek taşması saldırıları genellikle bilgisayar korsanının sistem dosyalarını değiştirme, veritabanı dosyalarını okuma ve diğer yollarla nasıl geçebileceklerini görür. Arabellek taşması saldırıları Saldırgan, bir arabellek taşması saldırısında ya kurban Linux makinesine elle bilgi dizisi gönderir veya bir komut dosyası yazar ...

VMware Tools kurulumu - mankenler

VMware Tools kurulumu - mankenler

Bir VMware sanal makinesine bir işletim sistemi yüklediğinizde Başka bir şey yapmadan önce VMware Tools adı verilen önemli bir uygulamayı yükleyin. VMware Tools bir VMware sanal makinesi için çeşitli önemli işlevler sunar: Önemli ölçüde geliştirilmiş grafik performansı Paylaşılan klasörler, sanal makineleri ve arasında klasörler paylaşmanızı sağlar ...

Ahlaki Hack Planı İçin Hedeflerin Oluşması - test planınızın hedeflerine ihtiyacı olan mankenler

Ahlaki Hack Planı İçin Hedeflerin Oluşması - test planınızın hedeflerine ihtiyacı olan mankenler

. Etik hırsızlığının ana amacı, kötü adamlar açısından sisteminizdeki güvenlik açıklarını bulmaktır; böylece ortamınızı daha güvenli hale getirebilirsiniz. Daha sonra bunu bir adım daha ileri götürebilirsiniz: Daha spesifik hedefleri tanımlayın. Bu hedefleri işletme hedeflerinizle aynı hizaya getirin. Nesin ...