İçindekiler:
Video: Ders 6 - Çapraz Tablo Oluşturma ve Yüzde/Frekanslarla Veri Özetleme?/SPSS ile Veri Analizi 2025
ggplot2'nin çok kullanışlı bir özelliği, arşivdeki R verilerinizi özetlemek için kullanılan fonksiyon aralığıdır. Bu, genellikle verilerinizi önceden özetlemek zorunda olmadığınız anlamına gelir. Örneğin, bir histogramdaki çubukların yüksekliği, verilerinizde kaç şey gözlem yaptığınızı gösterir.
Bunun istatistiksel özeti, gözlemleri saymaktır. İstatistikçiler, bu işleme binning, ve geom_bar () için varsayılan stat stat_bin () olarak atıfta bulunurlar.
Her bir coğrafyanın ilişkili bir varsayılan stat olması gibi, her bir stat de varsayılan bir coğrafya değerine sahiptir.
Yani, bu soruya şöyle cevap veriyor: Bir coğrafi veya stat kullanıp kullanmamaya nasıl karar veriyorsunuz? Teorik olarak, coğrafi ya da stat ilk seçmeniz önem taşımaz. Bununla birlikte, pratikte, öncelikle bir tür arsa ile başlamak, başka bir deyişle bir coğrafi bölge belirlemek sezgiseltir. Ardından istatistiksel özetten başka bir katman eklemek isterseniz stat kullanın.
Bu çizimde, aynı verileri, önce geom_point () ile bir dağılım çizgisi oluşturmak için kullandınız ve ardından stat_smooth () ile düz çizgi eklediniz.
Stat işlevlerini kullanmaya yönelik bazı pratik örneklere bir göz atın.
Stat | Açıklama | Varsayılan Geom |
---|---|---|
stat_bin () | Kutularda gözlem sayısını sayar. | geom_bar () |
stat_smooth () | Düz bir çizgiyi oluşturur. | geom_line () |
stat_sum () | Değerler ekler. | geom_point () |
stat_identity () | Özet yok. Verileri olduğu gibi çizer. | geom_point () |
stat_boxplot () | Bir kutu ve bıyık çiziminin verilerini özetler. | geom_boxplot () |
Verileri ggplot2'de nasıl saklayabiliriz |
Verilerinizi kutulara özetlemek için stat_bin () işlevini nasıl kullanacağınızı zaten gördünüz, çünkü bu varsayılan geom_bar () stat'dır. Bu, aşağıdaki iki kod satırının aynı arsaları ürettiği anlamına gelir: >> ggplot (deprem, aes (x = derinlik)) + geom_bar (binwidth = 50)> ggplot (deprem, aes (x = derinlik)) + stat_bin binwidth = 50)
Ggplot2'de R verilerini yumuşatma
Ggplot2 paketi ayrıca verileriniz boyunca regresyon çizgileri yaratmayı kolaylaştırır. Bu tür bir çizgi oluşturmak için stat_smooth () işlevini kullanın.
stat_smooth () ile ilginç olan şey, yerel regresyonu varsayılan olarak kullanmasıdır. R bunu yapabilen çeşitli işlevlere sahiptir, ancak ggplot2 yerel regresyon için loess () işlevini kullanmaktadır. Bu, eğer doğrusal bir regresyon modeli oluşturmak istiyorsanız stat_smooth () 'ya farklı bir yumuşak fonksiyonu kullanmasını söylemelisin demektir. Bunu method argümanıyla yaparsınız.
Daha pürüzsüz bir kullanımı göstermek için, longley veri kümesinde bir işsizlik dağılımı oluşturarak başlayın: >> ggplot (longley, aes (x = Yıl, y = Çalışan)) + geom_point ()
Sonraki, daha pürüzsüz ekleyin.Bu, stat_smooth () kod satırınıza eklenmesi kadar basittir. >> ggplot (longley, aes (x = Yıl, y = İstihdam)) + + geom_point () + stat_smooth ()
Son olarak, stat_smooth'a doğrusal bir regresyon modeli kullanmasını söyleyin. Bunu, argüman yöntemi = "lm" ekleyerek yaparsınız. >> ggplot2'ye verilerinizi sadeleştirilmemiş halde bırakmak için nasıl söylersin
Bazen siz (ganglionis, gangster, gangster, gangster, ggplot2'nin arsa içindeki verilerinizi özetlemesini istemeyin. Bu genellikle verileriniz önceden özetlendiğinde veya veri çerçevenizin her satırının ayrı ayrı çizilmesi gerektiğinde olur. Bu gibi durumlarda, ggplot2'ye hiçbir şey yapmamasını söylemek istersiniz ve bunu yapmak için stat stat_identity () 'dir.
