Ev Kişisel Finans Log Veri Analizi Hadoop - mankenler ile

Log Veri Analizi Hadoop - mankenler ile

Video: Big Data Hadoop Training | Twitter Analysis with Apache Hive | Hadoop Tutorial | Edureka 2024

Video: Big Data Hadoop Training | Twitter Analysis with Apache Hive | Hadoop Tutorial | Edureka 2024
Anonim

Günlük analizi, açılış Hadoop projesi için ortak bir kullanım örneğidir. Nitekim, Hadoop'un en erken kullanım alanları, clickstream günlüklerinin - insanların ziyaret ettiği web sayfaları ve hangi sırada ziyaret ettikleri hakkındaki verileri kaydeden günlükleri - büyük ölçekli analizi için kullanılmıştır.

BT altyapınız tarafından üretilen tüm veri kayıtlarına genellikle veri egzozu adı verilir. Bir günlük, çalışan bir motorun egzoz borusundan gelen duman gibi çalışan bir sunucunun yan ürünüdür. Veri egzozu kirlilik veya atık çağrışımına sahiptir ve birçok işletme kuşkusuz bu düşünceyi akılda tutarak bu tür verilere yaklaşmaktadır.

Günlük verileri genellikle hızlı bir şekilde büyür ve üretilen yüksek hacim nedeniyle analiz etmek sıkıntılı olabilir. Ve bu verilerin potansiyel değeri çoğunlukla net değildir. BT departmanlarındaki günaha, bu günlük verilerini mümkün olduğunca az zaman saklamaktır. (950) Ancak, Hadoop matematiğini değiştirir: Veri saklama maliyeti oldukça ucuzdur ve Hadoop başlangıçta günlük verilerinin büyük ölçekli toplu işlenmesi.

Günlük veri analizi kullanımı durumu, Hadoop yolculuğunuza başlamak için kullanışlı bir yerdir, çünkü şansınız, birlikte çalıştığınız verilerin silinmesi ya da "yere bırakılması" demektir. "Haftada bir terabayt (TB) ya da daha fazla müşteri web etkinliği tutan bazı şirketler, verileri herhangi bir analiz olmaksızın atıyorlar (bu da onu toplamak için neden rahatsız olduklarını merak ediyor).

Hızlı bir şekilde başlamak için, bu kullanım durumundaki veriler büyük olasılıkla kolaydır ve Hadoop yolculuğunuzu diğer (yönetilen) verilerle başlatırsanız karşılaşacağınız aynı sorunları genelde kapsamaz.

Endüstri analistleri, var olan verilerin hızla artan hacimlerini tartıştıklarında (2014 itibariyle 4,1 exabyte - 4 milyondan fazla 1 TB sabit disk), günlük veri bu büyümenin büyük bölümünü oluşturmaktadır. Ve merak etmene gerek yok: Yaşamın neredeyse her yönü şimdi veri üretme ile sonuçlanır. Akıllı telefon, etkin bir kullanıcı için yalnızca ses, metin ve veri aktarımı değil aynı zamanda coğrafi konum verileri de izlenerek yüzlerce günlük girişi oluşturabilir.

Artık çoğu hanede elektrik kullanımlarını kaydeden akıllı sayaçlar var. Yeni arabalar, durumlarının ve kullanımlarının özelliklerini kaydeden binlerce sensöre sahiptir. İnternette gezinirken yaptığınız her tıklama ve fare hareketi, günlük girdilerinin kademeli olarak oluşturulmasına neden olur.

Her ne zaman bir şey satın aldığınızda - bir kredi kartı veya bankamatik kartı kullanmadan bile - sistemler sistemdeki faaliyeti veritabanlarında ve günlüklerde kaydederler.Günlük verilerinin daha yaygın kaynaklarından bazılarını görebilirsiniz: BT sunucuları, web tıklama akışları, algılayıcılar ve işlem sistemleri.

Özellikle belirli bir faaliyet türünü sıfırlayıp bulgularınızı bağlam sağlamak için başka bir veri kümesiyle ilişkilendirebildiğinizde, her endüstri (ve açıklanan tüm günlük türleri) değerli analiz için büyük potansiyele sahiptir.

Örnek olarak, bu tipik web tabanlı tarama ve satın alma deneyimini göz önünde bulundurun:

Siteyi dolaşarak satın alacak ürünleri arayın.

  1. Gözünüze çarpan bir ürünün açıklamalarını okumak için tıklayın.

  2. Sonunda, alışveriş sepetinize bir öğe ekleyip kasaya (satın alma işlemi) devam edin.

  3. Ancak gönderim bedelini gördükten sonra, öğenin fiyatının düşük olduğuna karar verdiniz ve tarayıcı penceresini kapattınız. Yaptığınız her tıklamayı - ve daha sonra yapmayı bırakın - bu e-ticaret sitesinin arkasındaki şirkete değerli bilgiler sunma potansiyeline sahiptir.

Bu örnekte, bu işletmenin, müşterilerine daha iyi nasıl hizmet verebileceklerini anlama amacıyla tıklama akışı verilerini (bir ziyaretçinin "dokunduğu her fare tıklaması ve sayfa görüntüleme hakkındaki veriler") topladığını varsayalım. E-ticaret işletmeleri arasında sık görülen bir sorun, terk edilmiş alışveriş sepetlerinin arkasındaki kilit faktörleri tanımaktır. Clickstream verilerinde daha derinlemesine analizler gerçekleştirir ve sitedeki kullanıcı davranışını incelerseniz desenler ortaya çıkmaya mecburdur.

Şirketiniz görünüşte basit bir sorunun cevabını biliyor mu? "Bazı ürünler diğerlerinden daha mı vazgeçiliyor? "Veya sorunun cevabı," Sepet terkini yüzde 10 azaltarsanız ne kadar gelir elde edilebilirsiniz? "Aşağıdakiler, Hadoop davanıza yatırım yapmak için iş liderlerine gösterebileceğiniz türden bir rapora örnektir.

Gösterilen grafikleri oluşturmak için verileri üretebileceğiniz noktaya gelmek için, tek tek kullanıcıların web'de gezinme oturumlarını (

oturumlaşma olarak bilinen bir süreç) , alışveriş sepetlerinin içeriğini tanımlarsınız ve oturumun sonundaki işlem durumunu - tümü tıklama akışını inceleyerek hazırlayın. Aşağıda, tüm tıklamaları ve URL adreslerini IP adresine göre gruplayarak kullanıcıların web tarama oturumlarını nasıl bir araya getireceğinize bir örnek verilmiştir.

Hadoop bağlamında, anahtarlar ve değerlerle her zaman birlikte çalışıyorsunuz- MapReduce'un her fazında, anahtar ve değer kümelerindeki veriler giriliyor ve çıktılanıyor. Anahtar IP adresidir ve değer zaman damgası ve URL'den oluşur. Harita aşamasında, kullanıcı oturumları Hadoop kümenizde saklanan tıklama akışı veri kümesinin tüm dosya blokları için paralel olarak toplanır.

Harita aşaması şu unsurları döndürür:

Ziyaret edilen son sayfa

  • Alışveriş sepetindeki öğelerin listesi

  • Her kullanıcı oturumu için işlem durumu (IP adresi tuşuyla dizine eklenir) < Redüktör, bu kayıtları alır ve ayda terk edilen arabaların sayısını ve değerini toplamaya ve kullanıcı oturumunu sona erdirmeden önce görüntülediği en yaygın nihai sayfaların toplamlarını toplamaya yönelik toplama işlemlerini gerçekleştirir.

Log Veri Analizi Hadoop - mankenler ile

Editörün Seçimi

Doktor Yardımcısı Sınavı İçin Cilt Durumlarının Gözden Geçirilmesi - mankenler

Doktor Yardımcısı Sınavı İçin Cilt Durumlarının Gözden Geçirilmesi - mankenler

Çoklu cilt koşulları vardır Doktor Yardımcısı Sınavı (PANCE) için haberdar olmalısınız. Çalışılmalıdır birkaç daha olmasına rağmen, kendinizi bu temelleri tanımak emin olun. Keratoz lezyonları İki tip keratozis lezyonunun farkında olmalısınız: Aktinik keratoz: Bu cilt lezyonu neden olur ...

Sınıfı için Kardiyomiyopatilerin sınıfları

Sınıfı için Kardiyomiyopatilerin sınıfları

Kardiyomiyopati hakkında iyi bir anlayış, Doktor Yardımcısı Sınavı. Bir kardiyomiyopati, kalp kasının yapısındaki değişikliklere bağlı olarak kalp işlevinin bir anormalliğidir. Konjestif kalp yetmezliğinin en yaygın nedeni iskemik kardiyomiyopatidir. Pek çok vakada olmasa bile, teşhis koyabilirsiniz ...

Editörün Seçimi

JavaScript ile anonim olarak çalışıyor - mankenler

JavaScript ile anonim olarak çalışıyor - mankenler

JavaScript'de işlevler oluşturabilirsiniz. JavaScript'te bir işlev oluşturmak için en yaygın yol, function anahtar sözcüğünü kullanmaktır. İşte bu tekniğe bir örnek: function myFunction () {// bir şey yapın} Bu işlev tanımında bir ada sahip bir işlev yaratılır. Fonksiyon her çağırıldığında ismini kullanarak ...

Ertelenmiş JavaScript ile yükleniyor - mankenler

Ertelenmiş JavaScript ile yükleniyor - mankenler

Yavaş web sayfalarının bir ana nedeni sözde engelleme komut dosyasıdır. Engelleme komut dosyası, yüklenmesi ve çalıştırılmasıyla bir web sayfasının yüklenmesini engelleyen bir JavaScript dosyasıdır. Aşırı koşullar altında, bir tarayıcı, JavaScript yüklenirken bir web sayfasının tamamını indirebilir ve birkaç saniye veya daha uzun süre boş bir ekran gösterebilir ...

Css Temelleri ve Douglas JavaScript Robotu - mankenler

Css Temelleri ve Douglas JavaScript Robotu - mankenler

, Siz stilleri değiştirip ekliyorsunuz Douglas adlı bir HTML robotuna. Douglas bu sabah robot fabrikasından teslim alındı. JavaScript becerileri olağanüstü; fazla bakıma (her seferinde oynamak için yeni bir değişkene) ihtiyaç duymaz; ve o iyi espriler anlatır! Tek sorun, onun bakışları ...

Editörün Seçimi

Sosyal Medya Metrikleri: Web Sitenizin Mobil Kullanımını İzleme - mankenler

Sosyal Medya Metrikleri: Web Sitenizin Mobil Kullanımını İzleme - mankenler

Analytics sitenize gelen mobil trafiği size anlatıyor mu? Mobil ölçümler, size hacim, ziyaretçinizin satın alma kalıpları veya potansiyel müşteri üretim kalıpları nedir ve mobil site ziyaretçilerinizin demografik bilgileri hakkında bilgi verebilir. Bunlarla ilgilendikten sonra, sitenizi mobil ziyaretçiler için yapışkan hale getirebilirsiniz. ...

Gerçek Zamanlı Sosyal Medya Ölçütleri Kullanmanın Faydaları - mankenler

Gerçek Zamanlı Sosyal Medya Ölçütleri Kullanmanın Faydaları - mankenler

Gerçek zamanlı sosyal medya metrikleri yararlıdır, tamamen markanıza ve müşterilerinize sunduğunuz hizmet veya ürüne bağlıdır. Markanızın, gerçek zamanlı olarak sayfanızla etkileşim halinde olan insanların izlenmesinden fayda çıkarsa, sizin için kullanabileceğiniz çeşitli çözümlere sahip olursunuz; Woopra, KISSmetrics, Clicky, Google Analytics ve ...

Harekete Alma Harekete Geçişiniz İçin Yerleştirme Seçeneği için Sosyal Medya Metriklerini Kullanarak

Harekete Alma Harekete Geçişiniz İçin Yerleştirme Seçeneği için Sosyal Medya Metriklerini Kullanarak

Harekete geçirici mesajların yerleştirilmesine yardımcı olması için metrikleri kullanmak önemlidir. Sayfa yerleşiminde A / B testi yapın. Açılış sayfanızın düğmelerine sahip sürümlerini farklı yerlerde çalıştırın. Her seferinde iki sürüm çalıştırmayı deneyin; bazı insanlar aynı anda beş test yerleşimi çalıştırır ve rasgele teslim edilir. Metrikleriniz yardımcı olabilir ...