Ev Kişisel Finans Hadoop'un MapReduce Uygulama Akışı Haritası Fazını

Hadoop'un MapReduce Uygulama Akışı Haritası Fazını

Video: hadoop yarn architecture 2025

Video: hadoop yarn architecture 2025
Anonim

Bir MapReduce uygulaması bölü girişindeki verileri kayıt başına kayıt esasına göre işler ve her kaydın MapReduce tarafından bir anahtar / değer olduğu anlaşılır çifti. Giriş bölmeleri hesaplandıktan sonra, eşleme görevleri onları işleyişine başlayabilir - yani, Kaynak Yöneticisinin planlama tesisi onlara işleme kaynaklarını atadıktan hemen sonra. (Hadoop 1'de JobTracker, eşleyici görevlerini belirli işleme alanlarına atar.)

Eşleme görevinin kendisi, bir defada bir girdi ayrımını işler - şekilte, bu yalnız kayıt anahtar / değer çifti ile temsil edilir. Uçuş verilerimizde, giriş bölmeleri hesaplandığında (metin dosyaları için varsayılan dosya işleme yöntemi kullanılarak) metin dosyasındaki her satırın tek bir kayıt olduğu varsayılır.

Her kaydın satırın metni değeri temsil eder ve her satırın bölünmesinin başlangıcından itibaren bayt uzaklığı anahtarı kabul eder.

Neden bayt ofset yerine satır numarasının kullanılmadığını merak ediyor olabilirsiniz. Çok büyük bir metin dosyasının birçok veri bloğuna ayrıldığını ve çok sayıda bölme olarak işlendiğini düşündüğünüzde satır numarası riskli bir kavramdır.

Her bölüntüye ait satır sayısı değişkendir, bu nedenle işlenmekte olan satırdan önceki satır sayısını hesaplamak mümkün değildir. Bununla birlikte, bayt ofseti ile hassas olabilirsiniz, çünkü her bloğun sabit sayıda baytları vardır.

Eşleme görevi, her kaydı işlerken yeni bir anahtar / değer çifti üretir: Burada anahtar ve değer girdi çifti ile tamamen farklı olabilir. Eşleme görevinin çıktısı tüm bu anahtar / değer çiftlerinin tam koleksiyonudur.

Her harita görevinin son çıktı dosyası yazılmadan önce çıktı, tuşa dayalı olarak bölümlendirilir ve sıralanır. Bu bölümleme, her bir tuş için tüm değerlerin birlikte gruplandırılmış olması demektir.

Oldukça basit bir örnek uygulama söz konusu olduğunda yalnızca tek bir azaltıcı var, bu nedenle eşleme görevinin tüm çıktıları tek bir dosyaya yazılır. Fakat çoklu redüktörlü durumlarda, her haritalama görevinde birden çok çıktı dosyası da üretilebilir.

Bu çıkış dosyalarının dökümü bölümleme anahtarına dayanır. Örneğin, eşleme görevleri için yalnızca üç farklı bölme tuşu çıktısı varsa ve iş için üç redüktör yapılandırdıysanız, üç haritalayıcı çıktı dosyası olacaktır. Bu örnekte, belirli bir eşleme görevi bir girdi bölme işlemini gerçekleştirir ve ç anahtardan ikisini üretirse, yalnızca iki çıktı dosyası olacaktır.

Her zaman eşleme görevlerinin çıktı dosyalarını sıkıştırın. Daha küçük çıktı dosyalarının yazılması, mapper çıktısını, redüktörlerin çalıştığı düğümlere transfer etmenin kaçınılmaz maliyetini en aza indirgediğinden burada en büyük fayda performans kazanımlarıdır.

Varsayılan bölücü çoğu durumda yeterli değildir, ancak bazen verilerin redüktörler tarafından işlenmeden önce nasıl bölündüğünü özelleştirmek isteyebilirsiniz. Örneğin, sonuç kümelerindeki verilerin anahtara ve değerlerine göre sıralanmasını isteyebilirsiniz - ikincil türü.

Bunu yapmak için, varsayılan ayırıcıyı geçersiz kılabilir ve kendi ayırıcıyı uygulayabilirsiniz. Bununla birlikte, bu işlem biraz dikkat gerektirir; çünkü her bölümdeki kayıtların sayısının tekdüze olmasını sağlamak istersiniz. (Bir redüktör diğer redüktörlerden çok daha fazla veri işlemek zorunda kalırsa, tek işleve bağlı redüktör orantısız olarak büyük veri kümesi üzerinden kaymaya başlarken MapReduce işinizin bitmesini bekleyeceksiniz.)

Düzgün boyutlu ara dosyalar kullanarak, MapReduce işlemesinde mevcut olan paralellikten daha iyi yararlanabilir.

Hadoop'un MapReduce Uygulama Akışı Haritası Fazını

Editörün Seçimi

Genişletme Bağlantılar ve Bina Robotları için Pinouts - mankenler

Genişletme Bağlantılar ve Bina Robotları için Pinouts - mankenler

Eğer bir robot inşa ediyorsanız, çok sayıda elektrik bağlantısı, bu yüzden çok sayıda iğne ile uğraşıyorsunuz. Aşağıdaki tabloda, genişleme konektörleri ve pim numaraları için sinyal gösterilmektedir. İstenmeyen çapraz bağlantıları önlemeye yardımcı olabilir. Genişletme Konnektörü Pin Numarası Sinyal Genleşmesi Konnektör Pin Numarası Sinyal 1, 2 Toprak 16 P11 Yeşil LED 3, 4 + 5 ...

Dizinler içeren Kablosuz Erişim Noktalarını bulma - mankenler

Dizinler içeren Kablosuz Erişim Noktalarını bulma - mankenler

Sıcak noktaları bulma konusunda çevrimiçi dizinler, gezinmek için mükemmel bir araçtır. ABD, Kanada ve dünyadaki artan sayıda sıcak nokta. Size kolaylık sağlamak için, bu dizinlerden bazıları. Dizin Notları JiWire WiFi Bulucu 144 ülkede ücretsiz ve ücretli Wi-Fi yerleri dizini sağlar. AT & T ...

Ham Radyoda genel Sınıf Frekans Ayrıcalıkları - mankenler

Ham Radyoda genel Sınıf Frekans Ayrıcalıkları - mankenler

Yakında yapmadıysanız, siz Yükseltmeyi düşünüyorum. Aşağıdaki tabloda gösterildiği gibi, yüksek frekanslı (HF) bantlarda kullanmak için daha fazla frekansa sahipsiniz. Tüm lisans sınıfları için ABD frekansı ve mod ayrıcalıklarının eksiksiz bir listesi, Amerikan Radyo Röle Ligi'nden (ARRL) edinilebilir. Bant Frekansları ...

Editörün Seçimi

Adobe Flash CS6'da Maske Katmanlarını Kullanma - mankenler

Adobe Flash CS6'da Maske Katmanlarını Kullanma - mankenler

Adobe Flash CS6'da maskeleme kavramı Bir parçanın bölümlerini gizlemek ya da ortaya çıkarmak için bir şekli (ya da şekilleri) kullanır - tıpkı evinizdeki küçük bir pencere aracılığıyla dışarıdan bakmak gibi. Pencere boyutu, içerideyken görebileceğiniz şeyi sınırlar. Flash, özel bir katman özelliklerine sahiptir ...

Flash CS5 3D Rotasyon Aletinin Kullanımı - mankenler

Flash CS5 3D Rotasyon Aletinin Kullanımı - mankenler

Adobe'nin kapsamlı çizim ve animasyon yetenekleri Flash Creative Suite 5, Flash'ın 3D Döndürme aracıyla büyük ölçüde geliştirilebilir. 3B Döndürme aracı, sembolü x, y ve z eksenleri etrafında döndürmek ve dönüştürmek için herhangi bir film klibi örneğinde kullanılabilir. Bir film klibi örneğini 3D olarak oluşturmak için bunları izleyin ...

Flash CS5 3D Çeviri Aletini Kullanma - aumlalar

Flash CS5 3D Çeviri Aletini Kullanma - aumlalar

In 3D Döndürme aracının aksine Flash CS5 film kliplerini bir eksen etrafında döndüren Adobe Flash Creative Suite 5, 3D Çeviri aracı, bir film klibini algılanan mesafeyi ve sahnedeki diğer nesnelere göre derinliğini değiştirmek için belirli bir eksende kaydırır. Bu kavramı üçlü düşünün ...

Editörün Seçimi

Pratik İlköğretim Sınavı-Grafik Çözümleri - mankenler

Pratik İlköğretim Sınavı-Grafik Çözümleri - mankenler

Praxis İlköğretim sınavının Matematik bölümü bir dizi çizgide bir eşitsizliğe çözüm bulmanızı gerektiren bir soru. Başlamak için, çözümdeki sayıya bir nokta koyarsınız. Sembolü> veya

Pratik İlk Öğretim Sınavı-Ölüm Şekilleri - mankenler

Pratik İlk Öğretim Sınavı-Ölüm Şekilleri - mankenler

Praxis İlköğretim Matematik ve Bilim bölümleri Eğitim sınavı, farklı ölçme şekillerine aşina olmanız gereken sorular içerir. Ölçümler, çeşitli tiplerde tanımlanabilir. Mesafe için İngilizce sistem birimleri inç, feet, metre ve mil içerir. Bunlar birbirine dayanır. Bir ayak 12 ...

Pratik İlk Öğretim Sınavı-Akıcılık - mankenler

Pratik İlk Öğretim Sınavı-Akıcılık - mankenler

Praxis İlköğretim sınavı, yardımcı stratejilerinizi test eden sorular içerir öğrenciler akıcılıklarını İngilizce olarak geliştirirler. Bu stratejiler, grafik düzenleyicileri kullanarak ve çıkarımlar yapmayı içerebilir. Akıcı bir okuyucu, sınıf düzeyinde bir metni doğruluk, çabukluk ve ifade ile okuyabilir.