Ev Kişisel Finans Hadoop'un MapReduce Uygulama Akışı Haritası Fazını

Hadoop'un MapReduce Uygulama Akışı Haritası Fazını

Video: hadoop yarn architecture 2024

Video: hadoop yarn architecture 2024
Anonim

Bir MapReduce uygulaması bölü girişindeki verileri kayıt başına kayıt esasına göre işler ve her kaydın MapReduce tarafından bir anahtar / değer olduğu anlaşılır çifti. Giriş bölmeleri hesaplandıktan sonra, eşleme görevleri onları işleyişine başlayabilir - yani, Kaynak Yöneticisinin planlama tesisi onlara işleme kaynaklarını atadıktan hemen sonra. (Hadoop 1'de JobTracker, eşleyici görevlerini belirli işleme alanlarına atar.)

Eşleme görevinin kendisi, bir defada bir girdi ayrımını işler - şekilte, bu yalnız kayıt anahtar / değer çifti ile temsil edilir. Uçuş verilerimizde, giriş bölmeleri hesaplandığında (metin dosyaları için varsayılan dosya işleme yöntemi kullanılarak) metin dosyasındaki her satırın tek bir kayıt olduğu varsayılır.

Her kaydın satırın metni değeri temsil eder ve her satırın bölünmesinin başlangıcından itibaren bayt uzaklığı anahtarı kabul eder.

Neden bayt ofset yerine satır numarasının kullanılmadığını merak ediyor olabilirsiniz. Çok büyük bir metin dosyasının birçok veri bloğuna ayrıldığını ve çok sayıda bölme olarak işlendiğini düşündüğünüzde satır numarası riskli bir kavramdır.

Her bölüntüye ait satır sayısı değişkendir, bu nedenle işlenmekte olan satırdan önceki satır sayısını hesaplamak mümkün değildir. Bununla birlikte, bayt ofseti ile hassas olabilirsiniz, çünkü her bloğun sabit sayıda baytları vardır.

Eşleme görevi, her kaydı işlerken yeni bir anahtar / değer çifti üretir: Burada anahtar ve değer girdi çifti ile tamamen farklı olabilir. Eşleme görevinin çıktısı tüm bu anahtar / değer çiftlerinin tam koleksiyonudur.

Her harita görevinin son çıktı dosyası yazılmadan önce çıktı, tuşa dayalı olarak bölümlendirilir ve sıralanır. Bu bölümleme, her bir tuş için tüm değerlerin birlikte gruplandırılmış olması demektir.

Oldukça basit bir örnek uygulama söz konusu olduğunda yalnızca tek bir azaltıcı var, bu nedenle eşleme görevinin tüm çıktıları tek bir dosyaya yazılır. Fakat çoklu redüktörlü durumlarda, her haritalama görevinde birden çok çıktı dosyası da üretilebilir.

Bu çıkış dosyalarının dökümü bölümleme anahtarına dayanır. Örneğin, eşleme görevleri için yalnızca üç farklı bölme tuşu çıktısı varsa ve iş için üç redüktör yapılandırdıysanız, üç haritalayıcı çıktı dosyası olacaktır. Bu örnekte, belirli bir eşleme görevi bir girdi bölme işlemini gerçekleştirir ve ç anahtardan ikisini üretirse, yalnızca iki çıktı dosyası olacaktır.

Her zaman eşleme görevlerinin çıktı dosyalarını sıkıştırın. Daha küçük çıktı dosyalarının yazılması, mapper çıktısını, redüktörlerin çalıştığı düğümlere transfer etmenin kaçınılmaz maliyetini en aza indirgediğinden burada en büyük fayda performans kazanımlarıdır.

Varsayılan bölücü çoğu durumda yeterli değildir, ancak bazen verilerin redüktörler tarafından işlenmeden önce nasıl bölündüğünü özelleştirmek isteyebilirsiniz. Örneğin, sonuç kümelerindeki verilerin anahtara ve değerlerine göre sıralanmasını isteyebilirsiniz - ikincil türü.

Bunu yapmak için, varsayılan ayırıcıyı geçersiz kılabilir ve kendi ayırıcıyı uygulayabilirsiniz. Bununla birlikte, bu işlem biraz dikkat gerektirir; çünkü her bölümdeki kayıtların sayısının tekdüze olmasını sağlamak istersiniz. (Bir redüktör diğer redüktörlerden çok daha fazla veri işlemek zorunda kalırsa, tek işleve bağlı redüktör orantısız olarak büyük veri kümesi üzerinden kaymaya başlarken MapReduce işinizin bitmesini bekleyeceksiniz.)

Düzgün boyutlu ara dosyalar kullanarak, MapReduce işlemesinde mevcut olan paralellikten daha iyi yararlanabilir.

Hadoop'un MapReduce Uygulama Akışı Haritası Fazını

Editörün Seçimi

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Fotoğraf bir sanat biçimidir. İyi fotoğrafçılar, insanların bakmak isteyeceği çekici bir fotoğraf oluşturmak için kompozisyon kurallarını kullanırlar. Resminizi nasıl görselleştireceğinizi, çerçevede olanı düzenleyebileceğinizi ve ardından ilginç bir fotoğraf oluşturmak için kompozisyon kurallarını nasıl kullanacağınız. Doğal çerçeveleri kullanma Doğal çerçeveleri çizmek için kullanabilirsiniz ...

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital fotoğraf makineniz size yol göstermez panoramik bir fotoğraf çekmek için. Ancak, kesintisiz bir panoramik çekim oluşturmak için çakışan birkaç resim çekebilir ve onları birbirine dikebilirsiniz. Fotoğraf panoramasını oluşturmak için işinize bakalım:

Ham Dosyaları dönüştürme - mankenler

Ham Dosyaları dönüştürme - mankenler

Birçok dijital fotoğraf makinesi, görüntüleri Camera Raw dosya biçiminde veya sadece Ham olarak yakalayabilir. Bu format, JPEG formatında çekim yaparken oluşan olağan post-processing'leri uygulamadan herhangi bir görüntü sensöründen elde edilen ham görüntü verilerini depolar. Ham formatta çekim, bir takım avantajlar sunar. Fakat olumsuz ...

Editörün Seçimi

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Sabahınıza enerji artışı sağlayan krep düşünün endişesizsiniz. Bu tarif, bir sabah herkesin sevebileceği bir Karbonhidrat Diyeti (SCD) versiyonudur.

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

Bu aperitif, pumpernickel ekmeği konusunda harika, fakat ayrıca buğdaydan kaçınırsanız, filizlenmiş ekmeği denemek istersiniz. Sardalya, iyi bir kalsiyum ve D vitamini kaynağı olduğu kadar, iltihap düzeylerini azaltmaya yardımcı olduğu bilinen omega-3 yağ asitleri. Kredi: © Digiphoto, 2006 Caroline Nation bunu geliştirdi ...

Editörün Seçimi

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB'da göreceğiniz alt testlerden bir tanesi Kelime Bilgi testi. Test gününde soruların ve biçimin neye benzeyeceği hakkında bir fikir edinmek için aşağıdaki soruları inceleyin. Örnek sorular Kelime Bilgi Zamanı: 35 soru için 11 dakika Talimatlar: Kelime Bilgisi alt testi üçüncü alt testtir ...

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

Kelime Bilgisi ASVAB üzerinde alt test, bu tür soru, bir kelimeyi pasaj bağlamında kullanılan şekilde tanımlamanızı gerektirir. Sorunun doğru tanımı, sözcüğün en yaygın anlamı olabilir veya daha az bilinen bir anlam olabilir ...

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sayı problemleri ASVAB üzerinde bulacağınız sayı problemleri oldukça basittir. Sorular, sayıları temel ekleme, çıkarma, çarpma veya bölme ile değiştirmenizi ister. Çoğu kişi bu tür kelime problemlerini oldukça kolay buluyor. Birkaç tane denemek ister misiniz, sadece ayağınızı ıslatmak için mi? Elbette. Jesse ...