Video: QUÉ ES HADOOP 2024
Bu komik isimle tam olarak ne - Hadoop?) Temelinde, Hadoop, büyük kümeler üzerinde veri depolamak için bir çerçeve < küme , birbirine bağlı bilgisayarlardan oluşan bir gruptur ( düğümler olarak bilinir) küme donanım - ekonomik ve kolay erişilebilir gündelik bilgisayar donanımı - aynı problem üzerinde birlikte çalışabilir.
Ekonomi bilgisini kazanmak için uygun maliyetli hesaplama ağlarının kullanılması, Hadoop'un anahtar değer teklifidir.
Bu isim gelince, Hadoop, burada büyük bir önem arayın, Doug Cutting'in oğlu tarafından doldurulmuş filine verilen isim sadece. (Doug Cutting, elbette Hadoop'un ortak yaratıcısıdır.) Adı benzersiz ve hatırlanması kolay -
Hadoop iki ana bileşenden oluşur: dağınık bir işleme çerçevesi (artık YARN adlı bir bileşen tarafından desteklenmektedir) ve Hadoop dağıtılmış dosya sistemi veya HDFS olarak bilinen bir dağıtılmış dosya sistemi.
Hadoop'ta çalışan bir uygulama çalışmalarını kümedeki düğümler (makineler) arasında bölünmüş halde alır ve HDFS işlenecek verileri depolar. Bir Hadoop kümesi, HDFS'nin veriyi depoladığı binlerce makineyi ve MapReduce işleri, verilerin yakınında işlem yaparak g / Ç maliyetlerini düşük tutabilir. MapReduce son derece esnektir ve çok çeşitli uygulamaların geliştirilmesini sağlar.
Tahmin edebileceğiniz gibi, bir Hadoop kümesi, esasen hesaplama amacıyla kullanılan bir tür küme olan hesaplama kümesinin, formudur. Bir hesaplama kümesinde, birçok bilgisayar ( hesaplama düğümleri ) hesaplama iş yüklerini paylaşabilir ve küme boyunca çok geniş bir toplam bant genişliğinden faydalanabilir.
Hadoop kümeleri, tipik olarak, Hadoop'taki depolama ve işleme sistemlerini kontrol eden birkaç ana düğüm, ve tüm küme verilerini depolayan birçok bağımlı düğüm, veriler işlenir.