Video: HDInsight: Fast Interactive Queries with Hive on LLAP | Azure Friday 2024
HBase, büyük veri projeleri için kalıcılık deposu olarak HDFS'yi kullanan, dağıtılmış, ilişkisiz (sütunlu) bir veritabanıdır. Google BigTable'dan sonra modellenmiş ve çok büyük tablolara (milyarlarca sütun / satır) ev sahipliği yapabiliyor, çünkü Hadoop emtia donanım kümelerinde katmanlı.
HBase, büyük verilere rastgele, gerçek zamanlı okuma / yazma erişimi sağlar. HBase son derece yapılandırılabilir, böylece büyük miktarda veriyi verimli bir şekilde ele alan büyük bir esneklik sağlar. Şimdi HBase'in büyük veri zorluklarınızı nasıl çözebileceğine bir göz atın.
HBase, sütunlu bir veritabanıdır, bu nedenle tüm veriler, ilişkisel veritabanı yönetim sistemlerine (RDBMS) benzer satırlar ve sütunlar içeren tablolarda depolanır. Bir satır ve bir sütunun kesişimi bir hücre olarak adlandırılır. HBase tabloları ve RDBMS tabloları arasındaki önemli farklardan biri de sürümüdür.
Her hücre değeri, bir "sürüm" özniteliği içerir; bu, yalnızca hücreyi benzersiz biçimde tanımlayan bir zaman damgasından başka bir şey değildir. Sürüm oluşturma, hücredeki değişiklikleri izler ve gerekli hale gelmesi durumunda içeriğin herhangi bir sürümünü almak mümkün kılar. HBase, hücrelerin içindeki verileri azalan sırada saklar (zaman damgasını kullanarak), böylece bir okuma daima önce en son değerleri bulur.
HBase'deki sütunlar bir sütun ailesine aittir. Sütun soyadı, ailenin üyelerini tanımlamak için bir önek olarak kullanılır. Örneğin, meyveler: elma ve meyveler: muz, meyve sütun ailesinin üyesidir. HBase uygulamaları sütun ailesi düzeyinde ayarlanmıştır, bu nedenle verilere nasıl erişeceğiniz ve sütunların ne kadar büyük olmasını istediğiniz konusunda dikkatli olunmanız önemlidir.
HBase tablolarındaki satırların kendileriyle ilişkili bir anahtarı vardır. Anahtarın yapısı çok esnektir. Hesaplanmış bir değer, bir dize veya başka bir veri yapısı olabilir. Anahtar satırdaki hücrelere erişimi kontrol etmek için kullanılır ve düşük değerden yüksek değere sırayla saklanır.
Bu özelliklerin hepsi birlikte şemayı oluşturuyor. Şema, herhangi bir veri saklanmadan tanımlanır ve oluşturulur. Buna rağmen, tablolar değiştirilebilir ve veritabanı kurulduktan ve çalıştırıldıktan sonra yeni sütun aileleri eklenebilir. Bu genişletilebilirlik, büyük veri ile uğraşırken son derece yararlıdır çünkü veri akışlarınızın çeşitliliği hakkında her zaman bilgi sahibi olamazsınız.