İçindekiler:
- Büyük veri bütünleştirme lynchpin
- Veri depolarının ekstraksiyon, dönüşüm ve yüklemelerini yeniden düşünün
Video: Büyük Veri ile Yeni Dünya 2024
Veri ambarının ve büyük veri ortamının yeteneklerini bir araya getirmeye değer bulacaksınız. Büyük verilerin veri ambarı ile el ele çalışabilecekleri karma bir ortam oluşturmanız gerekir.
İlk önce, bugün tasarlanan veri ambarının kısa vadede değişmeyeceğini bilmek önemlidir.
Bu nedenle, veri ambarını, yapılması tasarlanan şey için kullanmak daha pratiktir - işin analiz etmek istediği bir konu hakkında gerçeğin iyi kontrol edilmiş bir versiyonunu sunmak. Depo, belirli bir şirketin ürün gamı, müşterileri, tedarikçileri ve bir yıllık değerli işlemler hakkında bilgi içerebilir.
Veri ambarı veya bölüm veri merkezi tarafından yönetilen bilgiler, meta verilerin doğru olması için dikkatli bir şekilde yapılandırılmıştır. Yeni web tabanlı bilgilerin büyümesiyle, bu büyük miktardaki veriyi geçmiş verilerle bağlantılı olarak analiz etmek pratik ve sıklıkla gerekli. Melez modeli buraya getiriyor.
Veri ambarı ile büyük veri ile evlenmenin bazı yönleri nispeten kolay olabilir. Örneğin, büyük veri kaynaklarının birçoğu kendi iyi tasarlanmış meta verilerini içeren kaynaklardan gelmektedir. Karmaşık e-ticaret siteleri, iyi tanımlanmış veri öğelerini içerir. Dolayısıyla, depo ve büyük veri kaynağı arasında analiz yapılırken, bilgi yönetimi organizasyonu, akılcı hale getirilmesi gereken özenle tasarlanmış meta veri modellerine sahip iki veri kümesiyle birlikte çalışmaktadır.
Elbette, bazı durumlarda, bilgi kaynakları açık meta verilere sahip değildir. Bir analist, tarihsel işlem verilerini daha az yapılandırılmış büyük veriyle birleştirmeden önce, işin yapılması gerekir. Tipik olarak, petabayt'lık verilerin ilk analizi, hastanın teşhisine yönelik işteki veya potansiyel çözümlerdeki ustalıklı değişiklikleri tahmin etmeye yardımcı olan ilginç kalıpları ortaya çıkaracaktır.
İlk analiz, MapReduce gibi Hadoop dağıtılmış dosya sistemi çerçevesindeki araçlardan yararlanılarak tamamlanabilir. Bu noktada, ele alınan sorunun değerlendirilmesine yardımcı olup olmadığını anlamaya başlayabilirsiniz.
Analiz sürecinde, gereksiz verileri iş bağlamıyla ilgili verileri tanımlamak için olduğu gibi ortadan kaldırmak kadar önemlidir. Bu aşama tamamlandığında, kalan verilerin meta veri tanımlarının kesin olması için dönüştürülmesi gerekir. Bu şekilde, büyük veriler depodaki geleneksel ve geçmiş verilerle birleştirildiğinde, sonuçlar doğru ve anlamlı olacaktır.
Büyük veri bütünleştirme lynchpin
Bu süreç, iyi tanımlanmış bir veri entegrasyon stratejisi gerektirir. Veri bütünleştirmesi büyük verilerin yönetilmesinde kritik bir unsur iken, veri ambarı ile hibrid bir analiz oluştururken de aynı derecede önemlidir. Aslında, verileri ayıklama ve karma bir çevrede dönüştürme süreci, bu işlemin geleneksel bir veri ambarında nasıl yürütüleceği ile çok benzerdir.
Veri ambarında, veri, CRM veya ERP sistemleri gibi geleneksel kaynak sistemlerinden çıkarılır. Bu çeşitli sistemlerden gelen öğelerin doğru şekilde eşleştirilmesi önemlidir.
Veri depolarının ekstraksiyon, dönüşüm ve yüklemelerini yeniden düşünün
Veri ambarında, genellikle ilişkisel veritabanı tablolarının, düz dosyaların ve ilişkisiz kaynaklardan oluşan bir kombinasyon bulursunuz. İyi yapılandırılmış bir veri ambarının yapısı, sorguların doğru ve tutarlı bir şekilde işlenmesine izin verilerek ortak bir biçimde dönüştürülür. Ayıklanan dosyalar, veri ambarının analiz etmek üzere tasarlandığı konu alanının iş kurallarına ve işlemlerine uyacak şekilde dönüştürülmelidir.
Başka bir deyişle, verilerin büyük veri kaynaklarından çıkarılması gerekir; böylece bu kaynaklar birlikte güvenli bir şekilde çalışabilir ve anlamlı sonuçlar ortaya çıkarabilir. Buna ek olarak, kaynaklar, tarihsel verilerle büyük veri kaynaklarından gelen daha dinamik ve gerçek zamanlı veriler arasındaki ilişkiyi analiz etmede yardımcı olacak şekilde dönüştürülmelidir.
Büyük veri modeline yükleme bilgileri, geleneksel bir veri ambarında beklediğinizden farklı olacak. Veri ambarları ile, veriler yasalaştırıldıktan sonra asla değişmez. Tipik bir veri ambarı, envanter veya satış gibi izleme gerektiren belirli bir ticari meseleyi analiz etme ihtiyacına dayanarak verilerin anlık görüntüsünü sağlayacaktır.
Büyük verilerin dağıtılan yapısı, kuruluşların önce bir veri dizisini düğümlere yükleyip sonra çıkarma ve dönüştürmeyi gerçekleştirmesine yol açacaktır. Geleneksel veri ambarı ve büyük veri ortamından oluşan bir melez oluştururken, büyük veri ortamının dağıtılmış doğası, kuruluşların işletme ile bağlantılı olarak büyük miktardaki verileri analiz etme kabiliyetini önemli ölçüde değiştirebilir.