Video: Learn Python - Full Course for Beginners [Tutorial] 2024
Bu şekil, verilerin bir veri ambarına dahil edilmek üzere üç farklı veri kaynağından çıkarıldığı ve üç kaynağın her biri farklı bir platformda olan bir ortamı göstermektedir. Orta katman sürecinin bir noktasında, bu KG'nin alıntıları bir araya getirilmiş bir haritalama ve dönüşüm süreci için bir araya getirilmelidir.
Eşleme ve dönüşüm hizmeti klasik veri ambarı sorunlarını ele alır. Bir veri kaynağının beş karakter müşteri kimliğini kullanarak müşterileri depoladığını ve başka bir kaynak altı basamaklı bir sayısal müşteri tanımlayıcı kullandığını varsayalım.
Karşılaştırmalar ve diğer veri ambarı işlemlerini gerçekleştirmek için ortak bir müşteri tanımlama yöntemine ihtiyacınız vardır: Tanımlama şemalardan biri, ortamın özelliklerine bağlı olarak diğerine veya belki de üçüncü bir nötr tanımlama sistemine dönüştürülmelidir.
Sistemler arası uyumsuzlukları işleme ek olarak, ek dönüştürmeler şunları içerebilir:
-
Veri özeti: Bir özet, süreçler arası, sistem arası harekete geçmeden önce Belirli veri ambarı ortamınızın özelliklerini.
-
Verilerin seçici eklenmesi: Örneğin, yalnızca bir veri kaynağından gelen kayıtları ekleyebilirsiniz, örneğin, başka bir ayıptan karşılaştırılabilir bir kayıt alırsanız. Tüm veri kaynağının katkılarını bir araya getirinceye kadar, seçici dahil etme kurallarının nasıl uygulantığını bilmiyorsunuzdur.
-
Veri yakınsaklığı: Bir veri kaynağındaki bazı öğeler, her bir müşteri, ürün, sözleşme veya ilgilendiğiniz her tür veri için birleşik bir kayıt oluşturmak için başka bir kaynaktaki öğelerle birleştirilir ile.
Haritalama ve dönüşüm hizmetiyle ilgili hatırlamanız gereken ana nokta, sonuçta, birkaç adım daha tamamlar girmez veri ambarı içine yüklenmeye hazır bir veri setine sahip olmanızdır.
Karmaşık veri ambarı ortamlarında, birden çok dönüştürme işlemi düşünebilirsiniz. Örneğin, bu şekilde gösterildiği gibi, veri özleri ara katman boru hattına daha da ilerlemeden önce birkaç farklı dönüşüm seviyesinde birleşiyor ve akışın başında birden fazla sunucu kullanarak dönüşüm sürecine daha fazla beygir gücü uygulayabilmenizi sağlıyor.