Ev Kişisel Finans Tablolar ile Kovan - Dummies <[SET:descriptiontr]Birleştiren

Tablolar ile Kovan - Dummies <[SET:descriptiontr]Birleştiren

Video: Python Tutorial for Beginners [Full Course] Learn Python for Web Development 2024

Video: Python Tutorial for Beginners [Full Course] Learn Python for Web Development 2024
Anonim

Muhtemelen, ilişkisel veritabanı modelleme ve tasarımındaki uzmanların çoğu zaman normalleştirilmiş veritabanlarını tasarlamak için zaman harcamaktadır veya şemalar <. Veritabanı normalleştirme , veri güncellenirken ve alınırken veri kaybına, fazlalık ve diğer anormalliklere karşı koruma sağlayan bir tekniktir. Uzmanlar, normalleştirilmiş bir veritabanına ulaşmak için bir takım kuralları takip eder, ancak Kural 1, tabloların bir

grubu ile sonuçlanması gerektiğidir. (Tüm verilerinizi depolayan büyük bir tablo normal değildir - pun tasarlanmıştır.) Kullanım durumuna bağlı olarak istisnalar vardır, ancak birçok tablo yasası genellikle, özellikle işlemler veya analitik işleme destekleyen veritabanları için (iş zekası, Örneğin).

Verilerinizi sorgulamaya ve analiz etmeye başladığınızda, tablolar SQL ile tanımlanmış ilişkilere dayanarak birleştirilir - bu, tablolara katılmaya başladığınızda disklerin sunucunuzda eninde sonunda meşgul olduğu anlamına gelir; yoğun diskler genellikle kullanıcı yanıt sürelerinin yavaşlamasına neden olur. Bununla birlikte, iyi haber, RDBMS'lerin ve EDW'lerin, mümkün olduğunca hızlı bir şekilde katılmaları için ayarlanmış olmasıdır.

Bunun, Kovan'daki katillerle ne ilgisi var? Apache Hadoop: MapReduce tabloya katılmanın motorudur ve Hadoop Dosya Sistemi (HDFS) altta yatan saklama alanıdır. Hive ile büyük tablolar oluşturmak, yönetmek ve analiz etmek isteyen kullanıcı için iyi bir haber.

Büyük veri yapılarında saklı olan bilgilerin kilidini açma potansiyeli heyecan vericidir. Bununla birlikte, Hive ile yapılan katılımlar genellikle RDBMS / EDW dünyasında yaptıkları gibi performans göstermez, bu nedenle ilk kez kullanıcılar sistem yanıtının "pokiness" den şaşırırlar.

MapReduce ve HDFS, büyük veri analizi ile verim için optimize edildi ve bu dünyada

gecikmeler - kullanıcı yanıt süresi, diğer bir deyimle - genellikle yüksek. Hive, hızlı çevrimiçi işlem işlemleri için değil, parti tarzı analitik işleme için tasarlanmıştır. Apache Hadoop'ta SQL ile mümkün olan en iyi performansı isteyen kullanıcılar çözümler sunmaktadır.

Hive ile tablolara girmeye başlarken bu dinamiği aklınızda tutun. Ayrıca, Kovan mimarların veritabanlarını normalde bir dereceye kadar normalden kaldırdıklarını, dolayısıyla daha az tabloya sahip olmalarının yaygın olduğunu unutmayın. Bu nedenle, STRUCT ve ARRAY gibi karmaşık veri türleri sağlanmaktadır. Bu karmaşık veri türlerini, tek bir tabloda çok daha fazla veri toplamak için kullanabilirsiniz.

HDFS ile okunur ve yazılır, çünkü genellikle HDFS ile çok büyük veri blokları içerdiğinden, bir masada ne kadar çok veri yönetiyorsanız, genel performans o kadar iyi olur.

Disk ve ağ erişimi bellek erişiminden çok daha yavaş, bu nedenle HDFS'nin en aza indirgenmesini mümkün olduğunca okuyor ve yazıyor.

Bu arka plan bilgisi akılda tutulursa, Kovan ile katılıma çabalayabilirsiniz. Neyse ki, Kovan geliştirme topluluğu gerçekçiydi ve kullanıcıların tabloları HiveQL ile birleştirmek istediğini ve bunlara katılmaları gerektiğini anlamıştı. Bu bilgi EDW artırmada özellikle önem kazanmaktadır. "Sorgulanabilir" arşivler gibi kullanım örnekleri genellikle veri analizi için katılır.

İşte, uçuş verileri tablolarını kullanan bir Kovan katılma örneği. Giriş, daha büyük FlightInfo2007 ve FlightInfo2008 tablolarından bir myflightinfo2007 tablosu ve bir myflightinfo2008 tablosu oluşturma ve görüntüleme yöntemini gösterir. Önümüzdeki plan CTAS tarafından oluşturulan myflightinfo2007 ve myflightinfo2008 tablolarını Hive'da nasıl birleştirebildiğimizi göstermek için kullandı.

Şekil, SQuirreL SQL istemcisini kullanarak myflightinfo2007 ve myflightinfo2008 tablolarıyla bir iç birleştirmenin sonucunu göstermektedir.

Hive, yalnızca

eş-birleşimlerini, birleşim yükleminde eşitlik karşılaştırmalarını kullanan belirli bir türde birleşmeyi destekler. (ON m8, FlightNum = m7, FlightNum bir eş-birleştirmenin bir örneğidir.) Less Than (<) gibi diğer karşılaştırıcılar desteklenmez. Bu kısıtlama, yalnızca MapReduce alt yapısı üzerindeki sınırlamalardan ötürüdür. Ayrıca, OR yan tümcesinde OR kullanamazsınız. Şekil, iç birleştirme ve diğer iki Hive birleştirme biçiminin daha önceki örneğini göstermektedir. Myflight2007 ve myflight2008 tablolarının içeriğini gözden geçirerek bir iç birleştirme sonuçlarını doğrulayabileceğini unutmayın.

Aşağıdaki şekil, tekniğe aşina değilseniz iç birleşimin bir Venn diyagramı kullanarak nasıl çalıştığını göstermektedir. Burada temel fikir, bir iç birleştirmenin iki tablo arasında eşleşen kayıtları döndürmesi. Dolayısıyla, iç birleşim, Temmuz 2007'de ve Temmuz 2008'de JFK (New York) ile ORD (Chicago) arasında hangi uçuşların aynı olduğunu belirlemek için mükemmel bir analiz aracıdır.

Kovan katılımlarını optimize etmek, Hive topluluğunda sıcak bir konudur. Geçerli optimizasyon teknikleri hakkında daha fazla bilgi için, Hive wiki'deki Katılma Optimizasyon sayfasına bakın.

Tablolar ile Kovan - Dummies <[SET:descriptiontr]Birleştiren

Editörün Seçimi

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Dijital Fotoğrafınızda Odak Noktası Yaratın - mankenler

Fotoğraf bir sanat biçimidir. İyi fotoğrafçılar, insanların bakmak isteyeceği çekici bir fotoğraf oluşturmak için kompozisyon kurallarını kullanırlar. Resminizi nasıl görselleştireceğinizi, çerçevede olanı düzenleyebileceğinizi ve ardından ilginç bir fotoğraf oluşturmak için kompozisyon kurallarını nasıl kullanacağınız. Doğal çerçeveleri kullanma Doğal çerçeveleri çizmek için kullanabilirsiniz ...

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital Fotoğraf Makinenizi Kullanarak Panoramik Resimler Oluşturma - mankenler

Dijital fotoğraf makineniz size yol göstermez panoramik bir fotoğraf çekmek için. Ancak, kesintisiz bir panoramik çekim oluşturmak için çakışan birkaç resim çekebilir ve onları birbirine dikebilirsiniz. Fotoğraf panoramasını oluşturmak için işinize bakalım:

Ham Dosyaları dönüştürme - mankenler

Ham Dosyaları dönüştürme - mankenler

Birçok dijital fotoğraf makinesi, görüntüleri Camera Raw dosya biçiminde veya sadece Ham olarak yakalayabilir. Bu format, JPEG formatında çekim yaparken oluşan olağan post-processing'leri uygulamadan herhangi bir görüntü sensöründen elde edilen ham görüntü verilerini depolar. Ham formatta çekim, bir takım avantajlar sunar. Fakat olumsuz ...

Editörün Seçimi

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Ile iBS Dostu Tarçın Krepleri Ghee - dummies'le Domuz Dostu Tarçın Krep

Sabahınıza enerji artışı sağlayan krep düşünün endişesizsiniz. Bu tarif, bir sabah herkesin sevebileceği bir Karbonhidrat Diyeti (SCD) versiyonudur.

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

IBS Sufferers için sardalya Yayılmış Tarif - mankenler

Bu aperitif, pumpernickel ekmeği konusunda harika, fakat ayrıca buğdaydan kaçınırsanız, filizlenmiş ekmeği denemek istersiniz. Sardalya, iyi bir kalsiyum ve D vitamini kaynağı olduğu kadar, iltihap düzeylerini azaltmaya yardımcı olduğu bilinen omega-3 yağ asitleri. Kredi: © Digiphoto, 2006 Caroline Nation bunu geliştirdi ...

Editörün Seçimi

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB: Kelime Bilgisi Alt Test Uygulaması - mankenler

ASVAB'da göreceğiniz alt testlerden bir tanesi Kelime Bilgi testi. Test gününde soruların ve biçimin neye benzeyeceği hakkında bir fikir edinmek için aşağıdaki soruları inceleyin. Örnek sorular Kelime Bilgi Zamanı: 35 soru için 11 dakika Talimatlar: Kelime Bilgisi alt testi üçüncü alt testtir ...

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

ASVAB Paragraf Anlama Alt Sınavında Sözlük Sorularını Nasıl Yanıt Vereceksiniz - mankenler

Kelime Bilgisi ASVAB üzerinde alt test, bu tür soru, bir kelimeyi pasaj bağlamında kullanılan şekilde tanımlamanızı gerektirir. Sorunun doğru tanımı, sözcüğün en yaygın anlamı olabilir veya daha az bilinen bir anlam olabilir ...

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sorunlarını Nasıl Yanıtlayalım ASVAB - aumlalar

Sayı problemleri ASVAB üzerinde bulacağınız sayı problemleri oldukça basittir. Sorular, sayıları temel ekleme, çıkarma, çarpma veya bölme ile değiştirmenizi ister. Çoğu kişi bu tür kelime problemlerini oldukça kolay buluyor. Birkaç tane denemek ister misiniz, sadece ayağınızı ıslatmak için mi? Elbette. Jesse ...