Video: Hive commands using command line interface 2024
İlk Hive istemcisi, Hive komut satırı arabirimidir (CLI). Hive CLI istemcisinin daha hassas noktalarını anlamak için (biraz meşgul görünümlü) Hive mimarisini gözden geçirmenize yardımcı olabilir.
İkinci şekilde, mimari, yalnızca CLI'yi çalıştırırken gerekli olan bileşenlere odaklanacak şekilde düzenlenmiştir.
Bunlar, bir Hadoop kümesinde CLI çalıştırırken gereken Kovan bileşenleri. Burada, Hive'yi, verileriniz için HDFS yerine yerel depolama birimini kullanan yerel modda çalıştırıyorsunuz.
Hive CLI'yi çalıştırmak için, kovan komutunu çalıştırın ve CLI'yi çalıştırmak istediğiniz hizmet olarak belirleyin. Aşağıdaki listede, ilk HiveQL ifadelerimizin bazılarının yanı sıra gereken komutu görebilirsiniz. (A-B-C modelini kullanarak bir adım açıklamaları, dikkatinizi ana komutlara yönlendirmek için listeye dahil edilmiştir.)
(A) $ $ HIVE_HOME / bin kovanı --service cli (B) kovan> kovanı ayarla. cli. Baskı. Geçerli. db = Gerçek; (C) kovan (varsayılan)> CREATE DATABASE ourfirstdatabase; Tamam Alınan süre: 3. 756 saniye (D) kovan (varsayılan)> İlk veri veritabanımızı kullanın; Tamam Tutma zamanı: 0. 039 saniye (E) kovanı (Ourfirstdatabase)> CREATE TABLE our_first_table (> Soyadı STRING,> Soyadı STRING,> EmployeeId INT); Tamam Alınan süre: 0 043 saniye kovanı (bizim veritabanı)> çıkın; (F) $ ls / home / biadmin / Kovan / depo / Bizimfirstdatabase. db our_first_table
İlk komut (Adım A'ya bakın), $ HIVE_HOME çevre değişkenini kullanarak Hive CLI'yi başlatır. -Service cli komut satırı seçeneği, diğer sunucuları seçmiş olsanız da, Hive sistemini komut satırı arabirimini başlatmaya yönlendirir.
Ardından, Adım B'de Hive CLI'ye, geçerli çalışma veritabanınızı yazdıracağından ad alanında nerede olduğunuzu bilirsiniz. (Bir sonraki komutu nasıl kullanacağınızı açıkladıktan sonra bu ifade mantıklı olacaktır, dolayısıyla sıkı tutun.)
Adım C'de ilk veritabanınızı oluşturmak için HiveQL'in veri tanımlama dili (DDL) kullanın. (Hive'daki veritabanlarının yalnızca belirli tabloların bulunduğu ad alanları olduğunu lütfen unutmayın; bir tablo kümesi bir veritabanı veya şema olarak düşünülebilir, aynı sonucu elde etmek için DAHİL yerine SCHEMA terimini kullanmış olabilirsiniz.).
Daha açık belirtmek gerekirse, sisteme ourfirstdatabase adlı bir veritabanı oluşturmasını söylemek için DDL kullanıyorsunuz ve bu veritabanını Adım D'deki USE komutunu kullanarak sonraki HiveQL DDL komutlarının varsayılanı yapmak için kullanıyorsunuz. Adım E'de, ilk tabloyu açın ve ona (oldukça uygun) bir isim olan our_first_table verin.
(Şimdiye kadar, SQL'e çok benzediğine inanmış olabilirsiniz, belki de hangi RDBMS'ye alıştığınıza bağlı olarak sözdiziminde birkaç küçük farklılık vardır - ve siz de haklıydınız.) Son komut, Adım F, seçtiğiniz Hive depo dizininin bir dizin listesi oluşturur; böylece, our_first_table dosyasının aslında diskte saklandığını görebilirsiniz.
Kovanı ayarladın. metastore. depo. dir değişkeninin, Linux sanal makinenizdeki yerel dizin / home / biadmin / Hive / ambarın üzerine gelmesi gerekir; HDFS, uygun bir Hadoop kümesinde olduğu gibi kullanın.
Bir tablo oluşturduktan sonra, tablonun meta verilerini görüntülemek ilginç. Üretim ortamlarında düzinelerce tablo veya daha fazla olabilir, bu nedenle tablo yapısını zaman zaman gözden geçirebilmeniz yararlı olacaktır. c ve , bunu Hive CLI kullanarak yapmak için bir HiveQL komutunu kullanır, ancak Hive Web Arayüzü (HWI) Sunucusu bu tür işlem için yararlı bir arabirim sağlar.
CLI yerine HWI Sunucusu kullanmak da daha güvenli olabilir. CLI'yi çalıştıran makine, tüm Hadoop kümesine erişmesi gerektiği için, üretim ortamlarında CLI kullanırken dikkatli olunması gerekir.
Bu nedenle sistem yöneticileri, CLI'yi çalıştıran makineye kontrollü ve güvenli erişim sağlamak ve ağ şifreleme sağlamak için genellikle güvenli kabuk (ssh) gibi araçları yerleştirir. Bununla birlikte, HWI Sunucusu çalıştırıldığında, bir kullanıcı kendi web tarayıcısı aracılığıyla HWI Sunucusu tarafından izin verilen Hive verisine erişebilir.