Video: Hadoop Rack Awareness 2024
Oozie iş akışları, çekirdeklerde, eylemler (Hadoop uygulamaları) ve veri akışı tanımlayabileceğiniz, ancak döngü içermeyen yönlendirilmiş grafiklerdir - yani, t bazı koşullar sağlanıncaya kadar belirli bir işlemi tekrar tekrar çalıştırdığınız bir yapı tanımlar (örneğin for döngüsü).
Oozie iş akışları, koşul temelli kararları ve paralel yürütme için çatallı yolları tanımlayabilmeniz açısından oldukça esnektir. Ayrıca, çok çeşitli eylemleri uygulayabilirsiniz.
Bu şekilde, Oozie iş akışlarının temel özelliklerini gösteren bir iş akışı görüyorsunuz. Önce bir Pig betiği çalıştırılır ve hemen bir karar ağacı gelir. Çıktının durumuna bağlı olarak, kontrol akışı doğrudan bir HDFS (Hadoop Dağıtılmış Dosya Sistemi) dosya işlemine (örneğin bir copyToLocal işlemi) veya bir çatal hareketine gidebilir.
Kontrol akışı fork eylemine geçerse, eşzamanlı olarak iki iş oluşur: MapReduce işi ve bir Hive sorgusu. Böylece, MapReduce işi ve Hive sorgusu tamamlandıktan sonra kontrol akışı HDFS işlemine geçilir. HDFS işlemi sonrasında iş akışı tamamlanmış olur.
Oozie iş akışı tanımları, Hadoop Süreç Tanımlama Dili (hPDL) şemasına dayalı olarak XML ile yazılmıştır. Bu belirli şema, iş süreç tanımlamalarını modellemek için ürüne bağlı bir standart olan XML İşlem Tanımlama Dili (XPDL) şemasına dayanır.
Bir Oozie iş akışı, XML düğümleri tarafından kodlanan bir dizi eylemden oluşur. Farklı türde eylemleri veya kontrol akış yönergelerini temsil eden farklı düğüm türleri vardır. Her Oozie iş akışının, her düğümün ve bağlantılarının tanımlandığı kendi XML dosyası bulunur.
İş akışı düğümlerinin tamamında, iş akışında işlenecek sonraki düğümü tanımlamak için kullanılan benzersiz tanımlayıcılar gereklidir. Bu, eylemlerin yürütülme sırası, bir eylemin düğümünün iş akışı XML'sinde nerede görüneceğine bağlıdır. Bu kavramın nasıl göründüğünü görmek için, bir Oozie iş akışının XML dosyasının temel yapısının bir örneğini gösteren aşağıdaki listeyi inceleyin.
… … "Öldürülen iş".
Bu örnekte, başlangıç, bitiş ve kill düğümleri dışında iki eylem düğümünüz var. Her eylem düğümü, bir uygulamayı veya yürütülmekte olan bir komutu temsil eder.