Video: 1.3. R Project Dışarıdan Veri Yükleme (CSV dosyaları) 2024
Büyük verilerin grafik veritabanları için temel yapısı "düğüm ilişkisi" olarak adlandırılır. "Bu yapı, birbirine bağlı çok miktarda veri ile uğraşmanız gerektiğinde en kullanışlıdır. Düğümler ve ilişkiler, verilerin depolandığı bir anahtar / değer çifti özelliklerini , destekler.
Bu veritabanları ilişkileri izleyerek gezinir. RDBMS'lerde (ilişkisel veri tabanı yönetim sistemleri) bu tür depolama ve gezinme, katı tablolama yapıları ve bizi nereye götürseler de veri arasında bağlantı izlenememesi nedeniyle mümkün değildir. Bir grafik veritabanı, petrol arama için coğrafi verileri yönetmek veya bir telekomünikasyon sağlayıcının ağlarını modellemek ve optimize etmek için kullanılabilir.
En yaygın kullanılan grafik veritabanlarından biri Neo4J'dir. GNU genel lisansı v3 kapsamında lisanslanan açık kaynaklı bir projedir. 0. Desteklenen, ticari bir sürüm, Neo Technology tarafından GNU AGPL v3 kapsamında sağlanmıştır. 0 ve ticari lisans.
Neo4J, kümelenme yoluyla yüksek kullanılabilirlik sağlayan bir ACID işlem veritabanıdır. Düğüm-ilişki özelliklerinin temel yapısı ve doğal olarak kendi insan ilişkilerimize nasıl eşlendiğinden dolayı modellenmesi kolay güvenilir ve ölçeklenebilir bir veritabanıdır. Bir şemaya ihtiyaç duymaz, aynı zamanda veri yazmaya da ihtiyaç duymaz, bu nedenle doğası gereği çok esnektir.
Bu esneklikle birkaç sınırlama getiriyor. Düğümler doğrudan kendilerini referans alamaz. Örneğin, (bir düğüm olarak) kendi babanız veya anneniz (ilişkiler olarak) olamaz, ancak a babalık veya anne olabilirsiniz. Kendine referans gerektiren gerçek dünya vakaları olabilir.
Öyleyse, kendi kendine referans kuralları kesinlikle zorunlu olduğu için bir grafik veritabanı en iyi çözüm değildir. Çoğaltma kabiliyeti çok iyi olsa da, Neo4J yalnızca grafikleri çoğaltabilir ve grafiğin genel boyutuna (yaklaşık 34 milyar düğüm ve 34 milyar ilişki) sınır koyabilir.
Diğer veritabanları ile entegrasyon:-
Neo4J, veri saklama alanlarını işaretlemeyle kesintisiz birlikte çalışabilirlik sağlamak için geri alma ile işlem yönetimini destekler. Senkronizasyon hizmetleri:
-
Neo4J, etkinlik veriyolu üzerinden olaya dayalı davranışları, kendini kullanan periyodik senkronizasyonu veya ana sunucu olarak bir RDBMS'yi ve geleneksel toplu senkronizasyonu destekler. Esneklik:
-
Neo4J, soğuk (yani, veritabanı çalışmadığında) ve sıcak (çalışırken) yedeklemelerin yanı sıra yüksek kullanılabilirlikli bir kümeleme modunu desteklemektedir.Standart uyarılar, mevcut operasyon yönetimi sistemleriyle entegrasyon için mevcuttur. Sorgu dili:
-
Neo4J, özellikle grafikleri ve bileşenlerini sorgulamak için tasarlanmış Cypher adlı bir bildirimsel dili destekler. Cypher komutları gevşekçe SQL sözdizimine dayanır ve grafik verisinin geçici sorguları hedeflenir. Neo4J uygulamaları,
Sosyal ağlar için en uygun Biyolojik veya tıbbi alanların sınıflandırılması
-
Dinamik veya pratik ilgi toplulukları oluşturma