Video: Veri Bilimi Serisi 41 Arama Motorları (Search Engines) 2024
Arama motorlarından ve NoSQL'den bahsetmek garip görünebilir, ancak bugünün arama motorlarının birçoğu NoSQL veritabanlarına çok benzer bir mimari kullanıyor. Endeksleri ve sorgu işleme dağılımı oldukça fazladır. Birçok arama motoru kendi başına bir anahtar-değer veya belge deposu olarak bile çalışabilir.
NoSQL veritabanları, sosyal medya mesajları veya web sayfaları gibi çeşitli yapılarda depolanabilen yapısız verileri, belgeleri veya verileri depolamak için sıklıkla kullanılır. Bu endekslenmiş verilerin yapısı büyük ölçüde değişir.
Ayrıca, belge veritabanları, sistem yöneticilerinin veya geliştiricilerin sık sık yapıların denetimine sahip olmadığı durumlarda uygundur. Bu durum, bir vitrinin birçok yayınevinden yeni kitapların ve meta verilerini aldığı yayıncılıkta sık görülür.
Yayıncılar, belgeler için PDF ve ePub ve meta veriler için ONIX XML dosyaları gibi benzer standartları kullanmasına rağmen, belgeleri biraz farklı şekillerde üretirler. Sonuç olarak, verilerin tutarlı bir şekilde işlenmesi zordur ve yayınlama, bir Belge veritabanı için büyük bir kullanım alanıdır.
Savunma ve istihbarat alanlarında benzer sorunlar ortaya çıkıyor. Bir ajans, müttefiklerden veya bir teröristin sabit diskinden çeşitli formatlarda veri alabilir. Yeni bir hedef türünün ele alınması için gözden geçirilmiş bir ilişkisel veritabanı şeması geliştirmek altı ay beklemek mümkün değildir! Burası dokümanı NoSQL veritabanları kullanılabilir.
Birçok yapıları tek bir veritabanında saklamak, tüm içeriğe standart bir sorgu mekanizması sağlamanın bir yolunu gerekli kılmaktadır. Arama motorları bu amaçla mükemmel. NoSQL Belge veritabanları ile yapılandırılmamış veri yönetiminin anahtar gereksinimini aramayı düşünün.
Arama teknolojisi geleneksel sorgu veritabanı arabirimi teknolojisinden farklıdır. SQL bir arama teknolojisi değildir; Bu bir sorgu dili. Sorgu, Boole tam eşleme mantığıyla (diğer bir deyişle, bir sorgunun tüm sonuçları aynı derecede alakalı) ele alındığında, kusurlu eşlemeler ve alaka skorlaması ile ilgilenmektedir.