İçindekiler:
- Akıllıca anahtar kelime tabanlı arama nasıl kullanılır? analitiği
- Tahmini analitikte semantik tabanlı aramalar nasıl kullanılır
Video: Top 25 Excel 2016 Tips and Tricks 2024
Kullanmak için Tahmini analitik verilerinizde, bulmak istediğiniz bilgileri nasıl bulacağınızı bilmeniz gerekir. Tahmini analitikte kullanmak için hazırlık aşamasında verilerinizi aramanın iki ana konsepti vardır:
-
Temel anahtar kelime aramasının ötesine geçmeye hazırlanma
-
Verilerinizi anlamsal olarak aranabilir hale getirme
Akıllıca anahtar kelime tabanlı arama nasıl kullanılır? analitiği
Büyük miktarda veri arama göreviniz varsa düşünün. Soruna yaklaşımın bir yolu, açıkçası sözcüklerden oluşan bir arama sorgusu vermektir. Arama aracı, veritabanındaki eşleşen kelimeleri, veri ambarını arar veya verilerinizin bulunduğu herhangi bir metinde dolaşmaya başlar.
Şu arama sorgusunu yayınladığınızı varsayın: Amerika Birleşik Devletleri Başkanı, Afrika'yı ziyaret etti. Arama sonuçları, Başkan, Birleşik Devletler, ziyaretler, Afrika kelimelerinin tam bir veya bir kombinasyonunu içeren bir metinden oluşacaktır. Aradığınız bilgileri tam olarak alabilirsiniz, ancak her zaman değil.
Daha önce bahsedilen kelimeleri içermeyen ancak aşağıdakilerin bazı kombinasyonlarını içermeyen belgelere ne dersin: Obama'nın Kenya gezisi .
Başlangıçta aradığınız kelimelerin hiçbiri - orada değil - ancak arama sonuçları semantik olarak (anlamlı) olarak yararlıdır. Verilerinizi semantik olarak geri getirilebilecek şekilde nasıl hazırlayabilirsiniz? Geleneksel anahtar kelime araştırmasının ötesine nasıl geçebilirsin? Okumaya devam ederseniz cevaplarınız bulunabilir.
Tahmini analitikte semantik tabanlı aramalar nasıl kullanılır
Anlamlı tabanlı araştırmaların nasıl çalıştığının bir örneği, Anasse Bari'nin öncelikli görevi olan uluslararası bir organizasyon olan Dünya Bankası Grubu'na yönlendirdiği bir projedir Dünyadaki yoksullukla mücadele etmek.
Proje, pazardaki mevcut büyük ölçekli kurumsal arama ve analitik araştırmayı ve Dünya Bankası verilerini organize edecek en yeni çerçeve için bir prototip oluşturmayı amaçladı - bunların çoğu yapılandırılmamış belgeler, yayınlar, proje raporları topluluğu idi, kısa bildirimler ve vaka analizleri.
Bu muazzam değerli bilgi, Banka'nın dünya yoksulluğunu azaltma konusundaki temel misyonu doğrultusunda kullanılan bir kaynaktır. Ancak yapılandırılmamış olması, erişmesi, yakalama, paylaşma, anlama, arama, veri madenciliği ve görselleştirmeyi zorlaştırıyor.
Dünya Bankası, dünyanın çeşitli bölgeleri ile muazzam bir organizasyondur. Ana birimlerden biri, bir çerçeve oluşturmak için çabalıyordu ve Bari ekibine Dünya Bankası içindeki İnsani Gelişme Ağı'na yardım etmek için kaynak tahsis etmeye hazırdı.
İnsani Gelişme Ağı Başkan Yardımcısı, belirsizlikten kaynaklanan bir sorunun altını çizdi: Bölünmesi, aynı genel anlamı ancak farklı nüansları olan birkaç terim ve kavram kullandı.
Örneğin, iklim değişimi, iklim değişikliği, gaz ozon tüketimi, ve sera emisyonları gibi terimler, tümüyle semantik olarak ilişkiliydi, ancak anlam bakımından aynı değillerdi. Birisi bu terimlerin herhangi birini aradığında ilgili kavramları içeren belgeleri çıkaracak kadar akıllı bir arama yeteneği istiyordu.
Bari ekibinin seçtiği bu kabiliyete ilişkin prototip çerçevesi, yazılım tabanlı bir çözüm olan Unstructured Information Management Architecture (UIMA) idi. Başlangıçta IBM Research tarafından tasarlanan UIMA, IBM Optimizasyonu'nu kazanan ünlü bilgisayar olan IBM Watson'tan güç alan araçlar olan IBM Content Analytics gibi IBM yazılımında mevcuttur.
Bari ekibi, IBM Content Management ve Enterprise Search'ten çok yetenekli bir ekiple ve daha sonra bir IBM Watson ekibi ile bu projede ortak çalışmak için güçlerini birleştirdi.
Bir Yapılandırılmamış Bilgi Yönetimi (UIM) çözümü, ilgili bilgileri keşfetmek, organize etmek ve sunmak için çok miktarda yapılandırılmamış bilgiyi (metin, ses, video, resim vb.) Analiz eden bir yazılım sistemidir. istemci veya uygulama son kullanıcısı.
Bir alanın ontolojisi , bir alana özgü bir dizi konsept ve ilgili terimdir. UIMA tabanlı bir çözüm, veri formatından (metin, konuşma, PowerPoint sunumu, e-posta, video vb.) Bağımsız olarak zenginleştirilmiş aramaya izin veren semantik etiketleme sağlamak için ontolojileri kullanır. UIMA, yakalanan verilere başka bir katman ekler ve sonra yapılandırılabilir ve semantik olarak aranabilen verileri tanımlamak için meta veriler ekler.
Semantik arama , UIMA'nın oluşturduğu aranabilir veri alanında görünen arama terimlerinin bağlamsal anlamlarına dayanır. Semantik arama, olağan anahtar kelime tabanlı aramadan daha doğrudur; çünkü bir kullanıcı sorgusu, yalnızca arama terimlerini içeren dokümanları değil aynı zamanda semantik olarak sorgu ile alakalı olan dokümanların arama sonuçlarını döndürür.
Afrika'da biyoçeşitlilik arıyor tipik (anahtar kelime tabanlı) arama, biyoçeşitlilik ve Afrika kelimeleri olan dokümanları döndürür.. Bir UIMA tabanlı semantik arama, yalnızca bu iki kelimeyi içeren belgeleri değil, aynı zamanda "Afrika'da biyolojik çeşitlilik" ile ilgili sözcük kombinasyonlarını içeren "Afrika'daki bitki kaynakları," "hayvan kaynaklarını Fas "ya da" Zimbabve'de genetik kaynaklar. "
Semantik etiketleme ve ontolojilerin kullanılması sayesinde bilgi, bilginin oluşturulduğu dilden veya ortadan bağımsız olarak (Word, PowerPoint, e-posta, video vb.) Semantik olarak alınabilir. Bu çözüm, verilerin yakalanması, organize edilmesi, değiştirilmesi ve semantik olarak geri alınabilmesi için tek bir merkez sağlar.
Eşanlamlı sözlükler ve ilgili terimler açık kaynaktır (serbestçe bulunur) - veya alan adınıza veya verilerinize özgü kendi sözlüklerinizi geliştirebilirsiniz. Kök kelimeyle ve buna karşılık gelen ilgili kelimeleri, eş anlamlı kelimeleri ve daha geniş terimleri içeren bir elektronik tablo oluşturabilirsiniz. Elektronik tablo, kurumsal arama ve içerik analizini güçlendirmek için IBM Content Analytics (ICA) gibi bir arama aracına yüklenebilir.