Video: BÖLÜM 4 - MUHASEBE EĞİTİMİNDE BIG DATA KULLANIMI 2024
Büyük veri girişimi için yapılandırılmamış verileri analiz etmek için çok sayıda yöntem vardır. Tarihsel olarak, bu teknikler, Doğal Dil İşleme (NLP), bilgi keşfi, veri madenciliği, bilgi alımı ve istatistikler gibi teknik alanlardan çıktı. Metin analitiği , yapılandırılmamış metni analiz etme, ilgili bilgileri çıkarma ve daha sonra çeşitli yollardan yararlanıla - bilir yapılı bilgiye dönüştürme sürecidir.
Analiz ve çıkarma süreçleri, sayısal dilbilim, istatistik ve diğer bilgisayar bilimleri disiplinlerinden kaynaklanan tekniklerden yararlanır.
Bazen bir örnek karmaşık bir konuyu açıklamaya yardımcı olabilir. Bir telsiz telefon şirketindeki pazarlama departmanı için çalıştığınızı varsayalım. Plan A ve Plan B'yi iki yeni arama planı başlattınız ve plan A'da almak istediğiniz tutumu almadınız. Çağrı merkezi notlarından yapılandırılmamış metne, bunun neden olduğu konusunda size bazı bilgiler verebiliriz.
Altı çizili kelimeler, Plan A'nın neden hızlı bir şekilde benimsenmesini sağlamadığını anlamanıza ihtiyaç duyabileceğiniz bilgileri sağlar. Örneğin, plan A öğesi, raporların plandan bahsettiğini belirten çağrı merkezi notları boyunca görünür.
devreden çıkarma dakikaları, 4GB veri, veri planı, ve pahalı terimleri, devreden çıkarma dakikaları, veri planı ve fiyat ile ilgili bir sorunun varlığının kanıtıdır. saçma ve aptal gibi sözcükler, bu durumda negatif olan arayanın duygularını anlar.
Metin analitiği süreci, cümle yapısını anlama, yapılandırılmamış metni analiz etme ve daha sonra bilgi çıkarma ve bu bilgiyi yapılandırılmış veriye dönüştürme gibi çeşitli algoritmaları kullanır. Yapılandırılmamış metinden çıkarılan yapılandırılmış veriler Tablo 13-1'de gösterilmektedir.
Tanımlayıcı | Varlık | Sayı | Duyarlılık |
---|---|---|---|
Seri XYZ | Plan A | Devam süresi | Boş |
Müşteriniz ABC | Plan A | Devam süresi | Olumsuz |
XXXX | Plan A | Pahalı | Nötr |
XXXX | Plan A | Veri planı | Nötr |
Kat Mülkiyeti XYT > Plan A | Veri planı | Olumsuz | Buna bakıp "Ama çağrı merkezi kayıtlarına bakarak bunu anlayabilirdim" diyebilirsiniz. "Ancak, bunlar, binlerce çağrı merkezi temsilcisinin kaydettiği bilgilerin küçük bir alt kümesidir. Her bir acente, şirket tarafından sunulan her bir planın soruyla ilgili geniş bir eğilimi algılayamaz. |
Ajanlar, Plan A hakkında benzer sayıda görüşme yapabilecek diğer tüm çağrı merkezi temsilcileri arasında bu bilgiyi paylaşma zamanı veya gereksinimi yoktur. Ancak, bu bilgiler toplama ve metin analizi algoritmaları kullanılarak işlendikten sonra, bir trend bu yapılandırılmamış verilerden çıkabilir. Metin analitiklerini bu kadar güçlü yapan şey de budur.
Arama, son kullanıcıların aradıklarını zaten bildiklerine dayanarak bir belge almakla ilgilidir. Metin analizi, bilgiyi keşfetmekle ilgilidir. Metin analitiği arama ile farklılık gösterirken arama tekniklerine yardımcı olabilir. Örneğin, metin analitiği arama ile birleştirildiğinde belgelerin daha iyi sınıflandırılması veya sınıflandırılması ve özetlerin veya belgelerin özetlerinin üretilmesi için kullanılabilir.
Dört teknoloji vardır: sorgu, veri madenciliği, arama ve metin analizi. Tablonun sol tarafında sorgu ve arama, ki bu da alma ile ilgilidir. Örneğin, bir son kullanıcı kaç müşterinin şirketin hizmetlerini son bir ay içinde kullanmayı bıraktığını bulmak için bir veritabanına sorabilir.
Sorgu, tek bir sayı döndürür. Ancak son kullanıcı, neden daha fazla ve farklı sorgular sorarak, müşterilerin neden ayrıldığını belirlemek için gerekli bilgileri elde eder. Aynı şekilde, anahtar kelime arama son kullanıcının bir şirketin rakiplerinin adlarını içeren belgeleri bulmasını sağlar. Arama, bir grup belge iade ederdi. Sadece belgeleri okuyarak son kullanıcı herhangi bir ilgili cevap bulabilir.
Alma
Analiz | Yapısal | |
---|---|---|
Sorgu: Verileri döndür | Veri madenciliği: Yapısal veriden anlama | Yapılandırılmamış |
Ara: Döndüren belgeler | Metin analitiği: Metinden anlayış < Solda yer alan teknolojiler, bilgi parçalarını döndürür ve bu bilgileri sentezlemek ve analiz etmek için insan etkileşimi gerektirir. Sağdaki teknolojiler (veri madenciliği ve metin analizi), içgörü çok daha hızlı bir şekilde iletir. Metin analizinin organizasyonunuza olan değeri açıkça belli oluyor. |