Video: Metin Madenciliği (Text Mining) (Veri Bilimcisi Olma Yolunda 38. Video) 2024
İnsanlar soyut verileri görsel hale getirmek için korkunç bir zaman geçiriyor ve bazen makine öğrenme çıktısı son derece soyut hale geliyor. Verilerin nasıl göründüğünü görselleştirebilmeniz için bir grafik çıktı aracı kullanabilirsiniz. Knime ve RapidMiner, yüksek kaliteli grafikleri kolayca üretmenize yardımcı olarak görevinde üstünlük sağlar. Çeşitli veri madenciliği görevleri için bunların kullanımları, bu ürünlerin her ikisini de diğer ürünlerden ayırır.
İlaç endüstrisi, veri akışlarına (boru hatları) dayanarak hem makine öğrenimi hem de veri madenciliği görevlerini yerine getirmek için Knime'a güvenir. Bir GUI kullanımı, Knime'ı görece kolaylaştırır.
Aslında Knime, Java, C / C ++, JavaScript ve PHP gibi pek çok programlama dilini desteklemek için kullanılan Eclipse (bugüne kadarki en popüler GUI'lerden birine güveniyor) eklentiler aracılığıyla). Aynı zamanda hem Weka hem de LIBSVM ile bütünleşir, bu nedenle kullanım kolaylığı işlevsellik kaybına yol açmaz.
RapidMiner, makine öğrenimi, veri madenciliği, metin incelemesi, tahmini analitik ve iş analitiği ihtiyaçları için kullanan iş gereksinimlerini daha fazla karşılar. RapidMiner, diğer pek çok ürünün aksine, sunucunun bulut tabanlı bir SaaS (Software-as-a-Service) seçeneği olarak göründüğü bir istemci / sunucu modeline güveniyor. Bu, bir işletmenin yazılım veya donanım üzerinde büyük bir başlangıç yatırımı yapmadan ortamı test edebileceği anlamına gelir. RapidMiner hem R hem de Python ile çalışır. EBay, Intel, PepsiCo ve Kraft Foods gibi şirketler şu anda çeşitli ihtiyaçlar için RapidMiner kullanmaktadır.
Her iki ürünün ayırt edici bir özelliği, Extract, Transform, Load (ETL) modeline güvenmeleridir. Bu modelde, işlem önce çeşitli kaynaklardan ihtiyaç duyulan tüm verileri ayıklar, bu verileri ortak bir formata dönüştürür ve daha sonra dönüştürülen verileri analiz için bir veritabanına yükler. İşlemin kısa bir özetini buradan bulabilirsiniz.