Video: Big Data (Büyük Veri) Nedir? 2024
Verilen hacim yüzünden dolandırıcılıkların belirlenmesini zorlaştıran işlemler, ironik olarak bu aynı meydan okuma, Hadoop'un parladığı bir alan olan daha dolandırıcılık tahmini modelleri oluşturmaya yardımcı olabilir.
Bugünün birbiriyle bağlantılı dünyasında, işlem hacmi ve karmaşıklığı dolandırıcılık bulmaktan daha zor hale geliyor. Eskiden "samanlıkta iğne bulma" adı verilen şey, "iğnelerin yığınlarında özel bir iğne bulma" görevidir. “
Dolandırıcılık önleme konusundaki geleneksel yaklaşımlar özellikle etkili değildir. Örneğin, uygun olmayan ödemelerin yönetimi, genellikle, hedeflenen göndericilere tıbbi dokümantasyon talep etmekle eşleşen çok küçük bir talep örneğine sahip olanları denetleyen analistler tarafından yönetilir. Bu model için endüstri dönemi ücretlidir ve takip eder: Talepler kabul edilir ve ödenir ve süreçler, taleplerin tasfiye sonrası incelenmesi yoluyla kasıtlı veya kasıtlı olmayan fazla ödemeleri arar.
Dolandırıcılık tespiti şimdi nasıl yapılır? Geleneksel teknolojilerin kısıtlamaları nedeniyle dolandırıcılık modelleri, örnekleme verileri ve sahte öngörme ve sapma modelleri seti oluşturmak için örnek kullanılarak oluşturulmuştur. Bu modeli, modelleri oluşturmak için eksiksiz bir veri setini (örnekleme yok) kullanan bir Hadoop bağlantılı dolandırıcılık departmanı ile karşılaştırdığınızda, farkı görebilirsiniz.
Hadoop kullanım durumlarının çoğunda gördüğünüz en yaygın tekrar eden tema, karar analizine dahil edilebilen hacim ve veri çeşitliliği konusunda cam tavan yapmama işine yardımcı olması. Sahip olduğunuz daha fazla veri (ve ne kadar çok mağaza sakladığınız), modelleriniz o kadar iyi olabilir.
Geçmişteki işlemler grubunuzla geleneksel olmayan veri biçimlerini karıştırmak sahtekarlık modellerinizi daha da sağlamlaştırabilir. Örneğin, bir işçi, işi detaylı bir şekilde anlatan ve dolandırıcılık için bir algılama kalıbı oluşturmaya yardımcı olan milyonlarca hasta sonucu olan bir havuza sahip olan, kayma ve düşme olayından kaynaklanan kötü bir geri dönüş için bir çalışan tazminat talebinde bulunursa.
Bu modelin nasıl çalıştığını gösteren bir örnek olarak, kırsal alanlardaki hastaların kentsel alanlardan daha yavaş iyileşip iyileşmediğini araştırmayı hayal edin. Fizyoterapi hizmetlerine olan yakınlığı inceleyerek başlayabilirsiniz. Kurtarma süreleri ve coğrafi konum arasında bir model ilişkisi var mı?
Eğer dolandırıcılık departmanınız belirli bir yaranın üç haftalık iyileşme sürdüğünü tespit ederse, aynı teşhise sahip bir çiftçi bir fizyoterapistten bir saat yaşıyor ve büro çalışanın ofisinde bir uygulayıcı varsa, bu dolandırıcılık için başka bir değişken oluyor -detection desen.
Davacılar için sosyal ağ verilerini toplayıp zorlu Mudder olarak bilinen dayanıklılık serilerini tamamlama konusunda övünen bir araç bulmak için, yeni veri türlerini geleneksel veri formlarıyla karıştırmaya bir örnek. sahtekarlık yapmak için.
Sahtekarlık tespit çabalarını daha üst seviyelere çıkarmak isterseniz, kuruluşunuz pazar segmenti modellemesinden uzaklaşmaya ve işlem başına veya kişi bazında modellemeye geçebilir.
Oldukça basit bir şekilde, bir kesime dayalı bir tahmin yapmak yardımcı olabilir, ancak bir işlemle ilgili belirli bilgilere dayanan bir karar vermek (açıkçası) daha iyi. Bunu yapmak için, geleneksel yaklaşımda geleneksel olarak mümkün olanlardan daha büyük bir veri kümesi oluşturursunuz. Dolandırıcılık modelleme için kullanışlı olabilecek mevcut bilgilerin en fazla (en fazla% 30'u) kullanılmaktadır.
Sahtekarlık saptama modelleri oluşturmak için Hadoop,
-
Tutma miktarı: için çok uygundur. Bu, tam veri kümesinin işlenmesi anlamına gelir - hiçbir veri örnekleme.
-
Yeni verilerin çeşitlerini yönetin: Örnekler, sahtekarlık modelini süslemek için yakınlık-bakım hizmetleri ve sosyal çevreler içermektedir.
-
Çevik bir çevre oluşturun: Mevcut modellerde farklı analiz ve değişiklikler yapılmasını sağlayın.
Dolandırıcılık modelleyicileri modelinize yeni değişkenler ekleyebilir ve test edebilir ve veritabanı yöneticisi ekibinize önerilerde bulunmadan bir şema değişikliğini onaylamak ve kendi çevrelerine yerleştirmek için birkaç hafta beklemek zorunda kalabilirsiniz.
Bu süreç dolandırıcılık tespiti için kritik önem taşır, çünkü dinamik ortamlar genellikle saatler, günler veya haftalarca gelen ve dolaşan dolandırıcılık kalıplarına sahiptir. Yeni sahtekarlık tespit modellerini tanımlamak veya güçlendirmek için kullanılan veriler bir anlık bir sürede mevcut değilse, bu yeni kalıpları keşfettiğiniz zaman, hasarı önlemek için çok geç olabilir.
İşinize, yalnızca daha fazla veri türüne sahip daha kapsamlı modeller oluşturmakla kalmayıp aynı zamanda bu modelleri her zamankinden daha hızlı tazelemek ve geliştirmek için yararlanın. Günlük modeli yenileyebilen ve geliştiren şirket, bunu üç ayda bir yapanlardakinden daha iyi sonuçlanacak.
Bu sorunun basit bir yanıtı olduğuna inanıyor olabilirsiniz - daha iyi modeller oluşturmak ve verilerin diğer yüzde 70'ini kendinize daha fazla yüklemek için CIO'tan operasyonel harcama (OPEX) ve sermaye harcaması (CAPEX) onaylarını almak için daha fazla veri isteyin. karar modelleri.
Bu yatırımın daha iyi dolandırıcılık tespiti ile kendisi için ödeneceğine inanabilirsiniz; Bununla birlikte, bu yaklaşımdaki problem, gerçekten değerli bir içgörünün olup olmadığını bilmediğiniz bilinmeyen verilerinin içine batırılması gereken ön ön maliyetlerdir.
Tabii ki, veri ambarınızın boyutunu üç katına çıkardığınızda, modellerinize ince ayar yapmak için yapılandırılmış geçmiş verilere daha fazla erişebilirsiniz, ancak sosyal medya patlamalarına uyum sağlayamazlar. Geleneksel teknolojiler de çevik değildir. Hadoop, yeni değişkenleri modele tanıtmayı kolaylaştırır ve eğer modelden iyileştirme yapmazlarsa, verileri atabilir ve devam ettirebilirsiniz.