Video: Using Python to build an AI to play and win SNES StreetFighter II with machine learning 2024
Verileriniz hazır olduğunda ve tahlil modelinizi analiz için hazırlamaya başlamak üzeresiniz, test metodolojinizi özetlemek ve bir test planı hazırlamak yararlı olacaktır. Test, topladığınız, belgelendiğiniz ve elde etmenize yardımcı olmak için gerekli tüm verileri topladığınız iş hedefleri tarafından yönlendirilmelidir.
Yarasa hemen, bir iş hedefine başarılı bir şekilde ulaşılıp ulaşılmadığını test etmek için bir yöntem hazırlamalısınız. Tahmini analitik, gelecekteki bir sonuç olasılığını ölçtüğünden ve bu tür bir testi çalıştırmaya hazır olmanın tek yolu, modelinizin geçmiş verileri üzerinde eğitim alması olduğundan, gelecekteki verilere karşı geldiğinde ne yapabileceğini hala görmeniz gerekir.
Elbette gerçek gelecekteki veriler üzerinde denenmemiş bir model çalıştırma riskini göze alamazsınız, bu nedenle gelecek verileri gerçekçi bir şekilde simüle etmek için mevcut verileri kullanmanız gerekecektir. Bunu yapmak için, üzerinde çalıştığınız verileri eğitim ve test veri setlerine bölmelisiniz.
Bu iki veri kümesini rasgele seçtiğinizden ve her iki veri kümesinin de ölçmekte olduğunuz tüm veri parametrelerini içerdiğinden ve kapsadığından emin olun.
Verilerinizi test ve eğitim veri kümelerine ayırdığınızda, modelin tüm veri kümesinde aşırı eğitilmesinden ve yalnızca örnek veri kümesine ait tüm gürültü kalıplarını veya belirli özellikleri toplamaktan kaynaklanabilecek aşırı uygun olan sorunları önlemektesiniz demektir ve diğer veri kümelerine uygulanmaz.
Verilerinizi sırasıyla yüzde 70 ve 30 oranında eğitim ve test veri kümelerine ayırmanız, oluşturduğunuz tahmini analitik modelin performansının doğru bir şekilde ölçülmesini sağlar. Modeli test verilerine karşı değerlendirmek istiyorsanız, çünkü modelin tahminlerinin doğru olup olmadığını ölçmenin basit bir yoludur.