Kullandığımız modelin ne kadar sağlıklı, kullanılabilir olduğunu test etmek için veri setimizi train ve test olarak iki parçaya ayırırız.
Devamı...Bilişim dünyasına kaliteli, özgün ve Türkçe içerikler kazandırmayı hedefleyen bir platform..
Kullandığımız modelin ne kadar sağlıklı, kullanılabilir olduğunu test etmek için veri setimizi train ve test olarak iki parçaya ayırırız.
Devamı...Makine Öğrenmesi Algoritmaları için veriyi hazır hale getirme yollarından birisi de veri birleştirme işlemidir. Bunun için Pandas kütüphanesiden DataFrame nesnesini ve concat metodunu kullanacağız.
Devamı...Makine öğrenme algoritmaları doğrudan kategorik veriler üzerinde çalışmamaktadır bu yüzden verilerimizin sayısal verilere dönüştürülmesi gerekmektedir. Makine öğrenmesi algoritmalarında kullanılan veri setlerindeki kategorik sınıflara sahip özniteliklerin, sayısal veri tipi ile ifade edilmesi için label encoding ve one-hot encoding işlemleri gerçekleştirilebilir.
Devamı...Büyük hacimli veri setlerinde kayıp ya da eksik değerlerin bulunması sıkça karşılaşılan bir durumdur. Araştırmacıların elde ettiği verilerde, bazı nedenlerden dolayı eksik yada kayıp değerler olabiliyor. Veri setinin kalitesini yükseltmek için bu tür verilerin saptanması, veri setinden silinmesi ve bir takım yöntemlerle tamamlanması gerekir.
Devamı...Berkeley Vision and Learning Center (BVLC) tarafından geliştirilen derin öğrenme için açık yapısıdır.
Devamı...LightGBM, Light Gradient Boosting Machine'in kısaltmasıdır, Microsoft tarafından geliştirilen açık kaynaklı, yüksek performanslı bir gradyan artırmalı karar ağaçları (GBDT) algoritmasıdır. Özellikle büyük veri kümeleri ve yüksek boyutlu özelliklerle çalışmak üzere optimize edilmiştir.
Devamı...