Feature Selection Measures
- Information gain
- Gini index
- Entropy(Measure of impurity in a dataset) two class 0-1 and multi class log2n
- Impurity: In a subset, if all the samples are in the same class(pure node)
Parametreleri kategorik hale getirmek lazım?
Kök, dal ve yapraktan oluşur, yaprak gelince karar verilir.
Karar Ağacı, hem sınıflandırma hem de regresyon için kullanılan denetimli bir makine öğrenmesi algoritmasıdır. Veri kümesini özellik koşullarına göre daha küçük alt kümelere bölerek, ağaç benzeri bir karar yapısı oluşturur. Her iç düğüm, bir özelliğe dayalı bir kararı temsil eder. Her dal, bu kararın sonucunu temsil eder. Her yaprak düğümü, nihai tahmini temsil eder. Model, genellikle Gini İndeksi veya Entropi gibi ölçütler kullanarak verilerdeki kirliliği azaltan bölmeleri seçerek öğrenir. Karar Ağaçlarının temel fikirleri: • Özellik tabanlı veri bölme • Verilerdeki kirliliği ölçme • Veri kümesinin özyinelemeli bölümlenmesi • Yorumlanabilir model yapısı Karar Ağaçları anlaşılması kolay, görselleştirilmesi basit ve Rastgele Orman gibi birçok güçlü topluluk modelinin temelini oluşturur.
Kaynaklar
- https://www.instagram.com/reels/DVi0-qJjdPZ/

