W kontekście drzew decyzyjnych nic Ci nie pomogę.
ALE rozbieżności Kullbacka-Leiblera jednościowego rozkładu prawdopodobieństwa jednej zmiennej z rozkładu warunkowego tej zmiennej z drugiej to moje hobby.
W nauce maszynowej ta koncepcja może być użyta do określenia preferowanej sekwencji atrybutów do zbadania, aby jak najszybciej zawęzić stan X. Taka sekwencja (która zależy od wyniku dochodzenia z poprzednich atrybutów na każdym etapie) nazywa się drzewem decyzyjnym. Zwykle atrybut o wysokich wzajemnych informacjach powinien być preferowany do innych atrybutów.
I tak zrób.