Weight of Evidence

Weight of Evidence (WoE) erleichtert das Verständnis und die Modellierung von Zusammenhängen, bei denen binäre Zielgrößen vorliegen. Dies ist in vielen Branchen der Fall, unabhängig davon, ob es um so unterschiedliche Zielkategorien wie  „gut“ vs. „schlecht“,  „gesund“ vs. „krank“ oder „ja“ vs. „nein“ geht.

Mit Weight of Evidence werden Einflussgrößen derart rekodiert, dass die Trennkraft zur abhängigen Variablen maximiert wird. Metrische Einflussgrößen werden hierbei in Klassen überführt, kategoriale Einflussgrößen umkodiert. Benachbarte Klassen bzw. Codes mit ähnlichem Anteilsverhältnis der beiden Zielkategorien werden hierbei zusammengefasst.

Die Abbildung zeigt beispielsweise wie mit zunehmender Kreditlaufzeit die Kreditwürdigkeit abnimmt. Den (unterschiedlich breiten) Monats-Intervallen ist jeweils ein WoE-Wert zugeordnet, wobei negative WoE-Werte hier überproportional viele Kreditausfälle bedeuten.

Die Suche nach der trennschärfsten Lösung läuft über ein Entscheidungsbaum-basiertes Verfahren auch für mehrere Einflussgrößen automatisch und kann auch mit Ausreißern und Missing Data umgehen.

Anwender können spezifizieren, ob komplexe nicht-lineare Zusammenhänge und Interaktionen zwischen Einflussgrößen abgebildet oder lediglich einfache Trends dargestellt werden sollen. Auch kann zwecks besserer Verständlichkeit auf eine weniger granulare Klassierung umgestellt werden.

Die WoE-Codierung wird in Form von Regeln ausgegeben, welche sich per Mausklick auf neue Daten anwenden lassen.

Mit Weight of Evidence lassen sich in der Modellierung häufig bessere Ergebnisse erzielen, insbesondere bei der Logistischen Regression. Da den Klassen bzw. Codes metrische WoE-Werte mit direktem Bezug zur Zielgröße zugeordnet sind, entfällt die Notwendigkeit  einer Dummy- oder Effektkodierung (welche zudem häufig Schätzprobleme mit sich bringen) und lassen sich Modelle einfacher interpretieren.

Kontakt