Risiken und Chancen prognostizieren

Warum Risiko- und Chancenprognose? 

Der Erfolg von Unter­neh­men hängt wesent­lich von den Ent­schei­dun­gen ihrer Kun­den ab. Kün­di­gen Kun­den oder ent­schei­den sich für einen Kauf, hat dies unmit­tel­ba­ren Ein­fluss auf den Geschäfts­er­folg. Mit­tels daten­ge­stütz­ter Pro­gno­se sind Unter­neh­men in der Lage, Ent­schei­dun­gen vor­her­zu­sa­gen und Ursa­chen zu ver­ste­hen. Dabei spricht man von Risi­ko­pro­gno­se, wenn es sich um Ereig­nis­se han­delt, die sich nega­tiv auf den Geschäfts­er­folg aus­wir­ken. Mit den­sel­ben ana­ly­ti­schen Mit­teln las­sen sich eben­so Ereig­nis­se pro­gnos­ti­zie­ren, die sich posi­tiv auf den Geschäfts­er­folg aus­wir­ken.

Kon­kre­te Anwen­dungs­fäl­le für die Risi­ko­pro­gno­se sind:

  • Die Kün­di­ger­ana­ly­se (Churn Pre­dic­tion), bei der Abwan­de­rung von Kun­den pro­gnos­ti­ziert wer­den soll
  • Die Kre­dit­ri­si­ko­pro­gno­se (Cre­dit Risk Scoring) bei dem die Aus­fall­wahr­schein­lich­keit von Kre­di­ten bewer­tet wer­den soll

Kon­kre­te Anwen­dungs­fäl­le für die Pro­gno­se von posi­ti­ven Ereig­nis­sen sind:

  • Win­back-Ana­ly­se bei der – nach ein­ge­gan­ge­ner Kün­di­gung – die Chan­ce auf eine Rück­ge­win­nung der Kun­den ermit­telt wer­den soll
  • Kam­pa­gnen­op­ti­mie­rung (Cam­paign Opti­miza­ti­on) bei der die Erfolgs­wahr­schein­lich­keit zu Abschlüs­sen (Con­ver­si­on) bei Teil­neh­men­den einer Kam­pa­gne ermit­telt wer­den soll

Es gibt noch vie­le wei­te­re Anwen­dungs­fäl­le, die sich alle in fol­gen­den Aspek­ten ähneln

  • Der Unter­su­chungs­ge­gen­stand sind Ent­schei­dun­gen von Men­schen
  • Das Ereig­nis von Inter­es­se ist meist sel­ten und wert­voll (also gewinn­träch­tig oder kost­spie­lig)

Datenakquise und Aufbereitung 

Am Anfang jedes Pro­gno­se­pro­jek­tes steht die Daten­ak­qui­se und -berei­ni­gung. Dabei müs­sen die Daten zu den betref­fen­den Kun­den und den kon­kre­ten Trans­ak­tio­nen zusam­men­ge­stellt und ana­ly­se­taug­lich gemacht wer­den. Dies ist ein bedeu­ten­der und bei den ers­ten ana­ly­ti­schen Pro­jek­ten auf­wän­di­ger Schritt.

Bei der Zusam­men­stel­lung der Merk­ma­le für ein sol­ches Pro­jekt, sind die Unter­neh­mens­da­ten bezüg­lich der Kun­den zu unter­su­chen. Inter­es­san­te Merk­ma­le ..

  • .. machen Kun­den ver­gleich­bar.
  • .. drü­cken die Inter­es­sen von Kun­den aus z.B. hin­sicht­lich in Anspruch genom­me­ner Ange­bo­te, ein­ge­gan­ge­ner Beschwer­den oder Reak­tio­nen auf frü­he­re Kam­pa­gnen.
  • .. beschrei­ben die Reak­ti­vi­tät der Kun­den z.B. über die Dau­er der Kun­den­be­zie­hung, die Zeit seit dem letz­ten Kon­takt oder die Häu­fig­keit der Kon­tak­te.

Wäh­rend der Daten­ak­qui­se muss auch der Ver­zicht auf Daten mit­be­dacht wer­den, deren Aus­wer­tung nicht erwünscht oder ander­wei­tig pro­ble­ma­tisch ist. 

  • Poten­zi­ell dis­kri­mi­nie­ren­de Merk­ma­le
  • Ana­ly­tisch unwich­ti­ge Merk­ma­le (z.B. Merk­ma­le mit ein­ma­li­gen Aus­prä­gun­gen)
  • Merk­ma­le, deren zuver­läs­si­ge Erhe­bung nicht garan­tiert ist
  • Wei­te­re Merk­ma­le kön­nen anony­mi­siert wer­den, um Fol­ge­ri­si­ken zu mini­mie­ren.

Bei der anschlie­ßen­den Daten­be­rei­ni­gung wer­den Daten­feh­ler soweit mög­lich redu­ziert und die Daten so auf­be­rei­tet, dass ein ers­tes ana­ly­se­taug­li­ches Extrakt ent­steht. Dabei ist es oft erfor­der­lich die Daten zu ver­dich­ten (z.B. viel­fäl­ti­ge Pro­dukt­kenn­zeich­nun­gen auf weni­ge Pro­dukt­grup­pen zu redu­zie­ren) und die Daten ver­gleich­bar zu machen (Datums­an­ga­ben bei­spiels­wei­se in Zeit­räu­me umzu­be­rech­nen).

Zwei wei­te­re Aspek­te sind zu beach­ten:

  1. Alle die­se Schrit­te müs­sen als Pro­zess so imple­men­tiert wer­den, dass sie wie­der­hol­bar sind. Dies ist erfor­der­lich, weil sich im Geschäfts­ab­lauf neue Daten ansam­meln wer­den, die eben­falls zusam­men­ge­führt und berei­nigt wer­den müs­sen
  2. Zu den Schrit­ten die­ses Pro­zes­ses wird man häu­fig zurück­keh­ren, um Anpas­sun­gen vor­zu­neh­men. Zum einen, weil sich in den Fol­ge­pha­sen wei­te­re Erkennt­nis­se zur Daten­qua­li­tät erge­ben und zum ande­ren, weil sich in den neu anfal­len­den Daten neue Pro­ble­me ver­ber­gen wer­den.

Das Ereig­nis von Inter­es­se (Kauf, Kün­di­gung, o.Ä.) wird vor­aus­sicht­lich sel­ten – im Ver­gleich zum Gegen-Ereig­nis - in den Daten auf­tre­ten. Die­sem Pro­blem kann man teil­wei­se schon bei der Daten­auf­be­rei­tung begeg­nen z.B. durch Nut­zung stra­ti­fi­zier­ter Stich­pro­ben. Teil­wei­se wird man die­ses Pro­blem in der anschlie­ßen­den Model­lie­rung berück­sich­ti­gen z.B. durch pas­sen­de Modell­pa­ra­me­ter oder durch Fall­ge­wich­te.

Modellerstellung 

Ist ein nutz­ba­res Daten­ex­trakt erstellt, kann mit der Erstel­lung eines Pro­gno­se­mo­del­les begon­nen wer­den. Hier­bei kann es kon­kre­te regu­la­to­ri­sche oder betrieb­li­che Anfor­de­run­gen geben. So sind zum Bei­spiel Regres­si­ons­mo­del­le belieb­te Modell­kan­di­da­ten:

  • Sie sind in vie­len ana­ly­ti­schen Tools ver­füg­bar
  • Exzel­lent geeig­net zur Inter­pre­ta­ti­on (Ver­mei­dung von Black-Box-Model­len)
  • Sehr per­for­mant bere­chen­bar und über­all ein­zu­set­zen
  • Kon­ver­tier­bar in sog. Score­cards (rele­vant im Bereich Kre­dit­ri­si­ko­pro­gno­se)

Die Vor­zü­ge der Regres­si­ons­mo­del­le wer­den mit dem Nach­teil „erkauft“ beson­ders kom­ple­xe Zusam­men­hän­ge nicht adäquat abzu­bil­den. Des­we­gen soll­ten kom­ple­xe­re Modell­ty­pen eben­falls als Kan­di­da­ten über­prüft wer­den. Dazu zäh­len in anstei­gen­der Kom­ple­xi­tät: Ent­schei­dungs­bäu­me (wie CART und CHAID), Ensem­ble­mo­del­le (wie Ran­dom Forest oder Boos­ting), Sup­port Vec­tor Machi­nes und künst­li­che neu­ro­na­le Net­ze.

Die­se Model­le haben weni­ger Vor­aus­set­zun­gen, was die Daten­qua­li­tät und Kom­ple­xi­tät betrifft, sind aber in der Regel auf­wän­di­ger zu berech­nen, schwie­ri­ger zu bedie­nen und weni­ger leicht aus­zu­wer­ten.

Bewertung der Ergebnisse

Hat man Modell­ty­pen aus­ge­wählt und Modell­kan­di­da­ten erstellt kann man die­se prü­fen.

  1. Ver­gleich der Modell­kan­di­da­ten unter­ein­an­der
  2. Bewer­tung hin­sicht­lich der Pro­blem­stel­lung

Der Ver­gleich meh­re­rer Modell­kan­di­da­ten dient der

  • Abschät­zung einer zu erwar­ten­den Modell­per­for­mance
  • der Aus­wahl des bes­ten Modell­typs auf dem gege­be­nen Pro­blem
  • der Abschät­zung des „Güte­ver­lus­tes“, der ent­steht, falls man auf­grund von exter­nen Vor­ga­ben (z.B. Trans­pa­renz) auf die Nut­zung eines spe­zi­fi­schen Modell­typs ange­wie­sen ist.

Bei der Bewer­tung eines ein­zel­nen Modells hin­sicht­lich der Pro­blem­stel­lung, wird man häu­fig zunächst unbe­frie­di­gen­de Ergeb­nis­se erhal­ten. Die Tref­fer­ra­te (Anteil der rich­tig pro­gnos­ti­zier­ten Fäl­le, ins­be­son­de­re bei dem gesuch­ten Ereig­nis) kann – auf den ers­ten Blick - ent­täu­schend nied­rig sein.

Man ver­ge­gen­wär­ti­ge sich dabei aber fol­gen­des: auch des bes­te Pro­gno­se­mo­dell wird den betrach­te­ten Men­schen „nicht in den Kopf gucken kön­nen“. Mensch­li­che Ent­schei­dun­gen sind von einer Viel­zahl von Fak­to­ren beein­flusst, von denen der weit über­wie­gen­de Teil nicht in den unter­neh­mens­ei­ge­nen Daten abge­bil­det ist. (Umge­kehrt zu betrach­ten: erreicht man hier eine hohe Pro­gno­se­gü­te, soll­te anschlie­ßend eine sorg­fäl­ti­ge Prü­fung der Daten­grund­la­ge erfol­gen - sehr wahr­schein­lich hat man Merk­ma­le ver­ar­bei­tet, die von der unter­such­ten Ziel­grö­ße abge­lei­tet sind).

Anstatt die Model­le nach Tref­fer­ra­te zu bewer­ten, bie­ten sich (je nach Fra­ge­stel­lung) ande­re Bewer­tungs­mög­lich­kei­ten an. So wird in der Win­back-Ana­ly­se und in der Kam­pa­gnen­op­ti­mie­rung eher die Fähig­keit des Modells zur Sor­tie­rung der Kun­den bewer­tet. Dies kann bei­spiels­wei­se mit­tels Gains und Lift-Charts erfol­gen. Die Sor­tie­rung der Kun­den (nach Erfolgs­wahr­schein­lich­keit) kann dann genutzt wer­den, um ein vor­ge­ge­be­nes Bud­get (in bei­spiels­wei­se Incen­ti­ves, oder Kam­pa­gnen­ak­ti­vi­tä­ten) mög­lichst opti­mal ein­zu­set­zen.

Produktivbetrieb und Monitoring 

Nach der Ent­wick­lungs­pha­se „im Labor“ müs­sen die Model­le in den Pro­duk­tiv­be­trieb über­führt wer­den. Das heißt, dass eine Inte­gra­ti­on in die Sys­tem­land­schaft erfolgt und die Model­le im Betrieb ver­wen­det wer­den. Dabei müs­sen die Model­le regel­mä­ßig oder bedarfs­be­zo­gen aus­ge­führt wer­den und die erzeug­ten Pro­gno­sen in den Betriebs­ab­lauf inte­griert und/oder den Fach­per­so­nen zugäng­lich gemacht wer­den.

Die Inte­gra­ti­on in die Sys­tem­land­schaft soll­te umfas­sen, dass eine rei­bungs­lo­se Aktua­li­sie­rung der Model­le wei­ter­hin mög­lich ist, um regel­mä­ßi­ge Model­l­up­dates aus­rol­len zu kön­nen. Dabei kann mit Frei­ga­be­me­cha­nis­men (Appr­oval bzw. Vier-Augen-Prin­zip) und Ver­sio­nie­rung gear­bei­tet wer­den.

Im Betrieb muss das Modell­ver­hal­ten kon­ti­nu­ier­lich über­wacht wer­den, eben­so soll­te his­to­ri­siert wer­den, wel­che Pro­gno­sen zu wel­chem Zeit­punkt mit wel­chen Modell­ver­sio­nen erstellt wur­den, um eine lücken­lo­se Nach­ver­folg­bar­keit gewähr­leis­ten zu kön­nen. Durch die Über­wa­chung kann abge­schätzt wer­den, wann ein Model­l­up­date erfor­der­lich ist und ein zuver­läs­si­ger Sys­tem­be­trieb sicher­ge­stellt wer­den.

Wie geht es weiter? 

Risi­ko­pro­gno­se ist – wie ein­gangs auf­ge­zeigt – ein wich­ti­ges The­ma für vie­le Unter­neh­men. Zum Glück gibt es dafür viel­fäl­ti­ge Lösun­gen, sei es durch kom­mer­zi­el­le Werk­zeu­ge wie Spot­fi­re, Alte­ryx Desi­gner oder Sta­tis­ti­ca aber auch durch eige­ne Lösun­gen basie­rend auf R oder Python. Maß­stab für die Ent­schei­dung über das “Wie” zur Umset­zung soll­te sein, wie tief man auto­ma­ti­sie­ren und inte­grie­ren will, wel­che Qua­li­fi­ka­tio­nen das eige­ne Data Science Team und inter­ne Nut­zen­de haben und wie die Erkennt­nis­se im Unter­neh­men ver­teilt wer­den sol­len.

Wir hel­fen Ihnen gern bei die­sen Ent­schei­dun­gen!

Kategorien
Letzte News
Ihr Ansprechpartner

Wenn Sie Fra­gen zu unse­ren Pro­duk­ten haben oder Bera­tung benö­ti­gen, zögern Sie nicht, direkt Kon­takt zu uns auf­zu­neh­men.

Tel.: +49 40 22 85 900-0
E-Mail: info@statsoft.de

Sasha Shiran­gi (Head of Sales)