Vom Problem zur Analyse: Wie KI den Einstieg in die Datenanalyse erleichtert

Die Herausforderung: die richtige Analyse finden

In Pro­duk­ti­ons­um­ge­bun­gen ste­hen Prozessingenieur:innen und Qua­li­täts­ver­ant­wort­li­che oft vor einer ele­men­ta­ren Fra­ge: Wo fan­ge ich über­haupt an? Eine Pro­duk­ti­ons­li­nie läuft nicht wie erwar­tet, eine Char­ge wird nicht frei­ge­ge­ben, oder ein schlei­chen­der Drift in einem Qua­li­täts­merk­mal gibt Anlass zur Sor­ge. Die Daten sind vor­han­den, erfasst von Sen­so­ren, gespei­chert in LIMS- oder MES-Sys­te­men, doch aus die­sen Roh­da­ten einen geziel­ten Ana­ly­se­plan zu ent­wi­ckeln erfor­dert eine Kom­bi­na­ti­on aus Domä­nen­wis­sen, sta­tis­ti­scher Kom­pe­tenz und Kennt­nis der ver­füg­ba­ren Werk­zeu­ge. Die­se Kom­bi­na­ti­on ist sel­ten und teu­er.

Genau hier setzt ein neu­er Ansatz an: der Ein­satz von Lar­ge Lan­guage Models (LLMs) als ana­ly­ti­sche Weg­wei­ser zur Ori­en­tie­rung vor der eigent­li­chen Ana­ly­se.

Spaltennamen als Ausgangspunkt

Die Idee ist ein­fach: Moder­ne LLMs sind auf einem enor­men Kor­pus sta­tis­ti­scher und tech­ni­scher Lite­ra­tur trai­niert. Sie ken­nen Metho­den, Pro­zes­se und typi­sche Ursa­che-Wir­kungs-Zusam­men­hän­ge in der Fer­ti­gung. Was ihnen fehlt, ist der Kon­text des kon­kre­ten Pro­blems, und genau den kön­nen Ana­ly­sie­ren­de lie­fern.

Ein ein­fa­cher, aber wir­kungs­vol­ler Ein­stieg: Man über­gibt dem LLM die Spal­ten­na­men des vor­lie­gen­den Daten­sat­zes zusam­men mit einer kur­zen Beschrei­bung des Pro­blems. Bezeich­nun­gen wie reaktions_temp_C, katalysator_charge_id, ausbeute_pct oder partikelgroesse_d50 ver­mit­teln einem LLM sofort ein kla­res Bild vom Pro­zess und den gemes­se­nen Grö­ßen. Tat­säch­li­che Daten­wer­te müs­sen dabei gar nicht über­tra­gen wer­den – die Struk­tur allein reicht aus.

Kom­bi­niert mit einer Pro­blem­be­schrei­bung in natür­li­cher Spra­che – zum Bei­spiel: „Wir beob­ach­ten seit drei Pro­duk­ti­ons­wo­chen eine zuneh­men­de Streu­ung bei der Tablet­ten­här­te und ver­mu­ten einen vor­ge­la­ger­ten Gra­nu­lie­rungs­pa­ra­me­ter als Ursa­che” – hat das LLM alles, was es braucht, um wie eine erfah­re­ne Fach­be­ra­tung vor­zu­ge­hen.

Was das LLM einbringen kann

Wenn Spal­ten­struk­tur und Pro­blem­be­schrei­bung vor­lie­gen, kann das Modell gleich­zei­tig auf meh­re­re Wis­sens­do­mä­nen zurück­grei­fen.

Es kennt die sta­tis­ti­sche Metho­dik: Es erkennt, dass ein Pro­blem mit zeit­li­cher Varia­bi­li­tät den Ein­satz von Regel­kar­ten oder Vari­anz­kom­po­nen­ten­ana­ly­sen nahe­legt, und weiß, wann ein sta­tis­tisch geplan­tes Expe­ri­ment sinn­vol­ler ist als eine Aus­wer­tung vor­han­de­ner Beob­ach­tungs­da­ten. Es ver­fügt über Pro­zess­wis­sen: Es kennt typi­sche Ursa­che-Wir­kungs-Ket­ten in Gra­nu­lie­rungs­pro­zes­sen, die Varia­blen, die übli­cher­wei­se die Tablet­ten­här­te beein­flus­sen, oder die Fak­to­ren, die Aus­beu­te­ver­lus­te in che­mi­schen Syn­the­sen begüns­ti­gen. Und es kann bei­des auf ein kon­kre­tes Werk­zeugset abbil­den – etwa auf die ver­füg­ba­ren Modu­le einer Ana­ly­se­platt­form wie Sta­tis­ti­ca.

Das Ergeb­nis sind kei­ne gene­ri­schen Emp­feh­lun­gen, son­dern ein struk­tu­rier­ter, auf den kon­kre­ten Pro­zess zuge­schnit­te­ner Ana­ly­se­fahr­plan – in Minu­ten statt Stun­den.

Wer davon profitiert

Nicht alle Sta­tis­ti­ca-Nut­zen­den haben einen sta­tis­ti­schen Hin­ter­grund. Vie­le haben einen Hin­ter­grund aus der Inge­nieurs­wis­sen­schaft, aus der Che­mie oder der Qua­li­täts­si­che­rung, und set­zen das Werk­zeug in ers­ter Linie aus beruf­li­cher Not­wen­dig­keit ein. Für die­se Grup­pe macht eine kla­re, begrün­de­te Ein­stiegs­emp­feh­lung den ana­ly­ti­schen Pro­zess deut­lich zugäng­li­cher. Aber auch erfah­re­ne Fach­leu­te pro­fi­tie­ren: Das LLM kann Metho­den oder Varia­blen­zu­sam­men­hän­ge ins Spiel brin­gen, die zunächst nicht im Fokus stan­den – es funk­tio­niert als Spar­rings­part­ner, der mensch­li­che Exper­ti­se ergänzt, nicht ersetzt.

KI ver­än­dert damit nicht nur, wie Ana­ly­se­er­geb­nis­se kom­mu­ni­ziert wer­den – son­dern auch, wie der Weg dort­hin gefun­den wird.

++++

Stat­Soft bie­tet mit dem GPT Con­nec­tor eine direk­te Inte­gra­ti­on die­ses Ansat­zes in Sta­tis­ti­ca Workspaces. Kon­tak­tie­ren Sie uns, um mehr zu erfah­ren.

Kategorien
Letzte News
Ihr Ansprechpartner

Wenn Sie Fra­gen zu unse­ren Pro­duk­ten haben oder Bera­tung benö­ti­gen, zögern Sie nicht, direkt Kon­takt zu uns auf­zu­neh­men.

Tel.: +49 40 22 85 900-0
E-Mail: info@statsoft.de

Gui­do Band­holz (Head of Sales)