Statistica als MiniTab-Alternative 

Die­ser Arti­kel stammt von unse­rem geschätz­ten Part­ner Lui­gi Rog­gia von App­ly Sience (https://www.applyscience.it/). Lui­gi ist Exper­te im Bereich der ange­wand­ten Sta­tis­tik und der zuge­hö­ri­gen Soft­ware-Werk­zeu­ge. Es ist uns eine gro­ße Ehre, dass wir sei­ne Erfah­run­gen in unse­rem Blog ver­öf­fent­li­chen kön­nen. 

War­um kann Sta­tis­ti­ca eine ech­te Alter­na­ti­ve zu Mini­T­ab sein? 
Seit 2006 bin ich ein Anwen­der von Mini­T­ab und über die Jah­re habe ich Mini­T­ab genutzt, um hun­der­ten Inter­es­sier­ten die Anwen­dung von Sta­tis­tik bei­zu­brin­gen und Bera­tung durch­zu­füh­ren. Ich erwäh­ne das, um zu bele­gen, dass ich viel Erfah­rung mit Mini­T­ab und Sta­tis­tik habe. Was in die­sem Arti­kel folgt, ist aus­schließ­lich basie­rend auf mei­ner per­sön­li­chen Erfah­rung und dem enthu­si­as­ti­schen Feed­back, dass wir von unse­ren Kun­den erhal­ten. 
Mini­T­ab ist ein eta­blier­tes Werk­zeug im Bereich der sta­tis­ti­schen Soft­ware. Aber trotz­dem habe ich mich im Jahr 2020 gefragt, ob es Alter­na­ti­ven gibt. Als Seni­or-Bera­ter in dem Bereich ist es mei­ne Auf­ga­be, die bes­ten Tech­no­lo­gien zur Lösung der Her­aus­for­de­run­gen unse­rer Kun­den zu iden­ti­fi­zie­ren. 
Bei mei­ner Recher­che im Bereich kom­mer­zi­el­ler und kos­ten­frei­er Lösun­gen begeg­ne­te ich vie­len ver­schie­den Soft­ware-Werk­zeu­gen, die ich anhand von Anfor­de­run­gen bewer­te­te. Die­ser Anfor­de­run­gen rich­te­ten sich klar nach den Bedürf­nis­sen, die ein Data Sci­en­tists heut­zu­ta­ge an eine Soft­ware stel­len: 

      • Sie soll­te eine kom­plet­ten Metho­den­satz bie­ten, um die Schrit­te von Six Sig­ma abzu­de­cken. 

      • Sie soll­te einen hohen Rei­fe­grad haben und die Bedürf­nis­se von gro­ßen Unter­neh­men erfül­len. 

      • Sie soll­te die Erstel­lung von auto­ma­ti­sier­ten ana­ly­ti­schen Pro­zes­sen erlau­ben. 

      • Sie soll­te in der Lage sein aus einer Viel­zahl von Daten­quel­len zu impor­tie­ren, ins­be­son­de­re den popu­lä­ren Quel­len. 

      • Sie soll­te die Daten in ver­schie­de­nen For­ma­ten expor­tie­ren kön­nen. 

      • Sie soll­te es erlau­ben, Pro­zes­se FDA-kon­form (z.B. gemä­ße 21 CFR Part 11) zu erstel­len. 

      • Sie soll­te bei Bedarf R und Python Code inte­grie­ren kön­nen. 

        • Sie soll­te Machi­ne Lear­ning Metho­den mit­brin­gen, weil die­se heut­zu­ta­ge unver­zicht­bar sind. 

        • Sie soll­te ein gutes User Inter­face haben, auch zur Ver­wal­tung von Pro­jek­ten und Reports. 

        • Sie soll­te Mecha­nis­men mit­brin­gen. um zügig von der Explo­ra­ti­ons­pha­se in den Pro­duk­tiv­be­trieb (z.B. für Model­le) über­zu­ge­hen. 

      Am Ende mei­ner Recher­che hat­te ich eine Lösung iden­ti­fi­ziert, die nicht nur die genann­ten Anfor­de­run­gen erfüllt, son­dern mich auch einen gro­ßen Schritt wei­ter­brin­gen konn­te. Nicht nur als Alter­na­ti­ve, son­dern als signi­fi­kan­te Ver­bes­se­rung. 
      Die Lösung, von der ich spre­che, ist Sta­tis­ti­ca. 

      Nach Sta­tis­ti­ca zu wech­seln war ein­fa­cher als gedacht: sobald ich die grund­sätz­li­che Logik ver­stan­den hat­te, war Sta­tis­ti­ca ein­fach zu ver­ste­hen und zu nut­zen. 

      Sta­tis­tik und Six Sig­ma 
      Sta­tis­ti­ca bie­tet alle Funk­tio­na­li­tä­ten, die man in der Pra­xis erwar­tet, man muss nach einem Wech­sel also auf nichts ver­zich­ten. Sucht man bei­spiels­wei­se nach den fol­gen­den Funk­tio­nen, wird man in Sta­tis­ti­ca fün­dig: 

          • Deskrip­ti­ve Sta­tis­tik 

          • Sta­tis­ti­sche Test­ver­fah­ren 

          • ANOVA (Ana­ly­sis of Vari­ance) 

          • Regres­si­ons­ana­ly­se 

          • Ver­suchs­pla­nung (Design of Expe­ri­ments) 

          • Qua­li­täts­re­gel­kar­ten (Con­trol Charts) 

          • Pro­zess­fä­hig­keit (Capa­bi­li­ty ana­ly­sis) 

          • Mess­sys­tem­ana­ly­se (Mea­su­re sys­tems ana­ly­sis) 

          • Zuver­läs­sig­keit (Relia­bi­li­ty) 

        Taucht man tie­fer in Sta­tis­ti­ca ein, z.B. als ein fort­ge­schrit­te­ner Anwen­der und will ein Six Sig­ma Pro­jekt durch­füh­ren, ist Sta­tis­ti­ca sehr hilf­reich, weil es mit einem spe­zi­fi­schen Menü durch die ver­schie­de­nen Stu­fen des DMAIC Pro­zes­ses lei­tet. 

        Sobald man etwas Sicher­heit im Umgang mit der neu­en Umge­bung gewon­nen hat, kann man ent­de­cken, dass vie­le Details so gestal­tet sind, dass sie die Arbeit der Anwen­den­den ver­ein­fa­chen. 

        Ein­fa­che und schnel­le Aus­wer­tun­gen 
        Wenn eine kon­kre­te Ana­ly­se durch­ge­führt wer­den soll, sind alle ver­füg­ba­ren Ein­stel­lun­gen und Ergeb­nis­se in pas­sen­den Ana­ly­se-Dia­lo­gen ver­sam­melt. Die­se Dia­lo­ge sind mit Rei­tern unter­teilt, um ein­fach die pas­sen­den Erkennt­nis­se zu gewin­nen. Im Rei­ter „Quick“ (oder „Stan­dard“) erhält man eine Zusam­men­fas­sung der wich­tigs­ten Ergeb­nis­se. Es ist nicht not­wen­dig an ande­ren Stel­len nach Menüs oder Werk­zeu­gen zu suchen: 

        Ver­suchs­pla­nung (Design of Expe­ri­ments) auf Pro­fi­ni­veau 
        In Sta­tis­ti­ca kann jeg­li­che Art von Ver­suchs­pla­nung erstellt wer­den und man kann beein­dru­cken­de Funk­tio­nen zur Aus­wer­tung von Ver­suchs­plä­nen fin­den. 
        Sobald man in die Ergeb­nis­aus­wer­tung ein­taucht, merkt man sofort, dass man aus den Ergeb­nis­sen zuver­läs­sig Schlüs­se zie­hen kann, wenn man zum Bei­spiel die Daten als Kon­tour-Plot oder auch als inter­ak­ti­ven 3D Plot inklu­si­ve Flä­chen-Plot (Sur­face Plot) und den zuge­hö­ri­gen Stütz­punk­ten dar­stel­len kann. Die­se Form der Dar­stel­lung ist extrem nütz­lich, für die­je­ni­gen, die ver­ste­hen wol­len, wie ein Regres­si­ons­mo­dell arbei­tet, um ein Modell der Rea­li­tät zu abzu­bil­den. 

        Natür­lich gibt es noch viel mehr. Sta­tis­ti­ca unter­stützt z.B. ein mäch­ti­ges Simu­la­ti­ons­werk­zeug, den „Model Pro­fi­ler“, der das eben opti­mier­te Modell anwen­det, um mit Hil­fe einer Mon­te Car­lo Simu­la­ti­on die opti­ma­le Kon­fi­gu­ra­ti­on für den Pro­duk­ti­ons­pro­zess zu bestim­men. Die Funk­tio­nen in Sta­tis­ti­ca bie­ten vie­le wei­te­re Kon­fi­gu­ra­ti­ons­op­tio­nen und Erwei­te­run­gen. Ergänzt wird dies durch die Mög­lich­keit R und Python zu inte­grie­ren und somit nahe­zu unbe­grenz­te Mög­lich­kei­ten im Bereich Simu­la­ti­on, Opti­mie­rung und Mul­ti-Opti­mie­rung zu nut­zen. 

        Ein­fach mit nicht-nor­mal­ver­teil­ten Daten arbei­ten 
        In Sta­tis­ti­ca kön­nen nicht-nor­mal­ver­teil­te Daten direkt ver­ar­bei­tet wer­den. Dabei ist es nicht erfor­der­lich, dass man dies manu­ell tut, statt­des­sen kann Sta­tis­ti­ca auto­ma­tisch Regel­kar­ten für nicht-nor­mal­ver­teil­te Daten erzeu­gen und ande­re als die (Gauss-) Nor­mal­ver­tei­lung ver­wen­den. Erstellt man eine sol­che Regel­kar­te oder berech­net eine Pro­zess­fä­hig­keits­ana­ly­se, ent­hal­ten die Ergeb­nis­se die Aus­wer­tung für den nor­mal und nicht-nor­mal­ver­teil­ten Fall und kom­plett auto­ma­tisch. 

        Ein­fach und über­sicht­lich dank Sta­tis­ti­ca Work­books 
        Sta­tis­ti­ca bie­tet soge­nann­te Work­books. Die­se sind hier­ar­chi­sche orga­ni­sier­te Con­tai­ner, um Ergeb­nis­se, wie Tabel­len, Gra­fi­ken und Reports zu sam­meln, zu grup­pie­ren und zu orga­ni­sie­ren. Alles bleibt sehr über­sicht­lich und orga­ni­siert. In ande­ren Wor­ten: kom­ple­xe Pro­jek­te in Sta­tis­ti­ca las­sen einen nicht irgend­wann ver­rückt wer­den, weil man nicht mehr ver­steht, was wovon ein Ergeb­nis ist. Viel­mehr hat man in den Work­books die Mög­lich­keit alles per­fekt nach dem eige­nen Geschmack anzu­ord­nen. 

        Drag und Drop im Workspace 
        Eines mei­ner liebs­ten Fea­tures, dass in Sta­tis­ti­ca zu fin­den ist, sind die Workspaces. Sie sind eine Ober­flä­che, die es erlaubt per Drag and Drop ana­ly­ti­sche Pro­zes­se zu erstel­len und auf Knopf­druck ablau­fen zu las­sen. Man muss ein­fach nur Funk­tio­nen (sog. „Kno­ten“) aus­wäh­len, mit der Maus ver­bin­den, kon­fi­gu­rie­ren und dann „Run“ drü­cken. Der Pro­zess läuft dann spe­zi­fi­ka­ti­ons­ge­mäß ab und legt alle Ergeb­nis­se struk­tu­riert in Work­books ab. 

        Unse­re Kun­den, schät­zen die Workspaces sehr, weil wir Ana­ly­sen für sie vor­be­rei­ten kön­nen und das Prin­zip schnell visu­ell ver­stan­den wer­den kann. Die Workspace bil­den ihre eige­ne Doku­men­ta­ti­on und kön­nen immer wie­der benutzt wer­den, wenn sich die Daten geän­dert haben, ein­fach durch den Klick auf „Run“ (bzw. „Aus­füh­ren“) 

        Wich­ti­ger Hin­weis: Workspaces kön­nen in der  Dash­boar­ding-Soft­ware Spot­fi­re ein­ge­bun­den wer­den und dort kom­ple­xe ana­ly­ti­sche Pro­zes­se auto­ma­ti­siert im Hin­ter­grund bereit­stel­len. 

        Model­le und Erkennt­nis­se in den Pro­duk­tiv-Betrieb brin­gen 
        Unter­neh­men in Pro­duk­ti­on und Dienst­leis­tung ste­hen vor der­sel­ben Her­aus­for­de­rung: Erkennt­nis­se und Model­le aus den ana­ly­ti­schen Pro­zes­sen müs­sen in die pro­duk­ti­ven Pro­zes­se inte­griert wer­den. In Sta­tis­ti­ca ist dies auf ver­schie­de­ne Wei­sen mög­lich, so kön­nen prä­dik­ti­ve Model­le in einer Viel­zahl von Pro­gram­mier­spra­chen und in der Modelspra­che PMML expor­tiert wer­den: 

        Außer­dem kann man direkt in Daten­ban­ken schrei­ben oder R, Python, Sca­la, Visu­al Basic oder C# (oder eine Kom­bi­na­ti­on davon) benut­zen, um Ergeb­nis­se zu expor­tie­ren. 

        Data Sci­ence und Machi­ne Lear­ning 
        Für Data Sci­en­tists bie­tet Sta­tis­ti­ca eine rie­si­ge Men­ge von Funk­tio­nen in einer gemein­sa­men Umge­bung. Nicht nur klas­si­sche und ange­wand­te Sta­tis­tik, son­dern auch Metho­den, um gro­ße Daten­men­gen und kom­ple­xes­te Fra­ge­stel­lun­gen zu bear­bei­ten. Sta­tis­ti­ca bie­tet eine sehr umfang­rei­che Aus­wahl von Machi­ne Lear­ning Metho­den an: 

        Außer­dem bie­tet es Funk­tio­nen für die Ver­ar­bei­tung von Big Data an. Die Funk­tio­nen kön­nen durch R und Python noch erwei­tert wer­den und das auch im Workspace, was eine Ver­bin­dung die­ser Tools und ihre gemein­sa­me Ver­wen­dung im sel­ben Pro­zess mög­lich macht. 

        Com­pli­ance mit FDA Vor­ga­ben 
        Sta­tis­ti­ca kann “stand-alo­ne” als Desk­top-Appli­ka­ti­on mit all den oben genann­ten Funk­tio­nen beschrie­ben wer­den, oder man kann es in einer Cli­ent-Ser­ver-Archi­tek­tur betrei­ben. In die­sem Fall ver­wen­det man Sta­tis­ti­ca Ser­ver und die­ser erwei­tert die Fähig­kei­ten enorm. Es kön­nen hier nicht alle Fea­tures der Ser­ver Ver­si­on behan­delt wer­den, aber her­vor­zu­he­ben ist, dass Sta­tis­ti­ca Ser­ver die Grund­la­ge bil­det, um ein ana­ly­ti­sches Sys­tem auf­zu­bau­en, dass die Anfor­de­run­gen von FDA 21 CFR part 11 erfüllt. 

        Aus­ge­hend von mei­ner Erfah­rung, wür­de ich sagen, dass Sta­tis­ti­ca die voll­stän­digs­te ana­ly­ti­sche Soft­ware ist, die die­se Anfor­de­run­gen erfüllt (inkl. Daten­in­te­gri­tät), so dass sie bei­spiels­wei­se in der phar­ma­zeu­ti­schen Indus­trie ein­ge­setzt wer­den kann. 

        Fazit 
        Nach vie­len Jah­ren als pro­fes­sio­nel­ler Anwen­der von Mini­T­ab, hat mich der Wech­sel zu Sta­tis­ti­ca deut­lich wei­ter­ge­bracht und erlaubt mir, mehr in kür­ze­rer Zeit zu schaf­fen. Die Tran­si­ti­on war ver­gleichs­wei­se ein­fach und jede Funk­ti­on, die ich brau­che, ist in Sta­tis­ti­ca ver­füg­bar. Mei­ne per­sön­li­che Eva­lua­ti­on ent­hält die fol­gen­den Schluss­fol­ge­run­gen: 

            • Viel mehr Funk­tio­nen inklu­si­ve eines voll­stän­di­gen Sets von Machi­ne Lear­ning Metho­den.  

            • Workspaces sind ein groß­ar­ti­ges Werk­zeug, um Ana­ly­sen visu­ell auf­zu­bau­en und sie wie­der­holt ablau­fen zu las­sen.  

            • Pro­jek­te kön­nen ein­fa­cher und über­sicht­li­cher ver­wal­tet wer­den. 

            • Die Aus­wer­tung von Expe­ri­men­ten (in der Ver­suchs­pla­nung) ist eine ganz neue und reich­hal­ti­ge­re Erfah­rung. 

            • Qua­li­täts­re­gel­kar­ten und Pro­zess­fä­hig­keits­ana­ly­sen lei­den nicht mehr unter dem „Fluch der Nor­ma­li­tät“. 

            • Das Öko­sys­tem von TIBCO ist unver­gleich­lich: Es bie­tet Inte­gra­ti­ons­mög­lich­kei­ten und Erwei­te­run­gen, die eine gan­ze Enter­pri­se-Land­schaft abde­cken. 

            • Sta­tis­ti­ca ist ein Werk­zeug für Statistiker:innen und Data Sci­en­tists glei­cher­ma­ßen: End­lich eine Soft­ware, die den Anfor­de­run­gen die­ser Zeit genügt. 

          Kategorien
          Letzte News
          Ihr Ansprechpartner

          Wenn Sie Fra­gen zu unse­ren Pro­duk­ten haben oder Bera­tung benö­ti­gen, zögern Sie nicht, direkt Kon­takt zu uns auf­zu­neh­men.

          Tel.: +49 40 22 85 900-0
          E-Mail: info@statsoft.de

          Sasha Shiran­gi (Head of Sales)