Statistica vs. MiniTab

Statistica als MiniTab-Alternative 

Die­ser Arti­kel stammt von unse­rem geschätz­ten Part­ner Lui­gi Rog­gia von App­ly Sience (https://www.applyscience.it/). Lui­gi ist Exper­te im Bereich der ange­wand­ten Sta­tis­tik und der zuge­hö­ri­gen Soft­ware-Werk­zeu­ge. Es ist uns eine gro­ße Ehre, dass wir sei­ne Erfah­run­gen in unse­rem Blog ver­öf­fent­li­chen kön­nen. 

War­um kann Sta­tis­ti­ca eine ech­te Alter­na­ti­ve zu Mini­T­ab sein? 
Seit 2006 bin ich ein Anwen­der von Mini­T­ab und über die Jah­re habe ich Mini­T­ab genutzt, um hun­der­ten Inter­es­sier­ten die Anwen­dung von Sta­tis­tik bei­zu­brin­gen und Bera­tung durch­zu­füh­ren. Ich erwäh­ne das, um zu bele­gen, dass ich viel Erfah­rung mit Mini­T­ab und Sta­tis­tik habe. Was in die­sem Arti­kel folgt, ist aus­schließ­lich basie­rend auf mei­ner per­sön­li­chen Erfah­rung und dem enthu­si­as­ti­schen Feed­back, dass wir von unse­ren Kun­den erhal­ten. 
Mini­T­ab ist ein eta­blier­tes Werk­zeug im Bereich der sta­tis­ti­schen Soft­ware. Aber trotz­dem habe ich mich im Jahr 2020 gefragt, ob es Alter­na­ti­ven gibt. Als Seni­or-Bera­ter in dem Bereich ist es mei­ne Auf­ga­be, die bes­ten Tech­no­lo­gien zur Lösung der Her­aus­for­de­run­gen unse­rer Kun­den zu iden­ti­fi­zie­ren. 
Bei mei­ner Recher­che im Bereich kom­mer­zi­el­ler und kos­ten­frei­er Lösun­gen begeg­ne­te ich vie­len ver­schie­den Soft­ware-Werk­zeu­gen, die ich anhand von Anfor­de­run­gen bewer­te­te. Die­ser Anfor­de­run­gen rich­te­ten sich klar nach den Bedürf­nis­sen, die ein Data Sci­en­tists heut­zu­ta­ge an eine Soft­ware stel­len: 

      • Sie soll­te eine kom­plet­ten Metho­den­satz bie­ten, um die Schrit­te von Six Sig­ma abzu­de­cken. 

      • Sie soll­te einen hohen Rei­fe­grad haben und die Bedürf­nis­se von gro­ßen Unter­neh­men erfül­len. 

      • Sie soll­te die Erstel­lung von auto­ma­ti­sier­ten ana­ly­ti­schen Pro­zes­sen erlau­ben. 

      • Sie soll­te in der Lage sein aus einer Viel­zahl von Daten­quel­len zu impor­tie­ren, ins­be­son­de­re den popu­lä­ren Quel­len. 

      • Sie soll­te die Daten in ver­schie­de­nen For­ma­ten expor­tie­ren kön­nen. 

      • Sie soll­te es erlau­ben, Pro­zes­se FDA-kon­form (z.B. gemä­ße 21 CFR Part 11) zu erstel­len. 

      • Sie soll­te bei Bedarf R und Python Code inte­grie­ren kön­nen. 

        • Sie soll­te Machi­ne Lear­ning Metho­den mit­brin­gen, weil die­se heut­zu­ta­ge unver­zicht­bar sind. 

        • Sie soll­te ein gutes User Inter­face haben, auch zur Ver­wal­tung von Pro­jek­ten und Reports. 

        • Sie soll­te Mecha­nis­men mit­brin­gen. um zügig von der Explo­ra­ti­ons­pha­se in den Pro­duk­tiv­be­trieb (z.B. für Model­le) über­zu­ge­hen. 

      Am Ende mei­ner Recher­che hat­te ich eine Lösung iden­ti­fi­ziert, die nicht nur die genann­ten Anfor­de­run­gen erfüllt, son­dern mich auch einen gro­ßen Schritt wei­ter­brin­gen konn­te. Nicht nur als Alter­na­ti­ve, son­dern als signi­fi­kan­te Ver­bes­se­rung. 
      Die Lösung, von der ich spre­che, ist Sta­tis­ti­ca. 

      Nach Sta­tis­ti­ca zu wech­seln war ein­fa­cher als gedacht: sobald ich die grund­sätz­li­che Logik ver­stan­den hat­te, war Sta­tis­ti­ca ein­fach zu ver­ste­hen und zu nut­zen. 

      Sta­tis­tik und Six Sig­ma 
      Sta­tis­ti­ca bie­tet alle Funk­tio­na­li­tä­ten, die man in der Pra­xis erwar­tet, man muss nach einem Wech­sel also auf nichts ver­zich­ten. Sucht man bei­spiels­wei­se nach den fol­gen­den Funk­tio­nen, wird man in Sta­tis­ti­ca fün­dig: 

          • Deskrip­ti­ve Sta­tis­tik 

          • Sta­tis­ti­sche Test­ver­fah­ren 

          • ANOVA (Ana­ly­sis of Vari­ance) 

          • Regres­si­ons­ana­ly­se 

          • Ver­suchs­pla­nung (Design of Expe­ri­ments) 

          • Qua­li­täts­re­gel­kar­ten (Con­trol Charts) 

          • Pro­zess­fä­hig­keit (Capa­bi­li­ty ana­ly­sis) 

          • Mess­sys­tem­ana­ly­se (Mea­su­re sys­tems ana­ly­sis) 

          • Zuver­läs­sig­keit (Relia­bi­li­ty) 

        Taucht man tie­fer in Sta­tis­ti­ca ein, z.B. als ein fort­ge­schrit­te­ner Anwen­der und will ein Six Sig­ma Pro­jekt durch­füh­ren, ist Sta­tis­ti­ca sehr hilf­reich, weil es mit einem spe­zi­fi­schen Menü durch die ver­schie­de­nen Stu­fen des DMAIC Pro­zes­ses lei­tet. 

        Sobald man etwas Sicher­heit im Umgang mit der neu­en Umge­bung gewon­nen hat, kann man ent­de­cken, dass vie­le Details so gestal­tet sind, dass sie die Arbeit der Anwen­den­den ver­ein­fa­chen. 

        Ein­fa­che und schnel­le Aus­wer­tun­gen 
        Wenn eine kon­kre­te Ana­ly­se durch­ge­führt wer­den soll, sind alle ver­füg­ba­ren Ein­stel­lun­gen und Ergeb­nis­se in pas­sen­den Ana­ly­se-Dia­lo­gen ver­sam­melt. Die­se Dia­lo­ge sind mit Rei­tern unter­teilt, um ein­fach die pas­sen­den Erkennt­nis­se zu gewin­nen. Im Rei­ter „Quick“ (oder „Stan­dard“) erhält man eine Zusam­men­fas­sung der wich­tigs­ten Ergeb­nis­se. Es ist nicht not­wen­dig an ande­ren Stel­len nach Menüs oder Werk­zeu­gen zu suchen: 

        Ver­suchs­pla­nung (Design of Expe­ri­ments) auf Pro­fi­ni­veau 
        In Sta­tis­ti­ca kann jeg­li­che Art von Ver­suchs­pla­nung erstellt wer­den und man kann beein­dru­cken­de Funk­tio­nen zur Aus­wer­tung von Ver­suchs­plä­nen fin­den. 
        Sobald man in die Ergeb­nis­aus­wer­tung ein­taucht, merkt man sofort, dass man aus den Ergeb­nis­sen zuver­läs­sig Schlüs­se zie­hen kann, wenn man zum Bei­spiel die Daten als Kon­tour-Plot oder auch als inter­ak­ti­ven 3D Plot inklu­si­ve Flä­chen-Plot (Sur­face Plot) und den zuge­hö­ri­gen Stütz­punk­ten dar­stel­len kann. Die­se Form der Dar­stel­lung ist extrem nütz­lich, für die­je­ni­gen, die ver­ste­hen wol­len, wie ein Regres­si­ons­mo­dell arbei­tet, um ein Modell der Rea­li­tät zu abzu­bil­den. 

        Natür­lich gibt es noch viel mehr. Sta­tis­ti­ca unter­stützt z.B. ein mäch­ti­ges Simu­la­ti­ons­werk­zeug, den „Model Pro­fi­ler“, der das eben opti­mier­te Modell anwen­det, um mit Hil­fe einer Mon­te Car­lo Simu­la­ti­on die opti­ma­le Kon­fi­gu­ra­ti­on für den Pro­duk­ti­ons­pro­zess zu bestim­men. Die Funk­tio­nen in Sta­tis­ti­ca bie­ten vie­le wei­te­re Kon­fi­gu­ra­ti­ons­op­tio­nen und Erwei­te­run­gen. Ergänzt wird dies durch die Mög­lich­keit R und Python zu inte­grie­ren und somit nahe­zu unbe­grenz­te Mög­lich­kei­ten im Bereich Simu­la­ti­on, Opti­mie­rung und Mul­ti-Opti­mie­rung zu nut­zen. 

        Ein­fach mit nicht-nor­mal­ver­teil­ten Daten arbei­ten 
        In Sta­tis­ti­ca kön­nen nicht-nor­mal­ver­teil­te Daten direkt ver­ar­bei­tet wer­den. Dabei ist es nicht erfor­der­lich, dass man dies manu­ell tut, statt­des­sen kann Sta­tis­ti­ca auto­ma­tisch Regel­kar­ten für nicht-nor­mal­ver­teil­te Daten erzeu­gen und ande­re als die (Gauss-) Nor­mal­ver­tei­lung ver­wen­den. Erstellt man eine sol­che Regel­kar­te oder berech­net eine Pro­zess­fä­hig­keits­ana­ly­se, ent­hal­ten die Ergeb­nis­se die Aus­wer­tung für den nor­mal und nicht-nor­mal­ver­teil­ten Fall und kom­plett auto­ma­tisch. 

        Ein­fach und über­sicht­lich dank Sta­tis­ti­ca Work­books 
        Sta­tis­ti­ca bie­tet soge­nann­te Work­books. Die­se sind hier­ar­chi­sche orga­ni­sier­te Con­tai­ner, um Ergeb­nis­se, wie Tabel­len, Gra­fi­ken und Reports zu sam­meln, zu grup­pie­ren und zu orga­ni­sie­ren. Alles bleibt sehr über­sicht­lich und orga­ni­siert. In ande­ren Wor­ten: kom­ple­xe Pro­jek­te in Sta­tis­ti­ca las­sen einen nicht irgend­wann ver­rückt wer­den, weil man nicht mehr ver­steht, was wovon ein Ergeb­nis ist. Viel­mehr hat man in den Work­books die Mög­lich­keit alles per­fekt nach dem eige­nen Geschmack anzu­ord­nen. 

        Drag und Drop im Workspace 
        Eines mei­ner liebs­ten Fea­tures, dass in Sta­tis­ti­ca zu fin­den ist, sind die Workspaces. Sie sind eine Ober­flä­che, die es erlaubt per Drag and Drop ana­ly­ti­sche Pro­zes­se zu erstel­len und auf Knopf­druck ablau­fen zu las­sen. Man muss ein­fach nur Funk­tio­nen (sog. „Kno­ten“) aus­wäh­len, mit der Maus ver­bin­den, kon­fi­gu­rie­ren und dann „Run“ drü­cken. Der Pro­zess läuft dann spe­zi­fi­ka­ti­ons­ge­mäß ab und legt alle Ergeb­nis­se struk­tu­riert in Work­books ab. 

        Unse­re Kun­den, schät­zen die Workspaces sehr, weil wir Ana­ly­sen für sie vor­be­rei­ten kön­nen und das Prin­zip schnell visu­ell ver­stan­den wer­den kann. Die Workspace bil­den ihre eige­ne Doku­men­ta­ti­on und kön­nen immer wie­der benutzt wer­den, wenn sich die Daten geän­dert haben, ein­fach durch den Klick auf „Run“ (bzw. „Aus­füh­ren“) 

        Wich­ti­ger Hin­weis: Workspaces kön­nen in der  Dash­boar­ding-Soft­ware Spot­fi­re ein­ge­bun­den wer­den und dort kom­ple­xe ana­ly­ti­sche Pro­zes­se auto­ma­ti­siert im Hin­ter­grund bereit­stel­len. 

        Model­le und Erkennt­nis­se in den Pro­duk­tiv-Betrieb brin­gen 
        Unter­neh­men in Pro­duk­ti­on und Dienst­leis­tung ste­hen vor der­sel­ben Her­aus­for­de­rung: Erkennt­nis­se und Model­le aus den ana­ly­ti­schen Pro­zes­sen müs­sen in die pro­duk­ti­ven Pro­zes­se inte­griert wer­den. In Sta­tis­ti­ca ist dies auf ver­schie­de­ne Wei­sen mög­lich, so kön­nen prä­dik­ti­ve Model­le in einer Viel­zahl von Pro­gram­mier­spra­chen und in der Modelspra­che PMML expor­tiert wer­den: 

        Außer­dem kann man direkt in Daten­ban­ken schrei­ben oder R, Python, Sca­la, Visu­al Basic oder C# (oder eine Kom­bi­na­ti­on davon) benut­zen, um Ergeb­nis­se zu expor­tie­ren. 

        Data Science und Machi­ne Lear­ning 
        Für Data Sci­en­tists bie­tet Sta­tis­ti­ca eine rie­si­ge Men­ge von Funk­tio­nen in einer gemein­sa­men Umge­bung. Nicht nur klas­si­sche und ange­wand­te Sta­tis­tik, son­dern auch Metho­den, um gro­ße Daten­men­gen und kom­ple­xes­te Fra­ge­stel­lun­gen zu bear­bei­ten. Sta­tis­ti­ca bie­tet eine sehr umfang­rei­che Aus­wahl von Machi­ne Lear­ning Metho­den an: 

        Außer­dem bie­tet es Funk­tio­nen für die Ver­ar­bei­tung von Big Data an. Die Funk­tio­nen kön­nen durch R und Python noch erwei­tert wer­den und das auch im Workspace, was eine Ver­bin­dung die­ser Tools und ihre gemein­sa­me Ver­wen­dung im sel­ben Pro­zess mög­lich macht. 

        Com­pli­ance mit FDA Vor­ga­ben 
        Sta­tis­ti­ca kann “stand-alo­ne” als Desk­top-Appli­ka­ti­on mit all den oben genann­ten Funk­tio­nen beschrie­ben wer­den, oder man kann es in einer Cli­ent-Ser­ver-Archi­tek­tur betrei­ben. In die­sem Fall ver­wen­det man Sta­tis­ti­ca Ser­ver und die­ser erwei­tert die Fähig­kei­ten enorm. Es kön­nen hier nicht alle Fea­tures der Ser­ver Ver­si­on behan­delt wer­den, aber her­vor­zu­he­ben ist, dass Sta­tis­ti­ca Ser­ver die Grund­la­ge bil­det, um ein ana­ly­ti­sches Sys­tem auf­zu­bau­en, dass die Anfor­de­run­gen von FDA 21 CFR part 11 erfüllt. 

        Aus­ge­hend von mei­ner Erfah­rung, wür­de ich sagen, dass Sta­tis­ti­ca die voll­stän­digs­te ana­ly­ti­sche Soft­ware ist, die die­se Anfor­de­run­gen erfüllt (inkl. Daten­in­te­gri­tät), so dass sie bei­spiels­wei­se in der phar­ma­zeu­ti­schen Indus­trie ein­ge­setzt wer­den kann. 

        Fazit 
        Nach vie­len Jah­ren als pro­fes­sio­nel­ler Anwen­der von Mini­T­ab, hat mich der Wech­sel zu Sta­tis­ti­ca deut­lich wei­ter­ge­bracht und erlaubt mir, mehr in kür­ze­rer Zeit zu schaf­fen. Die Tran­si­ti­on war ver­gleichs­wei­se ein­fach und jede Funk­ti­on, die ich brau­che, ist in Sta­tis­ti­ca ver­füg­bar. Mei­ne per­sön­li­che Eva­lua­ti­on ent­hält die fol­gen­den Schluss­fol­ge­run­gen: 

            • Viel mehr Funk­tio­nen inklu­si­ve eines voll­stän­di­gen Sets von Machi­ne Lear­ning Metho­den.  

            • Workspaces sind ein groß­ar­ti­ges Werk­zeug, um Ana­ly­sen visu­ell auf­zu­bau­en und sie wie­der­holt ablau­fen zu las­sen.  

            • Pro­jek­te kön­nen ein­fa­cher und über­sicht­li­cher ver­wal­tet wer­den. 

            • Die Aus­wer­tung von Expe­ri­men­ten (in der Ver­suchs­pla­nung) ist eine ganz neue und reich­hal­ti­ge­re Erfah­rung. 

            • Qua­li­täts­re­gel­kar­ten und Pro­zess­fä­hig­keits­ana­ly­sen lei­den nicht mehr unter dem „Fluch der Nor­ma­li­tät“. 

            • Das Öko­sys­tem von TIBCO ist unver­gleich­lich: Es bie­tet Inte­gra­ti­ons­mög­lich­kei­ten und Erwei­te­run­gen, die eine gan­ze Enter­pri­se-Land­schaft abde­cken. 

            • Sta­tis­ti­ca ist ein Werk­zeug für Statistiker:innen und Data Sci­en­tists glei­cher­ma­ßen: End­lich eine Soft­ware, die den Anfor­de­run­gen die­ser Zeit genügt. 

          Statistica ist die ideale Lösung für alle, die mehr aus ihren Daten herausholen und eine echte Alternative zu MiniTab suchen. Egal ob für Statistik, Datenanalyse oder spezifische Anforderungen – wir stehen Ihnen als Partner zur Seite, um Ihre Prozesse zu optimieren und Sie auf dem Weg zu neuen Erfolgen zu begleiten.

          Kategorien
          Letzte News
          Ihr Ansprechpartner

          Wenn Sie Fra­gen zu unse­ren Pro­duk­ten haben oder Bera­tung benö­ti­gen, zögern Sie nicht, direkt Kon­takt zu uns auf­zu­neh­men.

          Tel.: +49 40 22 85 900-0
          E-Mail: info@statsoft.de

          Sasha Shiran­gi (Head of Sales)