zur Startseite Datenanalyse, Statistik, Data Mining, Qualitätssicherung und Six Sigma

Software & Dienstleistung
Startseite Produkte & Lösungen Services & Training Downloads Referenzen Events Unternehmen
Kontakt

STATISTICA Basis

STATISTICA Basis liefert einen umfassenden Satz grundlegender Statistiken und mächtiger Grafiken in einem anwenderfreundlichen Software-Paket. Es besitzt die Leistungsfähigkeit, Kraft und leichte Bedienbarkeit der STATISTICA-Technologie.

Video starten
  "Was ist STATISTICA?"

Damit Sie das Potenzial unserer Software voll ausschöpfen können, bieten wir regelmäßig Kurse in unseren Schulungsräumlichkeiten in Hamburg und Inhouse-Schulungen beim Kunden an (siehe Kursangebot).
  Firmen-Broschüre im PDF-Format

STATISTICA Basis bietet:


Bild

 Deskriptive Statistik, gegliederte Tabellen und explorative Datenanalyse

STATISTICA Basis bietet eine breite Auswahl an Verfahren für explorative Analysen:

Deskriptive Statistik und Grafiken.  Die Software berechnet sowohl alle allgemeinen deskriptiven Statistiken, wie Mediane (Zentralwerte), Mittelwerte, Modalwerte, Quartile, benutzerdefinierte Perzentile, Varianzen und Standardabweichungen, Quartilsabstände, Konfidenzintervalle für den Mittelwert, Schiefe und Exzess mit Standardfehlern, harmonische und geometrische Mittel als auch viele spezielle deskriptive Statistiken und Diagnose-Kenngrößen. Wie auch in allen anderen Modulen von STATISTICA unterstützt eine Vielzahl von Grafiken die explorativen Analysen. Dazu zählen verschiedene Typen von Box-Whisker-Plots, Histogramme, bivariate Histogramme (3D oder in Kategorien), 2D- und 3D-Scatterplots mit hervorgehobenen Teilmengen, gewöhnliche, einseitige und trendbereinigte Verteilungsplots, Q-Q-Plots, P-P-Plots usw. Die Güte der Anpassung der Normalverteilung an die Daten kann auf der Basis ausgewählter Tests überprüft werden (Kolmogorov-Smirnov-, Lilliefors- und Shapiro-Wilks-Test). Außer der Normalverteilung kann eine Vielzahl weiterer Verteilungen angepasst werden (siehe auch die Prozessanalyse in STATISTICA Industrie und Informationen zu Grafiken in STATISTICA).

Analysen nach Gruppen.  Deskriptive Statistiken und Grafiken lassen sich aus nach einer oder mehreren Gruppierungsvariablen gegliederten Daten erstellen. So kann der Benutzer mit einigen Mausklicks die Daten z.B. nach dem Geschlecht (Variable Gender) und dem Alter (Variable Age) seiner Probanden gruppieren, um Histogramme, Box-Whisker-Plots, Normalverteilungsplots, Scatterplots usw. in Kategorien erstellen zu lassen. Werden mehr als zwei kategoriale Variablen ausgewählt, können Stapel überlappender Fenster der jeweiligen Grafiken automatisch erstellt werden. Für die Gruppierung nach Werten stetiger Variablen stehen Optionen zur Verfügung, mit denen z.B. die Werte einer Variablen in eine vorgegebene Anzahl von Intervallen aufgeteilt werden. Alternativ dazu kann die Funktion zum Umkodieren eingesetzt werden, mit der der Benutzer präzise vorgegeben kann, wie die Variable umkodiert werden soll. Diese Anweisungen zum Umkodieren können beliebig komplex ausfallen und sich auf alle Variablen der Datendatei beziehen. Darüber hinaus gibt es eine spezielle hierarchische Breakdown-Prozedur, die es dem Benutzer gestattet, die Daten nach bis zu sechs kategorialen Variablen zu gliedern, um anschließend eine Vielzahl von Grafiken in Kategorien, deskriptive Statistiken und Korrelationsmatrizen für Untergruppen zu erstellen. Zahlreiche Optionen zur Formatierung und zum Anbringen von Labels ermöglichen es dem Benutzer, publikationsreife Tabellen und Berichte zu verfassen. In dieser Breakdown-Prozedur können Designs extremen Umfangs, z.B. 300 Gruppen für eine einzelne Gruppierungsvariable, spezifiziert werden. Die Ergebnisse beinhalten alle relevanten ANOVA-Statistiken, einschließlich der vollständigen ANOVA-Tabelle, dem Levene-Test auf Varianzhomogenität usw. Wie in allen anderen Modulen von STATISTICA werden die Berechnungen mit erweiterter Genauigkeit ("vierfacher" Genauigkeit, wenn verfügbar) durchgeführt. Aufgrund der interaktiven Struktur der Software gestaltet sich die Exploration der Daten sehr einfach. So können z.B. explorative Grafiken direkt aus den Tabellen mit den Ergebnissen erstellt werden, indem mit der Maus auf ausgewählte Zellen oder Bereiche von Zellen gezeigt wird. Mit einem einzelnen Mausklick können Stapel komplexer Grafiken erstellt werden, die anschließend durch Klicken auf die Schaltfläche Weiter Grafik für Grafik betrachtet werden können. Alle Gliederungen von Tabellen und Gruppierungen können vom Benutzer vordefiniert werden, um die Anzahl der notwendigen Mausklicks zu reduzieren. Alle explorativen grafischen Verfahren, sind in die statistischen Verfahren integriert, um die grafische Datenanalyse z.B. durch interaktive Ausreißer-Elimination, Auswahl von Teilmengen, Glättung, Funktionsanpassung, Brushing zu unterstützen. Siehe auch den Abschnitt über Blockstatistiken weiter unten.

nach oben

 Korrelationen

Ein umfassender Satz von Optionen steht für die Untersuchung der Korrelationen zwischen Variablen zur Verfügung. Zunächst können alle üblichen Assoziationsmaße, wie Pearsons r, Spearmans R, Kendalls Tau (b, c), Gamma, tetrachorisches r, Phi, Cramers V, Kontingenzkoeffizient C, Sommers d, Unsicherheitskoeffizienten, partielle und Part-Korrelationen, Autokorrelationen, verschiedene Distanzmaße usw. berechnet werden. Nichtlineare Regression, Regression für zensierte Daten und weitere Analysen zu Abhängigkeiten zwischen Variablen sind in den Modulen Allgemeine Lineare/Nichtlineare Regression, Survival- und Ausfallzeitenanalyse und weiteren Modulen der Höheren Modelle von STATISTICA Professionell verfügbar. Fehlende Werte können bei der Berechnung von Korrelationsmatrizen fallweise oder paarweise ausgeschlossen bzw. durch Mittelwerte ersetzt werden. Wie in allen anderen Modulen von STATISTICA werden die Berechnungen mit erweiterter Genauigkeit durchgeführt. Die Darstellung von Korrelationsmatrizen in Ergebnistabellen lässt sich über verschiedene Formatierungsoptionen (siehe unten) steuern. Für die Visualisierung der numerischen Ergebnisse steht eine leistungsfähige Funktionalität zur Verfügung. Zeigt der Benutzer auf einen bestimmten Korrelationskoeffizienten in der Ergebnistabelle, kann er aus einer Vielzahl von grafischen Darstellungen wählen (z.B. Scatterplots mit Konfidenzintervallen, verschiedene bivariate 3D-Histogramme, Verteilungsplots).

Brushing und Ausreißerdiagnose.  Die umfassenden Funktionen des Brushing ermöglichen es dem Benutzer, in Scatterplots einzelne Datenpunkte aus- bzw. abzuwählen, um deren Einfluss auf die Regressiongerade oder andere Regressionsfunktionen zu bewerten.

Anzeigeformate von Zahlen.  Für die Korrelationskoeffizienten werden eine Vielzahl von globalen Anzeigeformaten unterstützt. So können z.B. signifikante Korrelationskoeffizienten automatisch markiert werden; jede Zelle der Ergebnistabelle kann um die Anzeige von n und p erweitert werden; es können außerdem ausführliche Ergebnisse angefordert werden, die dann alle deskriptiven Statistiken (paarweise Mittelwerte und Standardabweichungen, Regressionskoeffizienten (B's), Regressionskonstanten ) enthalten. Wie auch bei allen anderen numerischen Ergebnissen steht für die in Ergebnistabellen angezeigten Korrelationsmatrizen eine Zoom-Option und eine interaktive Steuerung des Anzeigeformats zur Verfügung (z.B. von +,4 bis +,41358927645193). Große Matrizen können also entweder mit Hilfe der Zoom-Option oder über die einstellbare Spaltenbreite komprimiert dargestellt werden. Damit wird die Suche nach Koeffizienten, die eine vom Benutzer spezifizierte Größe oder ein gewähltes Signifikanzniveau überschreiten (die in der Ergebnistabelle rot markiert werden können), vereinfacht.

Scatterplot, Scatterplotmatrizen, gruppierte Analysen.  Wie in allen Ausgabedialogen stehen zahlreiche globale Grafik-Optionen zur Verfügung, mit denen die Beziehungen zwischen den Variablen weiter untersucht werden können. Dazu zählen z.B. 2D- und 3D-Scatterplots (mit oder ohne Labels), um Muster in den Beziehungen zwischen Untergruppen von Fällen oder mehreren Variablen zu identifizieren. Korrelationsmatrizen können nach Werten von Gruppierungsvariablen getrennt berechnet und anhand von Scatterplots in Kategorien visualisiert werden. Auch "gegliederte Tabellen von Korrelationsmatrizen" können generiert (eine Matrix pro Teilmenge der Daten) und in Schlangen von Ergebnistabellen angezeigt werden (die später als Eingabe im Modul Structural Equations Modeling and Path Analysis (SEPATH) der Höheren Modelle von STATISTICA Professionell eingesetzt werden kann). Eine vollständige Korrelationsmatrix kann in einer einzigen Scatterplotmatrix veranschaulicht werden. Große Scatterplotmatrizen können dann interaktiv durch Vergrößern der ausgewählten Teile der Grafik bzw. durch Durchblättern im Zoom-Modus betrachtet werden. Auch diese Scatterplotmatrizen können nach Gruppierungsvariablen gegliedert werden (ein Matrixplot für jede Teilmenge der Daten). Alternativ dazu kann eine Scatterplotmatrix für multiple Teilmengen der Daten erstellt werden, in der die jeweiligen Teilmengen, die z.B. durch Stufen einer Gruppierungsvariable oder Auswahlbedingungen beliebiger Komplexität definiert wurden, im Plot durch verschiedene Symbole charakterisiert sind. Verschiedene weitere grafische Methoden können zur Visualisierung von Matrizen von Korrelationen bei der Suche nach globalen Mustern (z.B. Konturenplots, ungeglättete Flächen, Icons ) eingesetzt werden. All diese Operationen erfordern nur wenige Mausklicks und können durch den Einsatz verschiedener Shortcuts weiter vereinfacht werden. Eine beliebige Anzahl von Ergebnistabellen und Grafiken können gleichzeitig auf dem Bildschirm dargestellt werden, wodurch interaktive explorative Analysen und Vergleiche sehr einfach durchzuführen sind.

nach oben

 Elementare Statistik aus Ergebnistabellen

STATISTICA ist ein integriertes Analysesystem, das alle numerischen Ergebnisse in Tabellen darstellt, die sich (ohne weitere Veränderungen) als Eingabe für nachfolgende Analysen eignen. Demzufolge lassen sich elementare Statistiken (oder jede andere statistische Analyse) für Ergebnistabellen vorangegangener Analysen berechnen. Sie können beispielsweise eine Tabelle mit Mittelwerten für 2000 Variablen erzeugen und letztere danach als Eingabedatei für die Analyse der Verteilung dieser Mittelwerte nutzen. Die Elementare Statistik sind also jederzeit im Verlauf Ihrer Analyse abrufbar und lässt sich auf jede Ergebnistabelle anwenden.

Blockstatistiken.  Zusätzlich zu diesen Funktionen für Einzeldaten werden Funktionalitäten zur Erstellung von Statistiken und statistischen Grafiken angeboten, die auf beliebig ausgewählten (markierten) Blöcken von Werten des aktuellen Datenblattes oder der Ergebnistabelle basieren. Wenn Sie z.B. eine Ergebnistabelle mit Lagemaßen für 2000 Variablen (z.B. mit Mittelwerten, Modalwerten, Medianen, geometrischen Mittelwerten und harmonischen Mittelwerten) erzeugt haben, können Sie beispielsweise einen Block von 200 Variablen samt Mittelwerten und Medianen markieren und durch eine einzige Operation eine multiple Liniengrafik mit diesen beiden Maßen für die Untergruppe von 200 Variablen generieren. Diese Ausgaben können auf Zeilen oder Spalten des aktuell markierten Blocks basieren. So können Sie beispielsweise für eine Untergruppe von Variablen einen multiplen Linienplot aus den unterschiedlichen Lagenmaßen erzeugen.

nach oben

 Interaktiver Wahrscheinlichkeitsrechner

Ein flexibler interaktiver Wahrscheinlichkeitsrechner ist über alle Symbolleisten zu erreichen. Er enthält eine umfangreiche Auswahl von Verteilungen, einschließlich Beta, Cauchy, Chi-Quadrat, Exponential, Extremwert, F, Gamma, Laplace, Lognormal, Logistische, Pareto, Rayleigh, t (Student), Weibull und Z (Normal). In den Eingabedialog sind kleine Grafiken der Dichte- und der Verteilungsfunktion integriert, die es dem Benutzer ermöglichen, die Eigenschaften dieser beiden Funktionen zu veranschaulichen. Dabei können Mikro-Rollbalken eingesetzt werden, um entweder die letzte Ziffer der Eingabe (LINKE Maustaste) oder die vorletzte Ziffer (RECHTE Maustaste) zu verändern. Darüber hinaus können Verbundgrafiken der Verteilungen erstellt werden, in denen die im Dialog eingegebenen Argumente verdeutlicht werden. Damit können Zusammenhänge zwischen Argumenten, Wahrscheinlichkeiten und Parametern der Verteilung interaktiv untersucht werden.

nach oben

 t-Tests (Tests auf Unterschiede zwischen Gruppen).

T-Tests können sowohl für abhängige als auch für unabhängige Stichproben durchgeführt werden. Außerdem kann Hotellings T² berechnet werden [siehe auch ANOVA/MANOVA und ALM (Allgemeines lineares Modell) in den Höheren Modellen von STATISTICA Professionell]. Flexible Optionen für Vergleiche zwischen Variablen (z.B. die Behandlung von Daten jeder einzelnen Spalte als eine separate Stichprobe) und kodierten Gruppen (z.B. falls die Daten eine kategoriale Variable wie Geschlecht zum Identifizieren der Gruppenzugehörigkeit eines jeden Falles enthalten) werden bereitgestellt. Im Ergebnisdialog stehen vielfältige Optionen für Diagnose-Kenngrößen und Grafiken zur Verfügung. Beim t-Test für unabhängige Stichproben betrifft das beispielsweise Optionen für die Durchführung des Tests mit getrennten Varianzschätzungen, den Levene-Test auf Varianzhomogenität, verschiedene Box-Whisker-Plots, Histogramme, Verteilungsplots und Scatterplots in Kategorien und weitere. Weitere speziellere Tests auf Unterschiede zwischen Gruppen sind Bestandteil anderer Module (z.B. Nichtparametrische Verfahren (unten), Survival- und Ausfallzeitenanalyse (in den Höheren Modellen von STATISTICA Professionell), Reliability/Item Analyse (in den Explorativen Verfahren von STATISTICA Professionell).

nach oben

 Analyse von Mehrfachantworten

Für die Tabellierung von stetigen, kategorialen und Mehrfachantworten-Variablen stehen leistungsfähige Prozeduren zur Verfügung. Das Layout und die Formatierung der Tabellen kann über eine Vielzahl von Optionen gesteuert werden. So können z.B. für Tabellen, die Mehrfachantworten-Variablen (mehrfache Kategorien und Dichotomien) enthalten, Randhäufigkeiten und Anteile basierend auf der Anzahl der Antworten oder Antwortenden bestimmt werden; Mehrfachantworten-Variablen können paarweise verarbeitet werden, wobei verschiedene Optionen für die Behandlung fehlender Daten (Missing Data) zur Auswahl stehen. Außerdem können Häufigkeitstabellen basierend auf benutzerdefinierten, logischen Auswahlbedingungen beliebiger Komplexität, die Fällen Kategorien zuordnen, erstellt werden. Alle Tabellen können nachbearbeitet werden, um publikationsreife Berichte zu produzieren. So können z.B. zusammenfassende "Mehrfach-Tabellen" im Breakdown-Stil oder mit hierarchischer Anordnung der Faktoren erstellt werden; Kontingenztabellen können Zeilen-, Spalten- oder Gesamtprozente in jeder Zelle ausgeben; es können lange Wertelabels zur Beschreibung der Kategorien verwendet werden; Häufigkeiten, die einen festgelegten Schwellenwert überschreiten, können in der Tabelle hervorgehoben werden usw. Die Software ist in der Lage, kumulierte oder relative Häufigkeiten, Logit- und Probit-transformierte Häufigkeiten, erwartete Häufigkeiten bei Normalverteilung (sowie Kolmogorov-Smirnov-, Lilliefors- und Shapiro-Wilks-Test), erwartete und Residual-Häufigkeiten in Kontingenztabellen zu berechnen usw. In Kontingenztabellen stehen folgende statistische Tests zur Verfügung: Pearsons, Maximum-Likelihood und Yates-korrigierte Chi-Quadrate, McNemars Chi-Quadrat, der exakte Test von Fisher (ein- und zweiseitig), Phi und das tetrachorische r; zusätzliche Statistiken beinhalten Kendalls Tau (a, b), Gamma, Spearmans R, Sommers D, Unsicherheitskoeffizienten usw.

Grafiken.  Unter den grafischen Optionen finden sich einfache, mehrfache (in Kategorien) und 3D-Histogramme, Histogramme für beliebige Schnitte durch die "Schichten" der mehrdimensionalen Kontingenztabellen und viele weitere Grafiken einschließlich eines einzigartigen "Interaktionsplots für Häufigkeiten", der die Häufigkeiten für komplexe Kontingenztabellen zusammenfasst und mit einem Plot der Mittelwerte in der ANOVA zu vergleichen ist. Stapel komplexer Grafiken (z.B. für mehrfache Kategorien) können interaktiv ausgewertet werden. Siehe auch den Absatz über Blockstatistiken (oben) und die Absätze über Log-lineare Analyse (in den Höheren Modellen von STATISTICA Professionell) und Korrespondenzanalyse (in den Explorativen Verfahren von STATISTICA Professionell).

nach oben

 Verfahren der Multiplen Regression

Das Modul Multiple Regression stellt eine umfassende Implementation von Verfahren der linearen und quasilinearen Regression dar, in das einfache, multiple, schrittweise (vorwärts, rückwärts, in Blöcken), hierarchische, quasilineare (einschließlich polynomiale, exponentielle, logarithmische ) Modelle, Modelle mit und ohne Konstante, Verfahren der Ridge-Regression und Verfahren für gewichtete kleinste Quadrate integriert sind. Weitere höhere Verfahren werden im Modul Allgemeine Regressionsodelle angeboten (z.B. Beste-Subset-Regression, multivariate schrittweise Regression für multiple abhängige Variablen, für Modelle mit Wirkungen kategorialer Faktoren; statistische Ergebnisse für Validierungs- und Analyse-Stichproben, benutzerdefinierte Hypothesen, usw.). Die Software berechnet einen umfassenden Satz von Statistiken und erweiterten Diagnose-Kenngrößen, einschließlich der vollständigen Regressionstabelle (mit Standardfehlern für B, Beta und Konstante, R² und korrigiertes R² und ANOVA-Tabelle), Matrizen von partiellen und Part-Korrelationskoeffizienten, Korrelationen und Kovarianzen für die Regressionskoeffizienten, die Sweep-Matrix (inverse Matrix), die Durbin-Watson-Statistik, Mahalanobis- und Cooks-Distanzen, Residuen für gelöschte Beobachtungen, Konfidenzintervalle für Prognosewerte und viele weitere.

Prognosewerte und Residuen.  Für die Residuen- und Ausreißer-Analyse steht eine große Auswahl von Plots zur Verfügung, die u.a. eine Vielzahl von Scatterplots, Histogramme, einfache, einseitige und trendbereinigte Normalverteilungsplots, Plots partieller Korrelationen, verschiedene fallweise Residuen- und Ausreißerplots enthalten. Die Scores für einzelne Fälle können anhand explorativer Iconplots und anderer mehrdimensionaler Grafiken visualisiert werden, die direkt in die Ergebnistabelle der Ergebnisse integriert sind. Residuen und Prognosewerte können der aktuellen Datendatei automatisch angefügt werden. Ein Prognoseverfahren erlaubt es dem Benutzer, Was-wäre-wenn-Analysen durchzuführen, wobei die Prognosewerte basierend auf benutzerspezifizierten Werten der unabhängigen Variablen interaktiv berechnet werden können.

Gruppierte Analysen; verwandte Verfahren.  Designs extremen Umfangs, d.h. 500 Variablen oder mehr lassen sich analysieren. Eine Option zur multiplen Regressionsanalyse für gruppierte Daten wird ebenfalls bereitgestellt (multiple Regression nach Gruppen). Ein Add-On von zusätzlichen Verfahren enthält eine Regressionsprozedur, die sowohl Modelle mit Tausenden von Variablen und zweistufige Kleinste-Quadrate-Regression als auch Box-Cox- und Box-Tidwell-Transformationen mit Grafiken unterstützt. Die Höheren Modellen von STATISTICA Professionell enthalten auch Module zur Schätzung allgemeiner nichtlinearer Ansätze (Nichtlineare Regression, Verallgemeinertes Lineares Modell (VLM), Verallgemeinertes Additives Modell (VAM), Partielle Kleinste Quadrate (PKQ)) , in dem die Parameter jedes benutzerdefinierten, nichtlinearen Modells geschätzt werden können. In diesem Modul ist eine Auswahl vordefinierter Modelle, einschließlich Logit, Probit und anderen enthalten. Die Höheren Modelle von STATISTICA Professionell bieten mit SEPATH, das der allgemeinen Modellierung von Strukturgleichungen und der Pfadanalyse gewidmet ist, die Möglichkeit, Korrelations-, Kovarianz- oder Momentmatrizen extremer Größe zu analysieren.

nach oben

 Nichtparametrische Verfahren

Das Modul Nichtparametrische Verfahren stellt eine umfassende Auswahl zur deskriptiven und schließenden Statistik einschließlich der gebräuchlichen Tests und einiger spezieller Verfahren bereit. Im einzelnen sind folgende Tests vorhanden: Wald-Wolfowitz' Runs-Test, Mann-Whitneys U-Test (mit exakten Wahrscheinlichkeiten anstelle der Z-Approximation für kleine Stichproben), Kolmogorov-Smirnov-Tests, Wilcoxon-Test für verbundene Stichproben, Kruskal-Wallis Rang-Varianzanalyse, Median-Test, Vorzeichentest, Friedmans Rang-Varianzanalyse, Cochrans Q-Test, McNemar-Test, Kendalls Konkordanzkoeffizient, Kendalls Tau (b, c), Spearmans R, Fishers exakter Test, Chi-Quadrat-Tests, V-Quadrat-Statistik, Phi, Gamma, Sommers d, Kontingenzkoeffizienten und weitere. (Spezielle nichtparametrische Tests und Statistiken sind auch Teil weiterer Module, z.B. Survival- und Ausfallzeitenanalyse, Prozessanalyse und andere.) Alle auf Rängen basierenden Tests verwenden Korrekturen für kleine Stichprobenumfänge oder verbundene Ränge. Wie in allen anderen Modulen von STATISTICA sind bei allen Tests entsprechende Grafiken integriert, z.B. verschiedene Scatterplots, spezielle Box-Whisker-Plots, Linienplots, Histogramme und viele weitere 2D- und 3D-Darstellungen.

nach oben

 ANOVA / MANOVA

Das Modul ANOVA / MANOVA ist eine Untermenge des Moduls Allgemine Lineare Modelle (ALM) und kann univariate und multivariate Varianzanalysen für faktorielle Designs mit oder ohne einen Messwiederholungsfaktor ausführen. Das Modul Allgemeine Lineare Modelle (ALM) ermöglicht die Spezifikation linearer Modelle mit kategorialen und/oder stetiger Prädiktorvariablen, Zufallseffekten und mehreren Messwiederholungsfaktoren (schrittweise und Beste-Subset-Optionen werden im Modul Allgemeine Regressionsmodelle (ARM) angeboten).

Benutzeroberflächen.  Sie können alle Designs auf einfachste Weise beschreiben, indem Sie das Design in Abhängigkeit von den aktuellen Variablen und deren Stufen spezifizieren, und nicht auf technischem Weg, z.B. durch Spezifizieren von Matrizen mit Codes von Dummy-Variablen. Dadurch sind auch weniger erfahrene Benutzer in der Lage, selbst komplexe Designs mit Hilfe von STATISTICA. ANOVA / MANOVA bietet ebenso wie das Modul Allgemeine Lineare Modelle (ALM) drei alternative Benutzeroberflächen zum Spezifizieren der Designs:
(1) einen Assistenten, der Sie Schritt für Schritt durch den Prozess der Designspezifikation führt,
(2) eine dialogorientierte Benutzeroberfläche zur Auswahl von Variablen, Codes, Faktorstufen und Designoptionen, sowie
(3) einen Editor zur Designspezifikation über Schlüsselwörter auf der Grundlage einer allgemeinen Designsyntax.

Berechnungsverfahren.  Per Voreinstellung verwendet das Programm die sigmabeschränkte Parametrisierung für faktorielle Designs und den Ansatz der effektiven Hypothese (siehe Hocking, 1981), Wenn das Design unbalanciert oder unvollständig ist, lassen sich auch Typ I-, II-, III- und IV-Hypothesen berechnen, ebenso wie Typ V- und Typ VI-Hypothesen zum Testen der üblichen Analysen fraktioneller faktorieller Designs für industrielle und qualitätsverbessernde Anwendungen (siehe auch die Beschreibung im Modul Versuchsplanung).

Ergebnisse.  Das Modul ANOVA / MANOVA ist in seinen Berechnungsverfahren und Ergebnisausgaben sehr weitreichend, so dass die gesamte Bandbreite analytischer Verfahren der Allgemeinen Linearen Modelle verfügbar ist (zu weiteren Einzelheiten siehe die Beschreibung von Allgemeine Lineare Modelle). Die Ergebnisse umfassen ANOVA-Tabellen, univariate und multivariate Ergebnisse für Messwiederholungsfaktoren mit mehr als zwei Stufen, Korrekturen nach Greenhouse-Geisser und Huynh-Feldt, Interaktionsplots, detaillierte deskriptive Statistiken, detaillierte Residualstatistiken, geplante Vergleiche und Post-hoc-Tests, Tests für benutzerdefinierte Hypothesen und benutzerdefinierte Fehlerterme, detaillierte Diagnosestatistiken und -plots (z.B. ein Histogramm von Innerzellenresiduen, Tests auf Varianzhomogenität, Plots von Mittelwert gegen Standardabweichungen).

nach oben

 Verteilungsanpassung

Die Optionen zur Verteilungsanpassung ermöglichen den Vergleich der (empirischen) Verteilung einer Variablen mit einer großen Zahl von theoretischen Verteilungen. Für die Anpassung an die Daten stehen Normal-, Rechteck-, Exponential-, Gamma-, Lognormal-, Chi-Quadrat-, Weibull-, Gompertz-, Binomial-, Poisson-, Geometrische und Bernoulli-Verteilung zur Wahl. Die Güte der Anpassung kann mittels des Chi-Quadrat-Tests oder des Kolmogorov-Smirnov-Einstichprobentests bewertet werden. Auch der Lilliefors- und Shapiro-Wilks-Test sind implementiert (siehe oben). Die Anpassungsgüte einer bestimmten, hypothetischen Verteilung an die empirische Verteilung kann zusätzlich anhand von gewöhnlichen und kumulierten Histogrammen mit darübergelegten, entsprechend ausgewählten Funktionen (Dichten, Verteilungsfunktionen) bzw. Linien- und Balkengrafiken für die erwarteten und beobachteten Häufigkeiten bewertet werden. Weitere Optionen zur Verteilungsanpassung sind im Modul Prozessanalyse von STATISTICA Industrie verfügbar, in dem Maximum-Likelihood-Schätzungen der Parameter für Beta-, Exponential-, Extremwert- (Typ I, Gumbel), Gamma-, Lognormal-, Rayleigh- und Weibull-Verteilung berechnet werden können. In diesem Modul stehen außerdem sowohl Optionen zur automatischen Anpassung, d.h. der automatischen Wahl der an die Daten "bestangepassten" Verteilung, als auch Optionen zur allgemeinen Verteilungsanpassung anhand der ersten vier Momente (über Johnson- und Pearson-Kurven) zur Verfügung. In den Grafiken können auch benutzerdefinierte 2- und 3-dimensionale Funktionen dargestellt und "über die Grafiken gelegt" werden. Bei der Definition dieser Funktionen kann auf eine Vielzahl von Verteilungen direkt Bezug genommen werden. Dazu gehören Beta-, Binomial-, Cauchy-, Chi-Quadrat-, Exponential-, Extremwert-, F-, Gamma-, Geometrische, Laplace-, Logistische, Normal-, Lognormal-, Pareto-, Poisson-, Rayleigh-, Students t- sowie Weibull-Verteilung (Dichte- bzw. Wahrscheinlichkeitsfunktion, Verteilungsfunktion und deren Inverse). Unter dem Thema Nichtlineare Regression (in den Höheren Modellen von STATISTICA Professionell) zusätzliche Möglichkeiten zur Anpassung vor- oder benutzerdefinierter Funktionen beschrieben.

zur Startseite nach oben