STATISTICA Basis
STATISTICA Basis liefert einen umfassenden Satz grundlegender Statistiken und mächtiger Grafiken in einem anwenderfreundlichen Software-Paket. Es besitzt die Leistungsfähigkeit, Kraft und leichte Bedienbarkeit der
STATISTICA-Technologie.
Damit Sie das Potenzial unserer Software voll ausschöpfen können, bieten wir regelmäßig Kurse in unseren Schulungsräumlichkeiten in Hamburg und Inhouse-Schulungen beim Kunden an (siehe Kursangebot).
STATISTICA Basis bietet:
STATISTICA Basis bietet
eine breite Auswahl an Verfahren für explorative Analysen:
Deskriptive Statistik und Grafiken. Die Software berechnet
sowohl alle allgemeinen deskriptiven Statistiken, wie Mediane
(Zentralwerte), Mittelwerte, Modalwerte, Quartile, benutzerdefinierte
Perzentile, Varianzen und Standardabweichungen, Quartilsabstände,
Konfidenzintervalle für den Mittelwert, Schiefe und Exzess mit
Standardfehlern, harmonische und geometrische Mittel als auch viele
spezielle deskriptive Statistiken und Diagnose-Kenngrößen. Wie
auch in allen anderen Modulen von
STATISTICA unterstützt eine
Vielzahl von Grafiken die explorativen Analysen. Dazu zählen
verschiedene Typen von Box-Whisker-Plots, Histogramme, bivariate
Histogramme (3D oder in Kategorien), 2D- und 3D-Scatterplots mit
hervorgehobenen Teilmengen, gewöhnliche, einseitige und
trendbereinigte Verteilungsplots,
Q-Q-Plots,
P-P-Plots
usw. Die Güte der Anpassung der Normalverteilung an die Daten kann
auf der Basis ausgewählter Tests überprüft werden
(Kolmogorov-Smirnov-, Lilliefors- und Shapiro-Wilks-Test). Außer der
Normalverteilung kann eine Vielzahl weiterer Verteilungen angepasst werden
(siehe auch die
Prozessanalyse
in
STATISTICA Industrie und Informationen zu
Grafiken in STATISTICA).
Analysen nach Gruppen. Deskriptive Statistiken und Grafiken
lassen sich aus nach einer oder mehreren Gruppierungsvariablen
gegliederten Daten erstellen. So kann der Benutzer mit einigen Mausklicks
die Daten z.B. nach dem Geschlecht (Variable Gender) und dem Alter
(Variable Age) seiner Probanden gruppieren, um Histogramme,
Box-Whisker-Plots, Normalverteilungsplots, Scatterplots usw. in Kategorien
erstellen zu lassen. Werden mehr als zwei kategoriale Variablen ausgewählt,
können Stapel überlappender Fenster der jeweiligen Grafiken
automatisch erstellt werden. Für die Gruppierung nach Werten stetiger
Variablen stehen Optionen zur Verfügung, mit denen z.B. die Werte
einer Variablen in eine vorgegebene Anzahl von Intervallen aufgeteilt
werden. Alternativ dazu kann die Funktion zum Umkodieren eingesetzt
werden, mit der der Benutzer präzise vorgegeben kann, wie die
Variable umkodiert werden soll. Diese Anweisungen zum Umkodieren können
beliebig komplex ausfallen und sich auf alle Variablen der Datendatei
beziehen. Darüber hinaus gibt es eine spezielle hierarchische
Breakdown-Prozedur, die es dem Benutzer gestattet, die Daten nach bis zu
sechs kategorialen Variablen zu gliedern, um anschließend eine
Vielzahl von Grafiken in Kategorien, deskriptive Statistiken und
Korrelationsmatrizen für Untergruppen zu erstellen.
Zahlreiche Optionen zur Formatierung und zum Anbringen von Labels ermöglichen
es dem Benutzer, publikationsreife Tabellen und Berichte zu verfassen. In
dieser Breakdown-Prozedur können Designs extremen Umfangs, z.B. 300
Gruppen für eine einzelne Gruppierungsvariable, spezifiziert werden.
Die Ergebnisse beinhalten alle relevanten ANOVA-Statistiken, einschließlich
der vollständigen ANOVA-Tabelle, dem Levene-Test auf Varianzhomogenität
usw. Wie in allen anderen Modulen von STATISTICA werden die
Berechnungen mit erweiterter Genauigkeit ("vierfacher"
Genauigkeit, wenn verfügbar) durchgeführt. Aufgrund der
interaktiven Struktur der Software gestaltet sich die Exploration der
Daten sehr einfach. So können z.B. explorative Grafiken direkt aus
den Tabellen mit den Ergebnissen erstellt werden, indem mit der Maus auf
ausgewählte Zellen oder Bereiche von Zellen gezeigt wird. Mit einem
einzelnen Mausklick können Stapel komplexer Grafiken erstellt werden,
die anschließend durch Klicken auf die Schaltfläche Weiter
Grafik für Grafik betrachtet werden können. Alle Gliederungen
von Tabellen und Gruppierungen können vom Benutzer vordefiniert
werden, um die Anzahl der notwendigen Mausklicks zu reduzieren. Alle
explorativen grafischen Verfahren, sind in die
statistischen Verfahren integriert, um die grafische Datenanalyse z.B.
durch interaktive Ausreißer-Elimination, Auswahl von Teilmengen, Glättung,
Funktionsanpassung, Brushing zu unterstützen. Siehe auch den
Abschnitt über Blockstatistiken weiter
unten.
 |
Ein umfassender Satz von Optionen steht für
die Untersuchung der Korrelationen zwischen Variablen zur Verfügung.
Zunächst können alle üblichen Assoziationsmaße, wie
Pearsons
r, Spearmans
R, Kendalls
Tau (b, c),
Gamma,
tetrachorisches
r,
Phi, Cramers
V,
Kontingenzkoeffizient
C, Sommers
d,
Unsicherheitskoeffizienten, partielle und Part-Korrelationen,
Autokorrelationen, verschiedene Distanzmaße usw. berechnet werden.
Nichtlineare Regression, Regression für zensierte Daten und weitere
Analysen zu Abhängigkeiten zwischen Variablen sind in den Modulen
Allgemeine
Lineare/Nichtlineare Regression,
Survival- und
Ausfallzeitenanalyse und weiteren Modulen der
Höheren Modelle
von
STATISTICA Professionell
verfügbar. Fehlende Werte können bei der Berechnung von
Korrelationsmatrizen fallweise oder paarweise ausgeschlossen bzw. durch
Mittelwerte ersetzt werden. Wie in allen anderen Modulen von
STATISTICA
werden die Berechnungen mit erweiterter Genauigkeit durchgeführt. Die
Darstellung von Korrelationsmatrizen in Ergebnistabellen lässt sich über
verschiedene Formatierungsoptionen (siehe unten) steuern. Für die
Visualisierung der numerischen Ergebnisse steht eine leistungsfähige
Funktionalität zur Verfügung. Zeigt der Benutzer auf einen
bestimmten Korrelationskoeffizienten in der Ergebnistabelle, kann er aus
einer Vielzahl von grafischen Darstellungen wählen (z.B. Scatterplots
mit Konfidenzintervallen, verschiedene bivariate 3D-Histogramme,
Verteilungsplots).
Brushing und Ausreißerdiagnose. Die umfassenden Funktionen
des
Brushing ermöglichen es dem Benutzer, in Scatterplots
einzelne Datenpunkte aus- bzw. abzuwählen, um deren Einfluss auf die
Regressiongerade oder andere Regressionsfunktionen zu bewerten.
Anzeigeformate von Zahlen. Für die
Korrelationskoeffizienten werden eine Vielzahl von globalen
Anzeigeformaten unterstützt. So können z.B. signifikante
Korrelationskoeffizienten automatisch markiert werden; jede Zelle der
Ergebnistabelle kann um die Anzeige von n und p erweitert
werden; es können außerdem ausführliche Ergebnisse
angefordert werden, die dann alle deskriptiven Statistiken (paarweise
Mittelwerte und Standardabweichungen, Regressionskoeffizienten (B's),
Regressionskonstanten ) enthalten. Wie auch bei allen anderen numerischen
Ergebnissen steht für die in Ergebnistabellen angezeigten
Korrelationsmatrizen eine Zoom-Option und eine interaktive Steuerung des
Anzeigeformats zur Verfügung (z.B. von +,4 bis
+,41358927645193). Große Matrizen können also entweder mit
Hilfe der Zoom-Option oder über die einstellbare Spaltenbreite
komprimiert dargestellt werden. Damit wird die Suche nach Koeffizienten,
die eine vom Benutzer spezifizierte Größe oder ein gewähltes
Signifikanzniveau überschreiten (die in der Ergebnistabelle rot
markiert werden können), vereinfacht.
Scatterplot, Scatterplotmatrizen, gruppierte Analysen. Wie in
allen Ausgabedialogen stehen zahlreiche globale Grafik-Optionen zur Verfügung,
mit denen die Beziehungen zwischen den Variablen weiter untersucht werden
können. Dazu zählen z.B. 2D- und 3D-Scatterplots (mit oder ohne
Labels), um Muster in den Beziehungen zwischen Untergruppen von Fällen
oder mehreren Variablen zu identifizieren. Korrelationsmatrizen können
nach Werten von Gruppierungsvariablen getrennt berechnet und anhand von
Scatterplots in Kategorien visualisiert werden. Auch "gegliederte
Tabellen von Korrelationsmatrizen" können generiert (eine Matrix
pro Teilmenge der Daten) und in Schlangen von Ergebnistabellen angezeigt
werden (die später als Eingabe im Modul
Structural Equations
Modeling and Path Analysis (SEPATH) der
Höheren Modelle
von STATISTICA Professionell eingesetzt werden kann). Eine vollständige Korrelationsmatrix
kann in einer einzigen Scatterplotmatrix veranschaulicht werden. Große
Scatterplotmatrizen können dann interaktiv durch Vergrößern
der ausgewählten Teile der Grafik bzw. durch Durchblättern im
Zoom-Modus betrachtet werden. Auch diese Scatterplotmatrizen können
nach Gruppierungsvariablen gegliedert werden (ein Matrixplot für jede
Teilmenge der Daten). Alternativ dazu kann eine Scatterplotmatrix für
multiple Teilmengen der Daten erstellt werden, in der die jeweiligen
Teilmengen, die z.B. durch Stufen einer Gruppierungsvariable oder
Auswahlbedingungen beliebiger Komplexität definiert wurden, im Plot
durch verschiedene Symbole charakterisiert sind. Verschiedene weitere
grafische Methoden können zur Visualisierung von Matrizen von
Korrelationen bei der Suche nach globalen Mustern (z.B. Konturenplots,
ungeglättete Flächen, Icons ) eingesetzt werden. All diese
Operationen erfordern nur wenige Mausklicks und können durch den
Einsatz verschiedener Shortcuts weiter vereinfacht werden. Eine beliebige
Anzahl von Ergebnistabellen und Grafiken können gleichzeitig auf dem
Bildschirm dargestellt werden, wodurch interaktive explorative Analysen
und Vergleiche sehr einfach durchzuführen sind.
 |
STATISTICA ist ein integriertes Analysesystem, das alle
numerischen Ergebnisse in Tabellen darstellt, die sich (ohne weitere Veränderungen)
als Eingabe für nachfolgende Analysen eignen. Demzufolge lassen sich
elementare Statistiken (oder jede andere statistische Analyse) für
Ergebnistabellen vorangegangener Analysen berechnen. Sie können
beispielsweise eine Tabelle mit Mittelwerten für 2000 Variablen
erzeugen und letztere danach als Eingabedatei für die Analyse der
Verteilung dieser Mittelwerte nutzen. Die Elementare Statistik sind also
jederzeit im Verlauf Ihrer Analyse abrufbar und lässt sich auf jede
Ergebnistabelle anwenden.
Blockstatistiken. Zusätzlich zu
diesen Funktionen für Einzeldaten werden Funktionalitäten zur
Erstellung von Statistiken und statistischen Grafiken angeboten, die auf
beliebig ausgewählten (markierten) Blöcken von Werten des
aktuellen Datenblattes oder der Ergebnistabelle basieren. Wenn Sie z.B.
eine Ergebnistabelle mit Lagemaßen für 2000 Variablen (z.B. mit
Mittelwerten, Modalwerten, Medianen, geometrischen Mittelwerten und
harmonischen Mittelwerten) erzeugt haben, können Sie beispielsweise
einen Block von 200 Variablen samt Mittelwerten und Medianen markieren und
durch eine einzige Operation eine multiple Liniengrafik mit diesen beiden
Maßen für die Untergruppe von 200 Variablen generieren. Diese
Ausgaben können auf Zeilen oder Spalten des aktuell
markierten Blocks basieren. So können Sie beispielsweise für
eine Untergruppe von Variablen einen multiplen Linienplot aus den
unterschiedlichen Lagenmaßen erzeugen.
 |
Ein flexibler
interaktiver Wahrscheinlichkeitsrechner ist über alle Symbolleisten
zu erreichen. Er enthält eine umfangreiche Auswahl von Verteilungen,
einschließlich
Beta, Cauchy, Chi-Quadrat, Exponential,
Extremwert, F, Gamma, Laplace, Lognormal, Logistische, Pareto, Rayleigh, t
(Student), Weibull und
Z (Normal). In den Eingabedialog sind
kleine Grafiken der Dichte- und der Verteilungsfunktion integriert, die es
dem Benutzer ermöglichen, die Eigenschaften dieser beiden Funktionen
zu veranschaulichen. Dabei können Mikro-Rollbalken eingesetzt werden,
um entweder die letzte Ziffer der Eingabe (LINKE Maustaste) oder die
vorletzte Ziffer (RECHTE Maustaste) zu verändern. Darüber hinaus
können Verbundgrafiken der Verteilungen erstellt werden, in denen die
im Dialog eingegebenen Argumente verdeutlicht werden. Damit können
Zusammenhänge zwischen Argumenten, Wahrscheinlichkeiten und
Parametern der Verteilung interaktiv untersucht werden.
T-Tests
können sowohl für abhängige als auch für unabhängige
Stichproben durchgeführt werden. Außerdem kann Hotellings
T²
berechnet werden [siehe auch
ANOVA/MANOVA
und
ALM (Allgemeines lineares
Modell) in den
Höheren Modellen
von
STATISTICA Professionell]. Flexible Optionen für Vergleiche zwischen
Variablen (z.B. die Behandlung von Daten jeder einzelnen Spalte als eine
separate Stichprobe) und kodierten Gruppen (z.B. falls die Daten eine
kategoriale Variable wie Geschlecht zum Identifizieren der Gruppenzugehörigkeit
eines jeden Falles enthalten) werden bereitgestellt. Im Ergebnisdialog
stehen vielfältige Optionen für Diagnose-Kenngrößen
und Grafiken zur Verfügung. Beim
t-Test für unabhängige
Stichproben betrifft das beispielsweise Optionen für die Durchführung
des Tests mit getrennten Varianzschätzungen, den Levene-Test auf
Varianzhomogenität, verschiedene Box-Whisker-Plots, Histogramme,
Verteilungsplots und Scatterplots in Kategorien und weitere. Weitere
speziellere Tests auf Unterschiede zwischen Gruppen sind Bestandteil
anderer Module (z.B.
Nichtparametrische
Verfahren (unten),
Survival-
und Ausfallzeitenanalyse (in den
Höheren Modellen
von
STATISTICA Professionell),
Reliability/Item
Analyse (in den
Explorativen Verfahren von
STATISTICA Professionell).
Für die Tabellierung von stetigen, kategorialen und
Mehrfachantworten-Variablen stehen leistungsfähige Prozeduren zur
Verfügung. Das Layout und die Formatierung der Tabellen kann über
eine Vielzahl von Optionen gesteuert werden. So können z.B. für
Tabellen, die Mehrfachantworten-Variablen (mehrfache Kategorien und
Dichotomien) enthalten, Randhäufigkeiten und Anteile basierend auf
der Anzahl der Antworten oder Antwortenden bestimmt werden;
Mehrfachantworten-Variablen können paarweise verarbeitet werden,
wobei verschiedene Optionen für die Behandlung fehlender Daten (
Missing
Data) zur Auswahl stehen. Außerdem können Häufigkeitstabellen
basierend auf benutzerdefinierten, logischen Auswahlbedingungen beliebiger
Komplexität, die Fällen Kategorien zuordnen, erstellt werden.
Alle Tabellen können nachbearbeitet werden, um publikationsreife
Berichte zu produzieren. So können z.B. zusammenfassende "Mehrfach-Tabellen"
im Breakdown-Stil oder mit hierarchischer Anordnung der Faktoren erstellt
werden; Kontingenztabellen können Zeilen-, Spalten- oder
Gesamtprozente in jeder Zelle ausgeben; es können lange Wertelabels
zur Beschreibung der Kategorien verwendet werden; Häufigkeiten, die
einen festgelegten Schwellenwert überschreiten, können in der
Tabelle hervorgehoben werden usw. Die Software ist in der Lage, kumulierte
oder relative Häufigkeiten, Logit- und Probit-transformierte Häufigkeiten,
erwartete Häufigkeiten bei Normalverteilung (sowie
Kolmogorov-Smirnov-, Lilliefors- und Shapiro-Wilks-Test), erwartete und
Residual-Häufigkeiten in Kontingenztabellen zu berechnen usw. In
Kontingenztabellen stehen folgende statistische Tests zur Verfügung:
Pearsons, Maximum-Likelihood und Yates-korrigierte
Chi-Quadrate,
McNemars
Chi-Quadrat, der exakte Test von Fisher (ein- und
zweiseitig),
Phi und das tetrachorische
r; zusätzliche
Statistiken beinhalten Kendalls
Tau (a, b), Gamma, Spearmans
R,
Sommers
D, Unsicherheitskoeffizienten usw.
Grafiken. Unter den grafischen Optionen finden sich einfache,
mehrfache (in Kategorien) und 3D-Histogramme, Histogramme für
beliebige Schnitte durch die "Schichten" der mehrdimensionalen
Kontingenztabellen und viele weitere Grafiken einschließlich eines
einzigartigen "Interaktionsplots für Häufigkeiten",
der die Häufigkeiten für komplexe Kontingenztabellen
zusammenfasst und mit einem Plot der Mittelwerte in der
ANOVA zu
vergleichen ist. Stapel komplexer Grafiken (z.B. für mehrfache
Kategorien) können interaktiv ausgewertet werden. Siehe auch den
Absatz über
Blockstatistiken
(oben) und die Absätze über
Log-lineare
Analyse (in den
Höheren Modellen
von
STATISTICA Professionell) und
Korrespondenzanalyse
(in den
Explorativen Verfahren von
STATISTICA Professionell).
Das
Modul
Multiple Regression stellt eine umfassende Implementation
von Verfahren der linearen und quasilinearen Regression dar, in das
einfache, multiple, schrittweise (vorwärts, rückwärts, in
Blöcken), hierarchische, quasilineare (einschließlich
polynomiale, exponentielle, logarithmische ) Modelle, Modelle mit und ohne
Konstante, Verfahren der Ridge-Regression und Verfahren für
gewichtete kleinste Quadrate integriert sind. Weitere höhere
Verfahren werden im Modul
Allgemeine Regressionsodelle angeboten
(z.B. Beste-Subset-Regression, multivariate schrittweise Regression für
multiple abhängige Variablen, für Modelle mit Wirkungen
kategorialer Faktoren; statistische Ergebnisse für Validierungs- und
Analyse-Stichproben, benutzerdefinierte Hypothesen, usw.). Die Software
berechnet einen umfassenden Satz von Statistiken und erweiterten
Diagnose-Kenngrößen, einschließlich der vollständigen
Regressionstabelle (mit Standardfehlern für
B,
Beta
und Konstante,
R² und korrigiertes
R² und ANOVA-Tabelle), Matrizen von
partiellen und Part-Korrelationskoeffizienten, Korrelationen und
Kovarianzen für die Regressionskoeffizienten, die Sweep-Matrix
(inverse Matrix), die Durbin-Watson-Statistik, Mahalanobis- und
Cooks-Distanzen, Residuen für gelöschte Beobachtungen,
Konfidenzintervalle für Prognosewerte und viele weitere.
Prognosewerte und Residuen. Für die Residuen- und Ausreißer-Analyse
steht eine große Auswahl von Plots zur Verfügung, die u.a. eine
Vielzahl von Scatterplots, Histogramme, einfache, einseitige und
trendbereinigte Normalverteilungsplots, Plots partieller Korrelationen,
verschiedene fallweise Residuen- und Ausreißerplots enthalten. Die
Scores für einzelne Fälle können anhand explorativer
Iconplots und anderer mehrdimensionaler Grafiken visualisiert werden, die
direkt in die Ergebnistabelle der Ergebnisse integriert sind. Residuen und
Prognosewerte können der aktuellen Datendatei automatisch angefügt
werden. Ein Prognoseverfahren erlaubt es dem Benutzer, Was-wäre-wenn-Analysen
durchzuführen, wobei die Prognosewerte basierend auf
benutzerspezifizierten Werten der unabhängigen Variablen interaktiv
berechnet werden können.
Gruppierte Analysen; verwandte Verfahren. Designs extremen
Umfangs, d.h. 500 Variablen oder mehr lassen sich analysieren. Eine Option
zur multiplen Regressionsanalyse für gruppierte Daten wird ebenfalls
bereitgestellt (multiple Regression nach Gruppen). Ein Add-On von zusätzlichen
Verfahren enthält eine Regressionsprozedur, die sowohl Modelle mit
Tausenden von Variablen und zweistufige Kleinste-Quadrate-Regression
als auch Box-Cox- und Box-Tidwell-Transformationen mit
Grafiken unterstützt. Die Höheren Modellen
von STATISTICA Professionell enthalten auch Module zur Schätzung
allgemeiner nichtlinearer Ansätze (Nichtlineare
Regression,
Verallgemeinertes Lineares Modell (VLM), Verallgemeinertes
Additives Modell (VAM), Partielle
Kleinste Quadrate (PKQ)) , in dem die Parameter jedes
benutzerdefinierten, nichtlinearen Modells geschätzt werden können.
In diesem Modul ist eine Auswahl vordefinierter Modelle, einschließlich
Logit, Probit und anderen enthalten. Die Höheren Modelle
von STATISTICA Professionell bieten mit SEPATH,
das der allgemeinen Modellierung von Strukturgleichungen und der
Pfadanalyse gewidmet ist, die Möglichkeit, Korrelations-, Kovarianz-
oder Momentmatrizen extremer Größe zu analysieren.
 |
Das Modul
Nichtparametrische Verfahren stellt eine umfassende Auswahl zur
deskriptiven und schließenden Statistik einschließlich der
gebräuchlichen Tests und einiger spezieller Verfahren bereit. Im
einzelnen sind folgende Tests vorhanden: Wald-Wolfowitz' Runs-Test,
Mann-Whitneys
U-Test (mit exakten Wahrscheinlichkeiten anstelle
der Z-Approximation für kleine Stichproben),
Kolmogorov-Smirnov-Tests, Wilcoxon-Test für verbundene Stichproben,
Kruskal-Wallis Rang-Varianzanalyse, Median-Test, Vorzeichentest, Friedmans
Rang-Varianzanalyse, Cochrans
Q-Test, McNemar-Test, Kendalls
Konkordanzkoeffizient, Kendalls
Tau (b, c), Spearmans
R,
Fishers exakter Test,
Chi-Quadrat-Tests,
V-Quadrat-Statistik,
Phi, Gamma, Sommers
d, Kontingenzkoeffizienten und
weitere. (Spezielle nichtparametrische Tests und Statistiken sind auch
Teil weiterer Module, z.B.
Survival-
und Ausfallzeitenanalyse,
Prozessanalyse und andere.) Alle auf Rängen basierenden
Tests verwenden Korrekturen für kleine Stichprobenumfänge oder
verbundene Ränge. Wie in allen anderen Modulen von
STATISTICA
sind bei allen Tests entsprechende Grafiken integriert, z.B. verschiedene
Scatterplots, spezielle Box-Whisker-Plots, Linienplots, Histogramme und
viele weitere 2D- und 3D-Darstellungen.
Das Modul
ANOVA / MANOVA
ist eine Untermenge des Moduls
Allgemine
Lineare Modelle (ALM) und kann univariate und multivariate
Varianzanalysen für faktorielle Designs mit oder ohne einen
Messwiederholungsfaktor ausführen. Das Modul
Allgemeine
Lineare Modelle (ALM) ermöglicht die Spezifikation linearer
Modelle mit kategorialen und/oder stetiger Prädiktorvariablen,
Zufallseffekten und mehreren Messwiederholungsfaktoren (schrittweise und
Beste-Subset-Optionen werden im Modul
Allgemeine
Regressionsmodelle (ARM) angeboten).
Benutzeroberflächen. Sie können alle Designs auf
einfachste Weise beschreiben, indem Sie das Design in Abhängigkeit
von den aktuellen Variablen und deren Stufen spezifizieren, und nicht auf
technischem Weg, z.B. durch Spezifizieren von Matrizen mit Codes von
Dummy-Variablen. Dadurch sind auch weniger erfahrene Benutzer in der Lage,
selbst komplexe Designs mit Hilfe von STATISTICA. ANOVA / MANOVA
bietet ebenso wie das Modul Allgemeine
Lineare Modelle (ALM) drei alternative Benutzeroberflächen
zum Spezifizieren der Designs:
(1) einen Assistenten, der Sie Schritt für Schritt durch den Prozess
der Designspezifikation führt,
(2) eine dialogorientierte Benutzeroberfläche zur Auswahl von
Variablen, Codes, Faktorstufen und Designoptionen, sowie
(3) einen Editor zur Designspezifikation über Schlüsselwörter
auf der Grundlage einer allgemeinen Designsyntax.
Berechnungsverfahren. Per Voreinstellung verwendet das Programm
die sigmabeschränkte Parametrisierung für faktorielle Designs
und den Ansatz der effektiven Hypothese (siehe Hocking, 1981), Wenn das
Design unbalanciert oder unvollständig ist, lassen sich auch Typ I-,
II-, III- und IV-Hypothesen berechnen, ebenso wie Typ V- und Typ
VI-Hypothesen zum Testen der üblichen Analysen fraktioneller
faktorieller Designs für industrielle und qualitätsverbessernde
Anwendungen (siehe auch die Beschreibung im Modul Versuchsplanung).
Ergebnisse. Das Modul ANOVA / MANOVA ist in seinen
Berechnungsverfahren und Ergebnisausgaben sehr weitreichend, so dass die
gesamte Bandbreite analytischer Verfahren der Allgemeinen Linearen
Modelle verfügbar ist (zu weiteren Einzelheiten siehe die
Beschreibung von Allgemeine Lineare Modelle). Die Ergebnisse
umfassen ANOVA-Tabellen, univariate und multivariate Ergebnisse für
Messwiederholungsfaktoren mit mehr als zwei Stufen, Korrekturen nach
Greenhouse-Geisser und Huynh-Feldt, Interaktionsplots, detaillierte
deskriptive Statistiken, detaillierte Residualstatistiken, geplante
Vergleiche und Post-hoc-Tests, Tests für benutzerdefinierte
Hypothesen und benutzerdefinierte Fehlerterme, detaillierte
Diagnosestatistiken und -plots (z.B. ein Histogramm von
Innerzellenresiduen, Tests auf Varianzhomogenität, Plots von
Mittelwert gegen Standardabweichungen).
Die Optionen zur
Verteilungsanpassung ermöglichen den Vergleich der
(empirischen) Verteilung einer Variablen mit einer großen Zahl von
theoretischen Verteilungen. Für die Anpassung an die Daten stehen
Normal-, Rechteck-, Exponential-, Gamma-, Lognormal-, Chi-Quadrat-,
Weibull-, Gompertz-, Binomial-, Poisson-, Geometrische und
Bernoulli-Verteilung
zur Wahl. Die Güte der Anpassung kann mittels des
Chi-Quadrat-Tests
oder des Kolmogorov-Smirnov-Einstichprobentests bewertet werden. Auch der
Lilliefors- und Shapiro-Wilks-Test sind implementiert (
siehe
oben). Die Anpassungsgüte einer bestimmten, hypothetischen
Verteilung an die empirische Verteilung kann zusätzlich anhand von
gewöhnlichen und kumulierten Histogrammen mit darübergelegten,
entsprechend ausgewählten Funktionen (Dichten, Verteilungsfunktionen)
bzw. Linien- und Balkengrafiken für die erwarteten und beobachteten Häufigkeiten
bewertet werden. Weitere Optionen zur Verteilungsanpassung sind im Modul
Prozessanalyse von
STATISTICA Industrie verfügbar,
in dem Maximum-Likelihood-Schätzungen der Parameter für
Beta-,
Exponential-, Extremwert- (Typ I, Gumbel), Gamma-, Lognormal-, Rayleigh-
und
Weibull-Verteilung berechnet werden können. In diesem
Modul stehen außerdem sowohl Optionen zur automatischen Anpassung,
d.h. der automatischen Wahl der an die Daten "bestangepassten"
Verteilung, als auch Optionen zur allgemeinen Verteilungsanpassung anhand
der ersten vier Momente (über Johnson- und Pearson-Kurven) zur Verfügung.
In den Grafiken können auch benutzerdefinierte 2- und 3-dimensionale
Funktionen dargestellt und "über die Grafiken gelegt"
werden. Bei der Definition dieser Funktionen kann auf eine Vielzahl von
Verteilungen direkt Bezug genommen werden. Dazu gehören
Beta-,
Binomial-, Cauchy-, Chi-Quadrat-, Exponential-, Extremwert-, F-, Gamma-,
Geometrische, Laplace-, Logistische, Normal-, Lognormal-, Pareto-,
Poisson-, Rayleigh-, Students t- sowie
Weibull-Verteilung
(Dichte- bzw. Wahrscheinlichkeitsfunktion, Verteilungsfunktion und deren
Inverse). Unter dem Thema
Nichtlineare
Regression (in den
Höheren Modellen von
STATISTICA Professionell) zusätzliche Möglichkeiten zur
Anpassung vor- oder benutzerdefinierter Funktionen beschrieben.