|
|
2D 3D A B C D E F G H I J K L M N O P Q R S T U V W X Y Z |
|
Ausreißer sind definitionsgemäß untypische, seltene Beobachtungen oder Datenpunkte, die anscheinend nicht der charakteristischen Verteilung aller übrigen Daten entsprechen. Sie können echte Eigenschaften der zugrundeliegenden Phänomene (Variablen) widerspiegeln, aber auch Messfehler oder andere Anomalien, die nicht modellhaft erfasst werden sollen. Aufgrund der Methode, in der die Regressionsgerade in der Multiplen Regression bestimmt wird, insbesondere die Tatsache, dass sie nicht auf der Minimierung der Summe der einfachen (absoluten) Abstände, sondern auf der Minimierung der Summe der quadratischen Abstände der Datenpunkte von der Geraden basiert, können Ausreißer einen recht großen Einfluss auf den Anstieg der Regressionsgeraden und folglich auf den Wert des Korrelationskoeffizienten haben. Ein einzelner Ausreißer hat die Fähigkeit zur Veränderung des Anstiegs der Regressionsgeraden und folglich auch zur Veränderung des Wertes des Korrelationskoeffizienten. Im Allgemeinen wird angenommen, dass Ausreißer einen zufälligen Fehler darstellen, den man kontrollieren möchte.
Die Funktion Brushing kann dazu verwendet werden, interaktiv Ausreißer zu entfernen, indem sie in der Grafik markiert werden. Damit kann der Einfluss dieser Werte auf eine lineare oder nichtlineare Funktion, die an die Daten anzupassen ist, untersucht werden.
Siehe auch Explorative Datenanalyse und Data Mining-Techniken.