Τι είναι στατιστική; – Τυπικό σφάλμα Λοξοτητας – Τυπικό σφάλμα Κύρτωσης

Τυπικό σφάλμα Λοξότητας – Τυπικό σφάλμα Κύρτωσης
Η Λοξότητα και η Κύρτωση προσπαθούν να περιγράψουν κάποιο μέρος της διασποράς τιμών σε ένα αριθμητικό σύνολο, και άρα το σχήμα της γραφικής απεικόνισης του συνόλου αυτού. Όταν το μέγεθος δείγματος είναι μικρό, δεν μπορεί να αντιπροσωπεύουν αξιόπιστα την Λοξότητα και τη Κύρτωση του αναφερόμενου πληθυσμού από τον οποίο το δείγμα προέρχεται. Οπότε, εδώ εισέρχεται να βοηθήσει το Τυπικό σφάλμα Λοξότητας και το Τυπικό σφάλμα Κύρτωσης. Αυτά τα τυπικά λάθη δείχνουν την απόκλιση που θα μπορούσε να υπάρχει στις τιμές Λοξότητας και Κύρτωσης μεταξύ πολλαπλών τυχαίων δειγμάτων που θα προερχόντουσαν από την ίδια κατανομή που προήλθε και το δείγμα ανάλυσης.

Τυπικό σφάλμα Λοξότητας: Ορισμός
Το Τυπικό σφάλμα Λοξότητας δείχνει την απόκλιση που θα μπορούσε να υπάρχει στις τιμές Λοξότητας μεταξύ πολλαπλών τυχαίων δειγμάτων που θα προερχόντουσαν από την ίδια κατανομή που προήλθε και το δείγμα ανάλυσης. Μία μηδενική τιμή (0) στο Τυπικό σφάλμα δείχνει ότι η απόκλιση στις τιμές Λοξότητας μεταξύ πολλαπλών τυχαίων δειγμάτων που θα προερχόντουσαν από την ίδια κατανομή που προήλθε και το δείγμα ανάλυσης είναι μηδενική, και άρα δείχνει ότι και η κατανομή από όπου προήλθε το δείγμα της ανάλυσης δεν αποκλίνει καθόλου από μία συμμετρική κατανομή, και άρα του ίδιου του δείγματος η κατανομή είναι συμμετρική. Υψηλές τιμές δείχνουν μεγαλύτερη απόκλιση της κατανομής από όπου προήλθε το δείγμα από μία συμμετρική κατανομή.

Skewness_Kurtosi_SES__SEK_standard error

Τυπικό σφάλμα Κύρτωσης: Ορισμός
Παρόμοια λογική εφαρμόζεται και εδώ! Το Τυπικό σφάλμα Κύρτωσης δείχνει την απόκλιση που θα μπορούσε να υπάρχει στις τιμές Κύρτωσης μεταξύ πολλαπλών τυχαίων δειγμάτων που θα προερχόντουσαν από την ίδια κατανομή που προήλθε και το δείγμα ανάλυσης. Μία μηδενική τιμή (0) στο Τυπικό σφάλμα δείχνει ότι η απόκλιση στις τιμές Κύρτωσης μεταξύ πολλαπλών τυχαίων δειγμάτων που θα προερχόντουσαν από την ίδια κατανομή που προήλθε και το δείγμα ανάλυσης είναι μηδενική, και άρα δείχνει ότι και η κατανομή από όπου προήλθε το δείγμα της ανάλυσης δεν αποκλίνει καθόλου από μία κατανομή με μηδενική Υπερβάλλουσα Κύρτωση ή με Μεσόκυρτη κορυφή, και άρα του ίδιου του δείγματος η κατανομή έχει μηδενική Υπερβάλλουσα Κύρτωση. Υψηλές τιμές δείχνουν μεγαλύτερη απόκλιση της κατανομής από όπου προήλθε το δείγμα από μία κατανομή με μηδενική Υπερβάλλουσα Κύρτωση.

Skewness_Kurtosi_SES__SEK_standard error

Τυπικό σφάλμα Λοξότητας: Στατιστικός Ορισμός
Η Στατιστική φόρμουλα για το Τυπικό σφάλμα Λοξότητας (SES) για μία Κανονική Κατανομή είναι η παρακάτω:

SES=\sqrt{\frac{6n(n-1)}{(n-2)(n+1)(n+3)}}

Να σημειωθεί ότι “n” είναι το μέγεθος δείγματος. Επειδή ο τύπος βασίζεται αποκλειστικά στο μέγεθος δείγματος, μπορεί να υπολογιστούν οι τιμές SES για συγκεκριμένα μεγέθη δείγματος. Δες τον παρακάτω πίνακα. Αν η Λοξότητα δείγματος διαιρεθεί με το SES, μπορεί να φανεί πόσο πολύ αποκλίνει η κατανομή από την οποία προήλθε το δείγμα από μία συμμετρική κατανομή.

Τυπικό σφάλμα Κύρτωσης: Στατιστικός Ορισμός
Η Στατιστική φόρμουλα για το Τυπικό σφάλμα Κύρτωσης (SEK) για μία Κανονική Κατανομή είναι η παρακάτω:

SEK=2(SES)\sqrt{\frac{(n^2-1)}{(n-3)(n+5)}}

Να σημειωθεί ότι “n” είναι το μέγεθος δείγματος. Επειδή ο τύπος βασίζεται αποκλειστικά στο μέγεθος δείγματος “n” -Το SEK επίσης βασίζεται αποκλειστικά στο μέγεθος δείγματος- μπορεί να υπολογιστούν οι τιμές SEΚ για συγκεκριμένα μεγέθη δείγματος. Δες τον παρακάτω πίνακα. Αν η Κύρτωση δείγματος διαιρεθεί με το SEK, μπορεί να φανεί πόσο πολύ αποκλίνει η κατανομή που προήλθε το δείγμα από μία κατανομή με μεσόκυρτη κορυφή ή αλλιώς με μηδενική Υπερβάλλουσα Κύρτωση, αγνοώντας το πρόσημο της Κύρτωσης δείγματος.

Λοξότητα και Κανονική Κατανομή
Δεν υπάρχει ευρέος αποδεκτός Στατιστικός τύπος για να εντοπίζει την Λοξότητα σε όλες τις περιπτώσεις:
i) Υπάρχουν μερικοί Κανόνες οι οποίοι έχουν σαν αναφορά τον Πληθυσμό, και υποθέτουν Κανονική Διασπορά δεδομένων. Παρόλα αυτά, οποιοδήποτε όριο απόρριψης έχουν, έχει δημιουργηθεί αυθαίρετα.
ii) Ο Οπτικός έλεγχος Ιστογραμμάτων και Θηκογραμμάτων και άλλων παρόμοιων Στατιστικών Γραφημάτων είναι ο καλύτερος Στατιστικός έλεγχος για Λοξότητα.

A) Με το να διαιρέσεις το αποτέλεσμα της Λοξότητας (Skew(X)) με το Τυπικό σφάλμα Λοξότητας: Skew(X)/SES

i) Αν το αποτέλεσμα της διαίρεσης Skew(X)/SES<-2 είναι μικρότερο του πλην δύο (-2), τότε μπορεί να υποθέσει κάποιος ΓΙΑ την Κατανομή Πληθυσμού ότι έχει Αρνητική Λοξότητα
ii) Αν το αποτέλεσμα της διαίρεσης είναι μεγαλύτερο του συν δύο (2), τότε μπορεί να υποθέσει κάποιος ΓΙΑ την Κατανομή Πληθυσμού ότι έχει Θετική Λοξότητα: Skew(X)/SES>2
iii) Αν το αποτέλεσμα της διαίρεσης είναι μεγαλύτερο του πλην δύο (-2) και μικρότερο του συν δύο (+2) τότε μπορεί να υποθέσει κάποιος ΓΙΑ την Κατανομή Πληθυσμού ότι δεν έχει ούτε θετική ούτε αρνητική Λοξότητα: -2<Skew(X)/SES<2
iv) Μπορεί να κατασκευαστεί Διάστημα Εμπιστοσύνης 95% σύμφωνα με αυτές τις τιμές: Skew(X) \pm 2*SES

Αυτός ο Κανόνας μπορεί να ειπωθεί και διαφορετικά με το ίδιο νόημα: Όταν το Τυπικό Σφάλμα Λοξότητας (SES) είναι δύο φορές μεγαλύτερο από την απόλυτη τιμή της Λοξότητας, τότε, ο Πληθυσμός έχει πιθανότατα υψηλή Θετική ή Αρνητική Λοξότητα: |Skew(X)|>2*SES

SES και SEK ανά μέγεθος Δείγματος (n)
Στον παρακάτω πίνακα και γράφημα, μπορεί να παρατηρηθεί ότι όσο το μέγεθος του δείγματος αυξάνεται, το τυπικό λάθος Λοξότητας και Κύρτωσης αποκτούν τιμές που πλησιάζουν το μηδέν (0) π.χ. για n=10.000, έχουμε: SES=.024, SEK=.048.

Πίνακας 1. Οι τιμές που παίρνει το Τυπικό σφάλμα Λοξότητας και το Τυπικό σφάλμα Κύρτωσης όταν το μέγεθος του δείγματος έχει τιμές από 5 ως 10000 για μία Κανονική Κατανομή.

n (Μέγεθος δείγματος)Τυπικό σφάλμα Λοξότητας (SES)Τυπικό σφάλμα Κύρτωσης (SEK)
50.913
2.000
100.687
1.334
150.580
1.121
200.512
0.992
300.427
0.833
400.374
0.733
500.337
0.663
1000.241
0.478
2000.172
0.342
10000.077
0.154
100000.024
0.048

Standard error of Skewness - Standard Error of Kurtosis - as n goes to 1000, SES and SEK go close to zero