Το Excel είναι ένα ισχυρό εργαλείο που έχει μερικές εκπληκτικές λειτουργίες και λειτουργίες όταν εργάζεστε με στατιστικά.
Η εύρεση συσχέτισης μεταξύ δύο σειρών δεδομένων είναι ένας από τους πιο συνηθισμένους στατιστικούς υπολογισμούς όταν εργάζεστε με μεγάλα σύνολα δεδομένων,
Δούλευα ως χρηματοοικονομικός αναλυτής πριν από μερικά χρόνια και παρόλο που δεν είχαμε μεγάλη εμπλοκή σε στατιστικά δεδομένα, η εξεύρεση συσχέτισης ήταν κάτι που έπρεπε να κάνουμε αρκετά συχνά.
Σε αυτό το σεμινάριο, θα σας δείξω δύο πραγματικά εύκολους τρόπους υπολογίστε το συντελεστή συσχέτισης στο Excel. Υπάρχει ήδη μια ενσωματωμένη συνάρτηση για να το κάνετε αυτό, και μπορείτε επίσης να χρησιμοποιήσετε την Εργαλειοθήκη ανάλυσης δεδομένων.
Ας ξεκινήσουμε λοιπόν!
Τι είναι ο Συντελεστής Συσχέτισης;
Δεδομένου ότι δεν πρόκειται για κατηγορία στατιστικών, επιτρέψτε μου να εξηγήσω εν συντομία ποιος είναι ο συντελεστής συσχέτισης και στη συνέχεια θα προχωρήσουμε στην ενότητα όπου υπολογίζουμε τον συντελεστή συσχέτισης στο Excel.
Ο συντελεστής συσχέτισης είναι μια τιμή που σας λέει πόσο στενά συνδέονται δύο σειρές δεδομένων.
Ένα συνηθισμένο παράδειγμα είναι το βάρος και το ύψος 10 ατόμων σε μια ομάδα. Εάν υπολογίσουμε τον συντελεστή συσχέτισης για τα δεδομένα ύψους και βάρους για αυτούς τους ανθρώπους, θα λάβουμε μια τιμή μεταξύ -1 και 1.
Μια τιμή μικρότερη από μηδέν υποδηλώνει αρνητική συσχέτιση, πράγμα που σημαίνει ότι εάν το ύψος αυξάνεται τότε το βάρος μειώνεται ή εάν το βάρος αυξάνεται τότε το ύψος μειώνεται.
Και μια τιμή άνω του μηδενός υποδηλώνει μια θετική συσχέτιση, πράγμα που σημαίνει ότι αν το ύψος αυξάνεται τότε το βάρος αυξάνεται, και αν το ύψος μειώνεται τότε το βάρος μειώνεται.
Όσο πιο κοντά η τιμή είναι στο 1, τόσο ισχυρότερη είναι η θετική συσχέτιση. Έτσι, μια τιμή 0,8 θα έδειχνε ότι τα δεδομένα ύψους και βάρους συσχετίζονται έντονα.
Σημείωση: Υπάρχουν διάφοροι τύποι συντελεστών συσχέτισης και στατιστικών, αλλά σε αυτό το σεμινάριο, θα εξετάσουμε το πιο κοινό που είναι ο συντελεστής συσχέτισης PearsonΤώρα, ας δούμε πώς να υπολογίσουμε αυτόν τον συντελεστή συσχέτισης στο Excel.
Υπολογισμός Συντελεστή Συσχέτισης στο Excel
Όπως ανέφερα, υπάρχουν δύο τρόποι με τους οποίους μπορείτε να υπολογίσετε τον συντελεστή συσχέτισης στο Excel.
Χρησιμοποιώντας τον τύπο CORREL
Το CORREL είναι μια λειτουργία στατιστικών που εισήχθη στο Excel 2007.
Ας υποθέσουμε ότι έχετε ένα σύνολο δεδομένων όπως φαίνεται παρακάτω, όπου θέλετε να υπολογίσετε τον συντελεστή συσχέτισης μεταξύ του ύψους και του βάρους 10 ατόμων.
Παρακάτω είναι ο τύπος που θα το έκανε αυτό:
= CORREL (B2: B12, C2: C12)
Η παραπάνω συνάρτηση CORREL λαμβάνει δύο επιχειρήματα - τη σειρά με τα σημεία δεδομένων ύψους και τη σειρά με τα σημεία δεδομένων βάρους.
Και αυτό είναι!
Μόλις πατήσετε enter, το Excel κάνει όλους τους υπολογισμούς στο back-end και σας δίνει έναν μοναδικό αριθμό συντελεστή συσχέτισης Pearson.
Στο παράδειγμά μας, αυτή η τιμή είναι λίγο πάνω από .5, πράγμα που δείχνει ότι υπάρχει μια αρκετά ισχυρή θετική συσχέτιση.
Αυτή η μέθοδος χρησιμοποιείται καλύτερα εάν έχετε δύο σειρές και το μόνο που θέλετε είναι ο συντελεστής συσχέτισης.
Αλλά αν έχετε πολλές σειρές και θέλετε να μάθετε τον συντελεστή συσχέτισης όλων αυτών των σειρών, τότε μπορείτε επίσης να εξετάσετε τη χρήση του πακέτου εργαλείων ανάλυσης δεδομένων στο Excel (που καλύπτεται στη συνέχεια)
Χρήση της εργαλειοθήκης ανάλυσης δεδομένων
Το Excel διαθέτει εργαλειοθήκη ανάλυσης δεδομένων που μπορεί να χρησιμοποιηθεί για τον γρήγορο υπολογισμό διαφόρων τιμών στατιστικών (συμπεριλαμβανομένης της λήψης του συντελεστή συσχέτισης).
Αλλά η συλλογή εργαλείων ανάλυσης δεδομένων είναι απενεργοποιημένη από προεπιλογή στο Excel. Έτσι, το πρώτο βήμα θα ήταν να ενεργοποιήσετε ξανά το εργαλείο ανάλυσης δεδομένων και στη συνέχεια να το χρησιμοποιήσετε για να υπολογίσετε τον συντελεστή συσχέτισης Pearson στο Excel.
Ενεργοποίηση της εργαλειοθήκης ανάλυσης δεδομένων
Παρακάτω είναι τα βήματα για να ενεργοποιήσετε την Εργαλειοθήκη ανάλυσης δεδομένων στο Excel:
- Κάντε κλικ στην καρτέλα Αρχείο
- Κάντε κλικ στην επιλογή Επιλογές
- Στο παράθυρο διαλόγου Επιλογές Excel που ανοίγει, κάντε κλικ στην επιλογή Πρόσθετα στο παράθυρο πλευρικής γραμμής
- Στο αναπτυσσόμενο μενού Διαχείριση, επιλέξτε πρόσθετα του Excel
- Κάντε κλικ στο Go. Αυτό θα ανοίξει το παράθυρο διαλόγου πρόσθετων
- Ελέγξτε την επιλογή Ανάλυση εργαλειοθήκης
- Κάντε κλικ στο Ok
Τα παραπάνω βήματα θα προσθέσουν μια νέα ομάδα στην καρτέλα Δεδομένα στην κορδέλα του Excel που ονομάζεται Ανάλυση. Σε αυτήν την ομάδα, θα έχετε την επιλογή Ανάλυση δεδομένων
Υπολογισμός του συντελεστή συσχέτισης χρησιμοποιώντας εργαλειοθήκη ανάλυσης δεδομένων
Τώρα που έχετε ξανά διαθέσιμο το εργαλείο ανάλυσης στην κορδέλα, ας δούμε πώς να υπολογίσετε τον συντελεστή συσχέτισης χρησιμοποιώντας αυτό.
Ας υποθέσουμε ότι έχετε ένα σύνολο δεδομένων όπως φαίνεται παρακάτω και θέλετε να μάθετε τη συσχέτιση μεταξύ των τριών σειρών (ύψος και βάρος, ύψος και εισόδημα και βάρος και εισόδημα)
Παρακάτω είναι τα βήματα για να το κάνετε αυτό:
- Κάντε κλικ στην καρτέλα Δεδομένα
- Στην ομάδα Ανάλυση, κάντε κλικ στην επιλογή Ανάλυση δεδομένων
- Στο παράθυρο διαλόγου Ανάλυση δεδομένων που ανοίγει, κάντε κλικ στο «Συσχέτιση»
- Κάντε κλικ στο OK. Αυτό θα ανοίξει το παράθυρο διαλόγου Συσχέτιση
- Για εύρος εισόδου, επιλέξτε τις τρεις σειρές - συμπεριλαμβανομένων των κεφαλίδων
- Για το «Ομαδοποιημένο κατά», βεβαιωθείτε ότι έχετε επιλέξει «Στήλες»
- Επιλέξτε την επιλογή - «Ετικέτα στην πρώτη σειρά». Αυτό θα διασφαλίσει ότι στα δεδομένα που προκύπτουν θα έχουν τις ίδιες κεφαλίδες και θα είναι πολύ πιο εύκολο να κατανοήσουμε τα αποτελέσματα
- Στις επιλογές εξόδου, επιλέξτε πού θέλετε τον πίνακα που προκύπτει. Θα πάω με το κελί G1 στο ίδιο φύλλο εργασίας. Μπορείτε επίσης να επιλέξετε να λάβετε τα αποτελέσματά σας σε ένα νέο φύλλο εργασίας ή ένα νέο βιβλίο εργασίας
- Κάντε κλικ στο OK
Μόλις το κάνετε αυτό, το Excel υπολογίζει τον συντελεστή συσχέτισης για όλες τις σειρές και σας δίνει έναν πίνακα όπως φαίνεται παρακάτω:
Λάβετε υπόψη ότι ο πίνακας που προκύπτει είναι στατικός και δεν θα ενημερωθεί σε περίπτωση που αλλάξει οποιοδήποτε από τα σημεία δεδομένων στον πίνακά σας. Σε περίπτωση οποιασδήποτε αλλαγής, θα πρέπει να επαναλάβετε ξανά τα παραπάνω βήματα για να δημιουργήσετε έναν νέο πίνακα συντελεστών συσχέτισης.
Αυτές είναι λοιπόν δύο γρήγορες και εύκολες μέθοδοι για τον υπολογισμό του συντελεστή συσχέτισης στο Excel.
Ελπίζω να βρήκατε χρήσιμο αυτό το σεμινάριο!