Έκδοση: 26 / 10 / 2024
Σημαντική σημείωση
Για την παρακολούθηση των διαδικασιών που περιγράφονται στην ενότητα
αυτή ο αναγνώστης πρέπει να έχει προχωρήσει στη λήψη και την εγκατάσταση
της γλώσσας R (https://www.r-project.org/) αλλά και του λογισμικού R
Studio (https://www.rstudio.com/). Τόσο η γλώσσα R όσο και το R
Studio εκτελούνται με τον ίδιο τρόπο σε όλα τα λειτουργικά συστήματα
(Windows, Apple, Linux).
Προετοιμασία περιβάλλοντος R
Οι παρακάτω εντολές, ελέγχουν αν έχουν εγκατασταθεί τα απαιτούμενα
πακέτα για την εκτέλεση του συνόλου του κώδικα της ενότητας.
list.of.packages <- c("dplyr", "tidyverse", "tidyr", "haven", "openxlsx", "lavaan", "semPlot", "psych")
new.packages <- list.of.packages[!(list.of.packages %in% installed.packages()[,"Package"])]
if(length(new.packages)) install.packages(new.packages)
Όλες οι συναρτήσεις που χρησιμοποιούνται στην ενότητα αυτή βρίσκονται στο αρχείο της γλώσσας R: MyRFunctions.R.
Για να γίνουν διαθέσιμες για χρήση αρκεί να φορτωθούν στο περιβάλλον της R, εκτελώντας την εντολή
source("https://utopia.duth.gr/epdiaman/files/kedivim/MyRFunctions.R")
(Στην περίπτωση όπου γίνει λήψη τοπικά το αρχείο MyRFunctions.R, πρέπει να αλλαξει ανάλογα και η διεύθυνση του αρχείου)
Τα δεδομένα που χρησιμοποιούνται για τις δραστηριότητες αυτής της ενότητας μπορούν να φορτωθούν στο περιβάλλον της R, εκτελώντας την εντολή
source("https://utopia.duth.gr/epdiaman/files/eap/AllSampleData.R")
Η αξιοπιστία μιας ψυχομετρικής κλίμακας αναφέρεται στην ικανότητά της να μετρά με συνέπεια ένα ψυχολογικό χαρακτηριστικό. Μια αξιόπιστη κλίμακα πρέπει να δίνει σταθερά και επαναλαμβανόμενα αποτελέσματα όταν χρησιμοποιείται υπό τις ίδιες συνθήκες και με το ίδιο δείγμα.
Στην ανάλυση δεδομένων, η αξιοπιστία ορίζεται ως ο λόγος \[ Αξιοπιστία = \frac{\text{Διακύμανση Πραγματικών Τιμών}}{\text{Διακύμανση Πραγματικών Τιμών + Διακύμανση Σφαλμάτων Εκτίμησης}} \]
Αν η διακύμανση των σφαλμάτων είναι σημαντικά μικρότερη από τη διακύμανση των πραγματικών τιμών, μπορούμε να χαρακτηρίσουμε την μέτρηση ως αξιόπιστη. Στην περίπτωση αυτή ο λόγος της αξιοπιστίας θα είναι κοντά στο 1. Αντίθετα, αν η διακύμανση των σφαλμάτων είναι πολύ μεγάλη σε σχέση με τη διακύμανση των πραγματικών τιμών, αυτό σημαίνει πως η μέτρηση δεν έχει αξιοπιστία καθώς τα σφάλματα επικρατούν. Στην περίπτωση αυτή ο λόγος της αξιοπιστίας θα είναι μικρός.
Αναπαράσταση: https://utopia.duth.gr/epdiaman/files/eap/Unit1/reliability_demonstration.ods
Η υψηλή αξιοπιστία είναι κρίσιμη για την εγκυρότητα των συμπερασμάτων που προκύπτουν από τη χρήση μίας κλίμακας.
Στα πλαίσια του παραπάνω γενικού ορίσμου έχουν αναπτυχθεί διάφοροι τύποι αξιοπιστίας, όπως:
Αξιοπιστία εσωτερικής συνέπειας (internal
reliability)
Αφορά τον βαθμό στον οποίο τα επιμέρους στοιχεία μιας κλίμακας
συσχετίζονται μεταξύ τους, συνήθως μετριέται με τον δείκτη Cronbach’s α,
ή τον δείκτη ω του McDonald.
Αξιοπιστία επαναληπτικής μέτρησης (test-retest reliability) Αξιολογεί κατά πόσο τα αποτελέσματα της κλίμακας παραμένουν σταθερά σε διαφορετικές χρονικές στιγμές.
Διαβαθμολογική αξιοπιστία (Inter-Rater
Reliability)
Η διαβαθμολογική αξιοπιστία ή αξιοπιστία διακριτών παρατηρητών
αναφέρεται στην αξιολόγηση της συνέπειας ή της συμφωνίας μεταξύ δύο ή
περισσότερων παρατηρητών ή αξιολογητών που μετρούν το ίδιο φαινόμενο ή
χαρακτηριστικό. Είναι ιδιαίτερα σημαντική σε περιπτώσεις όπου η μέτρηση
ή η αξιολόγηση βασίζεται σε υποκειμενικές κρίσεις, όπως η κωδικοποίηση
συμπεριφοράς, η βαθμολόγηση δοκιμασιών ή η αξιολόγηση απόδοσης.
Έστω ότι μία ψυχομετρική κλίμακα αποτελείται από p παρατηρούμενες μεταβλητές X1, X2, …, Xp, που έχουν μετρηθεί n φορές (δηλαδή έγινε δειγματοληψία σε n υποκείμενα). Υποθέτουμε ότι όλες οι μεταβλητές αποτελούν όψεις του ίδιου λανθάνοντος χαρακτηριστικού F.
Ο υπολογισμός της αξιοπιστίας της κλίμακας προϋποθέτει τη γνώση των πραγματικών τιμών της F, οι οποίες δεν είναι γνωστές. Ωστόσο, υποθέτοντας πως η αντανάκλαση της F σε κάθε μία μεταβλητή είναι γραμμική, μπορούμε να γράψουμε:
\[ Χ_1 = μ_1 + λ_{1}F + ε_1, \\ Χ_2 = μ_2 + λ_{2}F + ε_2, \\ ... \\ Χ_p = μ_p + λ_{p}F + ε_p. \] όπου
μi η μέση τιμή κάθε μίας μεταβλητής.
λi ο συντελεστής που δείχνει πόσο πολύ “φορτώνεται” η μεταβλητή Χi στον παράγοντα F.
εi το σφάλμα της μέτρησης.
Συνοπτικά, το παραπάνω σύστημα γράφεται:
\[ Χ = M + F^T Λ^T + E \] ή
\[ \begin{bmatrix} X_{11} & X_{21} & \dots & X_{p1} \\ X_{12} & X_{22} & \dots & X_{p2} \\ \vdots & \vdots & \dots & \vdots \\ X_{1n} & X_{2n} & \dots & X_{pn} \end{bmatrix} = \begin{bmatrix} μ_1 & μ_2 & \dots & μ_p \\ μ_1 & μ_2 & \dots & μ_p \\ \vdots & \vdots & \dots & \vdots \\ μ_1 & μ_2 & \dots & μ_p \end{bmatrix} + \begin{bmatrix} f_1 \\ f_2 \\ \vdots \\ f_n \end{bmatrix} \begin{bmatrix} λ_1 & λ_2 & \dots & λ_p \end{bmatrix} + \begin{bmatrix} ε_{11} & ε_{21} & \dots & ε_{p1} \\ ε_{12} & ε_{22} & \dots & ε_{p2} \\ \vdots & \vdots & \dots & \vdots \\ ε_{1n} & ε_{2n} & \dots & ε_{pn} \end{bmatrix} \]
όπου
1. Πίνακας X (n × p): Ο πίνακας X είναι ο πίνακας των k παρατηρούμενων μεταβλητών. \[ X = \begin{bmatrix} X_1 & X_2 & \dots & X_p \end{bmatrix} = \begin{bmatrix} X_{11} & X_{21} & \dots & X_{p1} \\ X_{12} & X_{22} & \dots & X_{p2} \\ \vdots & \vdots & \dots & \vdots \\ X_{1n} & X_{2n} & \dots & X_{pn} \end{bmatrix} \]
Κάθε σειρά αντιστοιχεί σε μια παρατήρηση (συμμετέχων) και κάθε στήλη αντιστοιχεί σε ένα στοιχείο (παρατηρούμενη μεταβλητή).
2. Πίνακας Μ (n × p): Ο πίνακας Μ περιέχει σε κάθε γραμμή τη μέση τιμή της αντίστοιχης μεταβλητής. \[ M = \begin{bmatrix} μ_1 & μ_2 & \dots & μ_p \\ μ_1 & μ_2 & \dots & μ_p \\ \vdots & \vdots & \dots & \vdots \\ μ_1 & μ_2 & \dots & μ_p \end{bmatrix} \]
3. Πίνακας Λ (p x 1) Φορτία Παραγόντων (Factor Loadings): Υποθέτουμε ότι όλες οι μεταβλητές αντανακλούν τον παράγοντα F. Ο πίνακας Λ είναι ο p x 1 πίνακας
\[ Λ = \begin{bmatrix} λ_1 \\ λ_2 \\ \vdots \\ λ_p \end{bmatrix} \]
που περιέχει τα φορτία των μεταβλητών πάνω στον παράγοντα.
4. Πίνακας F (1 × n) (Βαθμολογία παραγόντων): Κάθε μία από τις παρατηρήσεις, αντιπροσωπεύεται από συντεταγμένες ως προς τους m λανθάνοντες παράγοντες. Ο πίνακας F είναι ο 1 x n πίνακας \[ F = \begin{bmatrix} f_1 & f_2 & \dots & f_n \end{bmatrix} \]
που περιέχει τις τιμές των n παρατηρήσεων στον λανθάνον παράγοντα.
5. Πίνακας Ε (n × p) (Σφάλματα): Ο πίνακας Ε είναι ο πίνακας των σφαλμάτων, που περιέχει το τμήμα κάθε παρατήρησης που δεν εξηγείται από τον λανθάνον παράγοντα.
\[ E = \begin{bmatrix} ε_1 & ε_2 & \dots & ε_p \end{bmatrix} = \begin{bmatrix} ε_{11} & ε_{21} & \dots & ε_{p1} \\ ε_{12} & ε_{22} & \dots & ε_{p2} \\ \vdots & \vdots & \dots & \vdots \\ ε_{1n} & ε_{2n} & \dots & ε_{pn} \end{bmatrix} \]
Aπό τη σχέση \[ Χ = [ΛF]^T + E \] προκύπτει επιπλέον:
\[ Cov(Χ) = Cov([ΛF]^T + E) = Cov([ΛF]^T) + Cov(E) = ΛCov(F)Λ^Τ + Cov(E) \] ή
\[ Σ = ΛΦΛ^T + Θ \]
όπου Σ είναι ο πίνακας των συνδιακυμάνσεων των p μεταβλητών Xi, i = 1, 2, …, p,
\[ Σ = \begin{bmatrix} σ^2_{11} & σ^2_{12} & \ldots & σ^2_{1p} \\ σ^2_{21} & σ^2_{22} & \ldots & σ^2_{2p} \\ \vdots & \vdots & \vdots & \vdots \\ σ^2_{p1} & σ^2_{p2} & \ldots & σ^2_{pp} \end{bmatrix} \] Λ ο πίνακας των συντελεστών λi, i = 1, 2, …, p, Φ ο 1 x 1 πίνακας Φ = [Var(F)] και Θ ο διαγώνιος πίνακας με τις διακυμάνσεις των σφαλμάτων υπολογισμού των Χi.
Στην εξίσωση Σ = ΛΦΛT + Θ υπάρχουν p x p = p2 γνωστές ποσότητες στο αριστερό μέρος και p + 1 + p = 2p + 1, άγνωστες ποσότητες στο δεξιό μέρος. Αν p > 2, τότε οι γνωστές ποσότητες είναι περισσότερες από τις άγνωστες και το σύστημα μπορεί να λυθεί.
Ο υπολογισμός των Λ, F, E μπορεί να γίνει με τη Μέθοδο Μέγιστης Πιθανοφάνειας (Maximum Likelihood Estimation - MLE), προσπαθώντας να εντοπίσει την τιμή t που να ελαχιστοποιήσει την διαφορά Σobserved και Σmodel = ΛΦΛT + Θ.
Η διαδικασία MLE ακολουθεί τα εξής βήματα:
Επιλέγεται μία αρχική τιμή για τις παραμέτρους Λ, Φ και Θ. Στο lavaan, συνήθως οι τιμές είναι λi = 0, Φ = Ι και Θ = diag(Var(X1), Var(X2), …, Var(Xp)).
Υπολογίζεται ο πίνακα συνδιακύμανσης σύμφωνα με το μοντέλο Σmodel = ΛΦΛT+Θ.
Συγκρίνεται το Σmodel με το Σobserved χρησιμοποιώντας μια συνάρτηση πιθανότητας, η οποία ποσοτικοποιεί τη διαφορά μεταξύ των δύο πινάκων.
Προσαρμόζονται επαναληπτικά οι παράμετροι (φορτώσεις Λ, διακύμανση Φ και μοναδικές διακυμάνσεις Θ) με τρόπο ώστε να μεγιστοποιείται η πιθανότητα (ή ισοδύναμα, να ελαχιστοποιείτε η διαφορά μεταξύ των δύο πινάκων συνδιακύμανσης).
Όσο μεγαλύτερη είναι η απόκλιση μεταξύ Σmodel και Σobserved, τόσο μικρότερη είναι η πιθανότητα, που σημαίνει ότι το μοντέλο δεν ταιριάζει με τα δεδομένα.
Η διαδικασία σταματά όταν ελαχιστοποιηθεί η απόκλιση, που σημαίνει ότι το μοντέλο ταιριάζει με τα δεδομένα όσο το δυνατόν καλύτερα, δεδομένης της δομής του παράγοντα.
Ο παράγοντας F θεωρείται ανεξάρτητος από τα σφάλματα εi. Ως εκ τούτου μπορούμε να γράψουμε: \[ Var(Χ_1) = λ_{1}^2Var(F) + Var(ε_1), \\ Var(Χ_2) = λ_{2}^2Var(F) + Var(ε_2), \\ ... \\ Var(Χ_p) = λ_{p}^2Var(F) + Var(ε_p). \] Συμπεραίνουμε ότι:
Η συνολική διακύμανση του στοιχείου Xi είναι το άθροισμα της διακύμανσης του παράγοντα F (πολλαπλασιασμένο με το λi2) και της διακύμανσης του σφάλματος. Στο πλαίσιο αυτό ο παράγοντας F δηλώνει το πραγματικό άγνωστο σκορ της λανθάνουσας μεταβλητής.
Εάν το λi είναι μεγάλο, κυριαρχεί ο όρος λi2Var(F), που σημαίνει ότι ένα μεγάλο μέρος της παρατηρούμενης διακύμανσης στο Xi εξηγείται από τον λανθάνοντα παράγοντα F και η αντίστοιχη μεταβλητή είναι ένας ισχυρός δείκτης του F.
Εάν το λi είναι μικρό, η διακύμανση σφάλματος Var(εi) γίνεται πιο σημαντική και το Xi είναι ένας ασθενέστερος δείκτης του λανθάνοντος παράγοντα, με μεγαλύτερο ποσό της διακύμανσής του να αποδίδεται σε τυχαίο σφάλμα.
Βασική προϋπόθεση για τον υπολογισμό της αξιοπιστίας μία κλίμακας είναι η επιβεβαίωση της ομοιογένειας των ερωτήσεων που αυτή περιέχει, δηλαδή η επιβεβαίωση πως οι ερωτήσεις πράγματι συνιστούν μία κλίμακα και όχι περισσότερες Η έννοια της ομοιογένειας εξειδικεύεται περαιτέρω με τις έννοιες της ταυ-ισοδυναμίας και της παραλληλίας.
Η γενικότερη υπόθεση που μπορεί να γίνει για ένα σύνολο ερωτήσεων είναι πως αποτελούν μία ομοιογενή ομάδα, δηλαδή πως όλες τους μετρούν την ίδια λανθάνουσα μεταβλητή. Ειδικότερα, δεν υποτίθεται κανένας περιορισμός για το μέτρο που εκφράζει κάθε μία από αυτές την λανθάνουσα μεταβλητή όπως και για τα σφάλματα μέτρησης των ερωτήσεων.
Παράδειγμα 1 (Εργασιακή Ικανοποίηση)
Ερώτηση 1: Νιώθω ότι ο προϊστάμενός μου εκτιμά την
εργασία μου.
Ερώτηση 2: Είμαι ικανοποιημένος με το ρόλο μου στην
εργασία.
Ερώτηση 3: Απολαμβάνω τις εργασίες που εκτελώ στη
δουλειά μου.
Ερώτηση 4: Πιστεύω ότι η δουλειά μου αναγνωρίζεται και
εκτιμάται.
Παράδειγμα 2 (Αυτοεκτίμηση)
Ερώτηση 1: Νιώθω ότι είμαι άνθρωπος που αξίζει.
Ερώτηση 2: Είμαι σε θέση να κάνω πράγματα όπως και οι
περισσότεροι άλλοι άνθρωποι.
Ερώτηση 3: Έχω θετική στάση απέναντι στον εαυτό
μου.
Ερώτηση 4: Νιώθω ικανοποιημένος με τον εαυτό μου.
Παράδειγμα 3 (Γνωστική Ικανότητα στην
Αριθμητική)
Ερώτηση 1: Πόσο κάνει 5 + 3;
Ερώτηση 2: Αν 4x + 1 = 9, ποια είναι η τιμή του
x;
Ερώτηση 3: Πόσο κάνει 160.5;
Ερώτηση 4: Πόσοι αριθμοί ικανοποιούν την εξίσωση
2x2 - x - 1 = 0;
Παράδειγμα 1
Ερώτηση 1: Νιώθω ότι με εκτιμούν στο χώρο εργασίας μου.
(Εργασιακή Ικανοποίηση)
Ερώτηση 2: Ολοκληρώνω τις εργασίες μου αποτελεσματικά.
(Εργασιακή Αποτελεσματικότητα)
Παράδειγμα 2
Ερώτηση 1: Νιώθω σίγουρος για τις ικανότητές μου.
(Αυτοεκτίμηση)
Ερώτηση 2: Νιώθω νευρικός όταν μιλάω μπροστά σε άλλους.
(Κοινωνικό Άγχος)
Παράδειγμα 3
Ερώτηση 1: Ασκούμαι τακτικά και κάνω μια ισορροπημένη
διατροφή. (Σωματική Υγεία)
Ερώτηση 2: Συχνά νιώθω ότι με κυριεύει το άγχος.
(Ψυχική Υγεία)
Μία ομάδα ερωτήσεων είναι ταυ-ισοδύναμες όταν αντανακλούν την λανθάνουσα μεταβλητή στον ίδιο βαθμό.
Παράδειγμα 1 (Εργασιακή Ικανοποίηση)
Ερώτηση 1: Είμαι ευχαριστημένος με τον τρέχοντα
εργασιακό μου ρόλο.
Ερώτηση 2: Βρίσκω τη δουλειά μου ικανοποιητική.
Ερώτηση 3: Αισθάνομαι ικανοποιημένος με τα καθήκοντα
που εκτελώ.
Ερώτηση 4: Πιστεύω ότι η δουλειά μου ανταποκρίνεται
στις προσδοκίες μου.
Κάθε στοιχείο αναμένεται να εκφράζει στον ίδιο βαθμό την ικανοποίηση από την εργασία.
Παράδειγμα 2 (Αυτοεκτίμηση)
Ερώτηση 1: Αισθάνομαι σίγουρος για τις ικανότητές
μου.
Ερώτηση 2: Έχω θετική άποψη για τον εαυτό μου.
Ερώτηση 3: Είμαι περήφανος γι’ αυτό που είμαι.
Ερώτηση 4: Πιστεύω ότι έχω αξία ως άνθρωπος.
Κάθε στοιχείο αναμένεται να αντανακλά την αυτοεκτίμηση του ατόμου στον ίδιο βαθμό.
Παράδειγμα 1 (Εργασιακή Ικανοποίηση)
Ερώτηση 1: Οι αλληλεπιδράσεις με τους συναδέλφους στη
δουλειά μου προσφέρουν ικανοποίηση.
Ερώτηση 2: Νιώθω ότι η δουλειά μου μού επιτρέπει να
χρησιμοποιώ αποτελεσματικά τις δεξιότητες και τα ταλέντα μου.
Ερώτηση 3: Είμαι ικανοποιημένος με τα οφέλη και τα
προνόμια που προσφέρει η δουλειά μου.
Μεταξύ των παραπάνω ερωτήσεων, η 2η ερώτηση αναμένεται να έχει υψηλότερο συντελεστή φόρτωσης, επειδή η αποτελεσματική χρήση των δεξιοτήτων κάποιου είναι βασικό συστατικό της ικανοποίησης από την εργασία. Αντίστοιχα, η 1η και η 3η ερώτηση αναμένονται να έχουν μέτριο συντελεστή φόρτωσης, καθώς
οι αλληλεπιδράσεις με τους συναδέλφους και
τα οφέλη και τα προνόμια
είναι σημαντικές αλλά όχι οι κύριες πτυχές της ικανοποίησης από την εργασία.
Παράδειγμα 2 (Άγχος)
Ερώτηση 1: Συχνά νιώθω νευρικός για πράγματα που δεν
μπορώ να ελέγξω.
Ερώτηση 2: Βιώνω συχνά σωματικά συμπτώματα άγχους, όπως
π.χ. ταχυπαλμία.
Ερώτηση 3: Μερικές φορές ανησυχώ για μικρά
πράγματα.
Μεταξύ των παραπάνω, η 2η ερώτηση αναμένεται να έχει υψηλότερη φόρτωση παραγόντων, επειδή τα σωματικά συμπτώματα είναι ισχυρός δείκτης άγχους. Αντίθετα, η 1η αντικατοπτρίζει μια κοινή πτυχή του άγχους ενώ η 3η δεν είναι ισχυρός δείκτης γενικού άγχους, άρα αναμένεται να έχει μικρότερο βαθμό συσχέτισης με το γενικό άγχος.
Τα στοιχεία που δεν είναι ταυ-ισοδύναμα επιτρέπουν μια πιο λεπτομερή μέτρηση μιας έννοιας, καθώς αντανακλούν διαφορετικές όψεις ή επίπεδα έντασης μέσα στο κοινό λανθάνον χαρακτηριστικό.
Παράδειγμα 3 (Γνωστική Ικανότητα στην
Αριθμητική)
Ερώτηση 1: Πόσο κάνει 5 + 3;
Ερώτηση 2: Αν 4x + 1 = 9, ποια είναι η τιμή του
x;
Ερώτηση 3: Πόσο κάνει 160.5;
Ερώτηση 4: Πόσοι αριθμοί ικανοποιούν την εξίσωση
2x2 - x - 1 = 0;
Και οι 4 ερωτήσεις στοχεύουν στη μέτρηση της γνωστικής ικανότητας, ωστόσο ποικίλλουν ως προς τη δυσκολία και την πολυπλοκότητα. Στην πράξη, οι πιο απλές ερωτήσεις 1 και 2 θα απαντηθούν σωστά από τους περισσότερους εξεταζόμενους, συμβάλλοντας ελάχιστα στη διακύμανση των βαθμολογιών του τεστ. Αντίθετα, οι περισσότερο δύσκολες ερωτήσεις 3 και 4 εξαρτώνται περισσσότερο από τις μαθηματικές γνώσεις των ερωτώμενων και ως εκ τούτου μπορούν να διαφοροποιήσουν καλύτερα τα άτομα με διαφορετικά επίπεδα γνωστικής ικανότητας, συμβάλλοντας περισσότερο στη διακύμανση της βαθμολογίας.
Σημείωση
Οι ερωτήσεις που είναι ταυ-ισοδύναμες δεν έχουν απαραίτητα ίδια μέση
τιμή. Ενδεικτικά, οι παρακάτω ερωτήσεις μετρούν το άγχος:
Οι ερωτήσεις αυτές, αναμένεται να είναι ταυ-ισοδύναμες (δηλαδή να έχουν ίσες φορτίσεις παραγόντων στην υποκείμενη δομή άγχους), ωστόσο οι μέσες βαθμολογίες τους αναμένεται να διαφέρουν. Για παράδειγμα, οι ερωτηθέντες μπορεί να βαθμολογήσουν το πρώτο στοιχείο υψηλότερα κατά μέσο όρο, εάν το να νιώθουν νευρικότητα είναι πιο συνηθισμένο για αυτούς παρά να ανησυχούν για το μέλλον. Αυτή η διαφορά στις μέσες βαθμολογίες δεν παραβιάζει την ταυ-ισοδυναμία επειδή η ταυ-ισοδυναμία αφορά την ισότητα της σχέσης (φόρτωσης) μεταξύ κάθε στοιχείου και της υποκείμενης λανθάνουσας κατασκευής, όχι την ισότητα των μέσων βαθμών τους.
Μία ομάδα ερωτήσεων ονομάζονται παράλληλες όταν αντανακλούν στον ίδιο βαθμό τη λανθάνουσα μεταβλητή και έχουν επιπλέον ίδιες διακυμάνσεις στο σφάλμα μέτρησης. Συνήθως, είναι σχεδόν πανομοιότυπα σε περιεχόμενο, διασφαλίζοντας ότι μετρούν την υποκείμενη κατασκευή με τον ίδιο ακριβώς τρόπο. Αν και είναι χρήσιμα για τη δημιουργία πολύ αξιόπιστων κλιμάκων, η διατύπωση παράλληλων στοιχείων μπορεί να είναι δύσκολη.
Παραδείγματα ερωτήσεων που αναμένεται να είναι
παράλληλες
Παράδειγμα 1 (Ικανοποίηση από τη ζωή)
Ερώτηση 1: Είμαι ικανοποιημένος με τη ζωή μου
συνολικά.
Ερώτηση 2: Γενικά, αισθάνομαι ικανοποιημένος με τη ζωή
μου.
Ερώτηση 3: Είμαι ευχαριστημένος με τη ζωή μου
γενικά.
Στην παρακάτω εικόνα αναπαριστώνται οι περιπτώσεις της ταυ-ομοιογένειας και της παραλληλίας, αναφορικά με το μοντέλο \[ Χ_i = μ_i + λ_{i}F + ε_i, \quad i = 1, 2, ..., p, \]
Το πιο κοινό μέτρο για την αξιοπιστία εσωτερικής συνέπειας.
Υπολογίζει τον μέσο όρο όλων των πιθανών συνδυασμών διχοτόμησης των
στοιχείων της κλίμακας. Τιμές πάνω από 0.7 θεωρούνται γενικά αποδεκτές,
αν και για κάποιες εφαρμογές μπορεί να απαιτείται υψηλότερη τιμή.
Η χρήση του δείκτη άλφα του Cronbach ως συντελεστή αξιοπιστίας, έχει τις εξής προϋποθέσεις:
Οι μεταβλητές πρέπει να είναι συνεχείς. Αν είναι διατακτικές (ordinal) τότε ο δείκτης α μπορεί να υπολογιστεί με την επισήμανση πως είναι ένα κάτω όριο της πραγματικής αξιοπιστίας (δηλαδή, η πραγματική αξιοπιστία είναι υψηλότερη από την τιμή του α). Επιπλέον, στην περίπτωση αυτή είναι δυνατός ο υπολογισμός της αντίστοιχης διατακτικής εκδοχής του α (ordinal alpha), ο οποίος υπολογίζεται με τον ίδιο τρόπο, μόνο που αντί του πίνακα συνδιακυμάνσεων, χρησιμοποιείται ο πίνακας των πολυχωρικών συσχετίσεων (Polychoric correlation matrix).
Αν το δείγμα είναι μικρό τότε τα δεδομένα πρέπει να είναι κανονικά κατανεμημένα.
Τα δεδομένα είναι ομοιογενή, δηλαδή όλες οι ερωτήσεις να αντανακλούν την ίδια λανθάνουσα μεταβλητή. Εάν οι ερωτήσεις δεν μετρούν την ίδια λανθάνουσα μεταβλητή, η εφαρμογή του Cronbach’s alpha μπορεί να δώσει ψευδώς υψηλές ή χαμηλές τιμές και να σε οδηγήσει σε λανθασμένα συμπεράσματα για την αξιοπιστία της κλίμακας.
Τα δεδομένα είναι ταυ-ισοδύναμα, δηλαδή όλες οι ερωτήσεις αντανακλούν την ίδια λανθάνουσα μεταβλητή με την ίδια ισχύ. Εάν δεν πληρείται αυτή η υπόθεση, το Cronbach’s alpha δεν είναι αξιόπιστος δείκτης καθώς βασίζεται στην παραδοχή πως όλες οι ερωτήσεις έχουν το ίδιο φορτίο στον λανθάνοντα παράγοντα.
Τα σφάλματα στις μετρήσεις είναι ανεξάρτητα.
Αν το δείγμα είναι μικρό (π.χ. < 30), τότε πρέπει να ελεγχθεί η υπόθεση της κανονικότητας με όλες τις κατάλληλες στατιστικές δοκιμασίες (π.χ. Shapiro - Wilk κλπ).
Όλες οι υπόλοιπες παραδοχές μπορούν να μελετηθούν χρησιμοποιώντας CFA για να επιβεβαιωθεί πως οι ερωτήσεις συνιστούν έναν παράγοντα με αντίστοιχα φορτία πάνω σε αυτόν. Εάν ένα μονοδιάστατο μοντέλο με όλες οι φορτώσεις ίσες και μη συσχετισμένα σφάλματα προσαρμόζεται καλώς στα δεδομένα, τότε οι προϋποθέσεις υπολογισμού του Cronbach α ισχύουν.
Ο συντελεστής α εκφράζει την αξιοπιστία της αντίστοιχης κλίμακας μόνο όταν η υπόθεση της ταυ-ισοδυναμίας μπορεί να γίνει αποδεκτή. Στην περίπτωση όπου η υπόθεση αυτή δεν μπορεί να γίνει αποδεκτή, τότε εναλλακτικά, προτείνεται η χρήση του συντελεστή ω ή της σύνθετης αξιοπιστίας (composite reliability).
Έστω Xi, i = 1, 2, .., k, οι k ερωτήσεις, σ2ii = Var(Xi) και σ2ij = Cov(Xi, Xj). Θεωρούμε το άθροισμα όλων των μεταβλητών \[ T = \sum_{i = 1}^k X_i = X_1 + X_2 + .... + X_k \] Ορίζουμε, σT2 να είναι η διακύμανση της νέας μεταβλητής Τ. \[ σ_T^2 = Var(\sum_{i = 1}^k X_i) = \sum_{i = 1}^k σ_{ii}^2 + 2 \sum_{j = 1}^k \sum_{i = 1}^j Cov(X_i, X_j) \]
Ο δείκτης αξιοπιστίας άλφα του Cronbach ορίζεται να είναι ο εξής:
\[ α = \frac{k}{k-1} \left( 1 - \frac{\sum_{i=1}^k σ^2_{ii}}{σ_T^2} \right) \]
Παρατηρούμε ότι:
(α) Αν οι ερωτήσεις Χ1, Χ2, …, Χk, είναι ανεξάρτητες, τότε για i ≠ j, είναι Cov(Xi, Xj) = 0, σΤ2 = Σ σii^2 και α = 0.
(β) Αν οι ερωτήσεις Χ1, Χ2, …, Χk, είναι ταυτόσημες τότε όλες θα έχουν την ίδια διακύμανση σii2 = σ2, ενώ και κάθε συνδιακύμανση θα είναι ίση επίσης με σ2. Στην περίπτωση αυτή θα είναι σΤ2 = k2 σ2 και α = 1. Στην περίπτωση αυτήν αιτιολογείται και η χρήση του συντελεστή k/(k-1), ο οποίος διασφαλίζει πως, στην περίπτωση ταυτόσημων μεταβλητών η μέγιστη τιμή του στατιστικού α θα είναι 1.
Εκτός από τις ακραίες περιπτώσεις (α) και (β), στην πράξη αναμένουμε να υπάρχουν κάποιες θετικές συσχετίσεις μεταξύ των στοιχείων (υποθέτοντας ότι όλα είναι κωδικοποιημένα προς την ίδια κατεύθυνση), επομένως ο λόγος των διακυμάνσεων θα είναι μικρότερος από 1. Όσο μεγαλύτερες είναι οι συνδιακυμάνσεις, τόσο μεγαλύτερη είναι η τιμή του α.
Είναι αξιοσημείωτο πως ο δείκτης α του Cronbach ορίζεται με φυσικό τρόπο βάσει του πίνακα συνδιακύμανσης \[ Σ = \begin{bmatrix} σ^2_{11} & σ^2_{12} & \ldots & σ^2_{1k} \\ σ^2_{21} & σ^2_{22} & \ldots & σ^2_{2k} \\ \vdots & \vdots & \vdots & \vdots \\ σ^2_{k1} & σ^2_{k2} & \ldots & σ^2_{kk} \end{bmatrix} \] Ιδιαίτερα, παρατηρούμε πως ο αριθμητής που υπάρχει στον τύπο υπολογισμού είναι το ίχνος του πίνακα Σ, ενώ ο παρονομαστής δεν είναι τίποτα άλλο παρά το άθροισμα όλων των στοιχείων του Σ. Συμπεραίνουμε, ότι εναλλακτικά, ο δείκτης α του Cronbach ορίζεται ως:
\[ α = \frac{k}{k-1} \left( 1 - \frac{trace(Σ)}{sum(Σ)} \right) \]
Περισσότερες λεπτομέρειες εδώ:
(1) https://jim.imibh.edu.in/pages/table-of-contents/fulltext/?id=68&title=Cronbach%E2%80%99s+Alpha:+Genesis,+Issues+and+Alternatives
(2) https://stats.stackexchange.com/questions/166670/what-is-cronbachs-alpha-intuitively
Η παρακάτω συνάρτηση υλοποίεί τον αλγόριθμο του Cronbach α στη γλώσσα R
my.cronbach = function(my.data){
all.columns = names(my.data)
# Υπολογισμός σ_T^2
T.var = rowSums(my.data)
denominator = var(T.var)
# Υπολογισμός Σσ_i^2
nominator = 0
for(acol in all.columns){
nominator = nominator + var(my.data[, acol])
}
k = ncol(my.data)
coeff1 = k/(k-1)
alpha1 = coeff1*(1 - (nominator/denominator))
print(round(alpha1, 3))
}
Παράδειγμα 1
Μία ομάδα μαθητών εξετάστηκαν σε τρία test, με τα οποία ελέγχθηκε η
ικανότητά τους στη γραφή, στην ανάγνωση και στον προφορικό λόγο. Τα
δεδομένα my.data δίνονται παρακάτω:
my.data = as.data.frame(structure(list(speak.score = c(18, 13, 12, 16, 12, 6, 15, 1, 12, 20, 9, 11, 20, 6, 12, 25, 16, 6, 11, 16, 17, 7, 13, 26, 6, 10, 3, 21, 12, 17, 16, 15, 10, 15, 1, 12, 5, 8, 15, 7, 10, 9, 4, 15, 6, 23, 20, 16, 26, 14, 0, 9, 14, 24, 3, 10, 11, 1, 4, 10, 9, 28, 16, 12, 19, 5, 6, 23, 13, 1, 5, 4, 4, 7, 8, 14, 4, 8, 8, 7, 11, 9, 3, 12, 15, 10, 11, 4, 5, 3, 11, 6, 11, 24, 13, 23, 12, 11, 18, 9), read.score = c(18, 19, 7, 17, 14, 11, 15, 4, 14, 15, 10, 15, 19, 7, 10, 19, 20, 4, 11, 12, 18, 4, 20, 19, 3, 11, 9, 18, 10, 17, 15, 17, 9, 14, 2, 17, 2, 6, 18, 13, 9, 10, 3, 20, 10, 19, 18, 14, 19, 13, 8, 8, 9, 16, 3, 15, 14, 5, 7, 11, 14, 20, 16, 12, 17, 5, 7, 17, 14, 6, 3, 5, 6, 11, 6, 15, 2, 9, 11, 2, 12, 5, 8, 14, 16, 12, 6, 4, 4, 7, 14, 2, 6, 19, 19, 15, 8, 11, 15, 13), write.score = c(19, 16, 13, 20, 14, 12, 18, 4, 2, 16, 9, 16, 21, 13, 7, 24, 21, 8, 15, 15, 14, 4, 22, 15, 1, 13, 12, 20, 6, 13, 21, 18, 9, 14, 3, 19, 1, 5, 22, 16, 15, 8, 6, 26, 6, 16, 13, 8, 19, 16, 13, 12, 5, 23, 0, 15, 12, 5, 8, 11, 14, 20, 14, 10, 10, 3, 5, 28, 9, 7, 3, 1, 6, 7, 6, 13, 0, 1, 6, 3, 14, 3, 8, 18, 22, 8, 6, 9, 2, 7, 14, 2, 4, 19, 17, 19, 6, 9, 18, 9)), class = "data.frame", row.names = c(NA, -100L)))
Υπολογίζουμε το συντελεστή α:
my.cronbach(my.data)
## [1] 0.913
Μπορούμε να επαληθεύσουμε πως το ίδιο αποτέλεσμα προκύπτει από τη συνάρτηση cronbach.alpha της βιβλιοθήκης ltm
library(ltm)
## Loading required package: MASS
## Loading required package: msm
## Loading required package: polycor
cronbach.alpha(my.data)
##
## Cronbach's alpha for the 'my.data' data-set
##
## Items: 3
## Sample units: 100
## alpha: 0.913
Παράδειγμα 2
Item1 = c(1, 2, 3, 4, 5, 3, 4, 2, 4, 3, 3, 4, 2, 4, 3)
Item2 = c(1, 2, 3, 4, 5, 4, 5, 3, 4, 4, 4, 5, 3, 4, 4)
Item3 = c(1, 2, 3, 4, 5, 2, 3, 2, 4, 3, 2, 3, 2, 4, 3)
my.data = data.frame(Item1, Item2, Item3)
my.cronbach(my.data)
## [1] 0.934
Μπορούμε να επαληθεύσουμε πως το ίδιο αποτέλεσμα προκύπτει από τη συνάρτηση cronbach.alpha της βιβλιοθήκης ltm
library(ltm)
cronbach.alpha(my.data)
##
## Cronbach's alpha for the 'my.data' data-set
##
## Items: 3
## Sample units: 15
## alpha: 0.934
ή από τη συνάρτηση alpha της βιβλιοθήκης psych
library(psych)
##
## Attaching package: 'psych'
## The following object is masked from 'package:ltm':
##
## factor.scores
## The following object is masked from 'package:polycor':
##
## polyserial
alpha(my.data)
##
## Reliability analysis
## Call: alpha(x = my.data)
##
## raw_alpha std.alpha G6(smc) average_r S/N ase mean sd median_r
## 0.93 0.93 0.96 0.83 14 0.033 3.2 1 0.89
##
## 95% confidence boundaries
## lower alpha upper
## Feldt 0.84 0.93 0.98
## Duhachek 0.87 0.93 1.00
##
## Reliability if an item is dropped:
## raw_alpha std.alpha G6(smc) average_r S/N alpha se var.r med.r
## Item1 0.81 0.81 0.69 0.69 4.4 0.096 NA 0.69
## Item2 0.95 0.95 0.91 0.91 19.5 0.025 NA 0.91
## Item3 0.94 0.94 0.89 0.89 15.9 0.031 NA 0.89
##
## Item statistics
## n raw.r std.r r.cor r.drop mean sd
## Item1 15 0.99 0.99 0.99 0.98 3.1 1.1
## Item2 15 0.92 0.91 0.88 0.81 3.7 1.1
## Item3 15 0.92 0.92 0.90 0.82 2.9 1.1
##
## Non missing response frequency for each item
## 1 2 3 4 5 miss
## Item1 0.07 0.20 0.33 0.33 0.07 0
## Item2 0.07 0.07 0.20 0.47 0.20 0
## Item3 0.07 0.33 0.33 0.20 0.07 0
Αν και ο δείκτης α του Cronbach αφορά συνεχείς μεταβλητές, έχει επικρατήσει ο υπολογισμός και η αναφορά του και στις περιπτώσεις των διατακτικών μεταβλητών. Ειδικότερα, υπάρχουν πολλά επιστημονικά περιοδικά που απαιτούν την αναφορά του δείκτη α του Cronbach, ανεξάρτητα από τη φύση των ερωτήσεων (συνεχείς ή διατακτικές). Στην περίπτωση των διατακτικών η εναλλακτική επιλογή είναι ο υπολογισμός του ίδιου στατιστικού από τον πίνακα των πολυχωρικών συσχετίσεων, στατιστικό που συνήθως καλείται στη βιβλιογραφία ordinal Cronbach alpha. Στην R, αυτό γίνεται με τον παρακάτω κώδικα:
library(psych)
polychoric.pc <- polychoric(my.data)
## Warning in cor.smooth(mat): Matrix was not positive definite, smoothing was
## done
polychoric.pc$rho
## Item1 Item2 Item3
## Item1 1.0000000 0.9459039 0.9459039
## Item2 0.9459039 1.0000000 0.7894683
## Item3 0.9459039 0.7894683 1.0000000
S = polychoric.pc$rho
ordinal.a = 3/2*(1 - sum(diag(S))/ sum(S))
print(ordinal.a)
## [1] 0.9618868
Εναλλακτικά, μπορούμε να χρησιμοποιήσουμε και τη συνάρτηση alpha, όπως παρακάτω:
alpha(polychoric.pc$rho)
## In smc, smcs < 0 were set to .0
## In smc, smcs < 0 were set to .0
##
## Reliability analysis
## Call: alpha(x = polychoric.pc$rho)
##
## raw_alpha std.alpha G6(smc) average_r S/N median_r
## 0.96 0.96 0.78 0.89 25 0.95
##
## 95% confidence boundaries
## lower alpha upper
## Feldt 0.59 0.96 1
##
## Reliability if an item is dropped:
## raw_alpha std.alpha G6(smc) average_r S/N var.r med.r
## Item1 0.88 0.88 0.79 0.79 7.5 NA 0.79
## Item2 0.97 0.97 0.95 0.95 35.0 NA 0.95
## Item3 0.97 0.97 0.95 0.95 35.0 NA 0.95
##
## Item statistics
## r r.cor r.drop
## Item1 1.00 0.74 1.00
## Item2 0.95 0.91 0.88
## Item3 0.95 0.91 0.88
Σημείωση: Η χρήση του ordinal alpha δεν θεωρείται ασφαλής ως μέτρο αξιοπιστίας από μέρος της επιστημονικής κοινότητας. Ενδεικτικά:
Chalmers, R. P. (2018). On misconceptions and the limited usefulness of ordinal alpha. Educational and Psychological Measurement, 78(6), 1056–1071. https://doi.org/10.1177/0013164417727036
Ο υπολογισμός του Cronbach alpha χωρίς πρώτα να επιβεβαιωθεί πως οι ερωτήσεις αποτελούν έναν ενιαίο παράγοντα είναι ότι το αποτέλεσμα μπορεί να οδηγήσει σε παραπλανητικά ή λανθασμένα συμπεράσματα σχετικά με την αξιοπιστία της κλίμακας. Συγκεκριμένα, ενδέχεται να προκύψουν τα εξής προβλήματα:
Ψευδώς υψηλή τιμή Cronbach’s alpha: Αν οι μεταβλητές δεν μετρούν ένα και μόνο παράγοντα, τότε το alpha μπορεί να βγει υψηλό λόγω της αλληλοσυσχέτισης των ερωτήσεων. Αυτό μπορεί να οδηγήσει στην πεποίθηση πως η κλίμακα έχει υψηλή εσωτερική συνέπεια, ενώ στην πραγματικότητα η μέτρηση είναι πολυδιάστατη και δεν αντικατοπτρίζει ένα ενιαίο κατασκεύασμα.
Ψευδώς χαμηλή τιμή Cronbach’s alpha: Αν οι μεταβλητές αντιπροσωπεύουν διαφορετικές διαστάσεις ή παράγοντες, η μεταξύ τους συσχέτιση μπορεί να είναι χαμηλή, οδηγώντας τον ερευνητή να απορρίψει μια κλίμακα που στην πραγματικότητα περιέχει λειτουργικές υποκλίμακες.
Λανθασμένη εκτίμηση της αξιοπιστίας: Το Cronbach’s alpha βασίζεται στην υπόθεση ότι οι ερωτήσεις μετρούν το ίδιο κατασκεύασμα και ότι υπάρχει μια συγκεκριμένη μορφή συσχέτισης μεταξύ τους. Αν αυτή η υπόθεση δεν ισχύει, η εκτίμηση της αξιοπιστίας μπορεί να είναι είτε υπερεκτιμημένη είτε υποτιμημένη, οδηγώντας σε λανθασμένες αποφάσεις σχετικά με τη χρήση της κλίμακας.
Παραμέληση πολυδιάστατων κλιμάκων: Χωρίς τον έλεγχο πως οι μεταβλητές αποτελούν έναν ή περισσότερους παράγοντες, μπορεί να αγνοηθεί η ύπαρξη πολλαπλών υποκλιμάκων που πρέπει να εξεταστούν ξεχωριστά. Αυτό σημαίνει ότι θα χαθεί η ευκαιρία να κατανοηθούν οι ξεχωριστές διαστάσεις που μπορεί να μετράει η κλίμακα.
Άρα, μία καλή πρακτική, είναι πριν τη χρήση του Cronbach’s alpha, να προηγείται η εξέταση της παραγοντικής δομής των μεταβλητών με τεχνικές όπως η Διερευνητική Παραγοντική Ανάλυση (EFA) και η Επιβεβαιωτική Παραγοντική Ανάλυση (CFA). Με τον τρόπο αυτόν, θα είναι εφικτή η εφαρμογή του Cronbach’s alpha μόνο στις ομάδες ερωτήσεων που μετρούν έναν ενιαίο παράγοντα, εξασφαλίζοντας την εγκυρότητα των αποτελεσμάτων.
Η αξιοπιστία μιας κλίμακας, σχετίζεται με το πόσο σταθερά η κλίμακα μετρά έναν μοναδικό λανθάνων παράγοντα F. Ο τρόπος με τον οποίο κάθε μία μεταβλητή Xi της κλίμακας αντανακλάται στον μοναδικό αυτόν παράγοντα, ποσοτικοποιείται με τον συντελεστή λi, στην εξίσωση \[ X_i = μ_i + λ_i F + ε_i. \] Στην παραπάνω εξίσωση
μi είναι η μέση τιμή της μεταβλητής Xi (θεωρούμε ότι E(F) = 0).
λi είναι το φορτίο της μεταβλητής Xi στον παράγοντα F.
εi είναι το σφάλμα της μέτρησης.
Η σχέση μεταξύ του συντελεστή φόρτισης λi και της διακύμανσης της Xi είναι κρίσιμη για την κατανόηση του πόσο μεγάλο μέρος της διακύμανσης στο Xi εξηγείται από τον λανθάνοντα παράγοντα. Πιο συγκεκριμένα, από τη σχέση: \[ Var(X_i) = λ_i^2 Var(F) + Var(ε_i) \] συνάγουμε ότι η συνολική διακύμανση της παρατηρούμενης μεταβλητής Xi μπορεί να διαμεριστεί σε δύο μέρη:
(α) Τη διακύμανση λi2Var(F) που εξηγείται από τον παράγοντα F
(β) Τη διακύμανση Var(εi) που δεν εξηγείται από τον παράγοντα (ή διακύμανση σφάλματος).
Τώρα, μπορούμε να γράψουμε
\[ \frac{\text{Διακύμανση της } Χ_i \text{ που επεξηγείται από τον F}}{\text{Συνολική Διακύμανση της } X_i} = \frac{ λ_i^2 Var(F)}{ λ_i^2 Var(F) + Var(ε_i)} \] Μία κοινή υπόθεση για τη διακύμανση του F είναι πως Var(F) = 1.
\[ \frac{\text{Διακύμανση της } Χ_i \text{ που επεξηγείται από τον F}}{\text{Συνολική Διακύμανση της } X_i} = \frac{ λ_i^2}{ λ_i^2 + Var(ε_i)} \] Για τον υπολογισμό του συντελεστή ω λαμβάνονται υπόψη οι τυποποιημένες τιμές των μεταβλητών, δηλαδή κάθε μία μεταβλητή Xi μετασχηματίζεται έτσι ώστε E(Xi) = 0 και Var(Xi) = 1. Με την παραδοχή αυτή:
\[ \text{Διακύμανση της } Χ_i \text{ που επεξηγείται από τον F} = \frac{ λ_i^2}{ λ_i^2 + Var(ε_i)} \]
Από την τελευταία έκφραση γίνεται κατανοητό πως εάν το λi2 είναι μεγάλο σε σχέση με το Var(εi), αυτό σημαίνει ότι το μεγαλύτερο μέρος της διακύμανσης της Xi εξηγείται από τον λανθάνοντα παράγοντα. Επομένως, μεγαλύτερες τιμές του το λi2 υποδεικνύουν ισχυρότερες σχέσεις μεταξύ Xi και F. Αντίστοιχα, οι υψηλές φορτίσεις όλων των μεταβλητών, υποδεικνύουν ότι η διακύμανση του συνόλου των μεταβλητών εξηγείται από τον παράγοντα, γεγονός που υποδηλώνει υψηλή αξιοπιστία της κλίμακας.
Επιπλέον, \[ 1 = λ_i^2 + Var(ε_i) \Leftrightarrow Var(ε_i) = 1 - λ_i^2 . \]
Ο συντελεστής ωμέγα (ω) του McDonald είναι ένας συντελεστής σύνθετης αξιοπιστίας (Composite Reliability) που αξιοποιεί τους συντελεστές λi για να υπολογίσει τη συνολική αναλογία της διακύμανσης σε ένα σύνολο παρατηρούμενων μεταβλητών (στοιχείων) που αποδίδεται σε έναν κοινό λανθάνοντα παράγοντα.
Ο συντελεστής ωμέγα βασίζεται σε εκτιμήσεις φορτίων παραγόντων και
διακυμάνσεις των σφαλμάτων που προκύπτουν για ένα συγκεκριμένο μοντέλο
CFA. Ως εκ τούτου, δύο στατιστικές απαιτήσεις πρέπει να
πληρούνται:
Το μοντέλο να ταιριάζει καλά στα εμπειρικά δεδομένα.
Οι εκτιμήσεις παραμέτρων να είναι ακριβείς.
Το μέγεθος του δείγματος πρέπει να είναι αρκετά μεγάλο (π.χ. Ν > 200) για να ληφθούν αξιόπιστες εκτιμήσεις των παραμέτρων του μοντέλου. Ωστόσο, μπορεί και ένα μικρότερο δείγμα να είναι επαρκές όταν οι συντελεστές λ είναι μεγάλοι.
Σχετική αναφορά: https://stats.stackexchange.com/questions/365109/mcdonalds-omega-assumptions-coefficients-and-interpretation
Ο ω λαμβάνει υπόψη τους τυποποιημένους συντελεστές φόρτωσης λi, i=1, 2, .., k, των επιμέρους ερωτήσεων στον κοινό παράγοντα και τις διακυμάνσεις των σφάλματων Var(εi) όπως αυτά υπολογίζονται από μια επιβεβαιωτική παραγοντική ανάλυση (CFA). Στο παραπάνω πλαίσιο
λi2 εκφράζει το ποσοστό της διακύμανσης της αντίστοιχης ερώτησης (item) που εξηγείται από τον λανθάνων παράγοντα.
εi = 1 - λi2, είναι το ποσοστό της διακύμανσης της αντίστοιχης ερώτησης που δεν εξηγείται από τον λανθάνον παράγοντα, δηλαδή αποδίδεται στο σφάλμα της μέτρησης.
Ύστερα από την εφαρμογή της CFA και τον υπολογισμό των λi, από τις εξισώσεις \[ X_i = λ_i F + ε_i, \]
ο συντελεστής ω υπολογίζεται ως:
\[ ω = \frac{(\sum_{i=1}^k λ_i)^2}{(\sum_{i=1}^k λ_i)^2 + \sum_{i=1}^k (1 - λ_i^2)}= \frac{(\sum_{i=1}^k λ_i)^2}{(\sum_{i=1}^k λ_i)^2 + \sum_{i=1}^k Var(ε_i)}. \]
Ο συντελεστής ω μπορεί να θεωρηθεί ως γενίκευση του άλφα του Cronbach αλλά θεωρείται πιο ακριβής εκτίμηση της αξιοπιστίας, ειδικά όταν παραβιάζεται η υπόθεση της ταυ-ισοδυναμίας (ίσα φορτία παραγόντων). Υψηλότερες τιμές (κοντά στο 1) υποδεικνύουν ότι ένα μεγάλο ποσοστό της διακύμανσης οφείλεται στην υποκείμενη κατασκευή, υποδηλώνοντας υψηλότερη αξιοπιστία.
Η παρακάτω συνάρτηση υλοποίεί στην R τον υπολογισμό
my.omega = function(my.data){
items <- paste(names(my.data), collapse = "+")
model <- paste("FactorF", items, sep = "=~")
print(model)
library(lavaan)
fit <- cfa(model, data = my.data)
sl <- standardizedSolution(fit)
sl <- sl$est.std[sl$op == "=~"]
names(sl) <- names(my.data)
re <- 1 - sl^2
omega.reliability = sum(sl)^2 / (sum(sl)^2 + sum(re))
print(round(omega.reliability, 3))
}
Μία ομάδα μαθητών εξετάστηκαν σε τρία test, με τα οποία ελέγχθηκε η ικανότητά τους στη γραφή, στην ανάγνωση και στον προφορικό λόγο. Τα δεδομένα my.data δίνονται παρακάτω:
my.data = as.data.frame(structure(list(speak.score = c(18, 13, 12, 16, 12, 6, 15, 1, 12, 20, 9, 11, 20, 6, 12, 25, 16, 6, 11, 16, 17, 7, 13, 26, 6, 10, 3, 21, 12, 17, 16, 15, 10, 15, 1, 12, 5, 8, 15, 7, 10, 9, 4, 15, 6, 23, 20, 16, 26, 14, 0, 9, 14, 24, 3, 10, 11, 1, 4, 10, 9, 28, 16, 12, 19, 5, 6, 23, 13, 1, 5, 4, 4, 7, 8, 14, 4, 8, 8, 7, 11, 9, 3, 12, 15, 10, 11, 4, 5, 3, 11, 6, 11, 24, 13, 23, 12, 11, 18, 9), read.score = c(18, 19, 7, 17, 14, 11, 15, 4, 14, 15, 10, 15, 19, 7, 10, 19, 20, 4, 11, 12, 18, 4, 20, 19, 3, 11, 9, 18, 10, 17, 15, 17, 9, 14, 2, 17, 2, 6, 18, 13, 9, 10, 3, 20, 10, 19, 18, 14, 19, 13, 8, 8, 9, 16, 3, 15, 14, 5, 7, 11, 14, 20, 16, 12, 17, 5, 7, 17, 14, 6, 3, 5, 6, 11, 6, 15, 2, 9, 11, 2, 12, 5, 8, 14, 16, 12, 6, 4, 4, 7, 14, 2, 6, 19, 19, 15, 8, 11, 15, 13), write.score = c(19, 16, 13, 20, 14, 12, 18, 4, 2, 16, 9, 16, 21, 13, 7, 24, 21, 8, 15, 15, 14, 4, 22, 15, 1, 13, 12, 20, 6, 13, 21, 18, 9, 14, 3, 19, 1, 5, 22, 16, 15, 8, 6, 26, 6, 16, 13, 8, 19, 16, 13, 12, 5, 23, 0, 15, 12, 5, 8, 11, 14, 20, 14, 10, 10, 3, 5, 28, 9, 7, 3, 1, 6, 7, 6, 13, 0, 1, 6, 3, 14, 3, 8, 18, 22, 8, 6, 9, 2, 7, 14, 2, 4, 19, 17, 19, 6, 9, 18, 9)), class = "data.frame", row.names = c(NA, -100L)))
my.omega(my.data)
## [1] "FactorF=~speak.score+read.score+write.score"
## This is lavaan 0.6-17
## lavaan is FREE software! Please report any bugs.
##
## Attaching package: 'lavaan'
## The following object is masked from 'package:psych':
##
## cor2cov
## [1] 0.922
Ο συντελεστής Omega λαμβάνει υπόψη τα διαφορετικά φορτία των ερωτήσεων στον υποκείμενο παράγοντα και υπολογίζει την αξιοπιστία με βάση αυτά τα φορτία. Αν οι ερωτήσεις ανήκουν σε διαφορετικούς παράγοντες, τα φορτία στον κοινό παράγοντα θα είναι χαμηλά ή ασύνδετα. Έτσι, ο Omega θα είναι χαμηλός, γιατί η συνοχή μεταξύ των ερωτήσεων είναι ανεπαρκής.
Ως εκ τούτου, ο συντελεστής Omega του McDonald’s αποτελεί καλύτερη επιλογή για τον έλεγχο της αξιοπιστίας καθώς ελέγχει παράλληλα και την υπόθεση της μοναδικής διάστασης. Ειδικότερα, αν εφαρμοστεί σε ερωτήσεις που δεν ανήκουν σε έναν ενιαίο παράγοντα, τότε η τιμή του θα είναι χαμηλή. Αυτό συμβαίνει επειδή ο συντελεστής Omega υπολογίζει την αξιοπιστία με βάση τα φορτία των ερωτήσεων σε έναν κοινό παράγοντα. Όταν οι ερωτήσεις δεν αποτελούν έναν ενιαίο παράγοντα (δηλαδή όταν υπάρχει πολυδιάστατη δομή), η μεταξύ τους συνοχή θα είναι χαμηλή και, κατά συνέπεια, το Omega θα αποτυπώσει αυτήν την ασυνέπεια.
Αν υπάρχουν 2 μετρήσεις (είτε πριν - μετά από μία παρέμβαση, είτε από δύο διαφορετικούς παρατηρητές), τότε μία επιλογή είναι ο συντελεστής συσχέτισης Pearson.
Αν υπάρχουν περισσότερες από 2 μετρήσεις (π.χ. 5 υποκείμενα που αξιολογούνται από 5 παρατηρητές), τότε μπορεί να χρησιμοποιηθεί ο Διαταξικός Συντελεστής Συσχέτισης (Intraclass Correlation Coefficient - ICC).
Ο συντελεστής συσχέτισης r δύο μεταβλητών Χ και Υ είναι ένας αριθμός μεταξύ -1 και +1 ο οποίος δείχνει το είδος και την ένταση της γραμμικότητας δύο συνεχών μεταβλητών. \[ r_{XY} = \frac{\sum_{i=1}^{n} (x_t - \bar{x_t})( y_{t} - \bar{y_t})}{s_X s_Y} \]
Ο συντελεστής συσχέτισης αξιολογείται σύμφωνα με τον παρακάτω πίνακα:
| Μέτρο συντελεστή r | Είδος σχέσης | ||
|---|---|---|---|
| \[0 ≤ |r| < 0,3\] | Μη γραμμική σχέση | ||
| \[0,3 ≤ |r| < 0,7\] | Ασθενής γραμμική σχέση | \[0,3 ≤ r < 0,7\] | Ασθενής θετική γραμμική σχέση |
| \[ \] | \[-0,7 ≤ r < -0,3\] | Ασθενής αρνητική γραμμική σχέση | |
| \[0,7 ≤ |r| ≤ 1\] | Ισχυρή γραμμική σχέση | \[0,7 ≤ r ≤ 1\] | Ισχυρή θετική γραμμική σχέση |
| \[-1 ≤ r ≤ -0,7\] | Ισχυρή αρνητική γραμμική σχέση |
Στο παρακάτω παράδειγμα παρουσιάζεται ο κώδικας με τον οποίο μπορεί να υπολογιστεί η αξιοπιστία επαναληπτικής μέτρησης με τη γλώσσα R.
# Δημιουργία δεδομένων για δύο χρονικές στιγμές
time1 <- c(3, 4, 2, 5, 4)
time2 <- c(4, 3, 2, 5, 5)
# Υπολογισμός του συντελεστή συσχέτισης Pearson
correlation <- cor(time1, time2, method = "pearson")
print(correlation)
## [1] 0.7735737
Ο Διαταξικός Συντελεστής Συσχέτισης (ICC) κυμαίνεται μεταξύ 0 έως 1, αν και μπορεί να πάρει και αρνητικές τιμές σε ιδιάζουσες περιπτώσεις. Ο δείκτης ερμηνεύεται ως εξής:
Στη γλώσσα R, ο ICC υπολογίζεται από τη συνάρτηση icc της βιβλιοθήκης irr. Όταν εξετάζουμε ποια μορφή ICC είναι κατάλληλη για ένα πραγματικό σύνολο δεδομένων, πρέπει να ληφθούν οι εξής αποφάσεις (Shrout & Fleiss, 1979):
Εάν μόνο τα υποκείμενα πρέπει να θεωρούνται ως τυχαίοι παράγοντες (model = “oneway”) ή και τα υποκείμενα και οι βαθμολογητές επιλέγονται τυχαία από μια μεγαλύτερη αντίστοιχη ομάδα (model = “twoway”).
Εάν οι διαφορές στις μέσες βαθμολογίες των κριτών παρουσιάζουν ενδιαφέρον, θα πρέπει να επιλεγχθεί type = “agreement” αντί για type = “consistency”.
Εάν η μονάδα ανάλυσης είναι ένας μέσος όρος πολλών αξιολογήσεων, τότε θέτουμε unit = “average”. Στις περισσότερες περιπτώσεις ωστόσο, λαμβάνονται υπόψη μεμονωμένες τιμές (unit = “single”).
Κάθε συνδυασμός δίνει μια διαφορετική ερμηνεία του ICC ανάλογα με το αν ενδιαφέρει περισσότερο η συμφωνία ή η συνέπεια και αν αξιολογούνται μεμονωμένες αξιολογήσεις ή οι μέσοι όροι και επιτρέπουν ευελιξία ανάλογα με το σχεδιασμό της μελέτης και τον τύπο της αξιοπιστίας που πρέπει να μετρηθεί.
Περισσότερες πληροφορίες σχετικά με την καταλληλότητα κάθε περίπτωσης υπάρχουν στην ερευνητική εργασία (Koo & Li (2016) όπου παρατίθεται και το διάγραμμα με τις αποφάσεις που πρέπει να ληφθούν σχετικά με την επιλογή του κατάλληλου υπολογισμού.
Koo, T. K., & Li, M. Y. (2016). A Guideline of Selecting and Reporting Intraclass Correlation Coefficients for Reliability Research. Journal of chiropractic medicine, 15(2), 155–163. https://doi.org/10.1016/j.jcm.2016.02.012
Shrout, P. E., & Fleiss, J. L. (1979). Intraclass correlations: Uses in assessing rater reliability. Psychological Bulletin, 86(2), 420–428. https://doi.org/10.1037/0033-2909.86.2.420
Ας υποθέσουμε ότι έχουμε δεδομένα με 3 διαφορετικές μετρήσεις από 5 υποκείμενα.
library(irr)
## Loading required package: lpSolve
ratings <- data.frame(
rater1 = c(4, 3, 5, 4, 2),
rater2 = c(5, 3, 4, 4, 3),
rater3 = c(4, 4, 5, 3, 2)
)
1. model = “oneway”, type = “agreement”, unit = “single”
Αυτή η διαμόρφωση προϋποθέτει ότι μόνο τα υποκείμενα είναι τυχαία επιλεγμένα και εστιάζει στην απόλυτη συμφωνία για μεμονωμένες μετρήσεις.
Παράδειγμα
Μία εκπαιδευμένη νοσοκόμα μέτρησε 3 φορές την αρτηριακή πίεση σε 5
ασθενείς. Αναζητούμε το μέτρο της συμφωνίας μεταξύ των τριών
επαναλαμβανόμενων μετρήσεων για τους 5 ασθενείς.
icc_result <- icc(ratings, model = "oneway", type = "agreement", unit = "single")
print(icc_result)
## Single Score Intraclass Correlation
##
## Model: oneway
## Type : agreement
##
## Subjects = 5
## Raters = 3
## ICC(1) = 0.684
##
## F-Test, H0: r0 = 0 ; H1: r0 > 0
## F(4,10) = 7.5 , p = 0.00464
##
## 95%-Confidence Interval for ICC Population Values:
## 0.184 < ICC < 0.956
2. model = “oneway”, type = “agreement”, unit = “average”
Αυτή η διαμόρφωση προϋποθέτει ότι μόνο τα υποκείμενα είναι τυχαία επιλεγμένα και εστιάζει στην απόλυτη συμφωνία, αλλά αξιολογεί τις μέσες βαθμολογίες.
Παράδειγμα
Ένας προπονητής αξιολογεί την απόδοση 5 αθλητών σε 3 αγωνίσματα και η
μέση βαθμολογία απόδοσης χρησιμοποιείται για αποφάσεις. Θέλουμε να
αξιολογήσουμε την διακριτική ικανότητα του μέσου όρου των
επαναλαμβανόμενων μετρήσεων, ή ισοδύναμα να δόσουμε απάντηση στην
ερώτηση “Αντικατοπτρίζουν οι μέσες βαθμολογίες με ακρίβεια τη σχετική
απόδοση κάθε αθλητή;”
icc_result <- icc(ratings, model = "oneway", type = "agreement", unit = "average")
print(icc_result)
## Average Score Intraclass Correlation
##
## Model: oneway
## Type : agreement
##
## Subjects = 5
## Raters = 3
## ICC(3) = 0.867
##
## F-Test, H0: r0 = 0 ; H1: r0 > 0
## F(4,10) = 7.5 , p = 0.00464
##
## 95%-Confidence Interval for ICC Population Values:
## 0.404 < ICC < 0.985
3. model = “oneway”, type = “consistency”, unit = “single”
Εδώ, τα υποκείμενα είναι τυχαία και εστιάζουμε στη συνέπεια μεταξύ μεμονωμένων μετρήσεων.
Παράδειγμα
Ένας υπάλληλος αξιολόγησε την ποιότητα 5 προϊόντων σε 3 διαφορετικές
χρονικές στιγμές. Επιθυμούμε να ελέγξουμε εάν ο υπάλληλος βαθμολογεί το
ίδιο προϊόν με παρόμοιο τρόπο σε όλες τις περιπτώσεις.
icc_result <- icc(ratings, model = "oneway", type = "consistency", unit = "single")
print(icc_result)
## Single Score Intraclass Correlation
##
## Model: oneway
## Type : consistency
##
## Subjects = 5
## Raters = 3
## ICC(1) = 0.684
##
## F-Test, H0: r0 = 0 ; H1: r0 > 0
## F(4,10) = 7.5 , p = 0.00464
##
## 95%-Confidence Interval for ICC Population Values:
## 0.184 < ICC < 0.956
4. model = “oneway”, type = “consistency”, unit = “average”
Σε αυτήν την περίπτωση υποθέτουμε πως τα υποκείμενα είναι τυχαία και εξετάζουμε τη συνέπεια μεταξύ του μέσου όρου των αξιολογητών.
Παράδειγμα
Μία έρευνα ικανοποίησης πελατών πραγματοποιήθηκε 3 φορές για την ίδια
ομάδα 5 ερωτηθέντων σε 3 διαφορετικές χρονικές στιγμές. Θέλουμε να
αξιολογήσουμε εάν η μέση βαθμολογία ικανοποίησης για κάθε ερωτώμενο στις
3 μετρήσεις δείχνει συνέπεια, αγνοώντας τις μικρές προκαταλήψεις στις
απαντήσεις.
icc_result <- icc(ratings, model = "oneway", type = "consistency", unit = "average")
print(icc_result)
## Average Score Intraclass Correlation
##
## Model: oneway
## Type : consistency
##
## Subjects = 5
## Raters = 3
## ICC(3) = 0.867
##
## F-Test, H0: r0 = 0 ; H1: r0 > 0
## F(4,10) = 7.5 , p = 0.00464
##
## 95%-Confidence Interval for ICC Population Values:
## 0.404 < ICC < 0.985
5. model = “twoway”, type = “agreement”, unit = “single”
Εδώ, τόσο τα υποκείμενα όσο και οι βαθμολογητές είναι τυχαία και εστιάζουμε στην απόλυτη συμφωνία για μεμονωμένες μετρήσεις.
Παράδειγμα
Σε μία ψυχολογική έρευνα 3 ψυχολόγοι αξιολόγησαν το ίδιο σύνολο 5
ασθενών με βάση τις παρατηρήσεις συμπεριφοράς. Θέλουμε να ελέγξουμε εάν
οι αξιολογήσεις των 3 ψυχολόγων συμφωνούν, δηλαδή παρέχουν την ίδια
βαθμολογία για κάθε ασθενή χωρίς να επιτρέπονται συστηματικές διαφορές
μεταξύ των αξιολογητών.
icc_result <- icc(ratings, model = "twoway", type = "agreement", unit = "single")
print(icc_result)
## Single Score Intraclass Correlation
##
## Model: twoway
## Type : agreement
##
## Subjects = 5
## Raters = 3
## ICC(A,1) = 0.677
##
## F-Test, H0: r0 = 0 ; H1: r0 > 0
## F(4,8.52) = 6.25 , p = 0.0122
##
## 95%-Confidence Interval for ICC Population Values:
## 0.102 < ICC < 0.956
6. model = “twoway”, type = “agreement”, unit = “average”
Εδώ, τόσο τα υποκείμενα όσο και οι βαθμολογητές είναι τυχαία επιλεγμένοι, εστιάζοντας στην απόλυτη συμφωνία για τον μέσο όρο των αξιολογήσεων.
Παράδειγμα
Σε μια μελέτη ιατρικής απεικόνισης 3 ακτινολόγοι ερμηνεύουν σαρώσεις για
το ίδιο σύνολο 5 ασθενών. Μας απασχολεί το πόσο διαφέρει η μέση
βαθμολογία των 3 ακτινολόγων για κάθε ασθενή.
icc_result <- icc(ratings, model = "twoway", type = "agreement", unit = "average")
print(icc_result)
## Average Score Intraclass Correlation
##
## Model: twoway
## Type : agreement
##
## Subjects = 5
## Raters = 3
## ICC(A,3) = 0.863
##
## F-Test, H0: r0 = 0 ; H1: r0 > 0
## F(4,8.59) = 6.25 , p = 0.012
##
## 95%-Confidence Interval for ICC Population Values:
## 0.258 < ICC < 0.985
7. model = “twoway”, type = “consistency”, unit = “single” Σε αυτήν την περίπτωση, τόσο τα υποκείμενα όσο και οι αξιολογητές είναι τυχαία και μας ενδιαφέρει η συνέπεια για μεμονωμένες μετρήσεις.
Παράδειγμα
Σε μία γραπτή εξέταση, εξετάστηκαν 5 μαθητές και 3 δάσκαλοι βαθμολόγησαν
τα γραπτά τους. Θέλουμε να ελέγξουμε αν οι δάσκαλοι βαθμολογούν τα
δοκίμια με συνέπεια (ακόμα κι αν ορισμένοι δάσκαλοι είναι συστηματικά
πιο αυστηροί ή πιο επιεικείς), χωρίς να απαιτείται η ακριβής
αντιστοίχιση των αξιολογήσεων.
icc_result <- icc(ratings, model = "twoway", type = "consistency", unit = "single")
print(icc_result)
## Single Score Intraclass Correlation
##
## Model: twoway
## Type : consistency
##
## Subjects = 5
## Raters = 3
## ICC(C,1) = 0.636
##
## F-Test, H0: r0 = 0 ; H1: r0 > 0
## F(4,8) = 6.25 , p = 0.0139
##
## 95%-Confidence Interval for ICC Population Values:
## 0.073 < ICC < 0.948
8. model = “twoway”, type = “consistency”, unit = “average”
Τέλος, εδώ υποθέτουμε ότι τόσο τα υποκείμενα όσο και οι βαθμολογητές είναι τυχαία επιλεγμένοι και εξετάζουμε τη συνέπεια για τον μέσο όρο των αξιολογήσεων. Χρησιμοποιείται όταν θέλουμε να αξιολογήσουμε τη συνοχή των μέσων μετρήσεων τόσο στα υποκείμενα όσο και στους βαθμολογητές, όπου και τα δύο θεωρούνται τυχαία επιλεγμένα από τον αντίστοιχο πληθυσμό.
Παράδειγμα
Οι ίδιοι 5 ασθενείς εξετάστηκαν σε 3 διαφορετικές κλινικές. Μας
απασχολεί το κατά πόσο η μέση τιμή αποτελεί συνεπής δείκτης της υγείας
για κάθε ασθενή, λαμβάνοντας υπόψη πιθανές διαφορές στην ερμηνεία μεταξύ
των αξιολογητών ή των κέντρων.
icc_result <- icc(ratings, model = "twoway", type = "consistency", unit = "average")
print(icc_result)
## Average Score Intraclass Correlation
##
## Model: twoway
## Type : consistency
##
## Subjects = 5
## Raters = 3
## ICC(C,3) = 0.84
##
## F-Test, H0: r0 = 0 ; H1: r0 > 0
## F(4,8) = 6.25 , p = 0.0139
##
## 95%-Confidence Interval for ICC Population Values:
## 0.192 < ICC < 0.982
Οι 8 περιπτώσεις συνοψίζονται στον πίνακα που ακολουθεί:
| Συνδυασμός (model, type, unit) | Παράδειγμα Ερευνητικού Σεναρίου |
|---|---|
| Oneway, Agreement, Single | Νοσηλεύτρια μετράει 3 φορές την αρτηριακή πίεση σε 5 ασθενείς |
| Oneway, Agreement, Average | Προπονητής αθλήματος αξιολογεί την απόδοση 5 αθλητών σε 3 δοκιμασίες |
| Oneway, Consistency, Single | Υπάλληλος αξιολογεί την ποιότητα 5 προϊόντων σε 3 διαφορετικές περιστάσεις |
| Oneway, Consistency, Average | Έρευνα ικανοποίησης 5 πελατών που πραγματοποιείται σε 3 χρονικά σημεία |
| Twoway, Agreement, Single | 3 θεραπευτές αξιολογούν τη συμπεριφορά των ίδιων 5 ασθενών |
| Twoway, Agreement, Average | 3 ακτινολόγοι ερμηνεύουν 5 ιατρικές εικόνες, ελέγχοντας τους μέσους βαθμούς |
| Twoway, Consistency, Single | 3 δάσκαλοι βαθμολογούν τις εκθέσεις 5 μαθητών, με έμφαση στη συνέπεια |
| Twoway, Consistency, Average | Πολυκεντρική κλινική μελέτη μέτρησης αποτελεσμάτων υγείας από 5 ασθενείς σε 3 κέντρα |
1. Λήψη Δεδομένων
Το Ερωτηματολόγιο στάσεων απέναντι στην μάθηση (ALSI) είναι ένα ψυχομετρικό εργαλείο με στόχο τη καταγραφή των στάσεων απέναντι στη μάθηση, όπως αυτή αντανακλάται στις υποκλίμακες βαθιάς προσέγγισης (deep approach: 2, 6, 7, 8, 11, 12, 15, 16), οργανωμένης μελέτης (organized study: 3, 5, 10, 14) και επιφανειακής προσέγγισης (surface approach: 1, 4, 9, 13). Σε σχετική έρευνα, συλλέχθηκαν δεδομένα από 500 ερωτώμενους, τα οποία είναι διαθέσιμα εδώ:
Σχετική αναφορά: https://www.jcmedu.org/jcmedu-articles/medical-students-approaches-to-learning-before-and-after-the-cardiology-problembased-learning-practice.pdf
2. Εισαγωγή Δεδομένων στο R Studio
Εισάγετε τα δεδομένα στην R με το όνομα ALSI.data.
3. Μορφοποίηση Δεδομένων
Αρχικά, τοποθετήστε τις περιγραφές κάθε μίας ερώτησης:
library(Hmisc)
##
## Attaching package: 'Hmisc'
## The following object is masked from 'package:psych':
##
## describe
## The following objects are masked from 'package:base':
##
## format.pval, units
label(ALSI.data$APPR1) = 'Έχω συχνά δυσκολευτεί να βγάλω νόημα από τις πληροφορίες που έπρεπε να θυμηθώ'
label(ALSI.data$APPR2) = 'Συνήθως ξεκινούσα με σκοπό να κατανοήσω εγώ προσωπικά το νόημα των πληροφοριών που είχα να μάθω'
label(ALSI.data$APPR3) = 'Έχω καταβάλει αρκετή προσπάθεια στη μελέτη μου'
label(ALSI.data$APPR4) = 'Πολλά από αυτά που έχω μάθει μοιάζουν να μην είναι τίποτα άλλο παρά ασύνδετα κομμάτια πληροφοριών στο μυαλό μου'
label(ALSI.data$APPR5) = 'Συνολικά θα έλεγα ότι υπήρξα συστηματικός και οργανωμένος στη μελέτη μου'
label(ALSI.data$APPR6) = 'Ιδέες που συνάντησα κατά τη μελέτη μου πυροδότησαν μια μακρά αλυσίδα σκέψεων'
label(ALSI.data$APPR7) = 'Κοίταζα προσεχτικά όλες τις πληροφορίες ή τα ευρήματα που υπήρχαν πριν καταλήξω στα δικά μου συμπεράσματα'
label(ALSI.data$APPR8) = 'Όταν έγραφα και μοιραζόμουν τις σκέψεις μου με άλλους ξανασκεφτόμουν πόσο καλά έδινα στον άλλο να καταλάβει τη σκέψη μου'
label(ALSI.data$APPR9) = 'Τα θέματα παρουσιάζονταν με τόσο πολύπλοκους τρόπους που συχνά δεν μπορούσα να βγάλω νόημα'
label(ALSI.data$APPR10) = 'Έχω οργανώσει προσεκτικά το χρόνο μελέτης μου ώστε να τον αξιοποιήσω όσο γίνεται καλύτερα'
label(ALSI.data$APPR11) = 'Κατά τη μελέτη μου έχω προσπαθήσει να καταλάβω εγώ προσωπικά τι εννοεί ο συγγραφέας'
label(ALSI.data$APPR12) = 'Αν δεν κατανοώ αρκετά καλά το αντικείμενο που μελετώ δοκιμάζω μια άλλη προσέγγιση'
label(ALSI.data$APPR13) = 'Συχνά πρέπει να μάθω και να ξαναμάθω πράγματα που στην ουσία όμως δεν μπορώ να κατανοήσω'
label(ALSI.data$APPR14) = 'Έχω βάλει προσεχτικά σε χρονική προτεραιότητα ότι έχω να κάνω ώστε να μπορέσω να ανταποκριθώ σε όλα'
label(ALSI.data$APPR15) = 'Προσπαθώ να συσχετίσω τη νέα ύλη με ότι ήδη γνωρίζω για ένα θέμα'
label(ALSI.data$APPR16) = 'Προσπαθώ να συνδέσω ό,τι έχω μάθει σε ένα μάθημα με ό,τι έμαθα σε άλλα μαθήματα'
4. Συντελεστές αξιοπιστίας
Σχετικά με την παραγοντική δομή του ALSI, στη βιβλιογραφία αναφέρεται πως υπάρχουν 3 λανθάνουσες διαστάσεις.
Υπολογίζουμε την εσωτερική αξιοπιστία κάθε μίας κλίμακας.
library(ltm)
# deep approach
cronbach.alpha(ALSI.data[, c(2, 6, 7, 8, 11, 12, 15, 16)])
##
## Cronbach's alpha for the 'ALSI.data[, c(2, 6, 7, 8, 11, 12, 15, 16)]' data-set
##
## Items: 8
## Sample units: 500
## alpha: 0.817
my.omega(ALSI.data[, c(2, 6, 7, 8, 11, 12, 15, 16)])
## [1] "FactorF=~APPR2+APPR6+APPR7+APPR8+APPR11+APPR12+APPR15+APPR16"
## [1] 0.818
# surface approach
cronbach.alpha(ALSI.data[, c(1, 4, 9, 13)])
##
## Cronbach's alpha for the 'ALSI.data[, c(1, 4, 9, 13)]' data-set
##
## Items: 4
## Sample units: 500
## alpha: 0.658
my.omega(ALSI.data[, c(1, 4, 9, 13)])
## [1] "FactorF=~APPR1+APPR4+APPR9+APPR13"
## [1] 0.663
# organized study
cronbach.alpha(ALSI.data[, c(3, 5, 10, 14)])
##
## Cronbach's alpha for the 'ALSI.data[, c(3, 5, 10, 14)]' data-set
##
## Items: 4
## Sample units: 500
## alpha: 0.777
my.omega(ALSI.data[, c(3, 5, 10, 14)])
## [1] "FactorF=~APPR3+APPR5+APPR10+APPR14"
## [1] 0.779
1. Λήψη Δεδομένων
Το CDRISC είναι ένα πολύ γνωστό ψυχομετρικό εργαλείο με στόχο τη μέτρηση της ψυχικής ανθεκτικότητας. Έχει πέντε υποκλίμακες που αξιολογούν διαφορετικές πτυχές της ανθεκτικότητας:
Προσωπική Ικανότητα (Personal Competence: 1, 4, 6, 7, 8, 11, 14, 16, 17). Αυτή η υποκλίμακα αντικατοπτρίζει την εμπιστοσύνη στις ικανότητες, τον καθορισμό στόχων και την επιμονή κάποιου.
Εμπιστοσύνη στα Ένστικτα και Ανοχή στα Αρνητικά Συναισθήματα (Trust in One’s Instincts and Tolerance of Negative Emotions: 2, 13, 19, 20). Μετρά την ικανότητα ενός ατόμου να διαχειρίζεται το άγχος και την πίστη του στο ένστικτό του για τη λήψη των σωστών αποφάσεων.
Θετική Αποδοχή της Αλλαγής και Ασφαλείς Σχέσεις (Positive Acceptance of Change and Secure Relationships: 5, 10, 12, 15, 18). Αυτή η υποκλίμακα σχετίζεται με την προσαρμοστικότητα, το άνοιγμα στην αλλαγή και την υποστήριξη ασφαλών σχέσεων.
Έλεγχος (Control: 3, 9). Αυτό μετρά πόσο έλεγχο αισθάνεται ένα άτομο στη ζωή και τα αποτελέσματά του, αντανακλώντας την αυτο-αποτελεσματικότητα.
Πνευματικές Επιρροές (Spiritual Influences: 21, 22, 23, 24, 25). Αυτή η υποκλίμακα καταγράφει το ρόλο της πίστης ή της πνευματικότητας στην παροχή άνεσης και δύναμης σε δύσκολες στιγμές.
Σε σχετική έρευνα, συλλέχθηκαν δεδομένα από 204 ερωτώμενους, τα οποία είναι διαθέσιμα εδώ:
2. Εισαγωγή Δεδομένων στο R Studio
Εισάγετε τα δεδομένα στην R με το όνομα CDRISC.data
3. Μορφοποίηση Δεδομένων
Αρχικά, τοποθετήστε τις περιγραφές κάθε μίας ερώτησης:
library(Hmisc)
label(CDRISC.data$gender) = 'Φύλο'
label(CDRISC.data$age) = 'Ηλικία'
label(CDRISC.data$CDRS1) = 'Μπορώ να προσαρμόζομαι στην αλλαγή '
label(CDRISC.data$CDRS2) = 'Έχω στενές και ασφαλείς σχέσεις '
label(CDRISC.data$CDRS3) = 'Μερικές φορές η μοίρα και ο Θεός μπορούν να βοηθήσουν '
label(CDRISC.data$CDRS4) = 'Μπορώ να τα βγάλω πέρα με ό,τι μου προκύπτει'
label(CDRISC.data$CDRS5) = 'Προηγούμενες επιτυχίες μου δίνουν αυτοπεποίθηση για καινούριες προκλήσεις '
label(CDRISC.data$CDRS6) = 'Βλέπω την εύθυμη πλευρά των πραγμάτων'
label(CDRISC.data$CDRS7) = 'Το να αντεπεξέρχομαι στο στρες μου δίνει δύναμη '
label(CDRISC.data$CDRS8) = 'Έχω την τάση να ανακάμπτω μετά από κάποια δοκιμασία ή ασθένεια '
label(CDRISC.data$CDRS9) = 'Τα πράγματα συμβαίνουν για κάποιο λόγο '
label(CDRISC.data$CDRS10) = 'Κάνω την καλύτερη δυνατή προσπάθεια, ότι και να γίνει '
label(CDRISC.data$CDRS11) = 'Μπορώ να επιτυγχάνω τους στόχους μου '
label(CDRISC.data$CDRS12) = 'Όταν τα πράγματα φαίνονται χωρίς ελπίδα, εγώ δεν παραιτούμαι '
label(CDRISC.data$CDRS13) = 'Ξέρω που να στραφώ για βοήθεια '
label(CDRISC.data$CDRS14) = 'Όταν βρίσκομαι κάτω από πίεση, συγκεντρώνομαι και σκέφτομαι καθαρά '
label(CDRISC.data$CDRS15) = 'Προτιμώ να παίρνω το προβάδισμα στην επίλυση προβλημάτων '
label(CDRISC.data$CDRS16) = 'Δεν αποθαρρύνομαι εύκολα από την αποτυχία '
label(CDRISC.data$CDRS17) = 'Με θεωρώ δυνατό άτομο '
label(CDRISC.data$CDRS18) = 'Μπορώ να παίρνω μη δημοφιλείς ή δύσκολες αποφάσεις '
label(CDRISC.data$CDRS19) = 'Μπορώ να χειρίζομαι δυσάρεστα συναισθήματα '
label(CDRISC.data$CDRS20) = 'Έχω ανάγκη να ακολουθώ τη διαίσθησή μου '
label(CDRISC.data$CDRS21) = 'Έχω ισχυρή αίσθηση σκοπού '
label(CDRISC.data$CDRS22) = 'Νιώθω ότι έχω τον έλεγχο της ζωής μου '
label(CDRISC.data$CDRS23) = 'Μου αρέσουν οι προκλήσεις '
label(CDRISC.data$CDRS24) = 'Εργάζομαι για να επιτυγχάνω τους στόχους μου'
label(CDRISC.data$CDRS25) = 'Καμαρώνω για τις επιτεύξεις μου '
Αφαιρέστε τις απούσες τιμές με την εντολή
CDRISC.data = na.omit(CDRISC.data)
4. Συντελεστές αξιοπιστίας
Σχετικά με την παραγοντική δομή του CDRISC, στη βιβλιογραφία αναφέρεται πως υπάρχουν 5 λανθάνουσες διαστάσεις.
Υπολογίζουμε την εσωτερική αξιοπιστία κάθε μίας κλίμακας.
CDRISC.scale = CDRISC.data[, c(3:27)]
Personal_Competence = CDRISC.scale[, c(1, 4, 6, 7, 8, 11, 14, 16, 17)]
Trust = CDRISC.scale[, c(2, 13, 19, 20)]
Positive_Acceptance = CDRISC.scale[, c(5, 10, 12, 15, 18)]
Control = CDRISC.scale[, c(3, 9)]
Spiritual_Influences = CDRISC.scale[, c(21, 22, 23, 24, 25)]
library(ltm)
# Personal Competence: 1, 4, 6, 7, 8, 11, 14, 16, 17
cronbach.alpha(Personal_Competence)
##
## Cronbach's alpha for the 'Personal_Competence' data-set
##
## Items: 9
## Sample units: 201
## alpha: 0.901
my.omega(Personal_Competence)
## [1] "FactorF=~CDRS1+CDRS4+CDRS6+CDRS7+CDRS8+CDRS11+CDRS14+CDRS16+CDRS17"
## [1] 0.904
# Trust in One's Instincts and Tolerance of Negative Emotions: 2, 13, 19, 20
cronbach.alpha(Trust)
##
## Cronbach's alpha for the 'Trust' data-set
##
## Items: 4
## Sample units: 201
## alpha: 0.702
my.omega(Trust)
## [1] "FactorF=~CDRS2+CDRS13+CDRS19+CDRS20"
## [1] 0.703
# Positive Acceptance of Change and Secure Relationships: 5, 10, 12, 15, 18
cronbach.alpha(Positive_Acceptance)
##
## Cronbach's alpha for the 'Positive_Acceptance' data-set
##
## Items: 5
## Sample units: 201
## alpha: 0.837
my.omega(Positive_Acceptance)
## [1] "FactorF=~CDRS5+CDRS10+CDRS12+CDRS15+CDRS18"
## [1] 0.839
# Control: 3, 9
cronbach.alpha(Control)
##
## Cronbach's alpha for the 'Control' data-set
##
## Items: 2
## Sample units: 201
## alpha: 0.75
my.omega(Control)
## [1] "FactorF=~CDRS3+CDRS9"
## Warning in lav_model_vcov(lavmodel = lavmodel, lavsamplestats = lavsamplestats, : lavaan WARNING:
## Could not compute standard errors! The information matrix could
## not be inverted. This may be a symptom that the model is not
## identified.
## Warning in lav_model_vcov(lavmodel = lavmodel, lavsamplestats = object@SampleStats, : lavaan WARNING:
## Could not compute standard errors! The information matrix could
## not be inverted. This may be a symptom that the model is not
## identified.
## [1] 0.752
# Spiritual Influences: 21, 22, 23, 24, 25
cronbach.alpha(Spiritual_Influences)
##
## Cronbach's alpha for the 'Spiritual_Influences' data-set
##
## Items: 5
## Sample units: 201
## alpha: 0.897
my.omega(Spiritual_Influences)
## [1] "FactorF=~CDRS21+CDRS22+CDRS23+CDRS24+CDRS25"
## [1] 0.898
1. Λήψη Δεδομένων
Το Trait Emotional Intelligence Questionnaire (TEIQue) είναι ένα πολύ γνωστό ψυχομετρικό εργαλείο με στόχο τη μέτρηση της συναισθηματικής νοημοσύνης.
Πληροφορίες για την ελληνική μετάφραση του ερωτηματολογίου είναι διαθέσιμες εδώ (σελ. 88).
Σε σχετική έρευνα, συλλέχθηκαν δεδομένα από 200 ερωτώμενους, τα οποία είναι διαθέσιμα εδώ:
2. Εισαγωγή Δεδομένων στο R Studio
Εισάγετε τα δεδομένα στην R με το όνομα TEI.data
3. Μορφοποίηση Δεδομένων
Τοποθετούμε τις περιγραφές κάθε μίας ερώτησεις με τον παρακάτω κώδικα:
library(Hmisc)
label(TEI.data$gender) = 'Φύλο'
label(TEI.data$age) = 'Ηλικία'
label(TEI.data$tei.q1) = 'Δε δυσκολεύομαι καθόλου να εκφράσω τα συναισθήματά μου με λόγια.'
label(TEI.data$tei.q2) = '(r)Συχνά το βρίσκω δύσκολο να δω τα πράγματα από την οπτική γωνία των άλλων.'
label(TEI.data$tei.q3) = 'Γενικά είμαι ένα ιδιαίτερα δραστήριο άτομο με στόχους.'
label(TEI.data$tei.q4) = '(r)Συνήθως μου είναι δύσκολο να ελέγξω τα συναισθήματά μου.'
label(TEI.data$tei.q5) = '(r)Γενικά δε βρίσκω τη ζωή διασκεδαστική.'
label(TEI.data$tei.q6) = 'Μπορώ να χειριστώ αποτελεσματικά τους άλλους ανθρώπους.'
label(TEI.data$tei.q7) = '(r)Έχω την τάση να αλλάζω γνώμη συχνά.'
label(TEI.data$tei.q8) = '(r)Γενικά δυσκολεύομαι να κατανοήσω τι ακριβώς νιώθω.'
label(TEI.data$tei.q9) = 'Πιστεύω πως έχω πολλά χαρίσματα.'
label(TEI.data$tei.q10) = '(r)Συχνά δυσκολεύομαι να υπερασπισθώ τα δικαιώματά μου. '
label(TEI.data$tei.q11) = 'Συνήθως μπορώ να επηρεάσω τα συναισθήματα των άλλων ανθρώπων. '
label(TEI.data$tei.q12) = '(r)Γενικά είμαι απαισιόδοξος άνθρωπος. '
label(TEI.data$tei.q13) = '(r)Οι κοντινοί μου άνθρωποι παραπονιούνται ότι δεν τους συμπεριφέρομαι σωστά. '
label(TEI.data$tei.q14) = '(r)Συνήθως δυσκολεύομαι να προσαρμόζω τη ζωή μου ανάλογα με τις περιστάσεις. '
label(TEI.data$tei.q15) = 'Γενικά, είμαι ικανός να αντιμετωπίσω το άγχος. '
label(TEI.data$tei.q16) = '(r)Συχνά δυσκολεύομαι να δείχνω στοργή στους κοντινούς μου ανθρώπους. '
label(TEI.data$tei.q17) = 'Συνήθως μπορώ να «μπω στη θέση του άλλου» και να καταλάβω τα συναισθήματά του.'
label(TEI.data$tei.q18) = '(r)Δεν έχω αρκετά κίνητρα στη ζωή μου. '
label(TEI.data$tei.q19) = 'Συνήθως μπορώ να βρω τρόπους να ελέγξω τα συναισθήματά μου όταν το θέλω. '
label(TEI.data$tei.q20) = 'Σε γενικές γραμμές, είμαι ευχαριστημένος από τη ζωή μου. '
label(TEI.data$tei.q21) = 'Θα περιέγραφα τον εαυτό μου ως καλό διαπραγματευτή. '
label(TEI.data$tei.q22) = '(r)Συχνά ανακατεύομαι σε καταστάσεις και αργότερα το μετανιώνω. '
label(TEI.data$tei.q23) = 'Συχνά, σταματώ αυτό που κάνω και συγκεντρώνομαι σε αυτό που νιώθω. '
label(TEI.data$tei.q24) = 'Αισθάνομαι καλά με τον εαυτό μου. '
label(TEI.data$tei.q25) = '(r)Έχω την τάση να υποχωρώ ακόμη και όταν γνωρίζω πως έχω δίκιο. '
label(TEI.data$tei.q26) = '(r)Πιστεύω πως δεν έχω καθόλου επιρροή στα συναισθήματα των άλλων. '
label(TEI.data$tei.q27) = 'Πιστεύω ότι γενικά τα πράγματα θα εξελιχθούν καλά στη ζωή μου. '
label(TEI.data$tei.q28) = '(r)Δυσκολεύομαι να δεθώ πολύ ακόμη και με όσους βρίσκονται πολύ κοντά μου. '
label(TEI.data$tei.q29) = 'Γενικά, μπορώ να προσαρμόζομαι σε καινούρια περιβάλλοντα και καταστάσεις. '
label(TEI.data$tei.q30) = 'Οι άλλοι με θαυμάζουν γιατί είμαι «άνετος».'
4. Ανακωδικοποίηση αποκρίσεων
Είναι συνηθισμένο στις ψυχομετρικές κλίμακες να υπάρχουν κάποιες με αντίθετο τρόπο έκφρασης σε σχέση με τις υπόλοιπες. Στην περίπτωση αυτή, πριν την ανίχνευση δομής, πρέπει να γίνει ανακωδικοποίηση των αποκρίσεων. Στο Trait Emotional Intelligence Questionnaire, οι ερωτήσεις που πρέπει να γίνουν ανακωδικοποίηση είναι οι 16, 2, 18, 4, 5, 7, 22, 8, 10, 25, 26, 12, 13, 28, 14
Σε αυτές τις ερωτήσεις πρέπει να γίνει 1 -> 7, 2 -> 6, 3 -> 5, 4 -> 4, 5 -> 3, 6 -> 2, 7 -> 1.
Αυτό, το πετυχαίνουμε με τον παρακάτω κώδικα:
items.to.reverse = c(16, 2, 18, 4, 5, 7, 22, 8, 10, 25, 26, 12, 13, 28, 14)
for(i in items.to.reverse){
TEI.data[, 2 + i] = 8 - TEI.data[, 2 + i]
}
5. Διαχωρισμός δεδομένων ανά υποκλίμακα
Η κατανομή των ερωτήσεων στις υποκλίμακες είναι διαθέσιμη στην διεύθυνση: https://psychometriclab.com/wp-content/uploads/2019/10/TEIQue-SF-v.-1.50-scoring-key.docx
TEI.scale = TEI.data[, c(3:32)]
well_being = TEI.scale[, c(5, 20, 9, 24, 12, 27)]
self_control = TEI.scale[, c(4, 19, 7, 22, 15, 30)]
emotionality = TEI.scale[, c(1, 16, 2, 17, 8, 23, 13, 28)]
sociability = TEI.scale[, c(6, 21, 10, 25, 11, 26)]
6. Συντελεστές αξιοπιστίας
Σχετικά με την παραγοντική δομή του Trait Emotional Intelligence Questionnaire, στη βιβλιογραφία αναφέρεται πως υπάρχουν 4 λανθάνουσες διαστάσεις (wellbeing, emotionality, sociability, και self-control).
Υπολογίζουμε την εσωτερική αξιοπιστία κάθε μίας κλίμακας.
library(ltm)
# well being
cronbach.alpha(well_being)
##
## Cronbach's alpha for the 'well_being' data-set
##
## Items: 6
## Sample units: 200
## alpha: 0.739
my.omega(well_being)
## [1] "FactorF=~tei.q5+tei.q20+tei.q9+tei.q24+tei.q12+tei.q27"
## [1] 0.785
# self control
cronbach.alpha(self_control)
##
## Cronbach's alpha for the 'self_control' data-set
##
## Items: 6
## Sample units: 200
## alpha: 0.599
my.omega(self_control)
## [1] "FactorF=~tei.q4+tei.q19+tei.q7+tei.q22+tei.q15+tei.q30"
## [1] 0.62
# emotionality
cronbach.alpha(emotionality)
##
## Cronbach's alpha for the 'emotionality' data-set
##
## Items: 8
## Sample units: 200
## alpha: 0.496
my.omega(emotionality)
## [1] "FactorF=~tei.q1+tei.q16+tei.q2+tei.q17+tei.q8+tei.q23+tei.q13+tei.q28"
## [1] 0.53
# sociability
cronbach.alpha(sociability)
##
## Cronbach's alpha for the 'sociability' data-set
##
## Items: 6
## Sample units: 200
## alpha: 0.661
my.omega(sociability)
## [1] "FactorF=~tei.q6+tei.q21+tei.q10+tei.q25+tei.q11+tei.q26"
## [1] 0.666
# Total Scale
cronbach.alpha(TEI.scale)
##
## Cronbach's alpha for the 'TEI.scale' data-set
##
## Items: 30
## Sample units: 200
## alpha: 0.854
my.omega(TEI.scale)
## [1] "FactorF=~tei.q1+tei.q2+tei.q3+tei.q4+tei.q5+tei.q6+tei.q7+tei.q8+tei.q9+tei.q10+tei.q11+tei.q12+tei.q13+tei.q14+tei.q15+tei.q16+tei.q17+tei.q18+tei.q19+tei.q20+tei.q21+tei.q22+tei.q23+tei.q24+tei.q25+tei.q26+tei.q27+tei.q28+tei.q29+tei.q30"
## [1] 0.868
To Ερωτηματολόγιο Πέντε Παραγόντων Προσωπικότητας ΝΕΟ (NEO Five-Factor Inventory [NEO-FFI], Form S) είναι ένα εργαλείο μέτρησης των χαρακτηριστικών της προσωπικότητας. Βασίζεται στη θεωρία των πέντε παραγόντων της προσωπικότητας και έχει σχεδιαστεί με σκοπό την αποτύπωση τους. Αυτοί οι πέντε παράγοντες είναι ο νευρωτισμός, η ευσυνειδησία, η εξωστρέφεια, η ευχαρίστηση και η δεκτικότητα προς νέες εμπειρίες.
Σε σχετική έρευνα, συλλέχθηκαν δεδομένα από 200 ερωτώμενους, τα οποία είναι διαθέσιμα εδώ:
2. Εισαγωγή Δεδομένων στο R Studio
Εισάγετε τα δεδομένα στην R με το όνομα NEO.data
Εναλλακτικά, τα δεδομένα μπορούν να εισαχθούν στην R με copy paste από τον παρακάτω κώδικα:
3. Μορφοποίηση Δεδομένων
Τοποθετούμε τις περιγραφές κάθε μίας ερώτησεις με τον παρακάτω κώδικα:
library(Hmisc)
label(NEO.data$gender) = 'Φύλο'
label(NEO.data$age) = 'Ηλικία'
label(NEO.data$neo.q1) = '(r)Δεν ανησυχώ γενικά'
label(NEO.data$neo.q2) = 'Μου αρέσει να έχω πολύ κόσμο γύρω μου'
label(NEO.data$neo.q3) = '(r)Δε μου αρέσει να χάνω το χρόνο μου ονειροπολώντας'
label(NEO.data$neo.q4) = 'Προσπαθώ να είμαι ευγενικός/η με όλους'
label(NEO.data$neo.q5) = 'Κρατώ τα πράγματά μου καθαρά και τακτοποιημένα'
label(NEO.data$neo.q6) = 'Συχνά νιώθω κατώτερρος/η από τους άλλους'
label(NEO.data$neo.q7) = 'Γελώ εύκολα'
label(NEO.data$neo.q8) = '(r)Όταν βρω το σωστό τρόπο να κάνω κάτι, τον χρησιμοποιώ'
label(NEO.data$neo.q9) = '(r)Συχνά τσακώνομαι με την οικογένειά μου και τους συνεργάτες μου'
label(NEO.data$neo.q10) = 'Είμαι καλός/η στο ναρυθμίζω τον εαυτό μου για να συναντώ προθεσμίες'
label(NEO.data$neo.q11) = 'Όταν βρίσκομαι κάτω από πίεση είναι φορές που νιώθω ότι θα διαλυθώ'
label(NEO.data$neo.q12) = '(r)Γενικά δε θεωρώ τον εαυτό μου ιδιαίτερα “ξένοιαστο”'
label(NEO.data$neo.q13) = 'Γοητεύομαι με τα μοτίβα που υπάρχουν στην τέχνη και στην φύση'
label(NEO.data$neo.q14) = '(r)Κάποιοι θεωρούν ότι είμαι εγωιστής/τρια και εγωκεντρικός/η'
label(NEO.data$neo.q15) = '(r)Δεν είμαι πολύ μεθοδικό άτομο'
label(NEO.data$neo.q16) = '(r)Σπάνια νιώθω μοναξιά ή θλίψη'
label(NEO.data$neo.q17) = 'Πραγματικά απολαμβάνω να μιλώ με κόσμο'
label(NEO.data$neo.q18) = '(r)Πιστεύω ότι με το να αφήνουμε τους μαθητές να ακούν ομιλητές που αμφισβητούν τις καθιερωμένες απόψεις νιώθουν πιο μπερδεμένοι και αποπροσανατολισμένοι'
label(NEO.data$neo.q19) = 'Προτιμώ να συνεργάζομαι με άλλου παρά να τους ανταγωνίζομαι'
label(NEO.data$neo.q20) = 'Προσπαθώ να εκπληρώνω ό.τι μου ανατίθεται με ευσυνειδησία'
label(NEO.data$neo.q21) = 'Συχνά νιώθω ένταση και νευρικότητα'
label(NEO.data$neo.q22) = 'Μου αρέσει να βρίσκομαι όπου υπάρχει δράση'
label(NEO.data$neo.q23) = '(r)Η ποίηση με αγγίζει ελάχιστα ή καθόλου'
label(NEO.data$neo.q24) = '(r)Έχω την τάση να είμαι κυνικός/ή και σκεπτικός/ή όσον αφορά την πρόθεση των άλλων'
label(NEO.data$neo.q25) = 'Έχω ξεκάθαρους στόχους και προσπαθώ να τους επιτύχω δουλεύοντας συστηματικά'
label(NEO.data$neo.q26) = 'Κάποιες φορές νιώθω τελείως ανάξιος/α'
label(NEO.data$neo.q27) = '(r)Συνήθως προτιμώ να κάνω πράγματα μόνος/η μου'
label(NEO.data$neo.q28) = 'Συχνά δοκιμάζω καινούρια και άγνωστα φαγητά'
label(NEO.data$neo.q29) = '(r)Πιστεύω ότι οι περισσότεροι άνθρωποι θα προσπαθήσουν να σε εκμεταλευτούν εάν τους αφήσεις'
label(NEO.data$neo.q30) = '(r)Χάνω πολύ χρόνο προτού συγκεντρωθώ σε μία δουλειά'
label(NEO.data$neo.q31) = '(r)Σπανια νιώθω να είμαι φοβισμένος/η ή αγνωμένος/η'
label(NEO.data$neo.q32) = 'Συχνά νιώθω να είμαι γεμάτος/η ενέργεια'
label(NEO.data$neo.q33) = '(r)Σπάνια προσέχω τη διάθεση που δημιουργούν “διαφορετικά” περιβάλλοντα'
label(NEO.data$neo.q34) = 'Οι περισσότεροι άνθρωποι που γνωρίζω με συμπαθούν'
label(NEO.data$neo.q35) = 'Δουλευω σκληρά για να πετύχω τους στόχους μου'
label(NEO.data$neo.q36) = 'Συχνά θυμώνω με τον τρόπο με τον οποίο οι άνθρωποι με αντιμετωπίζουν'
label(NEO.data$neo.q37) = 'Είμαι ένα χαρούμενο, αισιόδοξο άτομο'
label(NEO.data$neo.q38) = '(r)Πιστεύω ότι θα έπρεπε να στρεφόμαστε στη Θρησκευτική μας Ηγεσία όταν παίρνουμε αποφάσεις ή για θέματα ηθικής τάξης'
label(NEO.data$neo.q39) = '(r)Κάποιοι με θεωρούν άτομο ψυχρό και υπολογιστικό'
label(NEO.data$neo.q40) = 'Όταν δεσμεύομαι προσωπικά για κάτι, αναλαμβάνω υπεύθυνα να ττο φέρω εις πέρας'
label(NEO.data$neo.q41) = 'Πολύ συχνά, όταν τα πράγματα πάνε στραβά, νιώθω απογοητευμένος/η και θέλω να τα παρατήσω'
label(NEO.data$neo.q42) = '(r)εν είμαι γενικά αισιόδοξος/η'
label(NEO.data$neo.q43) = 'Κάποιες φορές όταν βλέπω ένα έργο τέχνης ή διαβάζω ένα ποίημα νιώθω ένα ρίγος ενθουσιασμού να με διαπερνά'
label(NEO.data$neo.q44) = '(r)Είμαι πραγματιστής/τρια και διακατέχομαι από ψυχρή λογική στις θέσεις μου'
label(NEO.data$neo.q45) = '(r)Κάποιες φορές δεν είμαι όσο σταθερός/η και υπεύθυνος/η όσο θα έπρεπε'
label(NEO.data$neo.q46) = '(r)Σπάνια είμαι θλιμμένος/η ή λυπημένος/η'
label(NEO.data$neo.q47) = 'Η ζωή μου έχει γρήγορους ρυθμούς'
label(NEO.data$neo.q48) = '(r)Δε με ενδιαφέρει ιδιαίτερα η ενασχόληση με την φύση του κόσμου ή τις συνθήκες του κόσμου'
label(NEO.data$neo.q49) = 'Γενικά προσπαθώ να είμαι ευαίσθητος/η στις ανάγκες των άλλων'
label(NEO.data$neo.q50) = 'Είμαι ένα παραγωγικό άτομο που ολοκληρώνει τη δουλειά που αναλαμβάνει'
label(NEO.data$neo.q51) = 'Συχνά νιώθω αβοήθητος/η και θέλω κάποιον άλλον να μου λύσει τα προβλήματα'
label(NEO.data$neo.q52) = 'Είμαι πολύ δραστήριο άτομο'
label(NEO.data$neo.q53) = 'Έχω πολλά πνευματικά ενδιαφέροντα'
label(NEO.data$neo.q54) = '(r)Εάν κάποιος/α δε μου είναι συμπαθής τον/την αφήνω να το καταλάβει'
label(NEO.data$neo.q55) = '(r)Ποτέ δεν τα καταφέρνω να οργανωθώ'
label(NEO.data$neo.q56) = 'Κατά καιρούς ένιωσα τόση ντροπή που θα ήθελα να εξαφανιστώ'
label(NEO.data$neo.q57) = '(r)Προτιμώ να κάνω γενικά το δικό μου, παρά να είμαι ο ηγέτης άλλων'
label(NEO.data$neo.q58) = 'Συχνά μου αρέσει να παίζω με ιδέες και με θεωρίες'
label(NEO.data$neo.q59) = '(r)Εάν είναι απαραίτητο είμαι διατεθειμένος/η να “μανουβράρω” τους άλλους προκειμένου να πετύχω αυτό που θέλω'
label(NEO.data$neo.q60) = 'Προσπαθώ να κάνω τέλεις ό,τι κάνω'
4. Ανακωδικοποίηση αποκρίσεων
Είναι συνηθισμένο στις ψυχομετρικές κλίμακες να υπάρχουν κάποιες με αντίθετο τρόπο έκφρασης σε σχέση με τις υπόλοιπες. Στην περίπτωση αυτή, πριν την ανίχνευση δομής, πρέπει να γίνει ανακωδικοποίηση των αποκρίσεων. Στο NEO-FFI, οι ερωτήσεις που πρέπει να γίνουν ανακωδικοποίηση είναι οι 1, 3, 8, 9, 12, 14, 15, 16, 18, 23, 24, 27, 29, 30, 31, 33, 38, 39, 42, 44, 45, 46, 48, 54, 55, 57, 59.
Σε αυτές τις ερωτήσεις πρέπει να γίνει 0 -> 4, 1 -> 3, 2 -> 2, 3 -> 1, 4 -> 0.
Αυτό, το πετυχαίνουμε με τον παρακάτω κώδικα:
items.to.reverse = c(1, 3, 8, 9, 12, 14, 15, 16, 18, 23, 24, 27, 29, 30, 31, 33, 38, 39, 42, 44, 45, 46, 48, 54, 55, 57, 59)
for(i in items.to.reverse){
NEO.data[, 2 + i] = 4 - NEO.data[, 2 + i]
}
5. Διαχωρισμός δεδομένων ανά υποκλίμακα
Η κατανομή των ερωτήσεων στις υποκλίμακες είναι διαθέσιμη στην διεύθυνση: https://eclass.upatras.gr/modules/document/file.php/MST173/%CE%95%CF%81%CF%89%CF%84%CE%B7%CE%BC%CE%B1%CF%84%CE%BF%CE%BB%CF%8C%CE%B3%CE%B9%CE%B1/NEO-FFI%20Greek.pdf
NEO.scale = na.omit(NEO.data[, c(3:62)])
neuroticism = NEO.scale[, c(1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56)]
conscientiousness = NEO.scale[, c(2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57)]
extroversion = NEO.scale[, c(3, 8, 13, 18, 23, 28, 33, 38, 43, 48, 53, 58)]
agreeableness = NEO.scale[, c(4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59)]
receptivity = NEO.scale[, c(5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60)]
6. Συντελεστές αξιοπιστίας
Σχετικά με την παραγοντική δομή του Trait Emotional Intelligence Questionnaire, στη βιβλιογραφία αναφέρεται πως υπάρχουν 4 λανθάνουσες διαστάσεις (wellbeing, emotionality, sociability, και self-control).
Υπολογίζουμε την εσωτερική αξιοπιστία κάθε μίας κλίμακας.
library(ltm)
library(psych)
# neuroticism
cronbach.alpha(neuroticism)
##
## Cronbach's alpha for the 'neuroticism' data-set
##
## Items: 12
## Sample units: 198
## alpha: 0.734
my.omega(neuroticism)
## [1] "FactorF=~neo.q1+neo.q6+neo.q11+neo.q16+neo.q21+neo.q26+neo.q31+neo.q36+neo.q41+neo.q46+neo.q51+neo.q56"
## [1] 0.742
# conscientiousness
cronbach.alpha(conscientiousness)
##
## Cronbach's alpha for the 'conscientiousness' data-set
##
## Items: 12
## Sample units: 198
## alpha: 0.775
my.omega(conscientiousness)
## [1] "FactorF=~neo.q2+neo.q7+neo.q12+neo.q17+neo.q22+neo.q27+neo.q32+neo.q37+neo.q42+neo.q47+neo.q52+neo.q57"
## [1] 0.79
# extroversion
cronbach.alpha(extroversion)
##
## Cronbach's alpha for the 'extroversion' data-set
##
## Items: 12
## Sample units: 198
## alpha: 0.617
my.omega(extroversion)
## [1] "FactorF=~neo.q3+neo.q8+neo.q13+neo.q18+neo.q23+neo.q28+neo.q33+neo.q38+neo.q43+neo.q48+neo.q53+neo.q58"
## [1] 0.627
# agreeableness
cronbach.alpha(agreeableness)
##
## Cronbach's alpha for the 'agreeableness' data-set
##
## Items: 12
## Sample units: 198
## alpha: 0.654
my.omega(agreeableness)
## [1] "FactorF=~neo.q4+neo.q9+neo.q14+neo.q19+neo.q24+neo.q29+neo.q34+neo.q39+neo.q44+neo.q49+neo.q54+neo.q59"
## [1] 0.68
# receptivity
cronbach.alpha(receptivity)
##
## Cronbach's alpha for the 'receptivity' data-set
##
## Items: 12
## Sample units: 198
## alpha: 0.815
my.omega(receptivity)
## [1] "FactorF=~neo.q5+neo.q10+neo.q15+neo.q20+neo.q25+neo.q30+neo.q35+neo.q40+neo.q45+neo.q50+neo.q55+neo.q60"
## [1] 0.824
Επικοινωνία: Επαμεινώνδας Διαμαντοπουλος, Τμήμα ΗΜ/ΜΥ, Δ.Π.Θ. Email: epdiaman@ee.duth.gr. Τηλ: 25410 79757, 6944683327↩︎