Έκδοση: 26 / 10 / 2024

Σημαντική σημείωση
Για την παρακολούθηση των διαδικασιών που περιγράφονται στην ενότητα αυτή ο αναγνώστης πρέπει να έχει προχωρήσει στη λήψη και την εγκατάσταση της γλώσσας R (https://www.r-project.org/) αλλά και του λογισμικού R Studio (https://www.rstudio.com/). Τόσο η γλώσσα R όσο και το R Studio εκτελούνται με τον ίδιο τρόπο σε όλα τα λειτουργικά συστήματα (Windows, Apple, Linux).

Προετοιμασία περιβάλλοντος R
Οι παρακάτω εντολές, ελέγχουν αν έχουν εγκατασταθεί τα απαιτούμενα πακέτα για την εκτέλεση του συνόλου του κώδικα της ενότητας.

list.of.packages <- c("dplyr", "tidyverse", "tidyr", "haven", "openxlsx", "lavaan", "semPlot", "psych")
new.packages <- list.of.packages[!(list.of.packages %in% installed.packages()[,"Package"])]
if(length(new.packages)) install.packages(new.packages)

Όλες οι συναρτήσεις που χρησιμοποιούνται στην ενότητα αυτή βρίσκονται στο αρχείο της γλώσσας R: MyRFunctions.R.

Για να γίνουν διαθέσιμες για χρήση αρκεί να φορτωθούν στο περιβάλλον της R, εκτελώντας την εντολή

source("https://utopia.duth.gr/epdiaman/files/kedivim/MyRFunctions.R")

(Στην περίπτωση όπου γίνει λήψη τοπικά το αρχείο MyRFunctions.R, πρέπει να αλλαξει ανάλογα και η διεύθυνση του αρχείου)

Τα δεδομένα που χρησιμοποιούνται για τις δραστηριότητες αυτής της ενότητας μπορούν να φορτωθούν στο περιβάλλον της R, εκτελώντας την εντολή

source("https://utopia.duth.gr/epdiaman/files/eap/AllSampleData.R")

1 Εισαγωγή

Η αξιοπιστία μιας ψυχομετρικής κλίμακας αναφέρεται στην ικανότητά της να μετρά με συνέπεια ένα ψυχολογικό χαρακτηριστικό. Μια αξιόπιστη κλίμακα πρέπει να δίνει σταθερά και επαναλαμβανόμενα αποτελέσματα όταν χρησιμοποιείται υπό τις ίδιες συνθήκες και με το ίδιο δείγμα.

Στην ανάλυση δεδομένων, η αξιοπιστία ορίζεται ως ο λόγος \[ Αξιοπιστία = \frac{\text{Διακύμανση Πραγματικών Τιμών}}{\text{Διακύμανση Πραγματικών Τιμών + Διακύμανση Σφαλμάτων Εκτίμησης}} \]

Αν η διακύμανση των σφαλμάτων είναι σημαντικά μικρότερη από τη διακύμανση των πραγματικών τιμών, μπορούμε να χαρακτηρίσουμε την μέτρηση ως αξιόπιστη. Στην περίπτωση αυτή ο λόγος της αξιοπιστίας θα είναι κοντά στο 1. Αντίθετα, αν η διακύμανση των σφαλμάτων είναι πολύ μεγάλη σε σχέση με τη διακύμανση των πραγματικών τιμών, αυτό σημαίνει πως η μέτρηση δεν έχει αξιοπιστία καθώς τα σφάλματα επικρατούν. Στην περίπτωση αυτή ο λόγος της αξιοπιστίας θα είναι μικρός.

Αναπαράσταση: https://utopia.duth.gr/epdiaman/files/eap/Unit1/reliability_demonstration.ods

Η υψηλή αξιοπιστία είναι κρίσιμη για την εγκυρότητα των συμπερασμάτων που προκύπτουν από τη χρήση μίας κλίμακας.

Στα πλαίσια του παραπάνω γενικού ορίσμου έχουν αναπτυχθεί διάφοροι τύποι αξιοπιστίας, όπως:

Αξιοπιστία εσωτερικής συνέπειας (internal reliability)
Αφορά τον βαθμό στον οποίο τα επιμέρους στοιχεία μιας κλίμακας συσχετίζονται μεταξύ τους, συνήθως μετριέται με τον δείκτη Cronbach’s α, ή τον δείκτη ω του McDonald.
Αξιοπιστία επαναληπτικής μέτρησης (test-retest reliability) Αξιολογεί κατά πόσο τα αποτελέσματα της κλίμακας παραμένουν σταθερά σε διαφορετικές χρονικές στιγμές.
Διαβαθμολογική αξιοπιστία (Inter-Rater Reliability)
Η διαβαθμολογική αξιοπιστία ή αξιοπιστία διακριτών παρατηρητών αναφέρεται στην αξιολόγηση της συνέπειας ή της συμφωνίας μεταξύ δύο ή περισσότερων παρατηρητών ή αξιολογητών που μετρούν το ίδιο φαινόμενο ή χαρακτηριστικό. Είναι ιδιαίτερα σημαντική σε περιπτώσεις όπου η μέτρηση ή η αξιολόγηση βασίζεται σε υποκειμενικές κρίσεις, όπως η κωδικοποίηση συμπεριφοράς, η βαθμολόγηση δοκιμασιών ή η αξιολόγηση απόδοσης.

2 Αξιοπιστία Ψυχομετρικής Κλίμακας

Έστω ότι μία ψυχομετρική κλίμακα αποτελείται από p παρατηρούμενες μεταβλητές X₁, X₂, …, X_p, που έχουν μετρηθεί n φορές (δηλαδή έγινε δειγματοληψία σε n υποκείμενα). Υποθέτουμε ότι όλες οι μεταβλητές αποτελούν όψεις του ίδιου λανθάνοντος χαρακτηριστικού F.

Ο υπολογισμός της αξιοπιστίας της κλίμακας προϋποθέτει τη γνώση των πραγματικών τιμών της F, οι οποίες δεν είναι γνωστές. Ωστόσο, υποθέτοντας πως η αντανάκλαση της F σε κάθε μία μεταβλητή είναι γραμμική, μπορούμε να γράψουμε:

\[ Χ_1 = μ_1 + λ_{1}F + ε_1, \\ Χ_2 = μ_2 + λ_{2}F + ε_2, \\ ... \\ Χ_p = μ_p + λ_{p}F + ε_p. \] όπου

μ_i η μέση τιμή κάθε μίας μεταβλητής.
λ_i ο συντελεστής που δείχνει πόσο πολύ “φορτώνεται” η μεταβλητή Χ_i στον παράγοντα F.
ε_i το σφάλμα της μέτρησης.

Συνοπτικά, το παραπάνω σύστημα γράφεται:

\[ Χ = M + F^T Λ^T + E \] ή

\[ \begin{bmatrix} X_{11} & X_{21} & \dots & X_{p1} \\ X_{12} & X_{22} & \dots & X_{p2} \\ \vdots & \vdots & \dots & \vdots \\ X_{1n} & X_{2n} & \dots & X_{pn} \end{bmatrix} = \begin{bmatrix} μ_1 & μ_2 & \dots & μ_p \\ μ_1 & μ_2 & \dots & μ_p \\ \vdots & \vdots & \dots & \vdots \\ μ_1 & μ_2 & \dots & μ_p \end{bmatrix} + \begin{bmatrix} f_1 \\ f_2 \\ \vdots \\ f_n \end{bmatrix} \begin{bmatrix} λ_1 & λ_2 & \dots & λ_p \end{bmatrix} + \begin{bmatrix} ε_{11} & ε_{21} & \dots & ε_{p1} \\ ε_{12} & ε_{22} & \dots & ε_{p2} \\ \vdots & \vdots & \dots & \vdots \\ ε_{1n} & ε_{2n} & \dots & ε_{pn} \end{bmatrix} \]

όπου

1. Πίνακας X (n × p): Ο πίνακας X είναι ο πίνακας των k παρατηρούμενων μεταβλητών. \[ X = \begin{bmatrix} X_1 & X_2 & \dots & X_p \end{bmatrix} = \begin{bmatrix} X_{11} & X_{21} & \dots & X_{p1} \\ X_{12} & X_{22} & \dots & X_{p2} \\ \vdots & \vdots & \dots & \vdots \\ X_{1n} & X_{2n} & \dots & X_{pn} \end{bmatrix} \]

Κάθε σειρά αντιστοιχεί σε μια παρατήρηση (συμμετέχων) και κάθε στήλη αντιστοιχεί σε ένα στοιχείο (παρατηρούμενη μεταβλητή).

2. Πίνακας Μ (n × p): Ο πίνακας Μ περιέχει σε κάθε γραμμή τη μέση τιμή της αντίστοιχης μεταβλητής. \[ M = \begin{bmatrix} μ_1 & μ_2 & \dots & μ_p \\ μ_1 & μ_2 & \dots & μ_p \\ \vdots & \vdots & \dots & \vdots \\ μ_1 & μ_2 & \dots & μ_p \end{bmatrix} \]

3. Πίνακας Λ (p x 1) Φορτία Παραγόντων (Factor Loadings): Υποθέτουμε ότι όλες οι μεταβλητές αντανακλούν τον παράγοντα F. Ο πίνακας Λ είναι ο p x 1 πίνακας

\[ Λ = \begin{bmatrix} λ_1 \\ λ_2 \\ \vdots \\ λ_p \end{bmatrix} \]

που περιέχει τα φορτία των μεταβλητών πάνω στον παράγοντα.

4. Πίνακας F (1 × n) (Βαθμολογία παραγόντων): Κάθε μία από τις παρατηρήσεις, αντιπροσωπεύεται από συντεταγμένες ως προς τους m λανθάνοντες παράγοντες. Ο πίνακας F είναι ο 1 x n πίνακας \[ F = \begin{bmatrix} f_1 & f_2 & \dots & f_n \end{bmatrix} \]

που περιέχει τις τιμές των n παρατηρήσεων στον λανθάνον παράγοντα.

5. Πίνακας Ε (n × p) (Σφάλματα): Ο πίνακας Ε είναι ο πίνακας των σφαλμάτων, που περιέχει το τμήμα κάθε παρατήρησης που δεν εξηγείται από τον λανθάνον παράγοντα.

\[ E = \begin{bmatrix} ε_1 & ε_2 & \dots & ε_p \end{bmatrix} = \begin{bmatrix} ε_{11} & ε_{21} & \dots & ε_{p1} \\ ε_{12} & ε_{22} & \dots & ε_{p2} \\ \vdots & \vdots & \dots & \vdots \\ ε_{1n} & ε_{2n} & \dots & ε_{pn} \end{bmatrix} \]

2.1 Υπολογισμός των Λ, F, E.

Aπό τη σχέση \[ Χ = [ΛF]^T + E \] προκύπτει επιπλέον:

\[ Cov(Χ) = Cov([ΛF]^T + E) = Cov([ΛF]^T) + Cov(E) = ΛCov(F)Λ^Τ + Cov(E) \] ή

\[ Σ = ΛΦΛ^T + Θ \]

όπου Σ είναι ο πίνακας των συνδιακυμάνσεων των p μεταβλητών X_i, i = 1, 2, …, p,

\[ Σ = \begin{bmatrix} σ^2_{11} & σ^2_{12} & \ldots & σ^2_{1p} \\ σ^2_{21} & σ^2_{22} & \ldots & σ^2_{2p} \\ \vdots & \vdots & \vdots & \vdots \\ σ^2_{p1} & σ^2_{p2} & \ldots & σ^2_{pp} \end{bmatrix} \] Λ ο πίνακας των συντελεστών λ_i, i = 1, 2, …, p, Φ ο 1 x 1 πίνακας Φ = [Var(F)] και Θ ο διαγώνιος πίνακας με τις διακυμάνσεις των σφαλμάτων υπολογισμού των Χ_i.

Στην εξίσωση Σ = ΛΦΛ^T + Θ υπάρχουν p x p = p² γνωστές ποσότητες στο αριστερό μέρος και p + 1 + p = 2p + 1, άγνωστες ποσότητες στο δεξιό μέρος. Αν p > 2, τότε οι γνωστές ποσότητες είναι περισσότερες από τις άγνωστες και το σύστημα μπορεί να λυθεί.

Ο υπολογισμός των Λ, F, E μπορεί να γίνει με τη Μέθοδο Μέγιστης Πιθανοφάνειας (Maximum Likelihood Estimation - MLE), προσπαθώντας να εντοπίσει την τιμή t που να ελαχιστοποιήσει την διαφορά Σ_observed και Σ_model = ΛΦΛ^T + Θ.

Η διαδικασία MLE ακολουθεί τα εξής βήματα:

Επιλέγεται μία αρχική τιμή για τις παραμέτρους Λ, Φ και Θ. Στο lavaan, συνήθως οι τιμές είναι λ_i = 0, Φ = Ι και Θ = diag(Var(X₁), Var(X₂), …, Var(X_p)).
Υπολογίζεται ο πίνακα συνδιακύμανσης σύμφωνα με το μοντέλο Σ_model = ΛΦΛT+Θ.
Συγκρίνεται το Σ_model με το Σ_observed χρησιμοποιώντας μια συνάρτηση πιθανότητας, η οποία ποσοτικοποιεί τη διαφορά μεταξύ των δύο πινάκων.
Προσαρμόζονται επαναληπτικά οι παράμετροι (φορτώσεις Λ, διακύμανση Φ και μοναδικές διακυμάνσεις Θ) με τρόπο ώστε να μεγιστοποιείται η πιθανότητα (ή ισοδύναμα, να ελαχιστοποιείτε η διαφορά μεταξύ των δύο πινάκων συνδιακύμανσης).
Όσο μεγαλύτερη είναι η απόκλιση μεταξύ Σ_model και Σ_observed, τόσο μικρότερη είναι η πιθανότητα, που σημαίνει ότι το μοντέλο δεν ταιριάζει με τα δεδομένα.
Η διαδικασία σταματά όταν ελαχιστοποιηθεί η απόκλιση, που σημαίνει ότι το μοντέλο ταιριάζει με τα δεδομένα όσο το δυνατόν καλύτερα, δεδομένης της δομής του παράγοντα.

2.2 Ερμηνεία των συντελεστών Λ

Ο παράγοντας F θεωρείται ανεξάρτητος από τα σφάλματα ε_i. Ως εκ τούτου μπορούμε να γράψουμε: \[ Var(Χ_1) = λ_{1}^2Var(F) + Var(ε_1), \\ Var(Χ_2) = λ_{2}^2Var(F) + Var(ε_2), \\ ... \\ Var(Χ_p) = λ_{p}^2Var(F) + Var(ε_p). \] Συμπεραίνουμε ότι:

Η συνολική διακύμανση του στοιχείου X_i είναι το άθροισμα της διακύμανσης του παράγοντα F (πολλαπλασιασμένο με το λ_i²) και της διακύμανσης του σφάλματος. Στο πλαίσιο αυτό ο παράγοντας F δηλώνει το πραγματικό άγνωστο σκορ της λανθάνουσας μεταβλητής.
Εάν το λ_i είναι μεγάλο, κυριαρχεί ο όρος λ_i²Var(F), που σημαίνει ότι ένα μεγάλο μέρος της παρατηρούμενης διακύμανσης στο X_i εξηγείται από τον λανθάνοντα παράγοντα F και η αντίστοιχη μεταβλητή είναι ένας ισχυρός δείκτης του F.
Εάν το λ_i είναι μικρό, η διακύμανση σφάλματος Var(ε_i) γίνεται πιο σημαντική και το X_i είναι ένας ασθενέστερος δείκτης του λανθάνοντος παράγοντα, με μεγαλύτερο ποσό της διακύμανσής του να αποδίδεται σε τυχαίο σφάλμα.

3 Η συνθήκη της ομοιογένειας

Βασική προϋπόθεση για τον υπολογισμό της αξιοπιστίας μία κλίμακας είναι η επιβεβαίωση της ομοιογένειας των ερωτήσεων που αυτή περιέχει, δηλαδή η επιβεβαίωση πως οι ερωτήσεις πράγματι συνιστούν μία κλίμακα και όχι περισσότερες Η έννοια της ομοιογένειας εξειδικεύεται περαιτέρω με τις έννοιες της ταυ-ισοδυναμίας και της παραλληλίας.

3.1 Ομοιογενείς (congeneric) ερωτήσεις

Η γενικότερη υπόθεση που μπορεί να γίνει για ένα σύνολο ερωτήσεων είναι πως αποτελούν μία ομοιογενή ομάδα, δηλαδή πως όλες τους μετρούν την ίδια λανθάνουσα μεταβλητή. Ειδικότερα, δεν υποτίθεται κανένας περιορισμός για το μέτρο που εκφράζει κάθε μία από αυτές την λανθάνουσα μεταβλητή όπως και για τα σφάλματα μέτρησης των ερωτήσεων.

3.1.1 Παραδείγματα ομοιογενών ερωτήσεων

Παράδειγμα 1 (Εργασιακή Ικανοποίηση)
Ερώτηση 1: Νιώθω ότι ο προϊστάμενός μου εκτιμά την εργασία μου.
Ερώτηση 2: Είμαι ικανοποιημένος με το ρόλο μου στην εργασία.
Ερώτηση 3: Απολαμβάνω τις εργασίες που εκτελώ στη δουλειά μου.
Ερώτηση 4: Πιστεύω ότι η δουλειά μου αναγνωρίζεται και εκτιμάται.

Παράδειγμα 2 (Αυτοεκτίμηση)
Ερώτηση 1: Νιώθω ότι είμαι άνθρωπος που αξίζει.
Ερώτηση 2: Είμαι σε θέση να κάνω πράγματα όπως και οι περισσότεροι άλλοι άνθρωποι.
Ερώτηση 3: Έχω θετική στάση απέναντι στον εαυτό μου.
Ερώτηση 4: Νιώθω ικανοποιημένος με τον εαυτό μου.

Παράδειγμα 3 (Γνωστική Ικανότητα στην Αριθμητική)
Ερώτηση 1: Πόσο κάνει 5 + 3;
Ερώτηση 2: Αν 4x + 1 = 9, ποια είναι η τιμή του x;
Ερώτηση 3: Πόσο κάνει 16^0.5;
Ερώτηση 4: Πόσοι αριθμοί ικανοποιούν την εξίσωση 2x² - x - 1 = 0;

3.1.2 Παραδείγματα μη - ομοιογενών ερωτήσεων

Παράδειγμα 1
Ερώτηση 1: Νιώθω ότι με εκτιμούν στο χώρο εργασίας μου. (Εργασιακή Ικανοποίηση)
Ερώτηση 2: Ολοκληρώνω τις εργασίες μου αποτελεσματικά. (Εργασιακή Αποτελεσματικότητα)

Παράδειγμα 2
Ερώτηση 1: Νιώθω σίγουρος για τις ικανότητές μου. (Αυτοεκτίμηση)
Ερώτηση 2: Νιώθω νευρικός όταν μιλάω μπροστά σε άλλους. (Κοινωνικό Άγχος)

Παράδειγμα 3
Ερώτηση 1: Ασκούμαι τακτικά και κάνω μια ισορροπημένη διατροφή. (Σωματική Υγεία)
Ερώτηση 2: Συχνά νιώθω ότι με κυριεύει το άγχος. (Ψυχική Υγεία)

3.2 Ταυ-ισοδύναμες (tau-equivalent) ερωτήσεις

Μία ομάδα ερωτήσεων είναι ταυ-ισοδύναμες όταν αντανακλούν την λανθάνουσα μεταβλητή στον ίδιο βαθμό.

3.2.1 Παραδείγματα ερωτήσεων που αναμένεται να είναι ταυ-ισοδύναμες

Παράδειγμα 1 (Εργασιακή Ικανοποίηση)
Ερώτηση 1: Είμαι ευχαριστημένος με τον τρέχοντα εργασιακό μου ρόλο.
Ερώτηση 2: Βρίσκω τη δουλειά μου ικανοποιητική.
Ερώτηση 3: Αισθάνομαι ικανοποιημένος με τα καθήκοντα που εκτελώ.
Ερώτηση 4: Πιστεύω ότι η δουλειά μου ανταποκρίνεται στις προσδοκίες μου.

Κάθε στοιχείο αναμένεται να εκφράζει στον ίδιο βαθμό την ικανοποίηση από την εργασία.

Παράδειγμα 2 (Αυτοεκτίμηση)
Ερώτηση 1: Αισθάνομαι σίγουρος για τις ικανότητές μου.
Ερώτηση 2: Έχω θετική άποψη για τον εαυτό μου.
Ερώτηση 3: Είμαι περήφανος γι’ αυτό που είμαι.
Ερώτηση 4: Πιστεύω ότι έχω αξία ως άνθρωπος.

Κάθε στοιχείο αναμένεται να αντανακλά την αυτοεκτίμηση του ατόμου στον ίδιο βαθμό.

3.2.2 Παραδείγματα ερωτήσεων που αναμένεται να μην είναι ταυ-ισοδύναμες

Παράδειγμα 1 (Εργασιακή Ικανοποίηση)
Ερώτηση 1: Οι αλληλεπιδράσεις με τους συναδέλφους στη δουλειά μου προσφέρουν ικανοποίηση.
Ερώτηση 2: Νιώθω ότι η δουλειά μου μού επιτρέπει να χρησιμοποιώ αποτελεσματικά τις δεξιότητες και τα ταλέντα μου.
Ερώτηση 3: Είμαι ικανοποιημένος με τα οφέλη και τα προνόμια που προσφέρει η δουλειά μου.

Μεταξύ των παραπάνω ερωτήσεων, η 2^η ερώτηση αναμένεται να έχει υψηλότερο συντελεστή φόρτωσης, επειδή η αποτελεσματική χρήση των δεξιοτήτων κάποιου είναι βασικό συστατικό της ικανοποίησης από την εργασία. Αντίστοιχα, η 1^η και η 3^η ερώτηση αναμένονται να έχουν μέτριο συντελεστή φόρτωσης, καθώς

οι αλληλεπιδράσεις με τους συναδέλφους και
τα οφέλη και τα προνόμια

είναι σημαντικές αλλά όχι οι κύριες πτυχές της ικανοποίησης από την εργασία.

Παράδειγμα 2 (Άγχος)
Ερώτηση 1: Συχνά νιώθω νευρικός για πράγματα που δεν μπορώ να ελέγξω.
Ερώτηση 2: Βιώνω συχνά σωματικά συμπτώματα άγχους, όπως π.χ. ταχυπαλμία.
Ερώτηση 3: Μερικές φορές ανησυχώ για μικρά πράγματα.

Μεταξύ των παραπάνω, η 2^η ερώτηση αναμένεται να έχει υψηλότερη φόρτωση παραγόντων, επειδή τα σωματικά συμπτώματα είναι ισχυρός δείκτης άγχους. Αντίθετα, η 1^η αντικατοπτρίζει μια κοινή πτυχή του άγχους ενώ η 3^η δεν είναι ισχυρός δείκτης γενικού άγχους, άρα αναμένεται να έχει μικρότερο βαθμό συσχέτισης με το γενικό άγχος.

Τα στοιχεία που δεν είναι ταυ-ισοδύναμα επιτρέπουν μια πιο λεπτομερή μέτρηση μιας έννοιας, καθώς αντανακλούν διαφορετικές όψεις ή επίπεδα έντασης μέσα στο κοινό λανθάνον χαρακτηριστικό.

Και οι 4 ερωτήσεις στοχεύουν στη μέτρηση της γνωστικής ικανότητας, ωστόσο ποικίλλουν ως προς τη δυσκολία και την πολυπλοκότητα. Στην πράξη, οι πιο απλές ερωτήσεις 1 και 2 θα απαντηθούν σωστά από τους περισσότερους εξεταζόμενους, συμβάλλοντας ελάχιστα στη διακύμανση των βαθμολογιών του τεστ. Αντίθετα, οι περισσότερο δύσκολες ερωτήσεις 3 και 4 εξαρτώνται περισσσότερο από τις μαθηματικές γνώσεις των ερωτώμενων και ως εκ τούτου μπορούν να διαφοροποιήσουν καλύτερα τα άτομα με διαφορετικά επίπεδα γνωστικής ικανότητας, συμβάλλοντας περισσότερο στη διακύμανση της βαθμολογίας.

Σημείωση
Οι ερωτήσεις που είναι ταυ-ισοδύναμες δεν έχουν απαραίτητα ίδια μέση τιμή. Ενδεικτικά, οι παρακάτω ερωτήσεις μετρούν το άγχος:

Νιώθω νευρικός συχνά.
Αγχώνομαι σε κοινωνικές καταστάσεις.
Συχνά ανησυχώ για το μέλλον μου.

Οι ερωτήσεις αυτές, αναμένεται να είναι ταυ-ισοδύναμες (δηλαδή να έχουν ίσες φορτίσεις παραγόντων στην υποκείμενη δομή άγχους), ωστόσο οι μέσες βαθμολογίες τους αναμένεται να διαφέρουν. Για παράδειγμα, οι ερωτηθέντες μπορεί να βαθμολογήσουν το πρώτο στοιχείο υψηλότερα κατά μέσο όρο, εάν το να νιώθουν νευρικότητα είναι πιο συνηθισμένο για αυτούς παρά να ανησυχούν για το μέλλον. Αυτή η διαφορά στις μέσες βαθμολογίες δεν παραβιάζει την ταυ-ισοδυναμία επειδή η ταυ-ισοδυναμία αφορά την ισότητα της σχέσης (φόρτωσης) μεταξύ κάθε στοιχείου και της υποκείμενης λανθάνουσας κατασκευής, όχι την ισότητα των μέσων βαθμών τους.

3.3 Παράλληλες ερωτήσεις

Μία ομάδα ερωτήσεων ονομάζονται παράλληλες όταν αντανακλούν στον ίδιο βαθμό τη λανθάνουσα μεταβλητή και έχουν επιπλέον ίδιες διακυμάνσεις στο σφάλμα μέτρησης. Συνήθως, είναι σχεδόν πανομοιότυπα σε περιεχόμενο, διασφαλίζοντας ότι μετρούν την υποκείμενη κατασκευή με τον ίδιο ακριβώς τρόπο. Αν και είναι χρήσιμα για τη δημιουργία πολύ αξιόπιστων κλιμάκων, η διατύπωση παράλληλων στοιχείων μπορεί να είναι δύσκολη.

Παραδείγματα ερωτήσεων που αναμένεται να είναι παράλληλες

Παράδειγμα 1 (Ικανοποίηση από τη ζωή)
Ερώτηση 1: Είμαι ικανοποιημένος με τη ζωή μου συνολικά.
Ερώτηση 2: Γενικά, αισθάνομαι ικανοποιημένος με τη ζωή μου.
Ερώτηση 3: Είμαι ευχαριστημένος με τη ζωή μου γενικά.

3.4 Αλγεβρική αναπαράσταση ταυ-ισοδυναμίας και παραλληλίας

Στην παρακάτω εικόνα αναπαριστώνται οι περιπτώσεις της ταυ-ομοιογένειας και της παραλληλίας, αναφορικά με το μοντέλο \[ Χ_i = μ_i + λ_{i}F + ε_i, \quad i = 1, 2, ..., p, \]

$Σχέσεις μεταξύ μεταβλητών κλίμακας$

Σχέσεις μεταξύ μεταβλητών κλίμακας

4 Συντελεστής άλφα του Cronbach (Cronbach’s Alpha)

Το πιο κοινό μέτρο για την αξιοπιστία εσωτερικής συνέπειας. Υπολογίζει τον μέσο όρο όλων των πιθανών συνδυασμών διχοτόμησης των στοιχείων της κλίμακας. Τιμές πάνω από 0.7 θεωρούνται γενικά αποδεκτές, αν και για κάποιες εφαρμογές μπορεί να απαιτείται υψηλότερη τιμή.

4.1 Προϋποθέσεις χρήσης

Η χρήση του δείκτη άλφα του Cronbach ως συντελεστή αξιοπιστίας, έχει τις εξής προϋποθέσεις:

Οι μεταβλητές πρέπει να είναι συνεχείς. Αν είναι διατακτικές (ordinal) τότε ο δείκτης α μπορεί να υπολογιστεί με την επισήμανση πως είναι ένα κάτω όριο της πραγματικής αξιοπιστίας (δηλαδή, η πραγματική αξιοπιστία είναι υψηλότερη από την τιμή του α). Επιπλέον, στην περίπτωση αυτή είναι δυνατός ο υπολογισμός της αντίστοιχης διατακτικής εκδοχής του α (ordinal alpha), ο οποίος υπολογίζεται με τον ίδιο τρόπο, μόνο που αντί του πίνακα συνδιακυμάνσεων, χρησιμοποιείται ο πίνακας των πολυχωρικών συσχετίσεων (Polychoric correlation matrix).
Αν το δείγμα είναι μικρό τότε τα δεδομένα πρέπει να είναι κανονικά κατανεμημένα.
Τα δεδομένα είναι ομοιογενή, δηλαδή όλες οι ερωτήσεις να αντανακλούν την ίδια λανθάνουσα μεταβλητή. Εάν οι ερωτήσεις δεν μετρούν την ίδια λανθάνουσα μεταβλητή, η εφαρμογή του Cronbach’s alpha μπορεί να δώσει ψευδώς υψηλές ή χαμηλές τιμές και να σε οδηγήσει σε λανθασμένα συμπεράσματα για την αξιοπιστία της κλίμακας.
Τα δεδομένα είναι ταυ-ισοδύναμα, δηλαδή όλες οι ερωτήσεις αντανακλούν την ίδια λανθάνουσα μεταβλητή με την ίδια ισχύ. Εάν δεν πληρείται αυτή η υπόθεση, το Cronbach’s alpha δεν είναι αξιόπιστος δείκτης καθώς βασίζεται στην παραδοχή πως όλες οι ερωτήσεις έχουν το ίδιο φορτίο στον λανθάνοντα παράγοντα.
Τα σφάλματα στις μετρήσεις είναι ανεξάρτητα.

4.2 Έλεγχος προϋποθέσεων

Αν το δείγμα είναι μικρό (π.χ. < 30), τότε πρέπει να ελεγχθεί η υπόθεση της κανονικότητας με όλες τις κατάλληλες στατιστικές δοκιμασίες (π.χ. Shapiro - Wilk κλπ).

Όλες οι υπόλοιπες παραδοχές μπορούν να μελετηθούν χρησιμοποιώντας CFA για να επιβεβαιωθεί πως οι ερωτήσεις συνιστούν έναν παράγοντα με αντίστοιχα φορτία πάνω σε αυτόν. Εάν ένα μονοδιάστατο μοντέλο με όλες οι φορτώσεις ίσες και μη συσχετισμένα σφάλματα προσαρμόζεται καλώς στα δεδομένα, τότε οι προϋποθέσεις υπολογισμού του Cronbach α ισχύουν.

Ο συντελεστής α εκφράζει την αξιοπιστία της αντίστοιχης κλίμακας μόνο όταν η υπόθεση της ταυ-ισοδυναμίας μπορεί να γίνει αποδεκτή. Στην περίπτωση όπου η υπόθεση αυτή δεν μπορεί να γίνει αποδεκτή, τότε εναλλακτικά, προτείνεται η χρήση του συντελεστή ω ή της σύνθετης αξιοπιστίας (composite reliability).

4.3 Υπολογισμός

Έστω X_i, i = 1, 2, .., k, οι k ερωτήσεις, σ²_ii = Var(X_i) και σ²_ij = Cov(X_i, X_j). Θεωρούμε το άθροισμα όλων των μεταβλητών \[ T = \sum_{i = 1}^k X_i = X_1 + X_2 + .... + X_k \] Ορίζουμε, σ_T² να είναι η διακύμανση της νέας μεταβλητής Τ. \[ σ_T^2 = Var(\sum_{i = 1}^k X_i) = \sum_{i = 1}^k σ_{ii}^2 + 2 \sum_{j = 1}^k \sum_{i = 1}^j Cov(X_i, X_j) \]

Ο δείκτης αξιοπιστίας άλφα του Cronbach ορίζεται να είναι ο εξής:

\[ α = \frac{k}{k-1} \left( 1 - \frac{\sum_{i=1}^k σ^2_{ii}}{σ_T^2} \right) \]

Παρατηρούμε ότι:

(α) Αν οι ερωτήσεις Χ₁, Χ₂, …, Χ_k, είναι ανεξάρτητες, τότε για i ≠ j, είναι Cov(X_i, X_j) = 0, σ_Τ² = Σ σ_ii^2 και α = 0.

(β) Αν οι ερωτήσεις Χ₁, Χ₂, …, Χ_k, είναι ταυτόσημες τότε όλες θα έχουν την ίδια διακύμανση σ_ii² = σ², ενώ και κάθε συνδιακύμανση θα είναι ίση επίσης με σ². Στην περίπτωση αυτή θα είναι σ_Τ² = k² σ² και α = 1. Στην περίπτωση αυτήν αιτιολογείται και η χρήση του συντελεστή k/(k-1), ο οποίος διασφαλίζει πως, στην περίπτωση ταυτόσημων μεταβλητών η μέγιστη τιμή του στατιστικού α θα είναι 1.

Εκτός από τις ακραίες περιπτώσεις (α) και (β), στην πράξη αναμένουμε να υπάρχουν κάποιες θετικές συσχετίσεις μεταξύ των στοιχείων (υποθέτοντας ότι όλα είναι κωδικοποιημένα προς την ίδια κατεύθυνση), επομένως ο λόγος των διακυμάνσεων θα είναι μικρότερος από 1. Όσο μεγαλύτερες είναι οι συνδιακυμάνσεις, τόσο μεγαλύτερη είναι η τιμή του α.

Είναι αξιοσημείωτο πως ο δείκτης α του Cronbach ορίζεται με φυσικό τρόπο βάσει του πίνακα συνδιακύμανσης \[ Σ = \begin{bmatrix} σ^2_{11} & σ^2_{12} & \ldots & σ^2_{1k} \\ σ^2_{21} & σ^2_{22} & \ldots & σ^2_{2k} \\ \vdots & \vdots & \vdots & \vdots \\ σ^2_{k1} & σ^2_{k2} & \ldots & σ^2_{kk} \end{bmatrix} \] Ιδιαίτερα, παρατηρούμε πως ο αριθμητής που υπάρχει στον τύπο υπολογισμού είναι το ίχνος του πίνακα Σ, ενώ ο παρονομαστής δεν είναι τίποτα άλλο παρά το άθροισμα όλων των στοιχείων του Σ. Συμπεραίνουμε, ότι εναλλακτικά, ο δείκτης α του Cronbach ορίζεται ως:

\[ α = \frac{k}{k-1} \left( 1 - \frac{trace(Σ)}{sum(Σ)} \right) \]

Περισσότερες λεπτομέρειες εδώ:
(1) https://jim.imibh.edu.in/pages/table-of-contents/fulltext/?id=68&title=Cronbach%E2%80%99s+Alpha:+Genesis,+Issues+and+Alternatives
(2) https://stats.stackexchange.com/questions/166670/what-is-cronbachs-alpha-intuitively

4.4 Υλοποίηση στην R

Η παρακάτω συνάρτηση υλοποίεί τον αλγόριθμο του Cronbach α στη γλώσσα R

my.cronbach = function(my.data){
  all.columns = names(my.data)
  
  # Υπολογισμός σ_T^2
  T.var = rowSums(my.data)
  denominator = var(T.var)

  # Υπολογισμός Σσ_i^2
  nominator = 0
  for(acol in all.columns){
    nominator = nominator + var(my.data[, acol])
  }
  
  k = ncol(my.data)
  coeff1 = k/(k-1)
  
  alpha1 = coeff1*(1 - (nominator/denominator))
  print(round(alpha1, 3))
}

Παράδειγμα 1
Μία ομάδα μαθητών εξετάστηκαν σε τρία test, με τα οποία ελέγχθηκε η ικανότητά τους στη γραφή, στην ανάγνωση και στον προφορικό λόγο. Τα δεδομένα my.data δίνονται παρακάτω:

my.data = as.data.frame(structure(list(speak.score = c(18, 13, 12, 16, 12, 6, 15, 1,  12, 20, 9, 11, 20, 6, 12, 25, 16, 6, 11, 16, 17, 7, 13, 26, 6,  10, 3, 21, 12, 17, 16, 15, 10, 15, 1, 12, 5, 8, 15, 7, 10, 9, 4, 15, 6, 23, 20, 16, 26, 14, 0, 9, 14, 24, 3, 10, 11, 1, 4,  10, 9, 28, 16, 12, 19, 5, 6, 23, 13, 1, 5, 4, 4, 7, 8, 14, 4,  8, 8, 7, 11, 9, 3, 12, 15, 10, 11, 4, 5, 3, 11, 6, 11, 24, 13,  23, 12, 11, 18, 9), read.score = c(18, 19, 7, 17, 14, 11, 15,  4, 14, 15, 10, 15, 19, 7, 10, 19, 20, 4, 11, 12, 18, 4, 20, 19, 3, 11, 9, 18, 10, 17, 15, 17, 9, 14, 2, 17, 2, 6, 18, 13, 9,  10, 3, 20, 10, 19, 18, 14, 19, 13, 8, 8, 9, 16, 3, 15, 14, 5,  7, 11, 14, 20, 16, 12, 17, 5, 7, 17, 14, 6, 3, 5, 6, 11, 6, 15,  2, 9, 11, 2, 12, 5, 8, 14, 16, 12, 6, 4, 4, 7, 14, 2, 6, 19,  19, 15, 8, 11, 15, 13), write.score = c(19, 16, 13, 20, 14, 12,  18, 4, 2, 16, 9, 16, 21, 13, 7, 24, 21, 8, 15, 15, 14, 4, 22,  15, 1, 13, 12, 20, 6, 13, 21, 18, 9, 14, 3, 19, 1, 5, 22, 16,  15, 8, 6, 26, 6, 16, 13, 8, 19, 16, 13, 12, 5, 23, 0, 15, 12,  5, 8, 11, 14, 20, 14, 10, 10, 3, 5, 28, 9, 7, 3, 1, 6, 7, 6,  13, 0, 1, 6, 3, 14, 3, 8, 18, 22, 8, 6, 9, 2, 7, 14, 2, 4, 19, 17, 19, 6, 9, 18, 9)), class = "data.frame", row.names = c(NA, -100L)))

Υπολογίζουμε το συντελεστή α:

my.cronbach(my.data)

## [1] 0.913

Μπορούμε να επαληθεύσουμε πως το ίδιο αποτέλεσμα προκύπτει από τη συνάρτηση cronbach.alpha της βιβλιοθήκης ltm

library(ltm)

## Loading required package: MASS

## Loading required package: msm

## Loading required package: polycor

cronbach.alpha(my.data)

## 
## Cronbach's alpha for the 'my.data' data-set
## 
## Items: 3
## Sample units: 100
## alpha: 0.913

Παράδειγμα 2

Item1 = c(1, 2, 3, 4, 5, 3, 4, 2, 4, 3, 3, 4, 2, 4, 3)  
Item2 = c(1, 2, 3, 4, 5, 4, 5, 3, 4, 4, 4, 5, 3, 4, 4)  
Item3 = c(1, 2, 3, 4, 5, 2, 3, 2, 4, 3, 2, 3, 2, 4, 3)  
my.data = data.frame(Item1, Item2, Item3)

my.cronbach(my.data)

## [1] 0.934

Μπορούμε να επαληθεύσουμε πως το ίδιο αποτέλεσμα προκύπτει από τη συνάρτηση cronbach.alpha της βιβλιοθήκης ltm

library(ltm)
cronbach.alpha(my.data)

## 
## Cronbach's alpha for the 'my.data' data-set
## 
## Items: 3
## Sample units: 15
## alpha: 0.934

ή από τη συνάρτηση alpha της βιβλιοθήκης psych

library(psych)

## 
## Attaching package: 'psych'

## The following object is masked from 'package:ltm':
## 
##     factor.scores

## The following object is masked from 'package:polycor':
## 
##     polyserial

alpha(my.data)

## 
## Reliability analysis   
## Call: alpha(x = my.data)
## 
##   raw_alpha std.alpha G6(smc) average_r S/N   ase mean sd median_r
##       0.93      0.93    0.96      0.83  14 0.033  3.2  1     0.89
## 
##     95% confidence boundaries 
##          lower alpha upper
## Feldt     0.84  0.93  0.98
## Duhachek  0.87  0.93  1.00
## 
##  Reliability if an item is dropped:
##       raw_alpha std.alpha G6(smc) average_r  S/N alpha se var.r med.r
## Item1      0.81      0.81    0.69      0.69  4.4    0.096    NA  0.69
## Item2      0.95      0.95    0.91      0.91 19.5    0.025    NA  0.91
## Item3      0.94      0.94    0.89      0.89 15.9    0.031    NA  0.89
## 
##  Item statistics 
##        n raw.r std.r r.cor r.drop mean  sd
## Item1 15  0.99  0.99  0.99   0.98  3.1 1.1
## Item2 15  0.92  0.91  0.88   0.81  3.7 1.1
## Item3 15  0.92  0.92  0.90   0.82  2.9 1.1
## 
## Non missing response frequency for each item
##          1    2    3    4    5 miss
## Item1 0.07 0.20 0.33 0.33 0.07    0
## Item2 0.07 0.07 0.20 0.47 0.20    0
## Item3 0.07 0.33 0.33 0.20 0.07    0

4.4.1 Διατακτική έκδοχη του Cronbach (Ordinal Cronbach)

Αν και ο δείκτης α του Cronbach αφορά συνεχείς μεταβλητές, έχει επικρατήσει ο υπολογισμός και η αναφορά του και στις περιπτώσεις των διατακτικών μεταβλητών. Ειδικότερα, υπάρχουν πολλά επιστημονικά περιοδικά που απαιτούν την αναφορά του δείκτη α του Cronbach, ανεξάρτητα από τη φύση των ερωτήσεων (συνεχείς ή διατακτικές). Στην περίπτωση των διατακτικών η εναλλακτική επιλογή είναι ο υπολογισμός του ίδιου στατιστικού από τον πίνακα των πολυχωρικών συσχετίσεων, στατιστικό που συνήθως καλείται στη βιβλιογραφία ordinal Cronbach alpha. Στην R, αυτό γίνεται με τον παρακάτω κώδικα:

library(psych)
polychoric.pc <- polychoric(my.data)

## Warning in cor.smooth(mat): Matrix was not positive definite, smoothing was
## done

polychoric.pc$rho

##           Item1     Item2     Item3
## Item1 1.0000000 0.9459039 0.9459039
## Item2 0.9459039 1.0000000 0.7894683
## Item3 0.9459039 0.7894683 1.0000000

S = polychoric.pc$rho
ordinal.a = 3/2*(1 - sum(diag(S))/ sum(S))
print(ordinal.a)

## [1] 0.9618868

Εναλλακτικά, μπορούμε να χρησιμοποιήσουμε και τη συνάρτηση alpha, όπως παρακάτω:

alpha(polychoric.pc$rho)

## In smc, smcs < 0 were set to .0
## In smc, smcs < 0 were set to .0

## 
## Reliability analysis   
## Call: alpha(x = polychoric.pc$rho)
## 
##   raw_alpha std.alpha G6(smc) average_r S/N median_r
##       0.96      0.96    0.78      0.89  25     0.95
## 
##     95% confidence boundaries 
##       lower alpha upper
## Feldt  0.59  0.96     1
## 
##  Reliability if an item is dropped:
##       raw_alpha std.alpha G6(smc) average_r  S/N var.r med.r
## Item1      0.88      0.88    0.79      0.79  7.5    NA  0.79
## Item2      0.97      0.97    0.95      0.95 35.0    NA  0.95
## Item3      0.97      0.97    0.95      0.95 35.0    NA  0.95
## 
##  Item statistics 
##          r r.cor r.drop
## Item1 1.00  0.74   1.00
## Item2 0.95  0.91   0.88
## Item3 0.95  0.91   0.88

Σημείωση: Η χρήση του ordinal alpha δεν θεωρείται ασφαλής ως μέτρο αξιοπιστίας από μέρος της επιστημονικής κοινότητας. Ενδεικτικά:

Chalmers, R. P. (2018). On misconceptions and the limited usefulness of ordinal alpha. Educational and Psychological Measurement, 78(6), 1056–1071. https://doi.org/10.1177/0013164417727036

4.5 Η σημασία της μονής διάστασης στα δεδομένα

Ο υπολογισμός του Cronbach alpha χωρίς πρώτα να επιβεβαιωθεί πως οι ερωτήσεις αποτελούν έναν ενιαίο παράγοντα είναι ότι το αποτέλεσμα μπορεί να οδηγήσει σε παραπλανητικά ή λανθασμένα συμπεράσματα σχετικά με την αξιοπιστία της κλίμακας. Συγκεκριμένα, ενδέχεται να προκύψουν τα εξής προβλήματα:

Ψευδώς υψηλή τιμή Cronbach’s alpha: Αν οι μεταβλητές δεν μετρούν ένα και μόνο παράγοντα, τότε το alpha μπορεί να βγει υψηλό λόγω της αλληλοσυσχέτισης των ερωτήσεων. Αυτό μπορεί να οδηγήσει στην πεποίθηση πως η κλίμακα έχει υψηλή εσωτερική συνέπεια, ενώ στην πραγματικότητα η μέτρηση είναι πολυδιάστατη και δεν αντικατοπτρίζει ένα ενιαίο κατασκεύασμα.
Ψευδώς χαμηλή τιμή Cronbach’s alpha: Αν οι μεταβλητές αντιπροσωπεύουν διαφορετικές διαστάσεις ή παράγοντες, η μεταξύ τους συσχέτιση μπορεί να είναι χαμηλή, οδηγώντας τον ερευνητή να απορρίψει μια κλίμακα που στην πραγματικότητα περιέχει λειτουργικές υποκλίμακες.
Λανθασμένη εκτίμηση της αξιοπιστίας: Το Cronbach’s alpha βασίζεται στην υπόθεση ότι οι ερωτήσεις μετρούν το ίδιο κατασκεύασμα και ότι υπάρχει μια συγκεκριμένη μορφή συσχέτισης μεταξύ τους. Αν αυτή η υπόθεση δεν ισχύει, η εκτίμηση της αξιοπιστίας μπορεί να είναι είτε υπερεκτιμημένη είτε υποτιμημένη, οδηγώντας σε λανθασμένες αποφάσεις σχετικά με τη χρήση της κλίμακας.
Παραμέληση πολυδιάστατων κλιμάκων: Χωρίς τον έλεγχο πως οι μεταβλητές αποτελούν έναν ή περισσότερους παράγοντες, μπορεί να αγνοηθεί η ύπαρξη πολλαπλών υποκλιμάκων που πρέπει να εξεταστούν ξεχωριστά. Αυτό σημαίνει ότι θα χαθεί η ευκαιρία να κατανοηθούν οι ξεχωριστές διαστάσεις που μπορεί να μετράει η κλίμακα.

Άρα, μία καλή πρακτική, είναι πριν τη χρήση του Cronbach’s alpha, να προηγείται η εξέταση της παραγοντικής δομής των μεταβλητών με τεχνικές όπως η Διερευνητική Παραγοντική Ανάλυση (EFA) και η Επιβεβαιωτική Παραγοντική Ανάλυση (CFA). Με τον τρόπο αυτόν, θα είναι εφικτή η εφαρμογή του Cronbach’s alpha μόνο στις ομάδες ερωτήσεων που μετρούν έναν ενιαίο παράγοντα, εξασφαλίζοντας την εγκυρότητα των αποτελεσμάτων.

5 Συντελεστής ω

5.1 Εισαγωγή

Η αξιοπιστία μιας κλίμακας, σχετίζεται με το πόσο σταθερά η κλίμακα μετρά έναν μοναδικό λανθάνων παράγοντα F. Ο τρόπος με τον οποίο κάθε μία μεταβλητή X_i της κλίμακας αντανακλάται στον μοναδικό αυτόν παράγοντα, ποσοτικοποιείται με τον συντελεστή λ_i, στην εξίσωση \[ X_i = μ_i + λ_i F + ε_i. \] Στην παραπάνω εξίσωση

μ_i είναι η μέση τιμή της μεταβλητής X_i (θεωρούμε ότι E(F) = 0).
λ_i είναι το φορτίο της μεταβλητής X_i στον παράγοντα F.
ε_i είναι το σφάλμα της μέτρησης.

Η σχέση μεταξύ του συντελεστή φόρτισης λ_i και της διακύμανσης της X_i είναι κρίσιμη για την κατανόηση του πόσο μεγάλο μέρος της διακύμανσης στο X_i εξηγείται από τον λανθάνοντα παράγοντα. Πιο συγκεκριμένα, από τη σχέση: \[ Var(X_i) = λ_i^2 Var(F) + Var(ε_i) \] συνάγουμε ότι η συνολική διακύμανση της παρατηρούμενης μεταβλητής X_i μπορεί να διαμεριστεί σε δύο μέρη:

(α) Τη διακύμανση λ_i²Var(F) που εξηγείται από τον παράγοντα F

(β) Τη διακύμανση Var(ε_i) που δεν εξηγείται από τον παράγοντα (ή διακύμανση σφάλματος).

Τώρα, μπορούμε να γράψουμε

\[ \frac{\text{Διακύμανση της } Χ_i \text{ που επεξηγείται από τον F}}{\text{Συνολική Διακύμανση της } X_i} = \frac{ λ_i^2 Var(F)}{ λ_i^2 Var(F) + Var(ε_i)} \] Μία κοινή υπόθεση για τη διακύμανση του F είναι πως Var(F) = 1.

\[ \frac{\text{Διακύμανση της } Χ_i \text{ που επεξηγείται από τον F}}{\text{Συνολική Διακύμανση της } X_i} = \frac{ λ_i^2}{ λ_i^2 + Var(ε_i)} \] Για τον υπολογισμό του συντελεστή ω λαμβάνονται υπόψη οι τυποποιημένες τιμές των μεταβλητών, δηλαδή κάθε μία μεταβλητή X_i μετασχηματίζεται έτσι ώστε E(X_i) = 0 και Var(X_i) = 1. Με την παραδοχή αυτή:

\[ \text{Διακύμανση της } Χ_i \text{ που επεξηγείται από τον F} = \frac{ λ_i^2}{ λ_i^2 + Var(ε_i)} \]

Από την τελευταία έκφραση γίνεται κατανοητό πως εάν το λ_i² είναι μεγάλο σε σχέση με το Var(ε_i), αυτό σημαίνει ότι το μεγαλύτερο μέρος της διακύμανσης της X_i εξηγείται από τον λανθάνοντα παράγοντα. Επομένως, μεγαλύτερες τιμές του το λ_i² υποδεικνύουν ισχυρότερες σχέσεις μεταξύ X_i και F. Αντίστοιχα, οι υψηλές φορτίσεις όλων των μεταβλητών, υποδεικνύουν ότι η διακύμανση του συνόλου των μεταβλητών εξηγείται από τον παράγοντα, γεγονός που υποδηλώνει υψηλή αξιοπιστία της κλίμακας.

Επιπλέον, \[ 1 = λ_i^2 + Var(ε_i) \Leftrightarrow Var(ε_i) = 1 - λ_i^2 . \]

Ο συντελεστής ωμέγα (ω) του McDonald είναι ένας συντελεστής σύνθετης αξιοπιστίας (Composite Reliability) που αξιοποιεί τους συντελεστές λ_i για να υπολογίσει τη συνολική αναλογία της διακύμανσης σε ένα σύνολο παρατηρούμενων μεταβλητών (στοιχείων) που αποδίδεται σε έναν κοινό λανθάνοντα παράγοντα.

5.2 Προϋποθέσεις

Ο συντελεστής ωμέγα βασίζεται σε εκτιμήσεις φορτίων παραγόντων και διακυμάνσεις των σφαλμάτων που προκύπτουν για ένα συγκεκριμένο μοντέλο CFA. Ως εκ τούτου, δύο στατιστικές απαιτήσεις πρέπει να πληρούνται:

Το μοντέλο να ταιριάζει καλά στα εμπειρικά δεδομένα.
Οι εκτιμήσεις παραμέτρων να είναι ακριβείς.

Το μέγεθος του δείγματος πρέπει να είναι αρκετά μεγάλο (π.χ. Ν > 200) για να ληφθούν αξιόπιστες εκτιμήσεις των παραμέτρων του μοντέλου. Ωστόσο, μπορεί και ένα μικρότερο δείγμα να είναι επαρκές όταν οι συντελεστές λ είναι μεγάλοι.

Σχετική αναφορά: https://stats.stackexchange.com/questions/365109/mcdonalds-omega-assumptions-coefficients-and-interpretation

5.3 Υπολογισμός

Ο ω λαμβάνει υπόψη τους τυποποιημένους συντελεστές φόρτωσης λ_i, i=1, 2, .., k, των επιμέρους ερωτήσεων στον κοινό παράγοντα και τις διακυμάνσεις των σφάλματων Var(ε_i) όπως αυτά υπολογίζονται από μια επιβεβαιωτική παραγοντική ανάλυση (CFA). Στο παραπάνω πλαίσιο

λ_i² εκφράζει το ποσοστό της διακύμανσης της αντίστοιχης ερώτησης (item) που εξηγείται από τον λανθάνων παράγοντα.
ε_i = 1 - λ_i², είναι το ποσοστό της διακύμανσης της αντίστοιχης ερώτησης που δεν εξηγείται από τον λανθάνον παράγοντα, δηλαδή αποδίδεται στο σφάλμα της μέτρησης.

Ύστερα από την εφαρμογή της CFA και τον υπολογισμό των λ_i, από τις εξισώσεις \[ X_i = λ_i F + ε_i, \]

ο συντελεστής ω υπολογίζεται ως:

\[ ω = \frac{(\sum_{i=1}^k λ_i)^2}{(\sum_{i=1}^k λ_i)^2 + \sum_{i=1}^k (1 - λ_i^2)}= \frac{(\sum_{i=1}^k λ_i)^2}{(\sum_{i=1}^k λ_i)^2 + \sum_{i=1}^k Var(ε_i)}. \]

Ο συντελεστής ω μπορεί να θεωρηθεί ως γενίκευση του άλφα του Cronbach αλλά θεωρείται πιο ακριβής εκτίμηση της αξιοπιστίας, ειδικά όταν παραβιάζεται η υπόθεση της ταυ-ισοδυναμίας (ίσα φορτία παραγόντων). Υψηλότερες τιμές (κοντά στο 1) υποδεικνύουν ότι ένα μεγάλο ποσοστό της διακύμανσης οφείλεται στην υποκείμενη κατασκευή, υποδηλώνοντας υψηλότερη αξιοπιστία.

5.4 Υλοποίηση στην R

Η παρακάτω συνάρτηση υλοποίεί στην R τον υπολογισμό

my.omega = function(my.data){
  items <- paste(names(my.data), collapse = "+")
  model <- paste("FactorF", items, sep = "=~")
  print(model)
  
  library(lavaan)
  fit <- cfa(model, data = my.data)
  
  sl <- standardizedSolution(fit)
  sl <- sl$est.std[sl$op == "=~"]
  names(sl) <- names(my.data)
  
  re <- 1 - sl^2
  
  omega.reliability = sum(sl)^2 / (sum(sl)^2 + sum(re))
  
  print(round(omega.reliability, 3))
}

5.5 Παράδειγμα

Μία ομάδα μαθητών εξετάστηκαν σε τρία test, με τα οποία ελέγχθηκε η ικανότητά τους στη γραφή, στην ανάγνωση και στον προφορικό λόγο. Τα δεδομένα my.data δίνονται παρακάτω:

my.data = as.data.frame(structure(list(speak.score = c(18, 13, 12, 16, 12, 6, 15, 1,  12, 20, 9, 11, 20, 6, 12, 25, 16, 6, 11, 16, 17, 7, 13, 26, 6,  10, 3, 21, 12, 17, 16, 15, 10, 15, 1, 12, 5, 8, 15, 7, 10, 9, 4, 15, 6, 23, 20, 16, 26, 14, 0, 9, 14, 24, 3, 10, 11, 1, 4,  10, 9, 28, 16, 12, 19, 5, 6, 23, 13, 1, 5, 4, 4, 7, 8, 14, 4,  8, 8, 7, 11, 9, 3, 12, 15, 10, 11, 4, 5, 3, 11, 6, 11, 24, 13,  23, 12, 11, 18, 9), read.score = c(18, 19, 7, 17, 14, 11, 15,  4, 14, 15, 10, 15, 19, 7, 10, 19, 20, 4, 11, 12, 18, 4, 20, 19, 3, 11, 9, 18, 10, 17, 15, 17, 9, 14, 2, 17, 2, 6, 18, 13, 9,  10, 3, 20, 10, 19, 18, 14, 19, 13, 8, 8, 9, 16, 3, 15, 14, 5,  7, 11, 14, 20, 16, 12, 17, 5, 7, 17, 14, 6, 3, 5, 6, 11, 6, 15,  2, 9, 11, 2, 12, 5, 8, 14, 16, 12, 6, 4, 4, 7, 14, 2, 6, 19,  19, 15, 8, 11, 15, 13), write.score = c(19, 16, 13, 20, 14, 12,  18, 4, 2, 16, 9, 16, 21, 13, 7, 24, 21, 8, 15, 15, 14, 4, 22,  15, 1, 13, 12, 20, 6, 13, 21, 18, 9, 14, 3, 19, 1, 5, 22, 16,  15, 8, 6, 26, 6, 16, 13, 8, 19, 16, 13, 12, 5, 23, 0, 15, 12,  5, 8, 11, 14, 20, 14, 10, 10, 3, 5, 28, 9, 7, 3, 1, 6, 7, 6,  13, 0, 1, 6, 3, 14, 3, 8, 18, 22, 8, 6, 9, 2, 7, 14, 2, 4, 19, 17, 19, 6, 9, 18, 9)), class = "data.frame", row.names = c(NA, -100L)))

my.omega(my.data)

## [1] "FactorF=~speak.score+read.score+write.score"

## This is lavaan 0.6-17
## lavaan is FREE software! Please report any bugs.

## 
## Attaching package: 'lavaan'

## The following object is masked from 'package:psych':
## 
##     cor2cov

## [1] 0.922

5.6 Πλεονεκτήματα του McDonald ω έναντι του Cronbach α

Ο συντελεστής Omega λαμβάνει υπόψη τα διαφορετικά φορτία των ερωτήσεων στον υποκείμενο παράγοντα και υπολογίζει την αξιοπιστία με βάση αυτά τα φορτία. Αν οι ερωτήσεις ανήκουν σε διαφορετικούς παράγοντες, τα φορτία στον κοινό παράγοντα θα είναι χαμηλά ή ασύνδετα. Έτσι, ο Omega θα είναι χαμηλός, γιατί η συνοχή μεταξύ των ερωτήσεων είναι ανεπαρκής.

Ως εκ τούτου, ο συντελεστής Omega του McDonald’s αποτελεί καλύτερη επιλογή για τον έλεγχο της αξιοπιστίας καθώς ελέγχει παράλληλα και την υπόθεση της μοναδικής διάστασης. Ειδικότερα, αν εφαρμοστεί σε ερωτήσεις που δεν ανήκουν σε έναν ενιαίο παράγοντα, τότε η τιμή του θα είναι χαμηλή. Αυτό συμβαίνει επειδή ο συντελεστής Omega υπολογίζει την αξιοπιστία με βάση τα φορτία των ερωτήσεων σε έναν κοινό παράγοντα. Όταν οι ερωτήσεις δεν αποτελούν έναν ενιαίο παράγοντα (δηλαδή όταν υπάρχει πολυδιάστατη δομή), η μεταξύ τους συνοχή θα είναι χαμηλή και, κατά συνέπεια, το Omega θα αποτυπώσει αυτήν την ασυνέπεια.

6 Αξιοπιστία επαναληπτικής μέτρησης (Test-Retest Reliability)

Αν υπάρχουν 2 μετρήσεις (είτε πριν - μετά από μία παρέμβαση, είτε από δύο διαφορετικούς παρατηρητές), τότε μία επιλογή είναι ο συντελεστής συσχέτισης Pearson.

Αν υπάρχουν περισσότερες από 2 μετρήσεις (π.χ. 5 υποκείμενα που αξιολογούνται από 5 παρατηρητές), τότε μπορεί να χρησιμοποιηθεί ο Διαταξικός Συντελεστής Συσχέτισης (Intraclass Correlation Coefficient - ICC).

6.1 Συντελεστής συσχέτισης Pearson

Ο συντελεστής συσχέτισης r δύο μεταβλητών Χ και Υ είναι ένας αριθμός μεταξύ -1 και +1 ο οποίος δείχνει το είδος και την ένταση της γραμμικότητας δύο συνεχών μεταβλητών. \[ r_{XY} = \frac{\sum_{i=1}^{n} (x_t - \bar{x_t})( y_{t} - \bar{y_t})}{s_X s_Y} \]

Ο συντελεστής συσχέτισης αξιολογείται σύμφωνα με τον παρακάτω πίνακα:

Μέτρο συντελεστή r	Είδος σχέσης
\[0 ≤ \|r\| < 0,3\]	Μη γραμμική σχέση
\[0,3 ≤ \|r\| < 0,7\]	Ασθενής γραμμική σχέση	\[0,3 ≤ r < 0,7\]	Ασθενής θετική γραμμική σχέση
\[ \]		\[-0,7 ≤ r < -0,3\]	Ασθενής αρνητική γραμμική σχέση
\[0,7 ≤ \|r\| ≤ 1\]	Ισχυρή γραμμική σχέση	\[0,7 ≤ r ≤ 1\]	Ισχυρή θετική γραμμική σχέση
		\[-1 ≤ r ≤ -0,7\]	Ισχυρή αρνητική γραμμική σχέση

Ενδεικτικά παραδείγματα, παρουσιάζονται στην παρακάτω εικόνα (πηγή: Wikipedia)

Παραδείγματα συντελεστών συσχέτισης

Στην παρακάτω εικόνα παρουσιάζεται η μεγάλη ποικιλία που μπορεί να λάβει ο συντελεστής συσχέτισης. Προσέξτε πως η μη γραμμική σχέση δύο μεταβλητών, δεν αντικατοπτρίζεται σε αυξημένο συντελεστσή.

Παραδείγματα συντελεστών συσχέτισης

Στο παρακάτω παράδειγμα παρουσιάζεται ο κώδικας με τον οποίο μπορεί να υπολογιστεί η αξιοπιστία επαναληπτικής μέτρησης με τη γλώσσα R.

# Δημιουργία δεδομένων για δύο χρονικές στιγμές
time1 <- c(3, 4, 2, 5, 4)
time2 <- c(4, 3, 2, 5, 5)

# Υπολογισμός του συντελεστή συσχέτισης Pearson
correlation <- cor(time1, time2, method = "pearson")
print(correlation)

## [1] 0.7735737

6.2 Διαταξικός Συντελεστής Συσχέτισης (Intraclass Correlation Coefficient - ICC)

Ο Διαταξικός Συντελεστής Συσχέτισης (ICC) κυμαίνεται μεταξύ 0 έως 1, αν και μπορεί να πάρει και αρνητικές τιμές σε ιδιάζουσες περιπτώσεις. Ο δείκτης ερμηνεύεται ως εξής:

μικρότερος από το 0: Πολύ κακή συμφωνία, κάτι μπορεί να μην πάει καλά με τα δεδομένα ή το μοντέλο.
0 έως 0,5: Κακή έως μέτρια συμφωνία.
0,5 έως 0,75: Μέτρια συμφωνία.
0,75 έως 0,9: Καλή συμφωνία.
μεγαλύτερος από το 0,9: Εξαιρετική συμφωνία.

Στη γλώσσα R, ο ICC υπολογίζεται από τη συνάρτηση icc της βιβλιοθήκης irr. Όταν εξετάζουμε ποια μορφή ICC είναι κατάλληλη για ένα πραγματικό σύνολο δεδομένων, πρέπει να ληφθούν οι εξής αποφάσεις (Shrout & Fleiss, 1979):

Εάν μόνο τα υποκείμενα πρέπει να θεωρούνται ως τυχαίοι παράγοντες (model = “oneway”) ή και τα υποκείμενα και οι βαθμολογητές επιλέγονται τυχαία από μια μεγαλύτερη αντίστοιχη ομάδα (model = “twoway”).
Εάν οι διαφορές στις μέσες βαθμολογίες των κριτών παρουσιάζουν ενδιαφέρον, θα πρέπει να επιλεγχθεί type = “agreement” αντί για type = “consistency”.
Εάν η μονάδα ανάλυσης είναι ένας μέσος όρος πολλών αξιολογήσεων, τότε θέτουμε unit = “average”. Στις περισσότερες περιπτώσεις ωστόσο, λαμβάνονται υπόψη μεμονωμένες τιμές (unit = “single”).

Κάθε συνδυασμός δίνει μια διαφορετική ερμηνεία του ICC ανάλογα με το αν ενδιαφέρει περισσότερο η συμφωνία ή η συνέπεια και αν αξιολογούνται μεμονωμένες αξιολογήσεις ή οι μέσοι όροι και επιτρέπουν ευελιξία ανάλογα με το σχεδιασμό της μελέτης και τον τύπο της αξιοπιστίας που πρέπει να μετρηθεί.

Περισσότερες πληροφορίες σχετικά με την καταλληλότητα κάθε περίπτωσης υπάρχουν στην ερευνητική εργασία (Koo & Li (2016) όπου παρατίθεται και το διάγραμμα με τις αποφάσεις που πρέπει να ληφθούν σχετικά με την επιλογή του κατάλληλου υπολογισμού.

Koo, T. K., & Li, M. Y. (2016). A Guideline of Selecting and Reporting Intraclass Correlation Coefficients for Reliability Research. Journal of chiropractic medicine, 15(2), 155–163. https://doi.org/10.1016/j.jcm.2016.02.012

Shrout, P. E., & Fleiss, J. L. (1979). Intraclass correlations: Uses in assessing rater reliability. Psychological Bulletin, 86(2), 420–428. https://doi.org/10.1037/0033-2909.86.2.420

6.2.1 Οι 8 διαφορετικές περίπτωσεις

Ας υποθέσουμε ότι έχουμε δεδομένα με 3 διαφορετικές μετρήσεις από 5 υποκείμενα.

library(irr)

## Loading required package: lpSolve

ratings <- data.frame(
  rater1 = c(4, 3, 5, 4, 2),
  rater2 = c(5, 3, 4, 4, 3),
  rater3 = c(4, 4, 5, 3, 2)
)

1. model = “oneway”, type = “agreement”, unit = “single”

Αυτή η διαμόρφωση προϋποθέτει ότι μόνο τα υποκείμενα είναι τυχαία επιλεγμένα και εστιάζει στην απόλυτη συμφωνία για μεμονωμένες μετρήσεις.

Παράδειγμα
Μία εκπαιδευμένη νοσοκόμα μέτρησε 3 φορές την αρτηριακή πίεση σε 5 ασθενείς. Αναζητούμε το μέτρο της συμφωνίας μεταξύ των τριών επαναλαμβανόμενων μετρήσεων για τους 5 ασθενείς.

icc_result <- icc(ratings, model = "oneway", type = "agreement", unit = "single")
print(icc_result)

##  Single Score Intraclass Correlation
## 
##    Model: oneway 
##    Type : agreement 
## 
##    Subjects = 5 
##      Raters = 3 
##      ICC(1) = 0.684
## 
##  F-Test, H0: r0 = 0 ; H1: r0 > 0 
##     F(4,10) = 7.5 , p = 0.00464 
## 
##  95%-Confidence Interval for ICC Population Values:
##   0.184 < ICC < 0.956

2. model = “oneway”, type = “agreement”, unit = “average”

Αυτή η διαμόρφωση προϋποθέτει ότι μόνο τα υποκείμενα είναι τυχαία επιλεγμένα και εστιάζει στην απόλυτη συμφωνία, αλλά αξιολογεί τις μέσες βαθμολογίες.

Παράδειγμα
Ένας προπονητής αξιολογεί την απόδοση 5 αθλητών σε 3 αγωνίσματα και η μέση βαθμολογία απόδοσης χρησιμοποιείται για αποφάσεις. Θέλουμε να αξιολογήσουμε την διακριτική ικανότητα του μέσου όρου των επαναλαμβανόμενων μετρήσεων, ή ισοδύναμα να δόσουμε απάντηση στην ερώτηση “Αντικατοπτρίζουν οι μέσες βαθμολογίες με ακρίβεια τη σχετική απόδοση κάθε αθλητή;”

icc_result <- icc(ratings, model = "oneway", type = "agreement", unit = "average")
print(icc_result)

##  Average Score Intraclass Correlation
## 
##    Model: oneway 
##    Type : agreement 
## 
##    Subjects = 5 
##      Raters = 3 
##      ICC(3) = 0.867
## 
##  F-Test, H0: r0 = 0 ; H1: r0 > 0 
##     F(4,10) = 7.5 , p = 0.00464 
## 
##  95%-Confidence Interval for ICC Population Values:
##   0.404 < ICC < 0.985

3. model = “oneway”, type = “consistency”, unit = “single”

Εδώ, τα υποκείμενα είναι τυχαία και εστιάζουμε στη συνέπεια μεταξύ μεμονωμένων μετρήσεων.

Παράδειγμα
Ένας υπάλληλος αξιολόγησε την ποιότητα 5 προϊόντων σε 3 διαφορετικές χρονικές στιγμές. Επιθυμούμε να ελέγξουμε εάν ο υπάλληλος βαθμολογεί το ίδιο προϊόν με παρόμοιο τρόπο σε όλες τις περιπτώσεις.

icc_result <- icc(ratings, model = "oneway", type = "consistency", unit = "single")
print(icc_result)

##  Single Score Intraclass Correlation
## 
##    Model: oneway 
##    Type : consistency 
## 
##    Subjects = 5 
##      Raters = 3 
##      ICC(1) = 0.684
## 
##  F-Test, H0: r0 = 0 ; H1: r0 > 0 
##     F(4,10) = 7.5 , p = 0.00464 
## 
##  95%-Confidence Interval for ICC Population Values:
##   0.184 < ICC < 0.956

4. model = “oneway”, type = “consistency”, unit = “average”

Σε αυτήν την περίπτωση υποθέτουμε πως τα υποκείμενα είναι τυχαία και εξετάζουμε τη συνέπεια μεταξύ του μέσου όρου των αξιολογητών.

Παράδειγμα
Μία έρευνα ικανοποίησης πελατών πραγματοποιήθηκε 3 φορές για την ίδια ομάδα 5 ερωτηθέντων σε 3 διαφορετικές χρονικές στιγμές. Θέλουμε να αξιολογήσουμε εάν η μέση βαθμολογία ικανοποίησης για κάθε ερωτώμενο στις 3 μετρήσεις δείχνει συνέπεια, αγνοώντας τις μικρές προκαταλήψεις στις απαντήσεις.

icc_result <- icc(ratings, model = "oneway", type = "consistency", unit = "average")
print(icc_result)

##  Average Score Intraclass Correlation
## 
##    Model: oneway 
##    Type : consistency 
## 
##    Subjects = 5 
##      Raters = 3 
##      ICC(3) = 0.867
## 
##  F-Test, H0: r0 = 0 ; H1: r0 > 0 
##     F(4,10) = 7.5 , p = 0.00464 
## 
##  95%-Confidence Interval for ICC Population Values:
##   0.404 < ICC < 0.985

5. model = “twoway”, type = “agreement”, unit = “single”

Εδώ, τόσο τα υποκείμενα όσο και οι βαθμολογητές είναι τυχαία και εστιάζουμε στην απόλυτη συμφωνία για μεμονωμένες μετρήσεις.

Παράδειγμα
Σε μία ψυχολογική έρευνα 3 ψυχολόγοι αξιολόγησαν το ίδιο σύνολο 5 ασθενών με βάση τις παρατηρήσεις συμπεριφοράς. Θέλουμε να ελέγξουμε εάν οι αξιολογήσεις των 3 ψυχολόγων συμφωνούν, δηλαδή παρέχουν την ίδια βαθμολογία για κάθε ασθενή χωρίς να επιτρέπονται συστηματικές διαφορές μεταξύ των αξιολογητών.

icc_result <- icc(ratings, model = "twoway", type = "agreement", unit = "single")
print(icc_result)

##  Single Score Intraclass Correlation
## 
##    Model: twoway 
##    Type : agreement 
## 
##    Subjects = 5 
##      Raters = 3 
##    ICC(A,1) = 0.677
## 
##  F-Test, H0: r0 = 0 ; H1: r0 > 0 
##   F(4,8.52) = 6.25 , p = 0.0122 
## 
##  95%-Confidence Interval for ICC Population Values:
##   0.102 < ICC < 0.956

6. model = “twoway”, type = “agreement”, unit = “average”

Εδώ, τόσο τα υποκείμενα όσο και οι βαθμολογητές είναι τυχαία επιλεγμένοι, εστιάζοντας στην απόλυτη συμφωνία για τον μέσο όρο των αξιολογήσεων.

Παράδειγμα
Σε μια μελέτη ιατρικής απεικόνισης 3 ακτινολόγοι ερμηνεύουν σαρώσεις για το ίδιο σύνολο 5 ασθενών. Μας απασχολεί το πόσο διαφέρει η μέση βαθμολογία των 3 ακτινολόγων για κάθε ασθενή.

icc_result <- icc(ratings, model = "twoway", type = "agreement", unit = "average")
print(icc_result)

##  Average Score Intraclass Correlation
## 
##    Model: twoway 
##    Type : agreement 
## 
##    Subjects = 5 
##      Raters = 3 
##    ICC(A,3) = 0.863
## 
##  F-Test, H0: r0 = 0 ; H1: r0 > 0 
##   F(4,8.59) = 6.25 , p = 0.012 
## 
##  95%-Confidence Interval for ICC Population Values:
##   0.258 < ICC < 0.985

7. model = “twoway”, type = “consistency”, unit = “single” Σε αυτήν την περίπτωση, τόσο τα υποκείμενα όσο και οι αξιολογητές είναι τυχαία και μας ενδιαφέρει η συνέπεια για μεμονωμένες μετρήσεις.

Παράδειγμα
Σε μία γραπτή εξέταση, εξετάστηκαν 5 μαθητές και 3 δάσκαλοι βαθμολόγησαν τα γραπτά τους. Θέλουμε να ελέγξουμε αν οι δάσκαλοι βαθμολογούν τα δοκίμια με συνέπεια (ακόμα κι αν ορισμένοι δάσκαλοι είναι συστηματικά πιο αυστηροί ή πιο επιεικείς), χωρίς να απαιτείται η ακριβής αντιστοίχιση των αξιολογήσεων.

icc_result <- icc(ratings, model = "twoway", type = "consistency", unit = "single")
print(icc_result)

##  Single Score Intraclass Correlation
## 
##    Model: twoway 
##    Type : consistency 
## 
##    Subjects = 5 
##      Raters = 3 
##    ICC(C,1) = 0.636
## 
##  F-Test, H0: r0 = 0 ; H1: r0 > 0 
##      F(4,8) = 6.25 , p = 0.0139 
## 
##  95%-Confidence Interval for ICC Population Values:
##   0.073 < ICC < 0.948

8. model = “twoway”, type = “consistency”, unit = “average”

Τέλος, εδώ υποθέτουμε ότι τόσο τα υποκείμενα όσο και οι βαθμολογητές είναι τυχαία επιλεγμένοι και εξετάζουμε τη συνέπεια για τον μέσο όρο των αξιολογήσεων. Χρησιμοποιείται όταν θέλουμε να αξιολογήσουμε τη συνοχή των μέσων μετρήσεων τόσο στα υποκείμενα όσο και στους βαθμολογητές, όπου και τα δύο θεωρούνται τυχαία επιλεγμένα από τον αντίστοιχο πληθυσμό.

Παράδειγμα
Οι ίδιοι 5 ασθενείς εξετάστηκαν σε 3 διαφορετικές κλινικές. Μας απασχολεί το κατά πόσο η μέση τιμή αποτελεί συνεπής δείκτης της υγείας για κάθε ασθενή, λαμβάνοντας υπόψη πιθανές διαφορές στην ερμηνεία μεταξύ των αξιολογητών ή των κέντρων.

icc_result <- icc(ratings, model = "twoway", type = "consistency", unit = "average")
print(icc_result)

##  Average Score Intraclass Correlation
## 
##    Model: twoway 
##    Type : consistency 
## 
##    Subjects = 5 
##      Raters = 3 
##    ICC(C,3) = 0.84
## 
##  F-Test, H0: r0 = 0 ; H1: r0 > 0 
##      F(4,8) = 6.25 , p = 0.0139 
## 
##  95%-Confidence Interval for ICC Population Values:
##   0.192 < ICC < 0.982

Οι 8 περιπτώσεις συνοψίζονται στον πίνακα που ακολουθεί:

Συνδυασμός (model, type, unit)	Παράδειγμα Ερευνητικού Σεναρίου
Oneway, Agreement, Single	Νοσηλεύτρια μετράει 3 φορές την αρτηριακή πίεση σε 5 ασθενείς
Oneway, Agreement, Average	Προπονητής αθλήματος αξιολογεί την απόδοση 5 αθλητών σε 3 δοκιμασίες
Oneway, Consistency, Single	Υπάλληλος αξιολογεί την ποιότητα 5 προϊόντων σε 3 διαφορετικές περιστάσεις
Oneway, Consistency, Average	Έρευνα ικανοποίησης 5 πελατών που πραγματοποιείται σε 3 χρονικά σημεία
Twoway, Agreement, Single	3 θεραπευτές αξιολογούν τη συμπεριφορά των ίδιων 5 ασθενών
Twoway, Agreement, Average	3 ακτινολόγοι ερμηνεύουν 5 ιατρικές εικόνες, ελέγχοντας τους μέσους βαθμούς
Twoway, Consistency, Single	3 δάσκαλοι βαθμολογούν τις εκθέσεις 5 μαθητών, με έμφαση στη συνέπεια
Twoway, Consistency, Average	Πολυκεντρική κλινική μελέτη μέτρησης αποτελεσμάτων υγείας από 5 ασθενείς σε 3 κέντρα

7 Δραστηριότητες

7.1 Αξιοπιστία Ερωτηματολόγιου στάσεων απέναντι στην μάθηση (ALSI) (16 ερωτήσεις)

1. Λήψη Δεδομένων

Το Ερωτηματολόγιο στάσεων απέναντι στην μάθηση (ALSI) είναι ένα ψυχομετρικό εργαλείο με στόχο τη καταγραφή των στάσεων απέναντι στη μάθηση, όπως αυτή αντανακλάται στις υποκλίμακες βαθιάς προσέγγισης (deep approach: 2, 6, 7, 8, 11, 12, 15, 16), οργανωμένης μελέτης (organized study: 3, 5, 10, 14) και επιφανειακής προσέγγισης (surface approach: 1, 4, 9, 13). Σε σχετική έρευνα, συλλέχθηκαν δεδομένα από 500 ερωτώμενους, τα οποία είναι διαθέσιμα εδώ:

Δεδομένα ALSI

Σχετική αναφορά: https://www.jcmedu.org/jcmedu-articles/medical-students-approaches-to-learning-before-and-after-the-cardiology-problembased-learning-practice.pdf

2. Εισαγωγή Δεδομένων στο R Studio

Εισάγετε τα δεδομένα στην R με το όνομα ALSI.data.

3. Μορφοποίηση Δεδομένων

Αρχικά, τοποθετήστε τις περιγραφές κάθε μίας ερώτησης:

library(Hmisc)

## 
## Attaching package: 'Hmisc'

## The following object is masked from 'package:psych':
## 
##     describe

## The following objects are masked from 'package:base':
## 
##     format.pval, units

label(ALSI.data$APPR1) = 'Έχω συχνά δυσκολευτεί να βγάλω νόημα από τις πληροφορίες που έπρεπε να θυμηθώ'
label(ALSI.data$APPR2) = 'Συνήθως ξεκινούσα με σκοπό να κατανοήσω εγώ προσωπικά το νόημα των πληροφοριών που είχα να μάθω'
label(ALSI.data$APPR3) = 'Έχω καταβάλει αρκετή προσπάθεια στη μελέτη μου'
label(ALSI.data$APPR4) = 'Πολλά από αυτά που έχω μάθει μοιάζουν να μην είναι τίποτα άλλο παρά ασύνδετα κομμάτια πληροφοριών στο μυαλό μου'
label(ALSI.data$APPR5) = 'Συνολικά θα έλεγα ότι υπήρξα συστηματικός και οργανωμένος στη μελέτη μου'
label(ALSI.data$APPR6) = 'Ιδέες που συνάντησα κατά τη μελέτη μου πυροδότησαν μια μακρά αλυσίδα σκέψεων'
label(ALSI.data$APPR7) = 'Κοίταζα προσεχτικά όλες τις πληροφορίες ή τα ευρήματα που υπήρχαν πριν καταλήξω στα δικά μου συμπεράσματα'
label(ALSI.data$APPR8) = 'Όταν έγραφα και μοιραζόμουν τις σκέψεις μου με άλλους ξανασκεφτόμουν πόσο καλά έδινα στον άλλο να καταλάβει τη σκέψη μου'
label(ALSI.data$APPR9) = 'Τα θέματα παρουσιάζονταν με τόσο πολύπλοκους τρόπους που συχνά δεν μπορούσα να βγάλω νόημα'
label(ALSI.data$APPR10) = 'Έχω οργανώσει προσεκτικά το χρόνο μελέτης μου ώστε να τον αξιοποιήσω όσο γίνεται καλύτερα'
label(ALSI.data$APPR11) = 'Κατά τη μελέτη μου έχω προσπαθήσει να καταλάβω εγώ προσωπικά τι εννοεί ο συγγραφέας'
label(ALSI.data$APPR12) = 'Αν δεν κατανοώ αρκετά καλά το αντικείμενο που μελετώ δοκιμάζω μια άλλη προσέγγιση'
label(ALSI.data$APPR13) = 'Συχνά πρέπει να μάθω και να ξαναμάθω πράγματα που στην ουσία όμως δεν μπορώ να κατανοήσω'
label(ALSI.data$APPR14) = 'Έχω βάλει προσεχτικά σε χρονική προτεραιότητα ότι έχω να κάνω ώστε να μπορέσω να ανταποκριθώ σε όλα'
label(ALSI.data$APPR15) = 'Προσπαθώ να συσχετίσω τη νέα ύλη με ότι ήδη γνωρίζω για ένα θέμα'
label(ALSI.data$APPR16) = 'Προσπαθώ να συνδέσω ό,τι έχω μάθει σε ένα μάθημα με ό,τι έμαθα σε άλλα μαθήματα'

4. Συντελεστές αξιοπιστίας

Σχετικά με την παραγοντική δομή του ALSI, στη βιβλιογραφία αναφέρεται πως υπάρχουν 3 λανθάνουσες διαστάσεις.

Υπολογίζουμε την εσωτερική αξιοπιστία κάθε μίας κλίμακας.

library(ltm)
# deep approach
cronbach.alpha(ALSI.data[, c(2, 6, 7, 8, 11, 12, 15, 16)])

## 
## Cronbach's alpha for the 'ALSI.data[, c(2, 6, 7, 8, 11, 12, 15, 16)]' data-set
## 
## Items: 8
## Sample units: 500
## alpha: 0.817

my.omega(ALSI.data[, c(2, 6, 7, 8, 11, 12, 15, 16)])

## [1] "FactorF=~APPR2+APPR6+APPR7+APPR8+APPR11+APPR12+APPR15+APPR16"
## [1] 0.818

# surface approach
cronbach.alpha(ALSI.data[, c(1, 4, 9, 13)])

## 
## Cronbach's alpha for the 'ALSI.data[, c(1, 4, 9, 13)]' data-set
## 
## Items: 4
## Sample units: 500
## alpha: 0.658

my.omega(ALSI.data[, c(1, 4, 9, 13)])

## [1] "FactorF=~APPR1+APPR4+APPR9+APPR13"
## [1] 0.663

# organized study
cronbach.alpha(ALSI.data[, c(3, 5, 10, 14)])

## 
## Cronbach's alpha for the 'ALSI.data[, c(3, 5, 10, 14)]' data-set
## 
## Items: 4
## Sample units: 500
## alpha: 0.777

my.omega(ALSI.data[, c(3, 5, 10, 14)])

## [1] "FactorF=~APPR3+APPR5+APPR10+APPR14"
## [1] 0.779

7.2 Αξιοπιστία Ερωτηματολόγιου CDRISC (25 ερωτήσεις)

1. Λήψη Δεδομένων

Το CDRISC είναι ένα πολύ γνωστό ψυχομετρικό εργαλείο με στόχο τη μέτρηση της ψυχικής ανθεκτικότητας. Έχει πέντε υποκλίμακες που αξιολογούν διαφορετικές πτυχές της ανθεκτικότητας:

Προσωπική Ικανότητα (Personal Competence: 1, 4, 6, 7, 8, 11, 14, 16, 17). Αυτή η υποκλίμακα αντικατοπτρίζει την εμπιστοσύνη στις ικανότητες, τον καθορισμό στόχων και την επιμονή κάποιου.

Εμπιστοσύνη στα Ένστικτα και Ανοχή στα Αρνητικά Συναισθήματα (Trust in One’s Instincts and Tolerance of Negative Emotions: 2, 13, 19, 20). Μετρά την ικανότητα ενός ατόμου να διαχειρίζεται το άγχος και την πίστη του στο ένστικτό του για τη λήψη των σωστών αποφάσεων.

Θετική Αποδοχή της Αλλαγής και Ασφαλείς Σχέσεις (Positive Acceptance of Change and Secure Relationships: 5, 10, 12, 15, 18). Αυτή η υποκλίμακα σχετίζεται με την προσαρμοστικότητα, το άνοιγμα στην αλλαγή και την υποστήριξη ασφαλών σχέσεων.

Έλεγχος (Control: 3, 9). Αυτό μετρά πόσο έλεγχο αισθάνεται ένα άτομο στη ζωή και τα αποτελέσματά του, αντανακλώντας την αυτο-αποτελεσματικότητα.

Πνευματικές Επιρροές (Spiritual Influences: 21, 22, 23, 24, 25). Αυτή η υποκλίμακα καταγράφει το ρόλο της πίστης ή της πνευματικότητας στην παροχή άνεσης και δύναμης σε δύσκολες στιγμές.

Σε σχετική έρευνα, συλλέχθηκαν δεδομένα από 204 ερωτώμενους, τα οποία είναι διαθέσιμα εδώ:

Δεδομένα CDRISC

2. Εισαγωγή Δεδομένων στο R Studio

Εισάγετε τα δεδομένα στην R με το όνομα CDRISC.data

3. Μορφοποίηση Δεδομένων

Αρχικά, τοποθετήστε τις περιγραφές κάθε μίας ερώτησης:

library(Hmisc)
label(CDRISC.data$gender) = 'Φύλο'
label(CDRISC.data$age) = 'Ηλικία'
label(CDRISC.data$CDRS1) = 'Μπορώ να προσαρμόζομαι στην αλλαγή '
label(CDRISC.data$CDRS2) = 'Έχω στενές και ασφαλείς σχέσεις '
label(CDRISC.data$CDRS3) = 'Μερικές φορές η μοίρα και ο Θεός μπορούν να βοηθήσουν '
label(CDRISC.data$CDRS4) = 'Μπορώ να τα βγάλω πέρα με ό,τι μου προκύπτει'
label(CDRISC.data$CDRS5) = 'Προηγούμενες επιτυχίες μου δίνουν αυτοπεποίθηση για καινούριες προκλήσεις '
label(CDRISC.data$CDRS6) = 'Βλέπω την εύθυμη πλευρά των πραγμάτων'
label(CDRISC.data$CDRS7) = 'Το να αντεπεξέρχομαι στο στρες μου δίνει δύναμη '
label(CDRISC.data$CDRS8) = 'Έχω την τάση να ανακάμπτω μετά από κάποια δοκιμασία ή ασθένεια '
label(CDRISC.data$CDRS9) = 'Τα πράγματα συμβαίνουν για κάποιο λόγο '
label(CDRISC.data$CDRS10) = 'Κάνω την καλύτερη δυνατή προσπάθεια, ότι και να γίνει '
label(CDRISC.data$CDRS11) = 'Μπορώ να επιτυγχάνω τους στόχους μου '
label(CDRISC.data$CDRS12) = 'Όταν τα πράγματα φαίνονται χωρίς ελπίδα, εγώ δεν παραιτούμαι '
label(CDRISC.data$CDRS13) = 'Ξέρω που να στραφώ για βοήθεια '
label(CDRISC.data$CDRS14) = 'Όταν βρίσκομαι κάτω από πίεση, συγκεντρώνομαι και σκέφτομαι καθαρά '
label(CDRISC.data$CDRS15) = 'Προτιμώ να παίρνω το προβάδισμα στην επίλυση προβλημάτων '
label(CDRISC.data$CDRS16) = 'Δεν αποθαρρύνομαι εύκολα από την αποτυχία '
label(CDRISC.data$CDRS17) = 'Με θεωρώ δυνατό άτομο '
label(CDRISC.data$CDRS18) = 'Μπορώ να παίρνω μη δημοφιλείς ή δύσκολες αποφάσεις '
label(CDRISC.data$CDRS19) = 'Μπορώ να χειρίζομαι δυσάρεστα συναισθήματα '
label(CDRISC.data$CDRS20) = 'Έχω ανάγκη να ακολουθώ τη διαίσθησή μου '
label(CDRISC.data$CDRS21) = 'Έχω ισχυρή αίσθηση σκοπού '
label(CDRISC.data$CDRS22) = 'Νιώθω ότι έχω τον έλεγχο της ζωής μου '
label(CDRISC.data$CDRS23) = 'Μου αρέσουν οι προκλήσεις '
label(CDRISC.data$CDRS24) = 'Εργάζομαι για να επιτυγχάνω τους στόχους μου'
label(CDRISC.data$CDRS25) = 'Καμαρώνω για τις επιτεύξεις μου '

Αφαιρέστε τις απούσες τιμές με την εντολή

CDRISC.data = na.omit(CDRISC.data)

4. Συντελεστές αξιοπιστίας

Σχετικά με την παραγοντική δομή του CDRISC, στη βιβλιογραφία αναφέρεται πως υπάρχουν 5 λανθάνουσες διαστάσεις.

Υπολογίζουμε την εσωτερική αξιοπιστία κάθε μίας κλίμακας.

CDRISC.scale = CDRISC.data[, c(3:27)]
Personal_Competence = CDRISC.scale[, c(1, 4, 6, 7, 8, 11, 14, 16, 17)]
Trust = CDRISC.scale[, c(2, 13, 19, 20)]
Positive_Acceptance = CDRISC.scale[, c(5, 10, 12, 15, 18)]
Control = CDRISC.scale[, c(3, 9)]
Spiritual_Influences = CDRISC.scale[, c(21, 22, 23, 24, 25)]

library(ltm)
# Personal Competence: 1, 4, 6, 7, 8, 11, 14, 16, 17
cronbach.alpha(Personal_Competence)

## 
## Cronbach's alpha for the 'Personal_Competence' data-set
## 
## Items: 9
## Sample units: 201
## alpha: 0.901

my.omega(Personal_Competence)

## [1] "FactorF=~CDRS1+CDRS4+CDRS6+CDRS7+CDRS8+CDRS11+CDRS14+CDRS16+CDRS17"
## [1] 0.904

# Trust in One's Instincts and Tolerance of Negative Emotions: 2, 13, 19, 20
cronbach.alpha(Trust)

## 
## Cronbach's alpha for the 'Trust' data-set
## 
## Items: 4
## Sample units: 201
## alpha: 0.702

my.omega(Trust)

## [1] "FactorF=~CDRS2+CDRS13+CDRS19+CDRS20"
## [1] 0.703

# Positive Acceptance of Change and Secure Relationships: 5, 10, 12, 15, 18
cronbach.alpha(Positive_Acceptance)

## 
## Cronbach's alpha for the 'Positive_Acceptance' data-set
## 
## Items: 5
## Sample units: 201
## alpha: 0.837

my.omega(Positive_Acceptance)

## [1] "FactorF=~CDRS5+CDRS10+CDRS12+CDRS15+CDRS18"
## [1] 0.839

# Control: 3, 9
cronbach.alpha(Control)

## 
## Cronbach's alpha for the 'Control' data-set
## 
## Items: 2
## Sample units: 201
## alpha: 0.75

my.omega(Control)

## [1] "FactorF=~CDRS3+CDRS9"

## Warning in lav_model_vcov(lavmodel = lavmodel, lavsamplestats = lavsamplestats, : lavaan WARNING:
##     Could not compute standard errors! The information matrix could
##     not be inverted. This may be a symptom that the model is not
##     identified.

## Warning in lav_model_vcov(lavmodel = lavmodel, lavsamplestats = object@SampleStats, : lavaan WARNING:
##     Could not compute standard errors! The information matrix could
##     not be inverted. This may be a symptom that the model is not
##     identified.

## [1] 0.752

# Spiritual Influences: 21, 22, 23, 24, 25
cronbach.alpha(Spiritual_Influences)

## 
## Cronbach's alpha for the 'Spiritual_Influences' data-set
## 
## Items: 5
## Sample units: 201
## alpha: 0.897

my.omega(Spiritual_Influences)

## [1] "FactorF=~CDRS21+CDRS22+CDRS23+CDRS24+CDRS25"
## [1] 0.898

7.3 Αξιοπιστία Ερωτηματολόγιου Trait Emotional Intelligence Questionnaire (TEIQue) (30 ερωτήσεις)

1. Λήψη Δεδομένων

Το Trait Emotional Intelligence Questionnaire (TEIQue) είναι ένα πολύ γνωστό ψυχομετρικό εργαλείο με στόχο τη μέτρηση της συναισθηματικής νοημοσύνης.

Πληροφορίες για την ελληνική μετάφραση του ερωτηματολογίου είναι διαθέσιμες εδώ (σελ. 88).

Σε σχετική έρευνα, συλλέχθηκαν δεδομένα από 200 ερωτώμενους, τα οποία είναι διαθέσιμα εδώ:

Δεδομένα TEI

2. Εισαγωγή Δεδομένων στο R Studio

Εισάγετε τα δεδομένα στην R με το όνομα TEI.data

3. Μορφοποίηση Δεδομένων

Τοποθετούμε τις περιγραφές κάθε μίας ερώτησεις με τον παρακάτω κώδικα:

library(Hmisc)
label(TEI.data$gender) = 'Φύλο'
label(TEI.data$age) = 'Ηλικία'
label(TEI.data$tei.q1) = 'Δε δυσκολεύομαι καθόλου να εκφράσω τα συναισθήματά μου με λόγια.'
label(TEI.data$tei.q2) = '(r)Συχνά το βρίσκω δύσκολο να δω τα πράγματα από την οπτική γωνία των άλλων.'
label(TEI.data$tei.q3) = 'Γενικά είμαι ένα ιδιαίτερα δραστήριο άτομο με στόχους.'
label(TEI.data$tei.q4) = '(r)Συνήθως μου είναι δύσκολο να ελέγξω τα συναισθήματά μου.'
label(TEI.data$tei.q5) = '(r)Γενικά δε βρίσκω τη ζωή διασκεδαστική.'
label(TEI.data$tei.q6) = 'Μπορώ να χειριστώ αποτελεσματικά τους άλλους ανθρώπους.'
label(TEI.data$tei.q7) = '(r)Έχω την τάση να αλλάζω γνώμη συχνά.'
label(TEI.data$tei.q8) = '(r)Γενικά δυσκολεύομαι να κατανοήσω τι ακριβώς νιώθω.'
label(TEI.data$tei.q9) = 'Πιστεύω πως έχω πολλά χαρίσματα.'
label(TEI.data$tei.q10) = '(r)Συχνά δυσκολεύομαι να υπερασπισθώ τα δικαιώματά μου. '
label(TEI.data$tei.q11) = 'Συνήθως μπορώ να επηρεάσω τα συναισθήματα των άλλων ανθρώπων. '
label(TEI.data$tei.q12) = '(r)Γενικά είμαι απαισιόδοξος άνθρωπος. '
label(TEI.data$tei.q13) = '(r)Οι κοντινοί μου άνθρωποι παραπονιούνται ότι δεν τους συμπεριφέρομαι σωστά. '
label(TEI.data$tei.q14) = '(r)Συνήθως δυσκολεύομαι να προσαρμόζω τη ζωή μου ανάλογα με τις περιστάσεις. '
label(TEI.data$tei.q15) = 'Γενικά, είμαι ικανός να αντιμετωπίσω το άγχος. '
label(TEI.data$tei.q16) = '(r)Συχνά δυσκολεύομαι να δείχνω στοργή στους κοντινούς μου ανθρώπους. '
label(TEI.data$tei.q17) = 'Συνήθως μπορώ να «μπω στη θέση του άλλου» και να καταλάβω τα συναισθήματά του.'
label(TEI.data$tei.q18) = '(r)Δεν έχω αρκετά κίνητρα στη ζωή μου. '
label(TEI.data$tei.q19) = 'Συνήθως μπορώ να βρω τρόπους να ελέγξω τα συναισθήματά μου όταν το θέλω. '
label(TEI.data$tei.q20) = 'Σε γενικές γραμμές, είμαι ευχαριστημένος από τη ζωή μου. '
label(TEI.data$tei.q21) = 'Θα περιέγραφα τον εαυτό μου ως καλό διαπραγματευτή. '
label(TEI.data$tei.q22) = '(r)Συχνά ανακατεύομαι σε καταστάσεις και αργότερα το μετανιώνω. '
label(TEI.data$tei.q23) = 'Συχνά, σταματώ αυτό που κάνω και συγκεντρώνομαι σε αυτό που νιώθω. '
label(TEI.data$tei.q24) = 'Αισθάνομαι καλά με τον εαυτό μου. '
label(TEI.data$tei.q25) = '(r)Έχω την τάση να υποχωρώ ακόμη και όταν γνωρίζω πως έχω δίκιο. '
label(TEI.data$tei.q26) = '(r)Πιστεύω πως δεν έχω καθόλου επιρροή στα συναισθήματα των άλλων. '
label(TEI.data$tei.q27) = 'Πιστεύω ότι γενικά τα πράγματα θα εξελιχθούν καλά στη ζωή μου. '
label(TEI.data$tei.q28) = '(r)Δυσκολεύομαι να δεθώ πολύ ακόμη και με όσους βρίσκονται πολύ κοντά μου. '
label(TEI.data$tei.q29) = 'Γενικά, μπορώ να προσαρμόζομαι σε καινούρια περιβάλλοντα και καταστάσεις. '
label(TEI.data$tei.q30) = 'Οι άλλοι με θαυμάζουν γιατί είμαι «άνετος».'

4. Ανακωδικοποίηση αποκρίσεων

Είναι συνηθισμένο στις ψυχομετρικές κλίμακες να υπάρχουν κάποιες με αντίθετο τρόπο έκφρασης σε σχέση με τις υπόλοιπες. Στην περίπτωση αυτή, πριν την ανίχνευση δομής, πρέπει να γίνει ανακωδικοποίηση των αποκρίσεων. Στο Trait Emotional Intelligence Questionnaire, οι ερωτήσεις που πρέπει να γίνουν ανακωδικοποίηση είναι οι 16, 2, 18, 4, 5, 7, 22, 8, 10, 25, 26, 12, 13, 28, 14

Σε αυτές τις ερωτήσεις πρέπει να γίνει 1 -> 7, 2 -> 6, 3 -> 5, 4 -> 4, 5 -> 3, 6 -> 2, 7 -> 1.

Αυτό, το πετυχαίνουμε με τον παρακάτω κώδικα:

items.to.reverse = c(16, 2, 18, 4, 5, 7, 22, 8, 10, 25, 26, 12, 13, 28, 14)

for(i in items.to.reverse){
  TEI.data[, 2 + i] = 8 - TEI.data[, 2 + i]
}

5. Διαχωρισμός δεδομένων ανά υποκλίμακα

Η κατανομή των ερωτήσεων στις υποκλίμακες είναι διαθέσιμη στην διεύθυνση: https://psychometriclab.com/wp-content/uploads/2019/10/TEIQue-SF-v.-1.50-scoring-key.docx

TEI.scale = TEI.data[, c(3:32)]

well_being = TEI.scale[, c(5, 20, 9, 24, 12, 27)]
self_control = TEI.scale[, c(4, 19, 7, 22, 15, 30)]
emotionality = TEI.scale[, c(1, 16, 2, 17, 8, 23, 13, 28)]
sociability = TEI.scale[, c(6, 21, 10, 25, 11, 26)]

6. Συντελεστές αξιοπιστίας

Σχετικά με την παραγοντική δομή του Trait Emotional Intelligence Questionnaire, στη βιβλιογραφία αναφέρεται πως υπάρχουν 4 λανθάνουσες διαστάσεις (wellbeing, emotionality, sociability, και self-control).

Υπολογίζουμε την εσωτερική αξιοπιστία κάθε μίας κλίμακας.

library(ltm)

# well being
cronbach.alpha(well_being)

## 
## Cronbach's alpha for the 'well_being' data-set
## 
## Items: 6
## Sample units: 200
## alpha: 0.739

my.omega(well_being)

## [1] "FactorF=~tei.q5+tei.q20+tei.q9+tei.q24+tei.q12+tei.q27"
## [1] 0.785

# self control
cronbach.alpha(self_control)

## 
## Cronbach's alpha for the 'self_control' data-set
## 
## Items: 6
## Sample units: 200
## alpha: 0.599

my.omega(self_control)

## [1] "FactorF=~tei.q4+tei.q19+tei.q7+tei.q22+tei.q15+tei.q30"
## [1] 0.62

# emotionality
cronbach.alpha(emotionality)

## 
## Cronbach's alpha for the 'emotionality' data-set
## 
## Items: 8
## Sample units: 200
## alpha: 0.496

my.omega(emotionality)

## [1] "FactorF=~tei.q1+tei.q16+tei.q2+tei.q17+tei.q8+tei.q23+tei.q13+tei.q28"
## [1] 0.53

# sociability
cronbach.alpha(sociability)

## 
## Cronbach's alpha for the 'sociability' data-set
## 
## Items: 6
## Sample units: 200
## alpha: 0.661

my.omega(sociability)

## [1] "FactorF=~tei.q6+tei.q21+tei.q10+tei.q25+tei.q11+tei.q26"
## [1] 0.666

# Total Scale
cronbach.alpha(TEI.scale)

## 
## Cronbach's alpha for the 'TEI.scale' data-set
## 
## Items: 30
## Sample units: 200
## alpha: 0.854

my.omega(TEI.scale)

## [1] "FactorF=~tei.q1+tei.q2+tei.q3+tei.q4+tei.q5+tei.q6+tei.q7+tei.q8+tei.q9+tei.q10+tei.q11+tei.q12+tei.q13+tei.q14+tei.q15+tei.q16+tei.q17+tei.q18+tei.q19+tei.q20+tei.q21+tei.q22+tei.q23+tei.q24+tei.q25+tei.q26+tei.q27+tei.q28+tei.q29+tei.q30"
## [1] 0.868

7.4 Αξιοπιστία Ερωτηματολόγιου NEO - FFI (60 ερωτήσεις)

To Ερωτηματολόγιο Πέντε Παραγόντων Προσωπικότητας ΝΕΟ (NEO Five-Factor Inventory [NEO-FFI], Form S) είναι ένα εργαλείο μέτρησης των χαρακτηριστικών της προσωπικότητας. Βασίζεται στη θεωρία των πέντε παραγόντων της προσωπικότητας και έχει σχεδιαστεί με σκοπό την αποτύπωση τους. Αυτοί οι πέντε παράγοντες είναι ο νευρωτισμός, η ευσυνειδησία, η εξωστρέφεια, η ευχαρίστηση και η δεκτικότητα προς νέες εμπειρίες.

Σε σχετική έρευνα, συλλέχθηκαν δεδομένα από 200 ερωτώμενους, τα οποία είναι διαθέσιμα εδώ:

Δεδομένα NEO - FFI

2. Εισαγωγή Δεδομένων στο R Studio

Εισάγετε τα δεδομένα στην R με το όνομα NEO.data

Εναλλακτικά, τα δεδομένα μπορούν να εισαχθούν στην R με copy paste από τον παρακάτω κώδικα:

3. Μορφοποίηση Δεδομένων

Τοποθετούμε τις περιγραφές κάθε μίας ερώτησεις με τον παρακάτω κώδικα:

library(Hmisc)
label(NEO.data$gender) = 'Φύλο'
label(NEO.data$age) = 'Ηλικία'
label(NEO.data$neo.q1) = '(r)Δεν ανησυχώ γενικά'
label(NEO.data$neo.q2) = 'Μου αρέσει να έχω πολύ κόσμο γύρω μου'
label(NEO.data$neo.q3) = '(r)Δε μου αρέσει να χάνω το χρόνο μου ονειροπολώντας'
label(NEO.data$neo.q4) = 'Προσπαθώ να είμαι ευγενικός/η με όλους'
label(NEO.data$neo.q5) = 'Κρατώ τα πράγματά μου καθαρά και τακτοποιημένα'
label(NEO.data$neo.q6) = 'Συχνά νιώθω κατώτερρος/η από τους άλλους'
label(NEO.data$neo.q7) = 'Γελώ εύκολα'
label(NEO.data$neo.q8) = '(r)Όταν βρω το σωστό τρόπο να κάνω κάτι, τον χρησιμοποιώ'
label(NEO.data$neo.q9) = '(r)Συχνά τσακώνομαι με την οικογένειά μου και τους συνεργάτες μου'
label(NEO.data$neo.q10) = 'Είμαι καλός/η στο ναρυθμίζω τον εαυτό μου για να συναντώ προθεσμίες'
label(NEO.data$neo.q11) = 'Όταν βρίσκομαι κάτω από πίεση είναι φορές που νιώθω ότι θα διαλυθώ'
label(NEO.data$neo.q12) = '(r)Γενικά δε θεωρώ τον εαυτό μου ιδιαίτερα “ξένοιαστο”'
label(NEO.data$neo.q13) = 'Γοητεύομαι με τα μοτίβα που υπάρχουν στην τέχνη και στην φύση'
label(NEO.data$neo.q14) = '(r)Κάποιοι θεωρούν ότι είμαι εγωιστής/τρια και εγωκεντρικός/η'
label(NEO.data$neo.q15) = '(r)Δεν είμαι πολύ μεθοδικό άτομο'
label(NEO.data$neo.q16) = '(r)Σπάνια νιώθω μοναξιά ή θλίψη'
label(NEO.data$neo.q17) = 'Πραγματικά απολαμβάνω να μιλώ με κόσμο'
label(NEO.data$neo.q18) = '(r)Πιστεύω ότι με το να αφήνουμε τους μαθητές να ακούν ομιλητές που αμφισβητούν τις καθιερωμένες απόψεις νιώθουν πιο μπερδεμένοι και αποπροσανατολισμένοι'
label(NEO.data$neo.q19) = 'Προτιμώ να συνεργάζομαι με άλλου παρά να τους ανταγωνίζομαι'
label(NEO.data$neo.q20) = 'Προσπαθώ να εκπληρώνω ό.τι μου ανατίθεται με ευσυνειδησία'
label(NEO.data$neo.q21) = 'Συχνά νιώθω ένταση και νευρικότητα'
label(NEO.data$neo.q22) = 'Μου αρέσει να βρίσκομαι όπου υπάρχει δράση'
label(NEO.data$neo.q23) = '(r)Η ποίηση με αγγίζει ελάχιστα ή καθόλου'
label(NEO.data$neo.q24) = '(r)Έχω την τάση να είμαι κυνικός/ή και σκεπτικός/ή όσον αφορά την πρόθεση των άλλων'
label(NEO.data$neo.q25) = 'Έχω ξεκάθαρους στόχους και προσπαθώ να τους επιτύχω δουλεύοντας συστηματικά'
label(NEO.data$neo.q26) = 'Κάποιες φορές νιώθω τελείως ανάξιος/α'
label(NEO.data$neo.q27) = '(r)Συνήθως προτιμώ να κάνω πράγματα μόνος/η μου'
label(NEO.data$neo.q28) = 'Συχνά δοκιμάζω καινούρια και άγνωστα φαγητά'
label(NEO.data$neo.q29) = '(r)Πιστεύω ότι οι περισσότεροι άνθρωποι θα προσπαθήσουν να σε εκμεταλευτούν εάν τους αφήσεις'
label(NEO.data$neo.q30) = '(r)Χάνω πολύ χρόνο προτού συγκεντρωθώ σε μία δουλειά'
label(NEO.data$neo.q31) = '(r)Σπανια νιώθω να είμαι φοβισμένος/η ή αγνωμένος/η'
label(NEO.data$neo.q32) = 'Συχνά νιώθω να είμαι γεμάτος/η ενέργεια'
label(NEO.data$neo.q33) = '(r)Σπάνια προσέχω τη διάθεση που δημιουργούν “διαφορετικά” περιβάλλοντα'
label(NEO.data$neo.q34) = 'Οι περισσότεροι άνθρωποι που γνωρίζω με συμπαθούν'
label(NEO.data$neo.q35) = 'Δουλευω σκληρά για να πετύχω τους στόχους μου'
label(NEO.data$neo.q36) = 'Συχνά θυμώνω με τον τρόπο με τον οποίο οι άνθρωποι με αντιμετωπίζουν'
label(NEO.data$neo.q37) = 'Είμαι ένα χαρούμενο, αισιόδοξο άτομο'
label(NEO.data$neo.q38) = '(r)Πιστεύω ότι θα έπρεπε να στρεφόμαστε στη Θρησκευτική μας Ηγεσία όταν παίρνουμε αποφάσεις ή για θέματα ηθικής τάξης'
label(NEO.data$neo.q39) = '(r)Κάποιοι με θεωρούν άτομο ψυχρό και υπολογιστικό'
label(NEO.data$neo.q40) = 'Όταν δεσμεύομαι προσωπικά για κάτι, αναλαμβάνω υπεύθυνα να ττο φέρω εις πέρας'
label(NEO.data$neo.q41) = 'Πολύ συχνά, όταν τα πράγματα πάνε στραβά, νιώθω απογοητευμένος/η και θέλω να τα παρατήσω'
label(NEO.data$neo.q42) = '(r)εν είμαι γενικά αισιόδοξος/η'
label(NEO.data$neo.q43) = 'Κάποιες φορές όταν βλέπω ένα έργο τέχνης ή διαβάζω ένα ποίημα νιώθω ένα ρίγος ενθουσιασμού να με διαπερνά'
label(NEO.data$neo.q44) = '(r)Είμαι πραγματιστής/τρια και διακατέχομαι από ψυχρή λογική στις θέσεις μου'
label(NEO.data$neo.q45) = '(r)Κάποιες φορές δεν είμαι όσο σταθερός/η και υπεύθυνος/η όσο θα έπρεπε'
label(NEO.data$neo.q46) = '(r)Σπάνια είμαι θλιμμένος/η ή λυπημένος/η'
label(NEO.data$neo.q47) = 'Η ζωή μου έχει γρήγορους ρυθμούς'
label(NEO.data$neo.q48) = '(r)Δε με ενδιαφέρει ιδιαίτερα η ενασχόληση με την φύση του κόσμου ή τις συνθήκες του κόσμου'
label(NEO.data$neo.q49) = 'Γενικά προσπαθώ να είμαι ευαίσθητος/η στις ανάγκες των άλλων'
label(NEO.data$neo.q50) = 'Είμαι ένα παραγωγικό άτομο που ολοκληρώνει τη δουλειά που αναλαμβάνει'
label(NEO.data$neo.q51) = 'Συχνά νιώθω αβοήθητος/η και θέλω κάποιον άλλον να μου λύσει τα προβλήματα'
label(NEO.data$neo.q52) = 'Είμαι πολύ δραστήριο άτομο'
label(NEO.data$neo.q53) = 'Έχω πολλά πνευματικά ενδιαφέροντα'
label(NEO.data$neo.q54) = '(r)Εάν κάποιος/α δε μου είναι συμπαθής τον/την αφήνω να το καταλάβει'
label(NEO.data$neo.q55) = '(r)Ποτέ δεν τα καταφέρνω να οργανωθώ'
label(NEO.data$neo.q56) = 'Κατά καιρούς ένιωσα τόση ντροπή που θα ήθελα να εξαφανιστώ'
label(NEO.data$neo.q57) = '(r)Προτιμώ να κάνω γενικά το δικό μου, παρά να είμαι ο ηγέτης άλλων'
label(NEO.data$neo.q58) = 'Συχνά μου αρέσει να παίζω με ιδέες και με θεωρίες'
label(NEO.data$neo.q59) = '(r)Εάν είναι απαραίτητο είμαι διατεθειμένος/η να “μανουβράρω” τους άλλους προκειμένου να πετύχω αυτό που θέλω'
label(NEO.data$neo.q60) = 'Προσπαθώ να κάνω τέλεις ό,τι κάνω'

4. Ανακωδικοποίηση αποκρίσεων

Είναι συνηθισμένο στις ψυχομετρικές κλίμακες να υπάρχουν κάποιες με αντίθετο τρόπο έκφρασης σε σχέση με τις υπόλοιπες. Στην περίπτωση αυτή, πριν την ανίχνευση δομής, πρέπει να γίνει ανακωδικοποίηση των αποκρίσεων. Στο NEO-FFI, οι ερωτήσεις που πρέπει να γίνουν ανακωδικοποίηση είναι οι 1, 3, 8, 9, 12, 14, 15, 16, 18, 23, 24, 27, 29, 30, 31, 33, 38, 39, 42, 44, 45, 46, 48, 54, 55, 57, 59.

Σε αυτές τις ερωτήσεις πρέπει να γίνει 0 -> 4, 1 -> 3, 2 -> 2, 3 -> 1, 4 -> 0.

Αυτό, το πετυχαίνουμε με τον παρακάτω κώδικα:

items.to.reverse = c(1, 3, 8, 9, 12, 14, 15, 16, 18, 23, 24, 27, 29, 30, 31, 33, 38, 39, 42, 44, 45, 46, 48, 54, 55, 57, 59)

for(i in items.to.reverse){
  NEO.data[, 2 + i] = 4 - NEO.data[, 2 + i]
}

5. Διαχωρισμός δεδομένων ανά υποκλίμακα

Η κατανομή των ερωτήσεων στις υποκλίμακες είναι διαθέσιμη στην διεύθυνση: https://eclass.upatras.gr/modules/document/file.php/MST173/%CE%95%CF%81%CF%89%CF%84%CE%B7%CE%BC%CE%B1%CF%84%CE%BF%CE%BB%CF%8C%CE%B3%CE%B9%CE%B1/NEO-FFI%20Greek.pdf

NEO.scale = na.omit(NEO.data[, c(3:62)])

neuroticism = NEO.scale[, c(1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56)]
conscientiousness = NEO.scale[, c(2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57)]
extroversion = NEO.scale[, c(3, 8, 13, 18, 23, 28, 33, 38, 43, 48, 53, 58)]
agreeableness = NEO.scale[, c(4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59)]
receptivity = NEO.scale[, c(5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60)]

6. Συντελεστές αξιοπιστίας

Υπολογίζουμε την εσωτερική αξιοπιστία κάθε μίας κλίμακας.

library(ltm)
library(psych)

# neuroticism
cronbach.alpha(neuroticism)

## 
## Cronbach's alpha for the 'neuroticism' data-set
## 
## Items: 12
## Sample units: 198
## alpha: 0.734

my.omega(neuroticism)

## [1] "FactorF=~neo.q1+neo.q6+neo.q11+neo.q16+neo.q21+neo.q26+neo.q31+neo.q36+neo.q41+neo.q46+neo.q51+neo.q56"
## [1] 0.742

# conscientiousness
cronbach.alpha(conscientiousness)

## 
## Cronbach's alpha for the 'conscientiousness' data-set
## 
## Items: 12
## Sample units: 198
## alpha: 0.775

my.omega(conscientiousness)

## [1] "FactorF=~neo.q2+neo.q7+neo.q12+neo.q17+neo.q22+neo.q27+neo.q32+neo.q37+neo.q42+neo.q47+neo.q52+neo.q57"
## [1] 0.79

# extroversion
cronbach.alpha(extroversion)

## 
## Cronbach's alpha for the 'extroversion' data-set
## 
## Items: 12
## Sample units: 198
## alpha: 0.617

my.omega(extroversion)

## [1] "FactorF=~neo.q3+neo.q8+neo.q13+neo.q18+neo.q23+neo.q28+neo.q33+neo.q38+neo.q43+neo.q48+neo.q53+neo.q58"
## [1] 0.627

# agreeableness
cronbach.alpha(agreeableness)

## 
## Cronbach's alpha for the 'agreeableness' data-set
## 
## Items: 12
## Sample units: 198
## alpha: 0.654

my.omega(agreeableness)

## [1] "FactorF=~neo.q4+neo.q9+neo.q14+neo.q19+neo.q24+neo.q29+neo.q34+neo.q39+neo.q44+neo.q49+neo.q54+neo.q59"
## [1] 0.68

# receptivity
cronbach.alpha(receptivity)

## 
## Cronbach's alpha for the 'receptivity' data-set
## 
## Items: 12
## Sample units: 198
## alpha: 0.815

my.omega(receptivity)

## [1] "FactorF=~neo.q5+neo.q10+neo.q15+neo.q20+neo.q25+neo.q30+neo.q35+neo.q40+neo.q45+neo.q50+neo.q55+neo.q60"
## [1] 0.824

Επικοινωνία: Επαμεινώνδας Διαμαντοπουλος, Τμήμα ΗΜ/ΜΥ, Δ.Π.Θ. Email: epdiaman@ee.duth.gr. Τηλ: 25410 79757, 6944683327↩︎

Ψυχομετρικές Κλίμακες και Ανάλυση Δεδομένων με την R: Θεωρία και Πρακτική

Ενότητα 3: Ανάλυση Αξιοπιστίας

Επαμεινώνδας Διαμαντόπουλος¹

9 έως 15 Δεκεμβρίου 2024

1 Εισαγωγή

2 Αξιοπιστία Ψυχομετρικής Κλίμακας

2.1 Υπολογισμός των Λ, F, E.

2.2 Ερμηνεία των συντελεστών Λ

3 Η συνθήκη της ομοιογένειας

3.1 Ομοιογενείς (congeneric) ερωτήσεις

3.1.1 Παραδείγματα ομοιογενών ερωτήσεων

3.1.2 Παραδείγματα μη - ομοιογενών ερωτήσεων

3.2 Ταυ-ισοδύναμες (tau-equivalent) ερωτήσεις

3.2.1 Παραδείγματα ερωτήσεων που αναμένεται να είναι ταυ-ισοδύναμες

3.2.2 Παραδείγματα ερωτήσεων που αναμένεται να μην είναι ταυ-ισοδύναμες

3.3 Παράλληλες ερωτήσεις

3.4 Αλγεβρική αναπαράσταση ταυ-ισοδυναμίας και παραλληλίας

4 Συντελεστής άλφα του Cronbach (Cronbach’s Alpha)

4.1 Προϋποθέσεις χρήσης

4.2 Έλεγχος προϋποθέσεων

4.3 Υπολογισμός

4.4 Υλοποίηση στην R

4.4.1 Διατακτική έκδοχη του Cronbach (Ordinal Cronbach)

4.5 Η σημασία της μονής διάστασης στα δεδομένα

5 Συντελεστής ω

5.1 Εισαγωγή

5.2 Προϋποθέσεις

5.3 Υπολογισμός

5.4 Υλοποίηση στην R

5.5 Παράδειγμα

5.6 Πλεονεκτήματα του McDonald ω έναντι του Cronbach α

6 Αξιοπιστία επαναληπτικής μέτρησης (Test-Retest Reliability)

6.1 Συντελεστής συσχέτισης Pearson

6.2 Διαταξικός Συντελεστής Συσχέτισης (Intraclass Correlation Coefficient - ICC)

6.2.1 Οι 8 διαφορετικές περίπτωσεις

7 Δραστηριότητες

7.1 Αξιοπιστία Ερωτηματολόγιου στάσεων απέναντι στην μάθηση (ALSI) (16 ερωτήσεις)

7.2 Αξιοπιστία Ερωτηματολόγιου CDRISC (25 ερωτήσεις)

7.3 Αξιοπιστία Ερωτηματολόγιου Trait Emotional Intelligence Questionnaire (TEIQue) (30 ερωτήσεις)

7.4 Αξιοπιστία Ερωτηματολόγιου NEO - FFI (60 ερωτήσεις)

Ψυχομετρικές Κλίμακες και Ανάλυση Δεδομένων με την R: Θεωρία και Πρακτική

Ενότητα 3: Ανάλυση Αξιοπιστίας

Επαμεινώνδας Διαμαντόπουλος1

9 έως 15 Δεκεμβρίου 2024

1 Εισαγωγή

2 Αξιοπιστία Ψυχομετρικής Κλίμακας

2.1 Υπολογισμός των Λ, F, E.

2.2 Ερμηνεία των συντελεστών Λ

3 Η συνθήκη της ομοιογένειας

3.1 Ομοιογενείς (congeneric) ερωτήσεις

3.1.1 Παραδείγματα ομοιογενών ερωτήσεων

3.1.2 Παραδείγματα μη - ομοιογενών ερωτήσεων

3.2 Ταυ-ισοδύναμες (tau-equivalent) ερωτήσεις

3.2.1 Παραδείγματα ερωτήσεων που αναμένεται να είναι ταυ-ισοδύναμες

3.2.2 Παραδείγματα ερωτήσεων που αναμένεται να μην είναι ταυ-ισοδύναμες

3.3 Παράλληλες ερωτήσεις

3.4 Αλγεβρική αναπαράσταση ταυ-ισοδυναμίας και παραλληλίας

4 Συντελεστής άλφα του Cronbach (Cronbach’s Alpha)

4.1 Προϋποθέσεις χρήσης

4.2 Έλεγχος προϋποθέσεων

4.3 Υπολογισμός

4.4 Υλοποίηση στην R

4.4.1 Διατακτική έκδοχη του Cronbach (Ordinal Cronbach)

4.5 Η σημασία της μονής διάστασης στα δεδομένα

5 Συντελεστής ω

5.1 Εισαγωγή

5.2 Προϋποθέσεις

5.3 Υπολογισμός

5.4 Υλοποίηση στην R

5.5 Παράδειγμα

5.6 Πλεονεκτήματα του McDonald ω έναντι του Cronbach α

6 Αξιοπιστία επαναληπτικής μέτρησης (Test-Retest Reliability)

6.1 Συντελεστής συσχέτισης Pearson

6.2 Διαταξικός Συντελεστής Συσχέτισης (Intraclass Correlation Coefficient - ICC)

6.2.1 Οι 8 διαφορετικές περίπτωσεις

7 Δραστηριότητες

7.1 Αξιοπιστία Ερωτηματολόγιου στάσεων απέναντι στην μάθηση (ALSI) (16 ερωτήσεις)

7.2 Αξιοπιστία Ερωτηματολόγιου CDRISC (25 ερωτήσεις)

7.3 Αξιοπιστία Ερωτηματολόγιου Trait Emotional Intelligence Questionnaire (TEIQue) (30 ερωτήσεις)

7.4 Αξιοπιστία Ερωτηματολόγιου NEO - FFI (60 ερωτήσεις)

Επαμεινώνδας Διαμαντόπουλος¹