Τι σημαίνει στατιστικά σημαντικό αποτέλεσμα σε μια κλινική μελέτη;

Τι σημαίνει στατιστικά σημαντικό αποτέλεσμα σε μια κλινική μελέτη;

Αφορμή για να γραφτεί ένα κείμενο για επεξήγηση της έννοιας της στατιστικής σημαντικότητας στις κλινικές μελέτες από έναν γιατρό είναι η διαπίστωση σε ιατρικά συνέδρια, σε επιστημονικές συζητήσεις, αλλά και σε δηλώσεις από επιστήμονες που αποτελούν μέλη σε επιτροπές αξιολόγησης και ρυθμιστικών αρχών ότι η έννοια αυτή δεν είναι πλήρως κατανοητή, όπως και ο τρόπος με τον οποίο προκύπτει ότι ένα φάρμακο είναι αποτελεσματικό π.χ. στην πρόληψη της ημικρανίας. Οπότε μπορεί να διαβάσει κανείς τα παρακάτω ως ένα κείμενο από γιατρό για γιατρούς ή για ανθρώπους που προσπαθούν να καταλάβουν πως λειτουργεί η κλινική έρευνα και ειδικά οι μελέτες σήμερα στην ιατρική.


Καταρχάς να τονίσουμε ότι οι πιθανότητες και η στατιστική δεν είναι εύκολα αποδεκτές έννοιες από τον εγκέφαλο μας. Πράγματα που μας φαίνονται αυτονόητα ή ασήμαντα ή σημαντικά, τα μαθηματικά των πιθανοτήτων και της στατιστικής ΑΠΟΔΕΙΚΝΥΟΥΝ ότι είναι ακριβώς το αντίθετο. Ένα εύκολο παράδειγμα: αν μας ρωτήσουν σε μια οικογένεια με τέσσερα παιδιά ποιος είναι ο πιο πιθανός συνδυασμός αγοριών και κοριτσιών (με δεδομένο ότι κάθε παιδί έχει 50% για το ένα φύλο) οι περισσότεροι από εμάς θα απαντήσουμε: 2 αγόρια και 2 κορίτσια. Λάθος! Ο πιο πιθανός συνδυασμός είναι 3 παιδιά από το ένα φύλο και 1 από το άλλο (εύκολα με μολύβι και χαρτί θα καταλάβετε την …πλάνη).


Από την άλλη, δεν μπορεί ένα γιατρός σήμερα, οποιασδήποτε ειδικότητας, να καταλάβει τα αποτελέσματα μιας έρευνας που θα διαβάσει ή που θα του παρουσιάσουν σε ένα συνέδριο αν δεν γνωρίζει βασικές αρχές μαθηματικών των πιθανοτήτων και της ιατρικής στατιστικής. Δεν μπορεί να κάνει οποιαδήποτε μελέτη, οποιαδήποτε διδακτορική διατριβή ή δημοσίευση χωρίς την βασική γνώση της στατιστικής ανάλυσης. Σύντομα το τρένο της evidence based medicine θα φύγει και θα τον αφήσει ακλεή να παρακολουθεί.
Όσο αφορά στην έννοια της πιθανότητας, ήδη από τον 19ο αιώνα ο σπουδαίος γιατρός Ουίλιαμ Όσλερ (1849- 1919) είχε καταλάβει την σημασία της και είχε πει πολύ σοφά ότι η ιατρική είναι «η τέχνη της πιθανότητας και η επιστήμη της αβεβαιότητας». Σήμερα η πιθανότητα γίνεται αντιληπτή ως σχετική συχνότητα που είναι και η κυρίαρχη ερμηνεία στην Ιατρική κλινική έρευνα. Η πιθανότητα ορίζεται ως η μακροπρόθεσμη οριακή συχνότητα παρόμοιων συμβάντων σε ένα σύνολο συμβάντων. Έτσι αν έχουμε ένα κέρμα και κάνουμε ρίψεις θέλουμε να δούμε μακροπρόθεσμα στο πλήθος των ρίψεων πόσες φορές θα εμφανιστεί «κορώνα» και πόσες «γράμμα». Και λέμε μακροπρόθεσμα γιατί αν ρίξουμε 3 φορές το κέρμα μπορεί και τις τρεις να έχουμε «Κορώνα», ενώ αν το ρίξουμε 1000 φορές, θα είναι περίπου 500 φορές «κορώνα» και 500 «γράμμα».


Πριν αναφερθούμε στην στατιστική σημαντικότητα θα πρέπει να ειπωθούν δυο κουβέντες για τις μελέτες με τις οποίες εγκρίνεται ένα φάρμακο, πως είναι δομημένες για να μπορέσουν οι ερευνητές στην συνέχεια με τα αποτελέσματα να διαπιστώσουν αν υπάρχει στατιστική σημαντικότητα, αν δηλαδή ένα φάρμακο επηρεάζει μια νόσο. Αυτές οι μελέτες είναι οι διπλά τυφλά τυχαιοποιημένες μελέτες. Στις διπλά τυφλά και τυχαιοποιημένες μελέτες οι συμμετέχοντες σε μια μελέτη χωρίζονται σε δυο ομάδες τυχαία με σχεδιασμό ώστε οι ατομικές διαφορές των συμμετεχόντων θα εκπροσωπούνται εξίσου και στις δυο ομάδες. Αυτό σημαίνει «τυχαιοποίηση». Π.χ. στις δυο αυτές ομάδες η μέση ηλικία των συμμετεχόντων θα πρέπει να είναι περίπου η ίδια και οι ημέρες ημικρανίας τον μήνα επίσης. Η τυχαιοποίηση γίνεται πλέον από υπολογιστικά προγράμματα και δεν εμπλέκεται κανένας ερευνητής. Αυτή η διαδικασία επιτρέπει στο τέλος την στατιστική ανάλυση στα αποτελέσματα και είναι και αρκετά ασφαλής η γενίκευση αυτών των αποτελεσμάτων στον γενικό πληθυσμό, αν ο αριθμός των συμμετεχόντων είναι μεγάλος (συνήθως > 500 σε κάθε ομάδα). Η μια ομάδα θα λάβει το υπό έρευνα φάρμακο και η άλλη εικονικό. Κανένας, ούτε οι συμμετέχοντες, ούτε όμως οι ερευνητές θα γνωρίζουν ποιος λαμβάνει φάρμακο και ποιος εικονικό σκεύασμα (placebo). Αυτό σημαίνει «τυφλή». Μετά από ένα χρονικό διάστημα π.χ. 12 εβδομάδων και καταγραφής των κρίσεων ημικρανίας σε ένα ηλεκτρονικό ημερολόγιο, διαπιστώνεται αν η ομάδα που πήρε το φάρμακο είχε μεγαλύτερη μείωση σε σχέση με την ομάδα που πήρε placebo. Αν αυτή η μείωση ήταν στατιστικά σημαντική σημαίνει ότι το φάρμακο λειτουργεί και δεν είναι τυχαίο φαινόμενο. Αυτού του τύπου οι μελέτες είναι μια μέθοδος που, είναι αποδεκτό ότι διασφαλίζει αιτιακούς ισχυρισμούς και υποθέσεις αναφορικά με την ικανότητα ενός φαρμάκου να παράγει κλινικά αποτελέσματα.


Αυτή η στατιστική σημαντικότητα συμβολίζεται μαθηματικά με την λεγόμενη τιμή p, που αν είναι μικρότερη από 0,05 σημαίνει ότι κάτι είναι στατιστικά σημαντικό (με βεβαιότητα 95%). Κάποιοι, ακόμα και ιατροί, κοιτώντας τα αποτελέσματα των μελετών σχολιάζουν ότι μπορεί ναι μεν η δράση ενός καινούργιου φαρμάκου να είναι στατιστικά σημαντική, αλλά ότι π.χ. διαφέρει μόνο κατά 2 ημέρες μείωσης της ημικρανίας τον μήνα σε σχέση με το εικονικό φάρμακο. Δηλ. μπορεί η ομάδα που πήρε Placebo να μείωσε τις ημέρες ημικρανίας από 9 τον μήνα πριν λάβει το Placebo σε 7 ημέρες μετά, ενώ η ομάδα που πήρε το φάρμακο από 9 ημέρες να πήγε στις 5 ημέρες. Ισχυρίζονται ότι μείωσε «μόνο» κατά 2 ημέρες σε σχέση με το Placebo, άρα είναι «λίγο» στατιστικά σημαντικό. Το μεγάλο λάθος εδώ είναι ότι δεν έχει γίνει κατανοητό ότι μια συγκεκριμένη μελέτη είναι έτσι σχεδιασμένη (και με την επίβλεψη των ρυθμιστικών αρχών) για να μας απαντήσει σε σχέση με κάποιους στόχους που θέτει, αν τους πληροί στο ορισμένο χρονικό διάστημα. Δηλ. αν το φάρμακο που ερευνάτε έχει αποτέλεσμα ή όχι. Μόνο αυτό. Αν είναι στατιστικά σημαντική η δράση του σε σχέση με το placebo, το φάρμακο δρα πάνω στην ασθένεια που μελετάται. Αυτή είναι η μόνη πληροφορία. Για να το πούμε με τα λόγια ενός πολύ γνωστού στατιστικολόγου:
«…δεν υπάρχει διαφορά ανάμεσα σε μια τιμή p ίση με 0,049 και σε μια τιμή ίση με 0,00001. Και τα δυο παρέχουν τον ίδιο βαθμό τεκμηρίωσης έναντι της μηδενικής υπόθεσης. Δεν έχει κανένα νόημα να λέγεται ότι ένα αποτέλεσμα είναι στατιστικώς «πολύ» ή «πάρα πολύ» σημαντικό. Ένα αποτέλεσμα ή είναι στατιστικώς σημαντικό ή δεν είναι.»
Salsburg David (1993) “The use of the statistical methods in the analysis of clinical studies.
Journal of clinical Epidemiology


Και εν τέλει, κάτι που σε μια μελέτη 12 εβδομάδων έχει τιμή p= 0,001 μπορεί, αν παρατείνουμε την μελέτη στις 52 εβδομάδες να έχει τιμή p= 0,049 και τανάπαλιν. Γι’ αυτό ακριβώς τον λόγο γίνονται και μακροχρόνιες μελέτες.


Εν κατακλείδι, η σωστή ανάγνωση των αποτελεσμάτων μιας μελέτης μόνο εύκολη υπόθεση δεν είναι γιατί προϋποθέτει να υπάρχουν οι γνώσεις για σωστή ερμηνεία. Και τις γνώσεις αυτές τις παρέχει η ιατρική στατιστική η οποία είναι τόσο απαραίτητη στην σύγχρονη ιατρική όσο και το σφυράκι του νευρολόγου.

Το κείμενο επιμελήθηκε ο Ιατρός - Επιστημονικός Σύμβουλος του Συλλόγου, Δρ. Εμμανουήλ Δερμιτζάκης.

 

Ακολουθήστε τα νέα μας

Συμπληρώστε το email σας για να λαμβάνετε τα newsletters μας.