Ogni anno, migliaia di manoscritti medici vengono rifiutati. Uno dei commenti dei revisori più frequenti recita:
"La scelta dei metodi statistici è inappropriata, il che mina l'affidabilità delle conclusioni."
Dietro quella frase ci sono solitamente tre errori molto specifici.
Errore 1: Riportare dati asimmetrici con Media ± DS
Hai mai scritto qualcosa del genere?
"La durata della degenza ospedaliera era di 8,3 ± 12,7 giorni."
Media 8,3, deviazione standard 12,7. La DS è maggiore della media — il che segnala quasi sempre una distribuzione asimmetrica a destra.
Durata del ricovero, costi medici, tempo di sopravvivenza — queste variabili hanno un limite inferiore naturale di zero e una lunga coda destra. Descriverle con una media è come descrivere il reddito medio in una classe dove la metà degli studenti era seduta vicino a un miliardario: tecnicamente accurato, completamente fuorviante.
Cosa fare invece:
- Riportare come Mediana (IQR) invece di Media ± DS
- Sostituire i t-test con Mann-Whitney U (due gruppi) o Kruskal-Wallis (gruppi multipli)
Molti ricercatori conoscono questa regola in teoria. Ma quando chiedono a una IA generale aiuto con l'analisi, l'IA va di default su media ± DS e t-test senza mai chiedere della distribuzione dei dati.
Errore 2: Eseguire confronti multipli senza correzione
Confronti quattro bracci di trattamento con sei test a coppie, ognuno usando p < 0,05 come soglia.
Il problema: con sei test, la probabilità di ottenere almeno un falso positivo supera il 26%.
Questo è il Problema dei Confronti Multipli. Ogni test è un lancio di moneta per un falso positivo. Più test esegui, più è probabile trovare qualcosa che non è reale.
I revisori esperti lo colgono immediatamente. È una delle principali ragioni per cui i manoscritti vengono rimandati per revisione maggiore.
Cosa fare invece:
- Usare la correzione di Bonferroni (conservativa; buona per la ricerca confermativa)
- O la correzione FDR (Benjamini-Hochberg) (potenza maggiore; migliore per la ricerca esplorativa)
Errore 3: Usare la regressione stepwise per la selezione delle variabili
"Ho usato la regressione stepwise per selezionare quali variabili entravano nel modello finale."
Questa frase è un segnale d'allarme per i revisori statistici — e lo è da decenni.
I problemi con la regressione stepwise:
- Risultati instabili — con un campione diverso, le variabili selezionate possono essere completamente diverse
- Valori p distorti — dopo più cicli di filtraggio, i valori p nel modello finale non possono più essere interpretati correttamente
- Overfitting — il modello funziona bene sui tuoi dati ma generalizza male ai nuovi pazienti
Questo metodo è diventato popolare negli anni '70 a causa di vincoli computazionali. Quei vincoli sono scomparsi. I difetti del metodo rimangono.
Cosa fare invece:
- Regressione LASSO (regolarizzazione L1; riduce automaticamente a zero i coefficienti poco importanti)
- Elastic Net (combina LASSO e Ridge; gestisce meglio la multicollinearità)
- O basare la selezione delle variabili sulla conoscenza clinica pregressa, non sull'automazione basata sui dati
Perché l'IA non riesce a individuare questi errori senza regole
Chiedi a ChatGPT "aiutami a scegliere i metodi statistici" e tipicamente riceverai:
- Un elenco di metodi che sembra ragionevole
- Qualificato con frasi come "a seconda dei tuoi dati" o "generalmente raccomandato"
Quello che non otterrai: una IA che chieda se i tuoi dati sono asimmetrici, verifichi se stai facendo confronti multipli, o si rifiuti di raccomandare la regressione stepwise.
Questi controlli richiedono regole esplicite — il tipo che un biostatistico senior esegue automaticamente quando revisiona una sezione metodi.
Il nostro Statistical Method Advisor codifica queste regole direttamente nello strumento IA:
- Rileva dati asimmetrici → raccomanda per default metodi non parametrici
- Segnala confronti multipli → sollecita la strategia di correzione
- Vieta la regressione stepwise → reindirizza a LASSO o Elastic Net
Inserisci la descrizione dei tuoi dati. Ottieni un piano statistico che i revisori non rispediranno indietro.
Riferimento rapido
| Errore | Alternativa corretta |
|---|---|
| Media ± DS per dati asimmetrici | Mediana (IQR) |
| Confronti multipli senza correzione | Bonferroni o FDR |
| Regressione stepwise | LASSO / Elastic Net |
I metodi statistici non sono complicati — ma tenere a mente ogni regola sotto la pressione delle scadenze sì. Uno strumento IA di ricerca specializzato automatizza quella lista di controllo per te.
Usa lo Statistical Method Advisor → · Sfoglia tutte le soluzioni di ricerca →
