Jedes Jahr werden Tausende medizinischer Manuskripte abgelehnt. Einer der häufigsten Reviewerkommentare lautet:
„Die Wahl der statistischen Methoden ist unangemessen und untergräbt die Zuverlässigkeit der Schlussfolgerungen."
Hinter diesem Satz stecken meist drei sehr spezifische Fehler.
Fehler 1: Schiefe Daten mit Mittelwert ± SD berichten
Haben Sie schon einmal so etwas geschrieben?
„Die Krankenhausverweildauer betrug 8,3 ± 12,7 Tage."
Mittelwert 8,3, Standardabweichung 12,7. Die SD ist größer als der Mittelwert – ein fast sicheres Zeichen für eine rechtschiefe Verteilung.
Krankenhausaufenthalt, Behandlungskosten, Überlebenszeit – diese Variablen haben eine natürliche Untergrenze bei null und einen langen rechten Ausläufer. Sie mit einem Mittelwert zu beschreiben ist wie das Durchschnittseinkommen in einer Klasse zu berichten, in der die Hälfte der Schüler neben einem Milliardär saß: technisch korrekt, aber vollständig irreführend.
Was stattdessen zu tun ist:
- Als Median (IQR) statt Mittelwert ± SD berichten
- t-Tests durch Mann-Whitney-U-Test (zwei Gruppen) oder Kruskal-Wallis-Test (mehrere Gruppen) ersetzen
Viele Forscher kennen diese Regel in der Theorie. Aber wenn sie eine allgemeine KI um Hilfe bei der Analyse bitten, gibt die KI standardmäßig Mittelwert ± SD und t-Tests aus, ohne jemals nach der Datenverteilung zu fragen.
Fehler 2: Mehrfachvergleiche ohne Korrektur
Sie vergleichen vier Behandlungsarme mit sechs paarweisen Tests, jeweils mit p < 0,05 als Schwellenwert.
Das Problem: Bei sechs Tests übersteigt die Wahrscheinlichkeit, mindestens ein falsch-positives Ergebnis zu erhalten, 26 %.
Dies ist das Mehrfachvergleichsproblem. Jeder Test ist ein Münzwurf für ein falsch-positives Ergebnis. Je mehr Tests Sie durchführen, desto wahrscheinlicher ist es, etwas zu finden, das nicht real ist.
Erfahrene Reviewer erkennen dies sofort. Es ist einer der häufigsten Gründe, warum Manuskripte zur größeren Überarbeitung zurückgeschickt werden.
Was stattdessen zu tun ist:
- Bonferroni-Korrektur verwenden (konservativ; gut für konfirmatorische Forschung)
- Oder FDR-Korrektur (Benjamini-Hochberg) (höhere Power; besser für entdeckende Forschung)
Fehler 3: Schrittweise Regression zur Variablenauswahl
„Ich habe schrittweise Regression verwendet, um auszuwählen, welche Variablen in das endgültige Modell eingehen."
Dieser Satz ist ein Warnsignal für statistische Reviewer – und das seit Jahrzehnten.
Die Probleme mit der schrittweisen Regression:
- Instabile Ergebnisse – bei einer anderen Stichprobe können die ausgewählten Variablen völlig anders sein
- Verzerrte p-Werte – nach mehreren Filterrunden können die p-Werte im endgültigen Modell nicht mehr korrekt interpretiert werden
- Overfitting – das Modell funktioniert gut auf Ihren Daten, generalisiert aber schlecht auf neue Patienten
Diese Methode wurde in den 1970er Jahren aufgrund von Rechenkapazitätsbeschränkungen populär. Diese Beschränkungen sind weg. Die Mängel der Methode bleiben.
Was stattdessen zu tun ist:
- LASSO-Regression (L1-Regularisierung; schrumpft automatisch unwichtige Koeffizienten auf null)
- Elastic Net (kombiniert LASSO und Ridge; geht besser mit Multikollinearität um)
- Oder Variablenauswahl auf klinischem Vorwissen basieren, nicht auf datengetriebenem Automatismus
Warum KI diese Fehler ohne Regeln nicht erkennt
Fragen Sie ChatGPT „Hilf mir, statistische Methoden zu wählen", erhalten Sie typischerweise:
- Eine Liste von Methoden, die vernünftig aussieht
- Eingeschränkt durch Phrasen wie „abhängig von Ihren Daten" oder „normalerweise empfohlen"
Was Sie nicht bekommen: eine KI, die fragt, ob Ihre Daten schief sind, prüft, ob Sie Mehrfachvergleiche durchführen, oder sich weigert, schrittweise Regression zu empfehlen.
Diese Überprüfungen erfordern explizite Regeln – die Art, die ein erfahrener Biostatistiker automatisch durchläuft, wenn er einen Methodenabschnitt überprüft.
Unser Statistical Method Advisor kodiert diese Regeln direkt in das KI-Tool:
- Erkennt schiefe Daten → empfiehlt standardmäßig nicht-parametrische Methoden
- Kennzeichnet Mehrfachvergleiche → fordert zur Korrektionsstrategie auf
- Verbietet schrittweise Regression → leitet zu LASSO oder Elastic Net um
Geben Sie Ihre Datenbeschreibung ein. Erhalten Sie einen statistischen Plan, den Reviewer nicht zurückschicken werden.
Kurzreferenz
| Fehler | Richtige Alternative |
|---|---|
| Mittelwert ± SD für schiefe Daten | Median (IQR) |
| Mehrfachvergleiche ohne Korrektur | Bonferroni oder FDR |
| Schrittweise Regression | LASSO / Elastic Net |
Statistische Methoden sind nicht kompliziert – aber alle Regeln unter Abgabedruck im Kopf zu behalten schon. Ein spezialisiertes KI-Forschungstool automatisiert diese Checkliste für Sie.
Statistical Method Advisor ausprobieren → · Alle Forschungslösungen ansehen →
