Strategie für fehlende Daten
Zweistufige datenschutzorientierte Beratung zu fehlenden Daten: KI generiert ein studiendesign-spezifisches Profiling-Skript (mit MAR-Diagnostik und Little's MCAR-Test) zur lokalen Ausführung, liefert dann eine vollständige Handhabungsstrategie auf Basis der anonymisierten Ausgabe — keine Rohdaten verlassen Ihr Gerät.
- Geben Sie Studiendesign, Datensatzbeschreibung und Muster der fehlenden Daten an (betroffene Variablen, geschatzter Anteil).
- Klicken Sie auf AI Run. Die KI erstellt ein auf Ihre Daten zugeschnittenes Profiling-Skript (R oder Python).
- Fuhren Sie das Skript lokal auf Ihrem Datensatz aus und fugen Sie die Ausgabe wieder in den Chat ein.
- Sie erhalten eine vollstandige Strategie fur fehlende Daten: empfohlene Methode, Implementierungscode, Entwurf fur die Methods-Sektion und Sensitivitatsanalyseplan.
Was dieses Tool tut
Ein zweiphasiger Berater für fehlende Daten für klinische Forscher. Phase 1: Die KI generiert ein studiendesign-bewusstes Profiling-Skript, das Variablentypen, Fehlraten, MAR-Korrelationsdiagnostik und designspezifische Prüfungen umfasst (RCT-Arm-Balance, Längsschnitt-Dropout-Muster, ergebnisstratifizierte Fehlerhaftigkeit). Phase 2: Die KI diagnostiziert den Fehlmechanismus und liefert eine vollständige Strategie — nicht nur eine Methodenempfehlung, sondern eine komplette Entscheidung mit Annahmen, Implementierungscode und Sensitivitätsanalyse.
Referenz zu fehlenden Datenmechanismen
| Mechanismus | Bedeutung | Profiler-Signal | Typischer Ansatz |
|---|---|---|---|
| MCAR | Fehlerhaftigkeit unabhängig von allen Variablen | Little-Test p > 0.05, kein Korrelationsmuster | Vollständige Fallanalyse oder einfache Imputation |
| MAR | Fehlerhaftigkeit abhängig von beobachteten Variablen | Korrelationssignal erkannt | Mehrfachimputation (mice/Amelia) oder IPW |
| MNAR | Fehlerhaftigkeit abhängig vom fehlenden Wert selbst | Kein Signal, aber klinische Logik deutet auf Muster hin | Mustermischmodelle; Annahmen müssen offengelegt werden |
Wichtige eingebaute Schutzmaßnahmen
Binäre/kategoriale/Zählvariablen werden nie mit Mittelwert oder Median imputiert. MNAR-Daten können nicht stillschweigend imputiert werden — die KI muss Annahmen auflisten, damit der Forscher entscheiden kann. Wenn eine wichtige Variable >20% fehlt, wird ein obligatorischer Auswirkungsbericht mit expliziten Kompromissen für 2–3 Ansätze erstellt. Alle Klärungsfragen werden in einer Nachricht gebündelt.
Was dieses Tool nicht tut
Es generiert Imputationscode zum Ausführen — es imputiert keine Daten direkt. MNAR kann nicht allein aus beobachteten Daten bestätigt werden; die KI kennzeichnet es, kann es aber nicht beweisen. Es ersetzt nicht das Urteil eines Statistikers für komplexe regulatorische Einreichungen.
Datenschutz
Das Profiling-Skript läuft vollständig auf Ihrem lokalen Computer. Nur zusammenfassende Statistiken werden in das Gespräch eingefügt — rohe Patientendaten verlassen Ihren Computer nie.