Warum der zweistufige Ansatz?

Das Profiling-Skript läuft vollständig lokal und gibt nur aggregierte Statistiken aus — Variablentypen, Fehlraten und Korrelationssignale — keine individuellen Patientendaten. Dies ermöglicht der KI objektive MAR-Diagnosedaten zu erhalten, ohne auf Ihre Beschreibung angewiesen zu sein, während Rohdaten privat bleiben. Das dynamische Skript passt die Diagnostik auch an Ihr Studiendesign an: RCT-Skripte prüfen Arm-Ungleichgewicht; longitudinale Skripte erkennen monotone Dropout-Muster.

Ich habe weder R noch Python installiert. Was kann ich tun?

Teilen Sie der KI in Phase 1 Ihre Softwarepräferenz mit. Falls Sie keines haben, bitten Sie die KI, ein Skript für die leichter zu installierende Variante zu generieren (für klinische Forscher ist R typischerweise einfacher). Alternativ können Sie die Datenstruktur in Phase 1 manuell beschreiben und die KI bitten, die Skriptgenerierung zu überspringen und direkt zu Phase 2 zu wechseln.

Wie füge ich die Profiler-Ausgabe ein?

Kopieren Sie alles zwischen dem '=== MISSING DATA PROFILER OUTPUT ===' Header und Footer und fügen Sie es in dasselbe Chatfenster ein. Falls Sie eine klinische Hypothese über die Fehlursache haben, fügen Sie diese unterhalb des eingefügten Blocks hinzu. Die KI erkennt dies automatisch als Phase-2-Auslöser.

Sollte ich eine klinische Hypothese über die Fehlursache angeben?

Ja, falls vorhanden — dies verbessert die Mechanismusdiagnose erheblich. Klinischer Kontext, den das Skript nicht automatisch erkennen kann: 'Patienten mit schlechteren Ergebnissen kamen seltener zur Nachuntersuchung'; 'Laborwerte wurden nur bei Hochrisikopatienten angeordnet'. Wenn Sie unsicher sind, lassen Sie es leer — die KI verwendet die MAR-Korrelationssignale des Profilers zur Schätzung.

Was ist der Unterschied zwischen MCAR, MAR und MNAR?

MCAR (Missing Completely At Random): Die Fehlwahrscheinlichkeit ist unabhängig von jeder Variable — wie zufällig verschütteten Kaffee auf einem Datenblatt. Vollständige Fallanalyse ist akzeptabel, aber mit Leistungsverlust. MAR (Missing At Random): Die Fehlwahrscheinlichkeit hängt von beobachteten Variablen ab — wie Patienten, die weit weg wohnen, häufiger Nachsorge verpassen. Multiple Imputation funktioniert gut. MNAR (Missing Not At Random): Das Fehlen hängt direkt mit dem unbeobachteten Wert zusammen — wie Patienten, die wegen Verschlechterung der Schmerzen keine Scores mehr melden. Keine Standardmethode ist unverzerrt.

Wann sollte ich eine vollständige Fallanalyse verwenden?

Vollständige Fallanalyse (listenweiser Ausschluss) ist nur gültig, wenn: (1) Daten MCAR sind, bestätigt durch Little's MCAR-Test (p > 0,05) und keine MAR-Korrelationen |r| > 0,2 im Profiler; UND (2) die Gesamtfehlrate unter 5% liegt. Andernfalls erzeugt sie verzerrte Schätzungen und Leistungsverlust.

Warum nicht immer multiple Imputation verwenden?

Multiple Imputation setzt MAR-Daten voraus. Bei MNAR erzeugt sie systematisch verzerrte Ergebnisse — manchmal schlechter als vollständige Fallanalyse, da plausibel aussehende, aber falsche Werte imputiert werden. Zudem erfordern binäre oder ordinale Variablen spezialisierte Methoden; Mittelwertimputation ist für diese Typen immer falsch.

Was erkennt die MAR-Diagnostik im Profiler tatsächlich?

Für jede Variable mit >5% Fehlwerten erstellt der Profiler eine binäre Fehlindikatorvariable (0=beobachtet, 1=fehlend) und berechnet deren Korrelation mit allen anderen beobachteten Variablen. Korrelationen |r| > 0,2 deuten darauf hin, dass das Fehlen dieser Variable mit den Werten einer anderen Variable zusammenhängt — ein klassisches MAR-Signal. Der Profiler gibt diese Signale aus, damit die KI spezifische Belege zitieren kann.

Strategie für fehlende Daten -- medPrompt

Nutzungsleitfaden

Geben Sie Studiendesign, Datensatzbeschreibung und Muster der fehlenden Daten an (betroffene Variablen, geschatzter Anteil).
Klicken Sie auf AI Run. Die KI erstellt ein auf Ihre Daten zugeschnittenes Profiling-Skript (R oder Python).
Fuhren Sie das Skript lokal auf Ihrem Datensatz aus und fugen Sie die Ausgabe wieder in den Chat ein.
Sie erhalten eine vollstandige Strategie fur fehlende Daten: empfohlene Methode, Implementierungscode, Entwurf fur die Methods-Sektion und Sensitivitatsanalyseplan.

Medizinischer Forschungsassistent

Variablen ausfüllen und direkt mit KI ausführen

Wiki

Was dieses Tool tut

Ein zweiphasiger Berater für fehlende Daten für klinische Forscher. Phase 1: Die KI generiert ein studiendesign-bewusstes Profiling-Skript, das Variablentypen, Fehlraten, MAR-Korrelationsdiagnostik und designspezifische Prüfungen umfasst (RCT-Arm-Balance, Längsschnitt-Dropout-Muster, ergebnisstratifizierte Fehlerhaftigkeit). Phase 2: Die KI diagnostiziert den Fehlmechanismus und liefert eine vollständige Strategie — nicht nur eine Methodenempfehlung, sondern eine komplette Entscheidung mit Annahmen, Implementierungscode und Sensitivitätsanalyse.

Referenz zu fehlenden Datenmechanismen

Mechanismus	Bedeutung	Profiler-Signal	Typischer Ansatz
MCAR	Fehlerhaftigkeit unabhängig von allen Variablen	Little-Test p > 0.05, kein Korrelationsmuster	Vollständige Fallanalyse oder einfache Imputation
MAR	Fehlerhaftigkeit abhängig von beobachteten Variablen	Korrelationssignal erkannt	Mehrfachimputation (mice/Amelia) oder IPW
MNAR	Fehlerhaftigkeit abhängig vom fehlenden Wert selbst	Kein Signal, aber klinische Logik deutet auf Muster hin	Mustermischmodelle; Annahmen müssen offengelegt werden

Wichtige eingebaute Schutzmaßnahmen

Binäre/kategoriale/Zählvariablen werden nie mit Mittelwert oder Median imputiert. MNAR-Daten können nicht stillschweigend imputiert werden — die KI muss Annahmen auflisten, damit der Forscher entscheiden kann. Wenn eine wichtige Variable >20% fehlt, wird ein obligatorischer Auswirkungsbericht mit expliziten Kompromissen für 2–3 Ansätze erstellt. Alle Klärungsfragen werden in einer Nachricht gebündelt.

Was dieses Tool nicht tut

Es generiert Imputationscode zum Ausführen — es imputiert keine Daten direkt. MNAR kann nicht allein aus beobachteten Daten bestätigt werden; die KI kennzeichnet es, kann es aber nicht beweisen. Es ersetzt nicht das Urteil eines Statistikers für komplexe regulatorische Einreichungen.

Datenschutz

Das Profiling-Skript läuft vollständig auf Ihrem lokalen Computer. Nur zusammenfassende Statistiken werden in das Gespräch eingefügt — rohe Patientendaten verlassen Ihren Computer nie.

FAQ