Strategi för saknad data
Tvåfasig integritetsfokuserad konsultation om saknad data: AI genererar ett studiedesign-anpassat profileringsskript (med MAR-diagnostik och Little's MCAR-test) att köra lokalt, levererar sedan en komplett hanteringsstrategi baserad på den anonymiserade utmatningen — ingen rådata lämnar din enhet.
- Fyll i studiedesign, beskrivning av datamangden och monster for bortfall (vilka variabler, uppskattad andel).
- Klicka pa AI Run. AI:n genererar ett profileringsskript anpassat till dina data (R eller Python).
- Kor skriptet lokalt pa datamangden och klistra tillbaka utdata i chatten.
- Fa en fullstandig strategi for bortfall: rekommenderad metod, implementeringskod, utkast till Methods-avsnitt och plan for kanslighetsanalys.
Vad det här verktyget gör
En tvåfasig konsult för saknade data för kliniska forskare. Fas 1: AI genererar ett studiedesign-medvetet profileringsskript som täcker variabeltyper, bortfallsfrekvenser, MAR-korrelationsdiagnostik och designspecifika kontroller (RCT-armbalans, longitudinella bortfallsmönster, utfallsstratifierad missingness). Fas 2: AI diagnostiserar sakningsmekanismen och levererar en komplett strategi — inte bara en metodrekommendation, utan ett fullständigt beslut med antaganden, implementeringskod och känslighetsanalys.
Referens för saknade datamekanismer
| Mekanism | Vad det innebär | Profileringssignal | Typisk metod |
|---|---|---|---|
| MCAR | Saknad oberoende av alla variabler | Littles test p > 0.05, inget korrelationsmönster | Fullständig fallanalys eller enkel imputering |
| MAR | Saknad beror på observerade variabler | Korrelationssignal upptäckt | Multipel imputering (mice/Amelia) eller IPW |
| MNAR | Saknad beror på det saknade värdet självt | Ingen signal, men klinisk logik antyder mönster | Mönster-blandningsmodeller; antaganden måste redovisas |
Viktiga inbyggda skyddsåtgärder
Binära/kategoriska/räknevariabler imputeras aldrig med medelvärde eller median. MNAR-data kan inte tyst imputeras — AI måste lista antaganden för att forskaren ska kunna besluta. Om någon nyckelvariabel överstiger 20% saknad, genereras en obligatorisk Impact Report med explicita avvägningar för 2–3 tillvägagångssätt. Alla förtydligande frågor grupperas i ett meddelande.
Vad det här verktyget inte gör
Det genererar imputeringskod för dig att köra — det imputerar inte data direkt. MNAR kan inte bekräftas enbart från observerade data; AI flaggar det men kan inte bevisa det. Det ersätter inte statistikerns bedömning för komplexa regulatoriska inlämningar.
Dataintegritet
Profileringsskriptet körs helt på din lokala dator. Endast sammanfattningsstatistik klistras in i konversationen — råa patientdata lämnar aldrig din dator.