결측 데이터 처리 전략
2단계 개인정보 보호 결측 데이터 상담: AI가 연구 설계에 맞춘 프로파일링 스크립트(MAR 진단 및 Little's MCAR 검정 포함)를 생성하고, 로컬에서 실행 후 익명화된 출력을 기반으로 완전한 처리 전략을 제공합니다. 원시 데이터는 기기를 벗어나지 않습니다.
- 연구 설계, 데이터셋 설명, 결측 패턴(어떤 변수인지, 추정 비율)을 입력해 주세요.
- AI Run을 클릭하면 AI가 데이터에 맞춘 프로파일링 스크립트(R 또는 Python)를 생성합니다.
- 해당 스크립트를 로컬 데이터셋에서 실행한 뒤, 출력을 채팅에 다시 붙여 넣어 주세요.
- 권장 방법, 구현 코드, Methods 섹션 초안, 민감도 분석 계획을 포함한 전체 결측 데이터 전략을 받아보실 수 있습니다.
이 도구에 대해
임상 연구자를 위한 2단계 결측 데이터 컨설턴트입니다. 1단계: AI가 연구 설계를 인식하는 프로파일링 스크립트를 생성합니다(변수 유형, 결측률, MAR 상관 진단, 연구 설계별 검사(RCT 팔 균형, 종단 탈락 패턴, 결과 계층화 결측성) 포함). 2단계: AI가 결측 메커니즘을 진단하고 단순 방법 추천을 넘어 가정, 구현 코드, 민감도 분석을 포함한 완전한 전략을 제공합니다.
결측 데이터 메커니즘 참조
| 메커니즘 | 의미 | 프로파일러 신호 | 일반적 접근법 |
|---|---|---|---|
| MCAR | 결측이 모든 변수와 독립 | Little 검정 p > 0.05, 상관 패턴 없음 | 완전 케이스 분석 또는 단순 대체 |
| MAR | 결측이 관측 변수에 의존 | 상관 신호 감지 | 다중 대체(mice/Amelia) 또는 IPW |
| MNAR | 결측이 결측값 자체에 의존 | 신호 없음, 그러나 임상 논리가 패턴 시사 | 패턴 혼합 모델; 가정 공개 필수 |
주요 내장 안전 장치
이진/범주/계수 변수에는 평균 또는 중앙값 대체가 절대 사용되지 않습니다. MNAR 데이터는 조용히 대체될 수 없습니다 — AI는 연구자가 결정할 수 있도록 가정을 나열해야 합니다. 주요 변수의 결측률이 20%를 초과하면 2–3가지 접근법의 명시적 트레이드오프를 보여주는 필수 영향 보고서가 생성됩니다. 모든 질문이 한 번에 일괄 전송됩니다.
이 도구가 하지 않는 것
실행할 대체 코드를 생성하며 직접 데이터를 대체하지 않습니다. MNAR는 관측 데이터만으로 확인할 수 없습니다; AI는 플래그를 표시하지만 증명할 수 없습니다. 복잡한 규제 제출을 위한 통계학자의 판단을 대체하지 않습니다.
데이터 프라이버시
프로파일링 스크립트는 로컬 컴퓨터에서 완전히 실행됩니다. 대화에 붙여넣는 것은 요약 통계뿐입니다 — 원시 환자 데이터는 컴퓨터를 절대 벗어나지 않습니다.