缺失数据处理策略

两阶段隐私保护缺失数据咨询:AI 先根据你的研究设计生成定制画像脚本(含 MAR 诊断和 Little's MCAR 检验),你在本地运行后粘贴输出,再获取完整处理策略。原始数据全程不离开你的设备。

missing dataimputationMCARMARMNARmultiple imputationdata qualitysensitivity analysisprivacy-firsttwo-phase
使用指南
  1. 填写研究设计、数据集描述和缺失数据模式(涉及哪些变量、估计缺失比例)。
  2. 点击 AI Run,AI 会生成适配你数据的画像脚本(R 或 Python)。
  3. 在本地数据集上运行该脚本,并将输出粘贴回聊天。
  4. 获取完整的缺失数据策略:推荐方法、实现代码、Methods 段落草稿和敏感性分析方案。
医学科研研究助手
填入研究信息,一键 AI 运行,结果直接展示在对话界面
说明文档

工具定位

这是一个针对临床研究者的两阶段缺失数据顾问。第一阶段:AI 生成研究设计感知的数据数据分析脚本,涵盖变量类型、缺失率、MAR 相关性诊断和研究设计专项检查(RCT 组间平衡、纵向脱失模式、结局分层缺失性)。第二阶段:AI 诊断缺失机制并提供完整策略——不只是方法推荐,而是包含假设、实现代码和敏感性分析的完整决策方案。

缺失数据机制参考

机制含义数据分析脚本信号典型处理方法
MCAR(完全随机缺失)缺失与所有变量无关Little 检验 p > 0.05,无相关模式完整案例分析或简单插补
MAR(随机缺失)缺失依赖于观测变量检测到相关信号多重插补(mice/Amelia)或 IPW
MNAR(非随机缺失)缺失依赖于缺失值本身无信号,但临床逻辑提示存在规律模式混合模型;必须披露假设

内置关键守卫

二元/分类/计数变量不得使用均值或中位数插补。MNAR 数据不得被静默插补——AI 必须列出假设供研究者决策。若任一关键变量缺失率超过 20%,将强制生成影响评估报告,呈现 2–3 种方案的显性权衡。所有澄清问题合并为一条消息发出(禁止逐一追问)。

本工具不会做的事

它生成供您运行的插补代码,不直接进行数据插补。MNAR 无法仅从观测数据中确认——AI 会标注但无法证明。它不能替代统计学家处理复杂的监管提交。

数据隐私

数据分析脚本完全在您的本机运行。粘贴回对话的只有汇总统计数据,原始患者数据不会离开您的电脑。

常见问题