Stratégie pour les données manquantes
Consultation en deux phases sur les données manquantes axée sur la confidentialité : l'IA génère un script de profilage spécifique à la conception de l'étude (avec diagnostics MAR et test MCAR de Little) à exécuter localement, puis fournit une stratégie complète basée sur la sortie anonymisée — aucune donnée brute ne quitte votre appareil.
- Renseignez le schema d'etude, la description du jeu de donnees et les profils de donnees manquantes (variables concernees, pourcentage estime).
- Cliquez sur AI Run : l'IA genere un script de profilage adapte a vos donnees (R ou Python).
- Executez ce script localement sur votre jeu de donnees puis recollez la sortie dans le chat.
- Recevez votre strategie complete de gestion des donnees manquantes : methode recommandee, code d'implementation, brouillon de la section Methods et plan d'analyse de sensibilite.
Ce que fait cet outil
Un consultant en données manquantes en deux phases pour les chercheurs cliniques. Phase 1 : l'IA génère un script de profilage conscient du design de l'étude couvrant les types de variables, les taux de manquants, les diagnostics de corrélation MAR et les vérifications spécifiques au design (équilibre des bras en ERC, modèles d'abandon longitudinal, missingness stratifié par résultat). Phase 2 : l'IA diagnostique le mécanisme de missing et fournit une stratégie complète — pas seulement une recommandation de méthode, mais une décision complète avec hypothèses, code d'implémentation et analyse de sensibilité.
Référence des mécanismes de données manquantes
| Mécanisme | Signification | Signal du profileur | Approche typique |
|---|---|---|---|
| MCAR | Missing indépendant de toutes les variables | Test de Little p > 0.05, aucun modèle de corrélation | Analyse des cas complets ou imputation simple |
| MAR | Missing dépend des variables observées | Signal de corrélation détecté | Imputation multiple (mice/Amelia) ou IPW |
| MNAR | Missing dépend de la valeur manquante elle-même | Aucun signal, mais logique clinique suggère un modèle | Modèles mélangés de patterns ; hypothèses à divulguer |
Garde-fous clés intégrés
Les variables binaires/catégorielles/de comptage ne sont jamais imputées avec la moyenne ou la médiane. Les données MNAR ne peuvent pas être imputées silencieusement — l'IA doit lister les hypothèses pour que le chercheur décide. Si une variable clé dépasse 20% de manquants, un rapport d'impact obligatoire est généré avec des compromis explicites pour 2–3 approches. Toutes les questions de clarification sont regroupées en un seul message.
Ce que cet outil ne fera pas
Il génère du code d'imputation à exécuter — il n'impute pas directement les données. MNAR ne peut pas être confirmé à partir des seules données observées ; l'IA le signale mais ne peut le prouver. Il ne remplace pas le jugement d'un statisticien pour les soumissions réglementaires complexes.
Confidentialité des données
Le script de profilage s'exécute entièrement sur votre machine locale. Seules des statistiques de résumé sont collées dans la conversation — les données brutes des patients ne quittent jamais votre ordinateur.