Pourquoi l'approche en deux phases ?

Le script de profilage s'exécute entièrement en local et ne produit que des statistiques agrégées — types de variables, taux de manquants et signaux de corrélation — jamais de données individuelles de patients. Cela permet à l'IA d'obtenir des données de diagnostic MAR objectives sans dépendre de votre description, tout en gardant les données brutes privées. Le script dynamique adapte également les diagnostics à votre conception d'étude.

Je n'ai ni R ni Python installé. Que faire ?

Indiquez votre préférence logicielle en Phase 1. Si vous n'avez aucun des deux, demandez à l'IA de générer un script pour le plus facile à installer (R est généralement plus simple pour les chercheurs cliniques). Vous pouvez aussi décrire manuellement la structure de vos données en Phase 1 et demander à l'IA de passer directement à la Phase 2.

Comment coller la sortie du profileur ?

Copiez tout ce qui se trouve entre le '=== MISSING DATA PROFILER OUTPUT ===' et collez-le dans la même fenêtre de chat. Si vous avez une hypothèse clinique sur la raison des données manquantes, ajoutez-la sous le bloc collé. L'IA le reconnaît automatiquement comme le déclencheur de la Phase 2.

Dois-je fournir une hypothèse clinique sur la raison des données manquantes ?

Oui, si vous en avez une — cela améliore significativement le diagnostic du mécanisme. Contexte clinique que le script ne peut pas détecter automatiquement : 'Les patients avec de moins bons résultats revenaient moins souvent au suivi' ; 'Les valeurs de laboratoire n'étaient commandées que pour les patients à haut risque'. Si vous n'êtes pas sûr, laissez vide.

Quelle est la différence entre MCAR, MAR et MNAR ?

MCAR : La probabilité de données manquantes est indépendante de toute variable. MAR : La probabilité de manque dépend de variables observées. MNAR : Le manque est directement lié à la valeur non observée elle-même. Le profileur fournit des signaux de corrélation pour distinguer MCAR de MAR. MNAR nécessite un jugement clinique.

Quand utiliser l'analyse des cas complets ?

Uniquement quand : (1) les données sont MCAR, confirmées par le test MCAR de Little (p > 0,05) sans corrélations MAR |r| > 0,2 ; ET (2) le taux global de manquants est < 5%. Sinon, elle produit des estimations biaisées et une perte de puissance statistique.

Pourquoi ne pas toujours utiliser l'imputation multiple ?

L'imputation multiple suppose des données MAR. Si le mécanisme est MNAR, elle produira des résultats systématiquement biaisés. De plus, les variables binaires ou ordinales nécessitent des méthodes spécialisées — l'imputation par la moyenne est toujours incorrecte pour ces types.

Que détecte réellement le diagnostic MAR du profileur ?

Pour chaque variable avec >5% de manquants, le profileur crée un indicateur de manque binaire et calcule sa corrélation avec toutes les autres variables observées. Des corrélations |r| > 0,2 suggèrent une association MAR. Le profileur rapporte ces signaux pour que l'IA puisse citer des preuves spécifiques.

Stratégie pour les données manquantes -- medPrompt

Guide d'utilisation

Renseignez le schema d'etude, la description du jeu de donnees et les profils de donnees manquantes (variables concernees, pourcentage estime).
Cliquez sur AI Run : l'IA genere un script de profilage adapte a vos donnees (R ou Python).
Executez ce script localement sur votre jeu de donnees puis recollez la sortie dans le chat.
Recevez votre strategie complete de gestion des donnees manquantes : methode recommandee, code d'implementation, brouillon de la section Methods et plan d'analyse de sensibilite.

Assistant de Recherche Médicale

Remplissez les variables et exécutez directement avec l'IA

Wiki

Ce que fait cet outil

Un consultant en données manquantes en deux phases pour les chercheurs cliniques. Phase 1 : l'IA génère un script de profilage conscient du design de l'étude couvrant les types de variables, les taux de manquants, les diagnostics de corrélation MAR et les vérifications spécifiques au design (équilibre des bras en ERC, modèles d'abandon longitudinal, missingness stratifié par résultat). Phase 2 : l'IA diagnostique le mécanisme de missing et fournit une stratégie complète — pas seulement une recommandation de méthode, mais une décision complète avec hypothèses, code d'implémentation et analyse de sensibilité.

Référence des mécanismes de données manquantes

Mécanisme	Signification	Signal du profileur	Approche typique
MCAR	Missing indépendant de toutes les variables	Test de Little p > 0.05, aucun modèle de corrélation	Analyse des cas complets ou imputation simple
MAR	Missing dépend des variables observées	Signal de corrélation détecté	Imputation multiple (mice/Amelia) ou IPW
MNAR	Missing dépend de la valeur manquante elle-même	Aucun signal, mais logique clinique suggère un modèle	Modèles mélangés de patterns ; hypothèses à divulguer

Garde-fous clés intégrés

Les variables binaires/catégorielles/de comptage ne sont jamais imputées avec la moyenne ou la médiane. Les données MNAR ne peuvent pas être imputées silencieusement — l'IA doit lister les hypothèses pour que le chercheur décide. Si une variable clé dépasse 20% de manquants, un rapport d'impact obligatoire est généré avec des compromis explicites pour 2–3 approches. Toutes les questions de clarification sont regroupées en un seul message.

Ce que cet outil ne fera pas

Il génère du code d'imputation à exécuter — il n'impute pas directement les données. MNAR ne peut pas être confirmé à partir des seules données observées ; l'IA le signale mais ne peut le prouver. Il ne remplace pas le jugement d'un statisticien pour les soumissions réglementaires complexes.

Confidentialité des données

Le script de profilage s'exécute entièrement sur votre machine locale. Seules des statistiques de résumé sont collées dans la conversation — les données brutes des patients ne quittent jamais votre ordinateur.

FAQ