投稿被拒？很可能是这3个统计错误在作怪

每年有数以万计的医学论文被期刊拒稿，审稿意见里出现频率最高的话之一是：

"统计方法选择不当，结论可信度存疑。"

这句话背后，往往藏着3个极其常见却容易被忽视的错误。

错误一：对偏态数据用均值±标准差汇报结果

你有没有这样描述过你的数据：

"住院天数为 8.3 ± 12.7 天"

均值 8.3，标准差 12.7。标准差比均值还大——这意味着你的数据几乎可以肯定是右偏分布。

住院天数、医疗费用、生存时间……这些变量天然有下界（不可能是负数），会拉出一条长长的右尾。用均值描述它们，就像用平均工资描述一个班里有一半学生和马云同班的收入水平一样——数字是对的，但完全误导人。

正确做法：

很多人知道这个规则，但真正用通用 AI 帮助分析时，AI 默认就会给你 mean ± SD 和 t 检验。缺少专业约束，AI 不会主动告诉你数据分布的问题。

你比较了4种治疗方案，分别做了6次两两比较，每次都用 p < 0.05 作为显著性阈值。

问题是：做6次比较，"至少出现一次假阳性"的概率已经超过 26%。

这就是多重比较问题（Multiple Comparisons Problem）。每次检验都在抛硬币，抛的次数越多，"凑巧显著"的概率就越高。

审稿人一眼就能看出来，这是被打回最高频的理由之一。

正确做法：

"我用了逐步回归（Stepwise Regression）来筛选哪些变量进入最终模型。"

这句话在统计学领域，已经是一个会让专业审稿人皱眉的信号。

逐步回归的问题在于：

这个方法在上世纪 70 年代因为计算资源限制而流行，但早已被现代统计学界不推荐。

正确做法：

如果你把数据描述丢给 ChatGPT 说"帮我选统计方法"，你大概率会得到：

但它不会主动问你：数据是否偏态？有没有多重比较？变量是怎么选进来的？

这些判断需要规则——就像一个经验丰富的生物统计顾问在脑子里跑的检查清单。

我们在 Statistical Method Advisor 中，把这些规则内置在 AI 工具里：

填入你的数据描述，直接得到一份"能让审稿人满意"的统计方案。

统计方法本身并不难，难的是在写作压力下保持对每一个细节的关注。专为医学研究设计的 AI 工具，就是帮你把这些检查清单自动化。