7.10 术语

  • 单元格(cell) 在卡方检验中,将观测按一定的标准分到各个单元格里,每个单元格代表一种分类。
  • 卡方检验(chi-square test) 用卡方统计量做统计量的统计检验 。
  • 交叉验证(cross-validation) 交叉验证使用一个数据集进行探索性数据分析,然后用另一个数据集进行测试。
  • 假阴性(false negative) 在效应真实存在的情况下,我们认为这个效应是由偶然因素引起的。
  • 假阳性(false positive) 在原假设为真的情况下,我们拒绝了原假设的结论。
  • 假设检验(hypothesis testing) 判定出现的效应是否具有统计显著性的过程。
  • 似然比(likelihood ratio) 一种概率的比值, P(E|A)/P(E|B),这里A和B是两种假设。似然比不依赖于先验概率,可以用来报道贝叶斯统计推断的结果。
  • 原假设(null hypothesis) 一种基于以下假设的模型系统:我们观测到的效应只是由偶然因素引起的。
  • 单边检验(one-sided test) 一种检验类型,关注的是出现比观测到的效应更大(或小)的效应的概率。
  • p值(p-value) 在原假设成立的情况下,出现我们观测到的效应的概率。
  • 功效 (power) 在原假设为假的情况下,检验推翻原假设的概率。
  • 显著性(significant) 我们说某个效应具有统计显著性指的是这种情况不大可能是由偶然因素引起的。
  • 检验统计量(test statistic) 衡量观测到的效应与原假设下期望的结果之间偏差的统计量。
  • 测试集(testing set) 用做测试的数据集。
  • 训练集(training set) 用做训练的数据集。
  • 双边检验(two-sided test) 一种检验类型,关注的是出现比观测到的效应更大的效应的概率,不考虑正负。