2.13 术语表

  • 区间(bin) 将相近数值进行分组的范围。
  • 集中趋势(central tendency) 样本或总体的一种特征,直观来说就是最能代表平均水平的值。
  • 临床上有重要意义(clinically significant) 分组间差异等跟实践操作有关的结果。
  • 条件概率(conditional probability) 某些条件成立的情况下计算出的概率。
  • 分布(distribution) 对样本中的各个值及其频数或概率的总结。
  • 频数(frequency) 样本中某个值的出现次数。
  • 直方图(histogram) 从值到频数的映射,或者表示这种映射关系的图形。
  • 众数(mode) 样本中频数最高的值。
  • 归一化(normalization) 将频数除以样本大小得到概率的过程。
  • 异常值(outlier) 远离集中趋势的值。
  • 概率(probability) 频数除以样本大小即得到概率。
  • 概率质量函数(Probability Mass Function,PMF) 以函数的形式表示分布,该函数将值映射到概率。
  • 相对风险(relative risk) 两个概率的比值,通常用于衡量两个分布的差异。
  • 分散(spread) 样本或总体的特征,直观来说就是数据的变动有多大。
  • 标准差(standard deviation) 方差的平方根,也是分散的一种度量。
  • 修剪(trim) 删除数据集中的异常值。
  • 方差(variance) 用于量化分散程度的汇总统计量。