4.8 术语

  • 连续分布(continuous distribution) 由连续函数描述的分布。

  • 语料库(corpus) 特定语言中用做样本的正文文本。

  • 经验分布(empirical distribution) 样本中值的分布。

  • 误差函数(error function) 一种特殊的数学函数,因源自误差度量研究而得名。

  • 一次频词(hapaxlegomenon) 表示语料库中只出现一次的词。这个单词在本书中迄今出现了两次。

  • 间隔时间(interarrival time) 两个事件的时间间隔。

  • 模型(model) 一种有效的简化。对于很多复杂的经验分布,连续分布是不错的模型。

  • 正态概率图(normal probability plot) 一种统计图形,用于表示样本中排序后的值与其服从正态分布时的期望值之间的关系。

  • 秩变换 (rankit) 元素的期望值,该元素位于服从正态分布的已排序列表中。