3.7 条件分布

所谓条件分布就是根据某个条件选择的数据子集的分布。

例如,如果你的体重略高于平均值,但身高远远超过平均值,那么就你的身材来说,你可能体重偏轻。如何才能更精确地表述这个情况?

  1. 选择一组身高跟你差不多(在一定范围内)的人。
  2. 算出这群人体重的CDF。
  3. 找到你的体重在该分布中的百分等级。

比较来自不同测试的度量结果或不同分组的测试结果时,百分等级非常有用。

例如,参加田径比赛的人一般是按年龄和性别分组的。要比较不同分组中选手的水平,就可以将比赛时间转换成百分等级再做比较。

习题3-8

我最近参加了在马萨诸塞州Dedham举办的James Joyce Ramble一万米长跑。比赛结果放在了http://coolrunning.com/results/10/ma/Apr25_27thAn_set1.shtml上。访问这个网页可以看到我的比赛成绩:在全部1633名选手中排名第97位。那么我在所有参赛选手中的百分等级是多少?

在我所在的分组中(M4049的意思是“40到49岁之间的男性”),我在256名选手中排在第26位。我在这个分组中的百分等级是多少?

如果我在未来十年都参加这个比赛(希望我能行),我就会参加M5059分组。假设我在分组中的百分等级不变,我的速度会变慢多少?

我跟我的一个学生比成绩,她是F2039组的。她要在下次一万米长跑中跑多快才能在百分等级上赢我?