5.3 庞加莱
亨利·庞加莱(Henri Poincaré)是法国著名的数学家,1900年左右在索邦大学任教。下面这个关于他的传闻可能是杜撰的,但这里有一个很有意思的概率问题。
庞加莱怀疑当地的面包屋出售的大面包的重量并没有他们所宣传的1000克那么重,所以他一年中每天都去买一个大面包,然后回家称重。到了年底,他画出了重量的分布图,并证明了该分布服从均值950克、标准差50克的正态分布。他把这个证据提交给了监管部门,监管部门警告了面包屋。
第二年,庞加莱继续每天测量他所购买的面包的重量。到了年底,他发现平均重量是1000克,跟宣传的一样。但他再次向监管部门投诉了面包屋,而这次监管部门处罚了面包屋。
为什么?因为重量分布是不对称的。跟正态分布不一样,这个分布向右倾斜,换言之就是面包屋做的面包依然只有950克,只是故意把比较重的面包卖给了庞加莱。
习题5-6
写一个程序模拟面包屋,从均值950克、标准差50克的分布中随机选出n块面包,把其中最重的一块给庞加莱。n等于什么值会得到一个均值1000克的分布?标准差是多少?
将这个分布跟均值、标准差相同的正态分布作比较。两者形状上的差异是否足以说服监管部门?
习题5-7
如果跳舞时舞伴是随机安排的,女的比男的高的比例是多少?
在BRFSS(见4.5节“对数正态分布”),身高的分布基本上是个正态分布,男性身高分布的μ=178 cm,σ2 =59.4 cm,女性身高分布的μ=163 cm,σ2 =52.8 cm。
插一句,读者可能发现男性身高的标准差比较大,这是否意味着男性身高的变化更大?比较两组的变化程度可以计算变异系数(coefficient of variation),即标准差除以均值,σ/μ。根据这个指标,女性身高的变化更大一些。