译者序

搞科研的都知道,论文发表情况是评判科研水平的主要指标,而学术期刊的影响因子则代表了期刊的档次,从而也就直接反映了论文的水平。在统计学领域,影响因子最高的期刊是什么?不是《皇家统计学会志,B辑》(JRSS B),也不是大名鼎鼎的《统计年鉴》(Annals of Statistics)和《美国统计学会会刊》(JASA),而是《统计软件杂志》(Journal of Statistical Software)。什么?我推导了十几页公式,提出了如此高级的统计模型,证明了十几年无人搞定的定理,竟然还不如写两千行代码,发布一个统计分析的小工具?

这样的统计学世界让人感觉怪怪的,但现实如此。统计学的分析对象再也不放进打印在A4纸上的表格,靠普通计算器和教科书附录中的各种表格已经不可能实现现实所需的统计分析——离开了计算机,统计在现代科学和工程领域寸步难行。

不讲代码的统计学图书已经过时了!

你手中的这本书不是教你如何在SPSS中点鼠标,也不是如何在SAS中调用函数,而是介绍如何用Python这样的通用编程语言去获取和处理原始数据,去理解和实现统计分析,去跟上时代对统计的要求。

本书采用大量实例介绍了基本的统计分析知识,教你如何用Python编程语言实现各种分析,乃至画出统计图形。本书提供了绝对实用的配套代码,你可以直接“拿来”对大量数据进行分析。作者Allen Downey是高校副教授,先后获得麻省理工学院计算机科学硕士和加州大学伯克利分校计算机科学博士学位。别惊讶,是的!计算机专业的教授写的统计学读本,这才是这本书最大的亮点。统计学和计算机在本书中紧紧地拥抱在一起,这是多美好的场景。

好吧,准备好键盘,让我们开始一次硅世界的统计学旅程!

张剑锋、陈钢 2013年3月26日于深圳华大基因

致谢

感谢发起本书翻译的陈钢博士,他出色地引导我完成了本书部分章节的翻译工作。感谢图灵编辑部的刘美英女士,她对本书的校译和定稿提供了宝贵意见和辛勤劳动。感谢所有引导我走上统计学道路的人们,他们让我认识了一个如此精彩纷呈的世界。

感谢我的家人,你们是我在艰难中前行的不竭动力。

——张建锋

感谢我的合作者张建锋,他在关键时刻参与了本书的翻译工作。感谢图灵的傅志红、李松峰、刘美英等编辑的帮助和宽容,让我们能最终完成这本书的翻译工作。

谨以此书献给我的夫人王倩和儿子陈涤菲,你们是我所有努力的动力源泉。

——陈钢