本书的写作原则
要写一本新教材,通常的做法是参考一堆老教材。很多书的内容因此都会重复,且行文组织也大同小异,出现了不少以讹传讹的情况。史蒂芬·古尔德在他的文章中就提到过一个关于猎狐犬的例子〔1〕。但我可没有这样做,我在撰写本书过程中几乎没有参考过任何已出版的材料,主要原因如下。
- 本书的目的是要探索这方面的新方法,所以对已有的方法我并不想讲太多。
- 我想让所有人都可以自由地使用本书内容,因此要确保书中所有内容都没有版权限制。
- 很多读者都不方便到图书馆借阅纸版书,所以本书尽量只引用能在网上免费查阅的内容。
- 传统媒体的支持者认为只使用网络资源是一种偷懒的行为,而且内容也不可靠。我认同前半句话,但不同意后半句,所以我要亲自证明。
〔1〕Stephen Jay Gould(1941—2002),美国著名的进化生物学家、古生物学家、科学史学家和科普作家;很多教科书中说始祖马跟小猎狐犬差不多大,史蒂芬·古尔德在他的文章中纠正了这一错误观点(译者注),狗大概只有始祖马的一半大(见http://wikipedia.org/wiki/Hyracotherium)。
我用得最多的资源是维基百科,其内容涉及方方面面,每个人都可以查阅。总体看来,我所读过的关于统计学的文章整体质量都不错(不过我也做了一些修改)。本书引用了不少维基百科的链接,建议读者去读一读这些网页内容。这些页面很多时候都是对本书所介绍内容的很好补充和完善。除非有充分的理由修改,否则本书中所使用的术语和概念与维基百科基本保持一致。
其他实用资源包括Wolfram MathWorld(http://mathworld.wolfram.com/),当然还有Google。我还用到了两本书,David MacKay的Information Theory, Inference, and Learning Algorithms〔2〕和Press等人合著的Numerical Recipes in C,前者是我学习贝叶斯统计的书。不过,因为这两本书都可以在网上找到,所以并不违反我之前所说的原则。
〔2〕中译本《信息论、推理与学习算法(翻译版)》由高等教育出版社出版(2006);《C语言数值算法程序大全(第二版)》由电子工业出版社出版(1995)。——编者注