概率与统计入门―――摘自 [美]H·L·奥尔德 E·B·罗赛勒

概率与统计入门 ―――摘自 [美]H·L·奥尔德 E·B·罗赛勒
统计学是关于数字资料收集、组织、分析与的科学。 “资料收集”是取得数量或数据的方法。正确的结论只能来源于正确的资料，来源于有代表性的资料。 “资料组织”是以适当形式表现所收集的资料，以得出符合逻辑的结论。 “资料分析”是从给定的量或数，抽出有关问题，从而得出一个简要的综合姓的结果。达到这个日的的最重要的量(平均数、中位数、极差、标推差，等等)。 “资料解释”是通过资料分析来作出结论的工作，它通常是通过类似对象的小的集合提供的信息来对有关对大的集合形成预测的。因此，统计学是一门科学，它处理在某种程度上可用数量信息回答的问题，而信息是通过计数和量度得到的。不论我们在生物研究中调查昆虫数、还是在工厂中调查工人数或工时数，统计工作者的职责首先是选择所裔的信息，其次是指导适当的有效的收集与加工信息，最后是结果。在结果中，特别是在资料不完全的情况下，统计工作者必须运用原理与方法以得出有效的调查结果。他常常要求面对不肯定的情况做出明智的决策。统计一词有两个显然不同的意义。当用作如上所指的情况时，它是。一种研究和评价数量资料的科学方法。当用作复数时，它是“数量资料：一词的同义语。因此，如果我们说在“世界年鉴” 或 “美国统计摘要”中有统计，即是说在它们中有数量资料。这是一个古老的、有普遍意义酌词。原先，统计着重为政府首脑国家政务提供资料。用数字资料表现的这种信息可以上溯到亚里斯多德及他的 “国家政务论” 。事实上， “statistics 与“state”源于同一词根，就是一个明证。早期大多数文明国家，由于军事的与财政的原因，曾经编制大规统计资料，以确定国家的入力与物力。我们在基督教圣经中曾看到诸如此类的户查，以及罗马帝国各地普遍编制的税册。概率论的研究始于意大利的文艺复兴时期，当时赌徒要求找到掷段子决定胜负的规则，曾向学者 G．卡达诺(150l--1576)和著名的数学天文学家 G．加利莱(1564—1642)求教；加利莱所写的一篇短文中，说明了概率的基本定律，从而为整个统计科学的发展奠定了理论基础。在 16 与 17 世纪，机会对策(赌博)在富人中特别普遍，而且引进了更复杂的对策，包括更大的赌注，不同的对策需要一个合理的 “机会” ，当时这个问题成了一个非常重要的问题。一个法国知识分子 C，梅勒也是一个狂热的赌徒，他曾向著名的数学家和哲学家 B。帕斯卡尔(1623—1662)求教，帕斯卡尔的注意促成了与他的数学朋友的交往，特别是与 P．弗曼特马(1601--16S5)的书信往来，就成为现率论与组合分析的起源。研究“机会”定律的其他闻名的数学家有 O．W．莱布尼兹(1646—1716)与雅可比??白努利(1654 —1705)，他是著名的白努利家族九个数学家中的第一个。他们都赢得了卓越的声誉，其中雅可比的兄弟约翰??白努利(1667--1748)，侄子尼古拉??白努利(1687--H59)与丹尼尔??白努利(1700—1782)都成为世界上知名的人。第一篇广博的概率论论文是由雅可比?? 白努利写出的，他详细地阐述了大数定律的原理。尼古拉??白努利把概率的概念用于法律问题，而丹尼尔．白努利则把概率的计算用于流行病学与保险学的研究。同一时期，在收集社会统计学资料上取得了重要的进展，现在叫做“统计学”的知识也有所发展。在英国，J．格兰特(1620—1674)对生命统计以及保险与经济统计部分采用了数学方法进行研究，他的研究通过 W．佩蒂(1623—1687)得以发展，佩带研究了伦敦城的人命统计，他是首先从事这类工作的人。 E．哈利(1656 一 1742)继承了这项工作，他发展了死亡表，并把他称为开创生命统学的人。 A．德 (1667—1754)说明了复合事件的概率程序，由摄率原理导出排列与组合理论，并奠定了生命意外事故科学的基础。1733 年他发明了正态曲线方程，很多的归纳统计学理论都以此为基础。同一钟形曲线
1
一般称之为“拉普拉斯曲线”“高斯曲线”或“高斯—拉普拉斯曲线” 、，以表示对 M．拉普拉斯(1749 —1827)与 K．F。高斯(1777 一 1855)的故意。高斯独立地发明了这个方程。高斯由重复量度同一个量所出现的误差，以推导正态曲线方程。他还发明了最小乎方法并发展了观察误差理论，拉普拉斯的最大贡献是把统计学应用于天文学，并与 A，勒让德(1752 一 1833)一起， M．把偏微分方程用于概率研究。 1815 年“概差”(probable error)一调第一砍出现在 F．W．贝塞(1784—1846)的著作中，他也发展了仪器误差理论。对理论的其他的有 J．斯特林(1692—1770)的 n!近似公式；M．康杜斯(1743—1794)把概率与统计应用于社会问题；T●贝期(1702—176，1)首先归纳地运用概率；L．尤勒(1707— 1783)首创使用希腊字母西格马
∑
作为求和的符号；以及 T．辛普 1710 一 1761)把连续原理运用到
数学横串理论中。人 L．R．阿勒贝特(1717—1783)在他的概率研究中使用了气象资料；人 L．拉格朗日 (1736—1813)使用了微分学；Po B．蒙特模特(1678—1719)引进了有限差分的。C．巴夫(1707— 1788)在现传的某些方面以及在概率计算上属于领先地位，此外，S．D．泊松(1781—1840)发展了以他本人名字命名的分布，即泊松分布。在 1835 一 1870 年间，比利时科学家 L．A．J. 魁持奈(1796 — 1874)对概率与统计的发展与应用作出了重大贡献。他把生物学的与人类学的油量和曲线紧密池联系：魁特奈把统计方法不仅用在生物上，而且用到教育与社会学上。他显示出对统计的极广泛的在一起。兴趣，他是认识大数稳定性的第一个人，也是首先论证在研究领域里，发展起来的统计方法可以推广到其他大多数领域的人之一。在德国，O．F．纳普(1842 一 1926)按照魁特奈的原则广泛地调查研究死计，而 W．刘易斯(1837 —1914)发展现在叫做一向方差分析的程序。在 19 世纪最后 25 年中，F．高尔顿(1822 一 1911)为英国的优生学泥的创始人，在论证每个生物变量的系统变化助原理上，显示出无穷的热情，他并且积累了这方面的适当资料。发现了生物变化的有秩序原理，这标志着生物研究新时开始。高尔顿与他的继承者 K．皮尔逊(1857—1936)利用遗传学的问题，发展了回归与相关的概念。后来(皮尔逊)与 C．B，斯皮尔曼(1863—1945)开拓了这个理论，并把它应用于社会科学。皮尔逊同时也广泛地研究了抽样误差的影陶，发展了 χ 检验，并在文献中弓!进“平均偏差”
2
(mean de Viatlon)与标准差(standard de V1ation)等词。：本世纪初，一位爱尔兰吉尼斯啤酒厂的统计学家 W．S．戈塞特(1876 一 1937)，笔名“学生” ，出版了许多篇关于解释抽样资料的文章。他是第一个入认识到发展小样本方法以得出可靠信息的重要性。这种方法以后由 R．A．费雪(1890 一 1962)及其同事在英国推广，费雪对科学作出了很大，特别是群体遗传学方面，他开拓了试验理论，注意统计方法及其在科学研究领域中的应用。正是费雪。他引进了现在广泛应用的“虚假设”一词(null—，hypothesis)，并发展了方差分析的统计方法。在二十世纪，涌现了许多的著名统计学家，他们积极发展新理论并应用于实践。电子计算机的应用极大地促进了统发展。今天研究工作者把统计看作一项最有用的工具．日常生活普遍受到以数量信息为基础的决策论的影响。现在，假设、试验与假设检验等一系列科学方法已为每个活动领域所熟悉。今天，建立在概率基础上的现代统计方法，作为物理学、生物科学、经济学、社会学、心理学、教育学、医学、农业、工业和政府的助手，证明它是不可缺少的。天文学以统计方法为基础，预测天体的未来位置；适当的遗传区分是由统计探明的；生命保险费与年金是以统计记录为基础的死亡表来的；能源公司如果没有地区需求的统计资料，就不能有效地供应电力，研究工作者用统计方法来农业试验的结果是否显著；工程师发现抽样理论在工业产品质量控制上是非常有用的；企业经理与政府分析家用统序作出决策。这些应用的范围虽然很不相同，但使用大量的统计方法则是相同的。统计分拆的某一方面在某个领域也许比在其它领域显得更重要，但一般说来，同一
2
统计方法则可用在所有领域。在统究中有一点要提请注意，认识这一点是很重要的,即没有一个统计方法本身能保证数据不出现错误、绝对准确，不能保证推理没有毛病、结论正确。原始资料一定要 '、方法一定要恰当；而结果一定要由不仅懂得方法，而且要由懂得应用的人来解释。本书是把所讨论的统计方法当作土具，由适当的人掌握，在设计合理的场合加以应用，以取得有用的结论，但统计方法本身并不能创造奇迹。
3
预备知识集合论基础概率论的严格理论是建筑在集合论与测度论基础上的。工科院校的概率论课程虽然不涉及概率论的严格理论，但也离不开集合论与测度论的初步知识，为此我们在学习概率论之前有必要复习一下同学们在中学里学习过的集合论知识，并对集合与 ‘—代数作简要介绍。一、集合的概念本书用大写拉丁或希腊等字母表示集合(或简称集)，用小写字母表示集合中的元素，记号。E 4 表示元素。属于集合 4，而记号。征 4 表示元素。不属于集合 4。把含元素是有限多个的集称为有限集，否则称为无限集。当无限集的元素可以一一数出即排成一列时，称它为可列集，否则称为不可列(无限)集.
4
5
6
7
8
9
￥
10
序言
科学研究的对象是客观现象的规律性。概率统计是研究客观现象，只对现发生或不发生感兴并不涉及现内在性质。人们在研究自然界和人类社会中各种事物运动的变化规律时会发现两类很不相同的现象。一类现象是在一定的条件之下，事物运动变化的规律是的．一旦认识了这些规律就可以事先作出 '的预言。例如太阳从东方升，２＋３＝５，等等．这一类现象我们称之为确定性现象．早期的科学家就是研究这一类现象规律性，所用的数学工具是几何，，微积分等．但是在自然界和人类社会中还广泛地存在着与性现象有着本质不问的另一类现象，例如：（１）抛掷一枚硬币事先并不能 '地预言结果是出现正面或反面；（２）打桥牌时事先无法预料是否能分到有四张 A 的，这类现象共同特点是在基本条件不变的情况下作一系列试验或观察会得到各种不同的结果．换句话说，仅仅就一次试验或观察而言它会时会出现这种结果，时而出现那种结果，呈现出一种偶然性，这种现象称为随机现象．概率统计是研究随机现数量规律性的一门数学学科。概率统计具有严密、深刻的理论体系。然而，它又是一门应用学科，在工业、农业、军事、医学、公共事业及尖端科学等几乎所有科学技术领域获得越来越重要的应用．今天，概率论已成为有广泛应用的，有深刻理论基础的，蓬勃发展的一个数学学科了．具体地，概率论是研究随机现象的数量规律性，其主要内容：
古典概型
(
独立试验序列概型
(
十七世纪 )
十八世纪 )
极限定理
(十八、九世纪)
严格数学基础、深刻的理论研究及实际的应用
( 二十世纪 )
数理统计学是关于数据资料的收集、整理、分析和推理的科学，侧重与应用研究随机现本身的规律性来考虑资料的收集、整理、分析，从而找出相应随机本来的分布律或它的数字特征，尽可能作出较合理精确的推断。它包括二大类内容：（1）试验的设计和研究：如何更合理更有效获得观察资料的方法；（2）统计推断：如何利用一定的资料对所关心的问题尽可能作出合理可靠的结论。本书前五章是概率论，后几章是数理统计，两者紧密联系，概率论是数理统计的理论基础。
11
第一章
§1
随机事件与概率
随机事件与事件的运算：
一. 随机试验: 概率论是一门研究随机现象量的规律性的数学学科．为了研究随机现象，就要对客观事物进行观察和试验，我们把这种观察和试验统称为试验．概率论中所研究的试验具有下列特点： (1) 可以在相同的条件可重复进行。 (2) 试验的可能结果不止一个，并且在试验前能明确可知所有可能的结果。 (3) 试验前无法预知哪一个结果出现。我们把具有上述特点的试验称为随机试验．在重复进行试验时个别结果发生与否具有偶然性，但当重复试验次数相当大时，总有某种规律性出现．例如：抛—枚均匀硬币，观察其出现面朝上情况，一次试验就是抛一枚硬币，这是随机试验，试验的可能结果有两个：出现、出现反面． “出现正面”这个结果的相对频率却呈现出稳定性(即在试验前无法断言哪个结果出现，但重复多次后，接近 0．5)，这便是规律．二．随机事件：１．随机事件的粗略定义：在随机试验中可能发生的结果或可能不发生结果称为随机事件，简称为事件，常用字Ａ、Ｂ、 L 表示．【例１】抛—枚均匀硬币， “正面朝上”这个事件（记作Ａ）是一个随机事件，简写为Ａ＝“正面朝上” ， ” 同样地，有Ｂ＝ “正面朝下” ．２．常用与最基本事件：在一随机试验中，它的每一个最简单不能再分解的结果称为基本随机（１）基本事件与复合事件：事件，简称基本事件。例如：掷一枚骰子这一试验，出现 “１点” “２点”“３点”“４点”“５点”“６点” ，，，，，，都是基本随机事件，可分别用
A i ＝“ i 点”
(i = 1, 2,L , 6)
表示．在一个试验中，由两个或两个以上基本事件复合而成，称它为复合随机事件。简称复合事件．例如：掷一枚骰子这一试验，出现偶数点是一复合事件，它是由出现 “２点”“４点” “６点” ，，，三个基本事件，而且当且仅当上述三个基本随机事件中的一个发生，出现偶数点这一复合随机事件发生，可用 A2 + A4 + A6 表示．（２）必然事件：在一定条件下必然会发生的事情称之为必然事件，记为 ?? ．（３）不可能事件：在一定条件下必定不会发生的事情称为不可能事件，记为 φ ．【注意】◆ 随机事件、必然事件、不可能事件都是相对一定试验条件而言，例如：掷一枚骰子这一试验，出现“７点”是不可能事件，但如果试验条件改为掷两枚骰子就不是不可能事件． ◆ 为讨论方便，必然事件、不可能事件都视为随机事件，作为极端情况．
12
三．样本点与样本空间：为研究方便起见，事件之间的关系及运算利用集合工具是有益的．（１）样本点：随机试验的每一个可能结果称为一个样本点，记为 ω ．（２）样本空间：由所有样本点组成的集合称为样本空间或称为基本事件空间，记为 ?? ．样本空间也就是必然事件，这是因为在每次试验必然出现 ?? 中的某个基本事件，也即必然发生，因此，仍用 ?? 表，而任何一个随机事件Ａ都是样本空间 ?? 的一个子集. ，【例２】在【例１】中，令 ω 1 ＝“正面朝上”
ω 2 ＝“正面朝下” 则有，
?? ＝ { ω 1 ， ω2
又若＝ { 0，
};
则有
令 0=“正面朝上” 1=“正面朝下” ，，
??
1
}
【例３】从标号为 1，2，…，10 的十个完全相同的球中任取一个，令
ω i ＝“取得 i 号球 ” (i = 1, 2,L ,10) ，则样本空间
??
＝{
ω 1 ， ω 2 ， L , ω10
L L L L
}
【例４】掷两枚骰子，其样本空间
?? (1,1), (1, 2), ??(2,1), (2, 2), ?? ??=?? L ?? L ??(6,1), (6.2), ??
【例５】令
(1, 6), ?? (2, 6), ?? ?? ?? ，共有３６个样本点． L ?? (6.6) ?? ??
你的一个同学约定在某天晚上 7 点到８点之间来你家作客。
ω t ＝“来到你家的时间” ，则
?? ＝ {ωt 19 ≤ ωt ≤ 20 }
四．事件的关系和运算 1．事件的包含和相等：设有事件Ａ及Ｂ，如果Ａ发生， B 必发生，则称事件Ｂ包含事件 A，记为Ａ ?? Ｂ或Ｂ ?? Ａ,
如果事件Ａ包含事件Ｂ，同时事件Ｂ也包含事件ＡＡ＝Ｂ特别地，对任一个事件 A ，有
则称事件Ａ与Ｂ相等，记为
φ ?? A????
．
２
事件的和（并）：两事件Ａ与Ｂ中至少发生一个，这一事件称为事件Ａ与事件 B 的和或并，记作Ａ＋Ｂ或ＡUＢ
13
类似地，可定义 n 个事件及可列无限个事件的和。若几个事件 A1 , A2 ,L , An 中至少有一个发生，则称这一事件 A1 , A2 ,L , An 为的和或并，记为
A1 + A2 + L + An
n
或
i =1
U Ai
的
若可列无限个事件 A1 , A2 ,L , An ，… 和或并，记为
中至少有一个发生，则称这一事件为 A1 , A2 ,L , An ，…
∞
A1 + A2 + L + An + L
或
i =1
U Ai
３．事件的积(交) 两事件 A 与 B 同时发生，称这—事件为事件 A 与事件 B 的积或交，记为Ａ I Ｂ或ＡＢ类似地，可定义 n 个事件及可列无限个事件的积。４. 事件的差: 事件 4 发生而事件 B 不发生，这一事件称为事件 A 与事件 B 的差，记为 A ?? B
特别地，
对任一个事件 A ，有
A?? A =φ ，
A ??φ = A，
?????? =φ
??
５.
不相容(互斥) 事件: 若两事件 A 与 B 不能同时发生，则称事件 A 与事件 B 是互不相容的或互斥的, 记为 A I B= φ 或 AB= φ 满足
类似地，若 n 个事件 A1 , A2 ,L , An ，任意两个事件是互不相容的，即当 i ≠ j 时， Ai I Aj = φ
(i, j = 1, 2,L , n)
则称这 n 个事件是互不相容的或这 n 个事件是两两互不相容的。
６．对立事件：事件 A 不发生的事件称为 A 的对立（或逆）事件，记作 A ，
14
由定义可知：
( A) = A
在一次试验中， A 和 A 不会同时发生，且 A 与 A 至少有一个发生，因此 A 和 A 满足
A+ A = ??，
AI A
=φ ，
A =???? A
人们注意到，随机试验的所有基本事件都是两两互斥的，因为每次试验只能出现一个结果，任何两个不同结果都不能同时出现，但基本事件彼此未必互为逆事件，例如，在掷一骰子的试验中， “掷出 3 点”与“掷出 4 点”是互斥事件，但不是互逆事件，因为不掷出 3 点还可能掷出 2 点，5 点，l 点，6 点来，因此，互斥未必互逆，但互逆必定互斥。 7．完备事件组：如果事件 B1 , B2 ,L , Bn 为两两互斥，且 B1 + B2 + L + Bn = ?? ，则称 B1 , B2 ,L , Bn 为一个完备事件组。 8．事件的运算规律：
9．小结：事件间的关系和运算归结为集合之间的关系和运算，这不仅对研究事件的关系和运算是方便的，而且对研究随机事件发生的可能性大小的数量指标与概率的运算也是非常有益的。
术语对照
15
【例 5】
掷一枚骰子的试验，观察出现的点数： A=“奇数点” ； B=“点数小于 5” ；
C=“小于 5 的偶数点” ，
用集合的列举法表示下列事件： ?? ，A，B，C，
?? = {1, 2,3, 4,5, 6} ，
A = {1,3,5} ， B = {1, 2,3, 4} ， C = {2, 4} ．
【例 6】随机抽检三件产品。设 A 表示“三件中至少有一件是废品” 表示“三件中至少有两件是，B 废品” 表示“三件都是正品” ，C ，示什么事件?
【例 7】设 A，B，C 是三事件，用 A，B，C 的运算关系表示下列事件：
16
五．习题： 1.
2．
3．设 A，B 为事件，问下列各事件表示什么意思?
表示（ ?? 示 B 发生，而 AB 不发生。
17
§2
概率的统计定义：１．频率：
随机事件的概率，古典概型与概率的加法公式
随机事件在一次具体的试验是否发生，虽然不能预先知道，但是，当大量重复同一试验时，随机现象却呈现出某种规律, 即所谓统计规律性．如：历史上有人作过成千上万次投掷硬币，下表列出他们的试验记录：
２．随机事件 1。随机事件及其概率 2。古典概型
容易看出，投掷次数越多正面向上的频率越接近０．５，其中事件Ａ发生的次数事件Ａ发生的频率＝试验总次数＝试验总次数．频数
我们将事件发生的可能性大小只停留在定性了够的，下面给出事件发生的可能性大小的客观的定量的描述，称为事件发生的概率．２．随机事件的概率：（１）定义：在不变的一组条件Ｓ下，重复作 n 次试验，记 ?? 是 n 次试验中事件 A 发生的次数．当试验的次数 n 很大时，如果频率
??
n
稳定在某一数值 p 的附近摆动，而且一来随着试验次数增多，
这种摆动的幅度越变越小，则称数值 p 为事件 A 在条件Ｓ下发生的概率，记作
P( A) = p
这里，频率的稳定性是概率一个直观朴素的描述，通常称为概率的统计定义．但必须指出，事件的频率是带有随机性的，这是由事件本身的随机性所决定。而事件的概率，却是一个客观存在的实数，是不变的。二．古典概型：１．定义：如果随机现象满足下列三个条件： (1) 一次试验可能结果只有有限个，即所有基本事件只有有限个：
A1 , A2 , L , An ，
18
(2) 每一个基本事件 Ai (i = 1, 2,L , n) 发生的可能性是相等的． (3) 基本事件 Ai (i = 1, 2,L , n) 是两两互不相容满足以上三个条件的随机现象模型，称为古典概型．在古典概型中，如果 n 为基本事件总数， m 为事件 A 包含的基本事件数, 事件 A 的概率
P ( A) =
m = n
法国数学家拉普拉斯(Laplace)在 1812 年把上式作为概率的一般定义．现在通常称它为概率的古典概型的定义，因为它只适用于古典概型场合．２．古典概型公式的运用举例：【例 1】袋里有 2 个白球和 3 个黑球．从袋任取出一球，求它是白球的概率．解：容易看出， “从袋里任取一球”这一试验是古典概型的，且基本事件总数 n＝5，取到白球的基本事件数 m＝2，故
把白球换为合格产品，黑球换为废品，则这个摸球模型就可以描述产品抽样检验问题．这种模型化的方法把表面上不同的问题归类于相同的模型之小中，能使问题更消楚，更易于计算。【例 2】把 a, b 两个球随机地放到编号为 I, Ⅱ, Ⅲ 的三只盒子里，求盒子 I 中没有球的概率。这是一个古典概型问题，把 a, b 两个球随机地放到编号为 I, Ⅱ, Ⅲ 的三只盒子里，基本事件总数
n = 32 = 9
设Ａ＝“盒子 I 中没有球” ，则事件 A 包含的基本事件数
m = 22 = 4
∴
P ( A) =
4 9
【例 3】有一个口袋，内装 a 只白球，b 只黑球，它们除颜色不同外，外形完全一样, 从袋了中任不同外，外形完全一样. 现任意模出 2 个球时，求：（１）模出 2 个球都是白球的概率；（２）模出一个白球一个黑球的概率解: 这口袋共有 a+b 只球，从袋了中任意模出 2 个球的基本事件总数
2 n = Ca + b
，
2 m1 = Ca ，
（１）模出 2 个球都是白球基本事件数
19
∴
模出 2 个球都是白球的概率
Ca2 m1 = 2 ； P= n Ca + b
1 1 m2 = Ca Cb = ab ，
（２）模出一个白球一个黑球的基本事件数
∴
模出一个白球一个黑球的概率
P=
m2 ab = 2 n Ca + b
．
若把黑球作为废品，白球作为好品，则这个摸球模型就可以描述产品抽样．按如产品分为更多等级，例如：一等品，二等品，二等品，等外品等等．则可用装有多种颜色的球的口袋的摸球模型来描述．【例 3】列
【例 4】
20
1．无放回抽样：
2．有放回抽样：
，
21
【例 5】有一个口袋内装可分辨 4 个黑球，个白球, 它们除颜色不同外， 6 外形完全一样. 现按两种取法；（Ⅰ）无放回；（Ⅱ）有放回连续从袋中取出３个球，分别求下面事件的概率：
A = “取出３个球都是白的” ；（１）（２） B = “取出２个黑球，１个白球” ．（Ⅰ）无放回：连续从袋中取出３个球的基本事件总数
3 n = A10 ， 3 m1 = A6 ，
（１）取出３个球都是白的基本事件数
∴
P ( A) =
3 m1 A6 6×5× 4 1 = 3 = = ≈ 0.167 n A10 10 × 9 × 8 6
；
（２）取出２个黑球，１个白球，注意到取出黑球的次序， ∴ 事件 B 的基本事件数
2 1 m2 = C42 × A4 × A6 ，
因而
P( B) =
2 2 1 m2 C4 × A4 × A6 = = 0.3 3 n A10
（Ⅱ）有放回：
连续从袋中取出３个球的基本事件总数
n = 103 ，
（１）取出３个球都是白的基本事件数
m1 = 63 ，
∴
P ( A) =
m1 63 = 3 = 0.216 ； n 10
2 1 m2 = C4 × 42 × C6 ，
（２）取出２个黑球，１个白球，注意到黑球黑球的次序， ∴ 事件 B 的基本事件数
因而
P( B) =
2 1 m2 C4 × 42 × C6 = = 0.288 n 103
【例６】设有 k 个球，每个球都能以同样的概率落到 N 个格子(N ≥ k)的每—个格子中，试求：下列事件的概率 (1) A=”某指定的 k 个格子中各有一个球”；
22
(1) (3) 解:
B=”任何 k 个格子中各有一个球”； C=“k 个球落到同一个格子中”. 这是一个古典概型问题，由于每个球可落入 N 个格子中的任一个，所以 n 个球在 N 个格子基本事件总数 n = N
k
(1) k 个球在那指定的 k 个格子中全排列，总数为 n!，因而所求概率
（2）n 个格子可以任意，即可以从 N 个格子中任意选出 n 个来，这种选法共有
n CN
又对于每种选定的 n 个格子，共有 n! 排列，因而所求概率
P2 =
n CN n ! N! = n n N N ( N ?? n)!
【例】
【例】
三。概率的性质：１．２．３．
0 ≤ P( A) ≤ 1 P ( ??) = 1 P(φ ) = 0
四．概率加法公式：
１．
概率加法公式：
（１）如果事件 A， B 是互不相容，则 P（A+B）=P（A）+P（B），特别地， P ( A +
A) = P( A) + P( A) = 1 ；
P( A) = 1 ?? P( A)
（２）
23
．特别地，（1）如果 A 与 B 是两个互斤事件，则，（2）
(3) 若 B ?? A ，则 2．逆事件概率：
P（AB） = P（A）
?? P（B）．
【例 7】在浴池的鞋柜中乱放着 10 双号码不同的托鞋．今随意取来三只，求有一双配对的概率． I：设 10 双鞋的号码为 t 号至 10 号鞋．我们有下列事件等式， “三只鞋中有一双配对”＝“三只中 1 号鞋配对” +“三只中 2 号鞋配对” + … +“三支中 10 号鞋配对” ．相应地可设事件为
把 1 号鞋看成废品，其他鞋看成合格品，由超几何分布的概率公式，有
24
1 的特点是把较复杂的事件分较简单的事件和．
【例 8】
【例 9】一个著名问题——匹配问题：４张卡门分别标着 1，2，3，4，面朝下放在桌子上．一个自称有透视能力的人将用他超感
25
觉能力说出卡片上的号数，如果他是冒充者而只是随机地猜一下，他至少猜中—个的概率是多少？对于这个小数日(n＝4)的具体问题，可以通过把“至少猜中一个”进行分析而获得解答．这里仅给出分析结果：
【例 10】【例】
φ

（ⅰ）∵
AB = φ
，
七．习题： 1．.
26
2．P．16 ----- 1，4，5，6，7
§3．条件概率、乘法公式、独立性
前面讲到随机事件时，说到随机事件是在一定条件 S 下，进行随机试验而可能发生或可能不发生的事件．当我们计算事件 A 的概率 P(A)时，如果除了条件 S 外，不再加上其它条件的限制，我们称此种概率为无条件的概率。但是在许多实际问题中，还存在着要求一个事件 B 在某一事件 A 已经发生的条件下的概率．我们称它条件的概率。【例 1】设箱中有 100 件同型产品。其中 70 件(50 件正品，20 件次品)来自甲厂，一． 30 件(25 件正品， 5 件次品)来自乙厂。现从中任取一件产品。 (1)求取得甲厂产品的概率； (2)求取得次品的概率； (3)已知取得的是甲厂产品，求取得的是次品的概率。分析：为了直观，我们将产品情况列成表
上面的问题，可用古典概率法求得。
则（1），，
（2）
，
（3）在“已知取得的是甲厂产品”这一条件下任取一件产品，实际上是从甲厂 70 件产品(50 件，20 件次品)中任取一件。这时样本空间只含 70 个基本事件(是原的样本空间的一部分)。由古典概率知：
为了给出条件概率的数学定义，我们对{例 1}的条件概率问题进行分析：
27
即有
二。条件概率：设 A,B 是条件 S 下的两个随机事件，P(A)＞0，则称在事
件 4 发生的条件下事件 B 发生的概率为条件概率,
且
【例 1】从带有自标号 1， 2， 3，4，5，6 的六个球中，任取两个，如果用 A 表示事件“取出的两球的自标号的和，为 6” ，用 B 表示事件“取出的两球的自标号都处偶数” ，试求：
28
【例】
φ

（ⅰ）∵
AB = φ
，
三．概率的乘法公式：
乘法公式：两个事件 A、B 之交的概率等于中任一个事件(其概率不为零)的概率乘以另一个事件在已知前一个事件发生下的条件概率。即
【例 2】盒中有 10 件同型产品。其中 8 件正品， 2 件次品，现从盒中无放回地连取 2 件，求第一次、第二次都取得正品的概率。
29
因为
在第一次已取得下，第二次再取产品时，盒中只剩 9 件产品，其中只有 7 件。
【例 3】10 个考签中有 4 个难签， 3 人参加抽签(不放回)，甲先、乙次、丙最后。求甲抽到难签，甲、乙都抽到难签，甲没抽到难签而乙抽到难签以及甲、乙、丙都抽到难签的概率。解：设事件 A，B、C 分别表示甲、乙、丙各抽到难签，则
【例 4】
30
【例 5】袋中有三个阄，其中仅有一阄为有物之阄，三人排队抓阄，每人取一个，记
从此例看出，抓阄时虽排队，但三人是等概的，否则这个办法就不会被人类采纳达数千年之久。三．事件的独立性：
如果则表示事件 A 发生并不影响事件 B 发生的概率。
31
即
P( B A) = P( B) ?? P( AB) = P( A) P( B)
1．定义：设 A，B 是两个随机事件，如果
2．性质：若
四对事件
A 与 B ； A 与 B ； A 与 B ； A 与 B 中有一对相互独立，
则其余三对也相互独立．即下面四个命题是等价的：
３．定义２：
应用独立性概念，可以简化概率的．
【例 6】在不超过 100 个自然数里任取一数，则它能被 2 或能被 5 整除的概率为多少？
32
=
3 5
【例】袋中放有 a 个白球和 b 个黑球，随机取出一个，然后放回，并同时再放进与取出的球同色的球 c 个，再取第二个，这样连续取 3 次，问取出的 3 个球中头两个是黑球，第 3 个是白球酌概率是多少? 解：
【例】
33
【例８】
已知每个人的血清中含有肝炎病毒的概率为 0．4％，且他们是否含有肝炎病毒是相互独立的．今混合 100 个人的血清，试求混合后的血清中含有肝炎病毒的概率．
现在我们知道对１００人的血清作检验．用新方法要检验 l01 可能性为 0．33，而只需检验一可能性为１—o．33 ＝o．67．由此，可以知道，只做一次检验的可能性远大于 t01 次检验的可能性．以后我们将知道：用新方法对 100 个人平均需做 34 次检验，当然这比老方法要做 too 次检验减少了工作量．
【例】
【例】甲、乙两人同时向一敌机炮击，已知甲击中的概率为 o．6，乙击中的概率为 o．5，求敌机被击中的概率。
34
【例１１】（１）两门火炮同时向一敌机射击，每门火炮的命中率为０．6，求敌机被击中的概率．（２）现若干门炮同时向向一敌机炮击，问欲以９９％的把握击中这敌机，至少需要几门炮？
（２）解：设至少 n 门炮同时向向一敌机炮击，
Ai = “第 i 门炮击中这敌机” A=
则 “敌机被击中”，
(i = 1, 2,L , n) ，
A = A1 + A2 + L + An ，
（∵ ∵ ∴
A1 , A2 ,L , An 不是两两互不相容，Ｐ（Ａ）计算量太大，可以考虑 A 的逆事件） A = A1 A2 L An ，
且 A1 , A2 , L , An 是相互独立的，
P ( A) = P ( A1 ) P( A2 )L P ( An ) = 1 ?? 0.6n = 0.4n ， P ( A) = 1 ?? P( A) = 1 ??0.4n ≥ 0.99
因而可见，
n ≥ 5.026 ，至少需要６门炮才能以９９％的把握击中这敌机。
【例】
若 n 立试验中，A 至少出现一概率为
,, 求一次试验中Ａ出现的概率。
35
四．习题：Ｐ。２９―――１，２，３，４
例题
36
37
38
39
40
41
42
43
44
45
46
47
48
49
§5 独立试验序列概型
在相同的条件下，将同一个试验重复做 n 次，且这 n 次试验是相互独立的，每次试验的结果为有限个，这样的 n 次试验称作 n 立试验概型．特别是，每次试验的结果只有两种可能时，这样的 n 立试验慨型称作 n 重贝努利概型． (下赌注问题) 17 世纪末，法国的 Chevalike Demere 注意到在赌博中一骰子抛 25 次，把赌注押到“至少出现一次双六”比把赌注押到“完全不出现双六”有利，但他本人说不出原因．后来请当时著名的法国数学家 Pasca1 才解决了这一问题．这问题应如何解决呢? 分析：一对骰子抛 25 次，就是说，两颗同样的骰子同时抛掷，共抛 25 次．要搞清“至少出现一次双六”比押到“完全不出现双六”有利这句话是什么意思? 首先记 B ＝ “至少出现一次双六” ，它的意思是指抛 25 次中至少出现一次数对(6，6)，即 25 次中出现一次(6，6)，或出现二次(6，6)，…，甚至 25 次中全是出现(6，6)．而完全不出现双六是指抛 25 次中出现的数对完全没有(6，6)，它事件 B 是的对立事件 B ． ∴
B ＝“完全不出现双六”
因而把赌注押到“至少出现一次双六”比押到“完全不出现双六”有利的意思即为
P( B) > P( B ) ，
因为，
P( B) + P( B ) = 1
故只要证明
P( B) >
1 2
即可了．一对骰子抛 1 次有下面的 36 种情况：
因此一对骰子抛一次出现一对 6 点的概率为 1／36．
设
A i ＝“第 i 次抛掷时这对骰子出现一对 6 点” ，由于各次抛掷是独立的，则有
50
一对骰子抛一次，可视为 1 次随机试验；一对骰子抛 25 次可视为 25 立随机试验；于是对所提的问题，可视为 25 重的贝努里概型，从而要证明的不等式转为
注意：不过，值得考虑一下的是为什么正好抛 25 次呢?抛的次数少了或多了会怎样呢?这只要在上面的不等式中把 25 换成 n，看会出现什么结果．即决定 n 使
故抛 25 次是起码的要求，少于 25 次不行．当然抛的次数超过 25 次越多越利，且
一．定理（独立试验序列概型公式），设单次试验中，事件 A 发生的概率为 p (0 < p < 1) ，则在 n 次重复试验中事件 A 恰好发生 k 概率为
，
51
其中【例1】
q = 1?? p
袋中装有 100 个小球，60 个红的，40 个绿的．作放回抽样，连续取 5 次，每次取 1 个，求： 1)恰好取到 3 个红球， 2 个绿球的概率； 2)红球的个数不大于 3 个的概率．
【例 2】
电灯泡使用时数在 1000 小时以上的概率为 0.2，求三个灯泡在 1000 时以后最多有一个坏了的概率．解: 设事件 A 表示电灯泡使用时效在 1000 小时以上，则 p＝o．2， q＝o．8．考察三个灯泡，可以看做三立试验．三个灯泡使用 1000 小时以后最多只有一个坏了这一事件也就是三个灯泡个至少有二个灯泡的使用时数在 1000 小时以上。所以它的概率为
P(k ≥ 2)
【例 3】甲、乙两个篮球运动员投篮命中率分别为 o．7 及 o．6，每人投篮三次，求 (1)二人进球数相等的慨率； (2)中比乙进球数多的概率．解：设 A i = ”运动员甲在三次投篮中投进个 i 球” ( i =0．1、2、3)，则我们有
设 B i = ”运动员甲在三次投篮中投进个 i 球” ( i =0．1、2、3)，则我们有
52
二．第一近似公式（泊松定理）：设在独立试验序列中事件 A 的概率为 p ，则在 n 次试验中事件 A 恰发生 k 溉率 Pn (k ) ，当 n → ∞ 时，有
Pn (k ) ≈
λk
k!
e ?? λ ，其中 λ = np
三．习题： P。39 ----- 1，3，4
第二章
§1
随机变量与概率分布
随机变量
53
在第一章里，讨论了随机事件和概率．为了进一步研究随机现象，需要将随机试验的结果数量化，我们将引进洋站一种特殊函数 ―― 随机变量，其目的将随机事件通过随机变量来表示。一．随机变量的定义：１．【例１】抛掷硬币的试验。抛掷一枚质地均匀的硬币，有
２．定义：设随机试验的样本空间为 ?? ，如果对于每一个可能的
【例２】盒中有５个乒乓球，其中 2 个白球，3 个黄球的，从中任取 3 个，记 X＝“取到白球的个数” ，则Ｘ是一个随机变量，且 X 的可能取值是０，１，２．不难：Ｐ（Ｘ＝０）＝
1 =0。1 10 6 =0。6 10
Ｐ（Ｘ＝１）＝
Ｐ（Ｘ＝２）＝
3 =0。3 10
【例３】考虑测试灯泡寿命的试验． X 表示一个灯寿命(以小时记)， X 是一个随机变量，且用则 X 的可能取值是 [0, + ∞) 随机变量的概念在概率论与数理统计中既是基本的又是重要的．在实际问题中广泛存在着随机变量，我们要学会把随机变量的概念与实际中的具体问题联系起来
二．随机变量分类随机变量通常分两类进行两类讨论。
54
离散型：如果随机变量Ｘ的可能取值能够一一列举出来，如:【例１】【例２】，随机变量非离其它在非离散型中连续型随机变量是最重要的，也是实际工作中经常遇到的随机变量，连续型：如: 【例 3】
§2
离散型随机变量
研究一个离随机变量不仅要知道它可能取值而且要知道它取每一个可能值的概率．一．概率分布：设离随机变量 X 的可能取值是有限个或可数个值，设 X 的可能取值：
x1 , x2 ,L , xn ,L
为了完全描述随机变量 X ，只知道Ｘ的可能取值是很不够的，还必须知道 X 取各种值的概率，也就是说要知道下列一串概率的值：
P { X = x1 } , P { X = x2 } , L , P { X = xk } , L
记
pk = P { X = xk } (k = 1, 2,L ) ，将 X 的可能取值及相应的既率成下表
X p
x1 p1
x2 p2
x3 p3
L L
xk L pk L
这个表称为 X 的概率分布表。它清楚地表示出 X 的取值的概率分布情况．为简单起见，随机变量 X 的概率分布情况也可以用一系列等式
pk = P { X = xk } (k = 1, 2,L )
(＊) 称为 X 的概率分布或分布律。例如：上节【例 1】 X 的概率分布表是
(＊)
X p
0 0.5
1 0.5
，
X 的概率分布是
pk = P { X = k } = 0.5
上节【例 2】 X 的概率分布表是
(k = 0, 1)
X p
0 0.1
1 0.6
2 0.3
55
X 的概率分布是
p0 = P { X = 0} = 0.1 , p1 = P { X = 1} = 0.6 , p2 = P { X = 2} = 0.3
【例 1】某射手每次射击打中目标的概率都是 p (0 < p < 1) ，现他连续向一目标射击，直到第一次击中目标为止，记 X ＝“射击次数” ，则 X 是一个随机变量，求 X 的概率分布解：的可能取值是一切自然数，即
X 的可能取值
X
且
= k (k = 1, 2,L ) ，
P ( X = k ) = pq k ??1 (k = 1, 2,L ) ，其中 q = 1 ?? p ，
且 X 的概率分布表如下：
X p
1 p
2 pq
3 L pq L
2
k pq
k ??1
L L
2．性质：任何一个离随机变量的概率分布一定满足性质，
利用随机变量及其分布律，我们可求各种随机事件发生的概率。【例 2】袋中有 5 个球，分别编号 1，2，３，４，5．从其中任取 3 个球，求取出的 3 个球中最大号码的概率函数和概率分布表．设 X ＝“取出的 3 个球中的最大号码”, 则 X 的可能取值：3，4，5，由古典概型知：
P ( X = 3) =
1 1 = =0。1， 3 C5 10
P ( X = 4) =
C32 3 = =0。3 3 C5 10
=0。6
X
的概率分布为
X
3
4
5
56
p
0.1
0.3
0.6
二．几个常用的离分布： 1. 两点分布：如果随机变量 X 的分布（概率）为：
P( X = a) = p (0 < p < 1) ， P ( X = b) = q = 1 ?? p
则称 X 服从两点分布（ p 为参数），特别地，当 a = 1, b = 0 时，则称 X 服从“0 －１” 分布,即
P( X = 1) = p (0 < p < 1) P( X = 0) = q = 1 ?? p
，
“0 －１”分布也常称为贝努利分布. 例如: 上节【例 1】中， X 服从“0 －１” 分布。【例 3】有 100 件产品，其中有 95 件是，5 件是次品，现在随机地抽取一件，假设抽到每一件的机会都相同，则抽得正品的概率＝0．95，而抽得次品的概率＝0．05．现定义随机变量 X 如下：
则有
P( X = 1) = 0.95 , P( X = 0) = 0.05 X 服从“0 －１” 分布。 2. 二项分布:
设随机变量 X 的可能取值为 0，1，2，…，n, 且
k P( X = k ) = Cn p k q n ?? k (k = 0,1, 2,L , n)
(0 < p < 1, q = 1 ?? p)
则称 X 服从参数为 n, p 的二项分布，
，
可验证：
57
特别地，当 n＝１时的二项分布就是两点分布。二项分布在讨论贝努里试验时很有用。贝努里试验是一种很重要且应用很广泛的数学模型。【例3】保险公司为了估计企业的利润，需要计算投保人在一年内死亡若干人的概串设某保险公司的某人寿保险险种有 1000 人投保，每个人一年内死亡的概率为 o．005 个，试求在未来一年中在这些投保人中死亡人数 X 不超过 10 人的概率．对每个人而言，在未来一年是否死当于做一次贝努里试验，1000 人就是做 1000 重贝努里试验，因此， X : B (1000, 0.005) ，所求概率为
k P( X ≤ 10) = ∑ C1000 (0.005) k (1 ?? 0.005)1000?? k ≈ 0.986 k =0 10
注意：从例中可以看到*要直接计算量大，可用泊松定理作近似计算(参看第一章§5)．
，则
【例】
58
３．泊松（Poisson）分布：设随机变量 X 的可能取值为 0，1，2，…，且
P( X = k ) =
λk
k!
e?? λ
(k = 0,1, 2,L ; λ > 0)
则称 X 服从参数为 λ 的泊松分布，
泊松分布是概率论中重要分布之一。许多随机现象都可以用泊松分布来进行描述，如单位长度布面上的疵点数，电话总机在单位时间内收到的呼叫数，一个地区每月发生的事故敛，物理学中热电子的发射个数等等都服从泊松分布．
59
【例】
下表记录
投在伦敦的飞弹
60
【例】
3. 几何分布：
4．超几何分布：
61
三．习题：Ｐ．５０
――
２，３，４，
§3
连续型随机变量
除了离散型随机变量之外，还有非离的随机变量，这些随机变量的取值已不再是有限个或可列个。在这类非离随机变量中，有一类常见而重要的类型，即所谓连续型随机变量。粗略地说，连续型随机变量可以在某特定区间内任何一点取值。例如某种树的高度；测量的误差；机的使用寿命等等都是连续型随机变量。对于连续型随机变量，不能一一列出它可能取值，因此不能像对离散型随机变量那样用它取各个可能值的概率来描述它的概率分布，而是要考虑该随机变量在某个区间上取值的概率，我们是用概率密度函数来研究连续型随机变量的。一．概率密度和连续型随机变量定义：对于随机变量 X ，如果存在非负可积函数
f ( x) (??∞ < x < +∞) ，使得对于任意实数，
P {a < X < b} = ∫
b
a, b (a < b) 都有
a
f ( x ) dx ，
则称 X 为连续型随机变量；称 f ( x) 为 X 的概率密度函数，简称概率密度或密度．由定义可知，分布密度 f ( x) 具有如下基本性质: （１） f ( x) ≥ 0 (??∞ < x < +∞) ；．（２）．
∫
+∞
??∞
f ( x) dx = P (??∞ < X < +∞) = 1 ．
这两条性质的几何意义是：概率分布密度曲线不在 x 轴下方，且该曲线与 x 轴所围的图形面积为 1。性质(1)、(2)可以作为判定一个函数是否可以作为一个连续型随机变量的分布密度的条件。对于连续型随机变量 X 可以证明，它在某一点 a 处取值的概率为零，即对于任意实数 a ，有 P ( X = a ) = 0 ．即研究 X 在某一点处取值的概率是没有什么实际意义的。从而可知，研究 X 在某区间上取值的概率时，该区间含不含端点，不影响概率值。即 (３)．对于任意实数，
a, b (a < b) 都有
P {a < X < b} = P {a ≤ X < b} = P {a < X ≤ b} = P {a ≤ X ≤ b} = ∫
b a
f ( x) dx
62
【例1】
设 X 是连续型随机变量，已知 X 的概率密度为
其中 λ 为正常数．试确定常数 A ．由概率密度函数性质，知
二．几个常用的一维连续型随机变量： 1. 均匀分布：如果连续型随机变量 X 的概率密度为
记作 X : U [a, b] ．
因此上述定义中的概率密度可以改为
其中 λ 为一常数，利用概率密度的性质，易得
λ=
1 b??a
2.
指数分布:
63
则称 X 服从指数分布（参数为 λ ），记为
X : E (λ )
若 X 服从参数为 λ 的指数分布，则对任意
0≤ a 0 ：可直接查本书的附表１，得 ◆ P (a < X < b) = Φ (b) ?? Φ (a ) （ⅲ） a > 0 ： ◆ P( X ≤ a) = Φ(a) ； ◆ Φ(??a) = P( X < ??a) =
∫
??a
??∞
?? (t )dt = 1 ?? ∫ φ (t )dt = 1 ??Φ (a ) ；
??∞
a
◆ P( X > a) = 1 ?? P( X ≤ a) = 1 ?? Φ(a) ◆ P (?? a < X ≤ b) = Φ (b) ?? Φ (?? a ) = Φ (b) ?? (1 ?? Φ (a ))
= Φ(b) + Φ(a) ?? 1 ；
◆ P ( X ≤ a ) = P ( ?? a ≤ X ≤ a ) = 2Φ ( a ) ?? 1 ．【例２】设 X : N (0,1) ，则
P(1 < X < 2) = Φ (2) ?? Φ(1) = 0.9773 ?? 0.8413 = 0.1360
P ( X < 1) = P (??1 < X < 1) = 2Φ (1) ?? 1 = 2 × 0.8413 ?? 1 = 0.6826
P( X ≤ ??1.96) = 1 ?? Φ (1.96) = 1 ?? 0.975 = 0.025 P(??1 < X ≤ 2) = Φ (2) + Φ (1) ?? 1 = 0.9773 + 0.8413 ?? 1 = 0.8190
（５）一般正态分布 N ( ?? , σ ) 的随机变量 X 落在区间 (a, b) 中的概率：
2
只要搞清楚一般正态分布与标准分布的关系，即可利用标准正态分布求得一般正态分布 N ( ?? , σ ) 的随机变量 X 落在区间 (a, b) 中的概率．具体地，
2
设
X : N ( ?? , σ 2 ) ，则
P ( a < X < b) = ∫
b
1 2π σ
??
1 2σ 2
( x ?? ?? )2
a
e
dx
令
t=
x????
σ
,
则有
b????
σ P ( a < X < b ) = ∫a ?? ?? σ
1 2π
e
1 ?? t2 2
dt = Φ (
b????
σ
) ?? Φ(
a????
σ
)，
66
转化为标准正态分布，查本书的附表１，就可得这概率．特别地，
P( ?? ?? σ < X < ?? + σ ) = Φ (1) ?? Φ(??1) = 2Φ (1) ?? 1 = 0.6826 ； P( ?? ?? 2σ < X < ?? + 2σ ) = Φ (2) ?? Φ (??2) = 2Φ (2) ?? 1 = 0.954 ； P( ?? ?? 3σ < X < ?? + 3σ ) = Φ (3) ?? Φ (??3) = 2Φ (3) ?? 1 = 0.9974 ，
由上面三式可见，服从分布 N ( ?? , σ ) 的随机变量 X 之值基本上落在
2
区间 [ ?? ?? 2σ ,
?? + 2σ ] 内，而几乎不在区间 [ ?? ?? 3σ , ?? + 3σ ] 外取值．
2
【例３】 X : N (2, 0.3 ) ，
求 P ( X > 2.4)
?? = 2, σ = 0.3,
P( X > 2.4) = 1 ?? P( X ≤ 2.4) = 1 ?? Φ (
2.4 ?? 2 ) = 1 ?? Φ (1.33) = 0.0918 0.3
三．例题：【例 4】
对以下各题随机变量所对应的概率分布，试常数 a.
67
【例 5】
【例 6】设随机变量 X 的概率密度为
68
【例设连续型随机变量 X 的分布面数为
【例 7】
则
，
四．习题： P．68
―――
１，２，４，５，１５
例题
69
70
71
【例】

72
【例】
73
将介绍连续型随机变量。我们要讨论的问题是相同的，但是它们的描述方法和使用助数学工具却不相同，为此我们将给出密度函数和分布函数的概念。正态分布是概率论和数理统计中最重要的分布，无论在理论研究和实际应用中它都占有头等重要的地位. 连续型随机变量和密度函数概念
例如：
由分布函数性质很容易看出，密度函数具有下面性质：：
3． 4．有
则
74
5．
对于连续型随机变量，如果已知分布函数或密度函数中的任一个，可求得另一个函数。
【例】
75
【例】

由密度函数求分布函数，注意到当密度函数是分段表示的函数时，分布函数也要分段表示，
【例】
76

对于分布，
77
例题：
78
79
80
81
82
83
84
85
86
87
第三章
随机变量的数字特征
前一章介绍了随机变量的分布，它是对随机变量的一种完整的描述。然而实际上，求出分布率并不是一件容易的事。在很多情况下，人们并不需要去全面地考察随机变量的变化情况，而只要知道随机变量的一些综合指标就够了．随机变量的数字特征就是用数字表示随机变量的分布特点。将介绍最常用的两种数字特征：数学期望与方差．
88
§1.
随机变量的数学期望及其性质
一．数学期望：
1．离随机变量的数学期望定义：
89
90
【例 3】
91
2。连续型随机变量的数学期望：
定义：
【例 4】
92
3．随机变量函数的数学期望：
X
,
二．
：：：
93
94
三．习题：１．Ｐ．７５２．Ｐ．８４
―――１，３，５； ―――１，３，５．
95
【例】据统计，一位 40 岁的健康(一般体检末发现病症)者，5 年之内活着或自杀死概率为 p(0＜p＜l，p 为已知)，在 5 年内非自杀死亡的概率为 1—p。保险公司开办 5 年人寿保险，参加者需交保险费 a 元(a 已知)，若 5 年之内非自杀死亡，公司赔偿 b 元(b＞a)。 b 应如何定才能使公司可期望获益；若有 m 人参加保险，公司可期望从中收益多少？
三
．习题：Ｐ．７５Ｐ．８４
―――１，３，５ ―――１，３，５随机变量的数字特征的例题
第三章
96
【例１】
97
98
99
100
101
102
103
104
105
106
107
108
109
§2
随机变量的方差及其性质
110
一．随机变量的方差：１．
（１）
111
【例１】
【例２】
112

2 ＤＸ＝ ∫ ( x ?? EX ) q ( x)dx ??∞
+∞
＝
t = (x ?? ??) / λ
∫
+∞
λ2
2
??∞
t e dt = λ
2 ??t
+∞ 2
∫t e
0
2 ??t
dt = λ 2 Γ(3) = 2λ 2
【例３】
q = 1 ?? p, 求DX .

113
２．
114
二．
：
n 个相互独立随机变量算术平均数的方差等于其方差算术平均数的 1／n 倍. ．
115

【例 4】

E ( X + 2) 2 = E ( X 2 + 4 X + 4) = EX 2 + 4 EX + 4 = ( DX + ( EX ) 2 ) + 4 EX + 4 = 30
116
【例 5】
【例 6】
，得
(参看ＰＰ．８８－８９)
三．几个常用的随机变量的期望与方差：（１）二点分布：随机变量 X 的分布为
X P
１
０
p
q
则
E ( X ) = p,
D( X ) = pq
。
117
.
q = 1?? p
证明：
如：
118
（3）
．
【例 7】
119
120
证明：
EX =
1
λ
,
DX =
1
λ2
121
(8) 分布： X : N ( ?? , σ 2 ) ，则
EX = ?? , DX = σ 2
证明：
也可以用下面方法来证明：与Ｐ．８５―― 习题九－４类似，），
122
123
【例 8】若连续型随机变量的概率密度是
124
四．习题： P．93 --------- 1， 2（习题九的 1，3，5）
第四章 §1
随机向量二维随机变量及其分布
125
1.
2．定义：
126
127
128
129
【例】
：
130
1．定义：
131
132
133
1.
:
2.
:
134
135
136
137
138
【注意】
））
139
【例 8】P．109 ----例 1．7
140
141
即一般情况下 ( ρ
≠ 0)
f ( x, y ) ≠ f X ( x ) f Y ( y )
142
【注意】（１）
（２）
（３）由例７知，
，
f ( x, y ) ≠ f X ( x) fY ( y ) ， ( ρ ≠ 0)
143
Q pij = pi g pg j (i, j = 1, 2,3)
∴
X , Y 是相互独立的．
144
145
146
【例１２】
147
六．习题： 1．课外：P.115 --- 1, （补充）求概率 P (1 ≤ 2, 4, 8 2．课内：P.116 –---3, 5, 7.
X ≤ 2, 3 ≤ Y ≤ 4)
148
149
§2
一．原点矩与中心矩：１．定义１：
矩、协方差和相关系数
２．定义２：
（参看
Ｐ．９３）
１．
二维随机变量的均值：
150
（3）
（参看
Ｐ．１２５―――１２７）
2，协方差与相关系数：
相关系数 ρ XY 也常记为 ρ ( X ,
Y ) ，或简记为 ρ
151
３．
152
153
【例】
154
X 与 Y 相互独立
【例２】
ρ XY = 0

155
156
【例３】
（１）（２）四．
157
【例４】
【例５】
158
【例６】
【例７】
+2Y , 试求 X 与 Z 的相关系数．
X 与 Z 的相关系数为
ρ xz =
由于
E ( XZ ) ?? EX EZ DX DZ
EX = 0, DX = 1, EZ = EX + 2 EY = 2 , DZ = DX + 4 DY = 9,
E ( XZ ) = E ( X ( X + 2Y )) = E ( X 2 + 2 XY ) = EX 2 + 2 E ( XY )
= EX 2 + 2 EX EY = 1 （ X 与 Y 相互独立）
所以
ρ xz =
1?? 0 1 9
=
1 3
159
【例９】
三．习题：１. p.136 ---- ２，４，６，８２. 补充题：袋中有球 3 白 2 黑，从中一次一球无放回抽 2 次，设
??1 当第二次抽得白球 ??1 当第一次抽得白球 X =?? ，Y = ?? ??0 当第二次抽得黑球 ??0 当第一次抽得黑球
求
cov( X , Y ) 。
§2 矩、协方差和相关系数
160
一．矩：２．
定义１：
２．定义２：
２．
二维随机变量的均值：
161
（3）
2，协方差：
162
３．相关系数：如果 DX ≠ 0 , DY ≠ 0 ,
163
164
：
165
【例】
166
【例】【例】
【例】
（１）（２）【例】
三．习题： 1. P.116 ------ ４，7
2.
3.
p.136 ----4,6
补充题：袋中有球 3 白 2 黑，从中一次一球无放回抽 2 次，设
??1 当第一次抽得白球 ??1 当第二次抽得白球，Y = ?? X =?? ??0 当第一次抽得黑球 ??0 当第二次抽得黑球
求 cov( X , Y ) 。
167
§3.
大数定律和中心极限定理
一．大数定律：
168
1.贝努里大数定律：
2. 大数定律：
169
3．推论：
二．中心极限定理：
170
1．中心极限定理：
2．例题：
171
三．习题：略
§2
一．
：
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
（2）
187
§2，统计量与统计量的分布
1．定义：
188
二．常用的统计量： 1. 常用的统计量:
2.
2.
:
：令
189
则
证明：因为
所以
：
证明：因为
所以【例１】
190
方法１：：
：
方法２：：
191
：
三．常用统计量的分布：
定理 1：
192
（1）定义（ χ
2
(n) 分布）：
（2）定理 2（ χ
2
(n ?? 1) 分布）：
（1）定义：
193
（2）定理 3：
（3）定理 4：
（4）．定理 5：
194
（1）定义：
（2）定理 6：
195
（3）定理 7：
§３
最大似燃估计与估计的优良性
一．似然函数
196
197
二．
198
2．
证明：
199
4．
200
三．例题：
【例１】
201
四．估计量的优良性： 1．无偏估计：
202
203
2．有效性估计：
204
【例 1】
205
3．一致性估计：
五．期望与方差的点估计：任何去估计一个随机变量
X
的期望与方差，上面的最大似燃估计已提供了一个均值与方
差的点估计，一般讲 1．均值的点估计：样本的均值
X =
2．
x1 + x2 + L + xn n
作为期望的点估计．方差的点估计：样本的方差
1 n S = ∑ ( xi ?? x)2 n ?? 1 i =1
2
作为方差的点估计．从前面可知，它们都是无偏估计．
206
六．习题：
１．P．１８５――２，３，又问估计量是否为未知参数的无偏估计？２．补充题:
x ?? 1 ??λ ?? X ~ p( x) = ?? λ e ?? 0 ??
x>0 x≤0
，样本 x1 , x2 ,∧
, xn ，
求 λ 最大似燃估计量。
§4 均值与方差的点估计
207
208
区间估计小结
第六章
假设检验
209
§1．
问题的提法
数理统计的中心任务，就是从局部观测资料的统计特性来推断事物整体的统性，所以统计推断工作是数理统计的核心部分．统计推断的主要问题可分为两大类： (1)总体参数的估计； (2)统计假设检验（参数的假设检验；分布的假设检验）在前一章里，我们已慨略地介绍了参数估计方法，在这一章里我们要介绍假设检验。
一．假设检验的基本概念：先看下面实例．例某种产品按照规定，次品率不得超过 4％才能出厂，从 1000 件产品中抽检 10 件，假设有 4 件次品，问这批产品能否出厂．假设产品次品率 p＝0．04，则抽捡 10 件产品中有 4 件次品的概率为：
先假设“符合出厂条件” ，然后分析抽检结果，如果出现了在假设成立的条件下，竟发生了实际很难发生的事件．于是有理由认为“符合出厂条件”的原假设不能成立，因此就拒绝原假设．所以产品不能出厂．上面的推理运用了“小概率原理” ，可称为概率论的反证法，掌握这种思想方法是很重要的．小概率原理：概率很小的随机事件， (通常以 α ＜0．05 的概率为小概率＝在一次试验中是很难出现的．如果依据原假设 H 0 ，预计某事件出现的概率很小，而在一次试验中，某事件竟然出现了．则我们可以认为原假设 H 0 是不 '的，从而否定(拒绝)原假设．通常情况，将 α ＝o．05 叫做检验标准或检验水平或显著性水平．
210
1．
：
2．
：
下来，这在数理统计中称为第二类错误．
（参看Ｐ。１９５）
211
§2 一．已知方差 σ 2 , 检验假设： H o （1）提出原假设： H o
: ?? = ??o
(
: ?? = ??o
X ?? ??o
?? o 是已知数)
（2）选择统计量：
U=
σ2
n
（3）求出在假设 H o 成立的条件下，该统计量服从的概率分布：
U : N (0,1)
（4）选择检验水平
u α ，查分布表（附表 1），得临界值 1?? α
>u
α
2
，即
2
P(
X ?? ??o
σ2
n
1??
) =α
（5）根据样本值计算统计量的观察值 uo ，给出拒绝或接受 H。的判断：当
uo > u
1??
α
2
时，
则拒绝 H。；
当
uo ≤ u
1??
α
2
时，则接受 H。．
【例1】某厂生产干电他，根据长期的资料知道，干电他的寿

212
现取 α
= 0.05 ，
P( X ?? 200 5 / 10
即
> 1.96) = 0.05
因而，拒绝原假设，即这批干电他的平均寿命不是 200 小时. 【例２】P.191 ―― 例 2.1（ α P.193―― 例 2．2 二．未知方差 σ 2 , 检验假设： H o （1）提出原假设： H o
= 0.05 ，
0.01）
: ?? = ??o
(
：
: ?? = ??o
T=
?? o 是已知数)
X ?? ??o S2 n
（2）选择统计量：
（3）求出在假设 H o 成立的条件下，该统计量服从的概率分布：
T : t ( n ?? 1)
（4）选择检验水平即
α ，查自由度为 n ?? 1 的 t ?? 分布表（附表 2），得临界值 λ
> λ) = α
，
P(
X ?? ??o S2 n
（5）根据样本值计算统计量的观察值 to ，且给出拒绝或接受 H。的判断：当当
to > λ to ≤ λ
时，
则拒绝 H。；
时，则接受 H。．
213
【例 2】某糖厂用自动打包机包装糖，每包重量服从分布，其标准重量 ?? o ＝100 斤．某日开工后测得 9 包重量如下： 99.3， 98.7, 100.5，101.2， 98.3， 99.7， 99.5， 102.1，100.5，问：这一天打包机的工作是否正常?(检验水平 α = 5％) （０）计算样本均值与样本均方差：
S = 1.21
（1）提出原假设： H o
: ?? = 100
X ?? 100 S2 9
（2）选择统计量：
T=
（3）求出在假设 H o 成立的条件下，该统计量服从的概率分布：
T : t (8)
（4）检验水平
α =0.05，查自由度为８的 t ?? 分布表（附表 2），得临界值
，即
λ = 2.36
P( X ?? 100 S2 9
> 2.36) = 0.05
（5）根据样本值计算统计量的观察值
to =
∴
to = 0.055 < 2.36
故接受原假设，即所打包机重量的总体的平均重量仍为 100 斤，也就是说打包机工作．
214
【例 3】
用一仪器间接测量温度 5 次 1250，1265，1245，1260，1275(℃)．而用另一种精密仪器测得该温度为 1277℃(可看作真值)，问用此仪器测温度有无系统偏差 (测量的温度服从正态分布)？(参看 P.187 –-- 例 1.2)
则
T : t (4) ,
自由度＝ n ?? 1 =
5 ??1 = 4 ，
。【例】P. 200 ―― 例 2.3
【例４】某厂生产镍合金线，其抗拉强度的均值为 10620 公斤．今改进工艺后生产一批镍合金线，抽取 10 根，测得抗拉强度(公斤)为： 10512 10623 10668 10554 10776 10707 10557 10581 10666 10670 认为抗拉强度服从分布，取 α 生产的合金线抗拉强度要高？解：
= 0.05 ，问新生产的镍合金线的抗拉强度是否比过去
H o : ?? ≤ 10620 ，即抗拉强度没有提高．
215
三．未知期望 ?? , 检验假设： H o （1）提出原假设： H o （2）选择统计量：
: σ 2 = σ o2
：
: σ 2 = σ o2 ( σ o2 是已知数)
χ =
2
(n ?? 1) S 2
σ o2
（3）求出在假设 H o 成立的条件下，该统计量服从的概率分布：
χ 2 : χ 2 ( n ?? 1),
（4）选择检验水平
自由度为
n ??1
3），得临界值
α ，查自由度为 n ?? 1 的 χ 2 ?? 分布表（附表
,
λ1 = χ 2
使得
1??
α
2
λ2 = χ 2α
2
，
P ( χ 2 < λ1 ) =
α
2
,
P ( χ 2 > λ2 ) =
2
α
2
（5）根据样本值计算统计量的观察值 χ o 当 χo 当
2
，给出拒绝或接受 H。的判断：时，则拒绝 H。；则接受 H。．
≤ λ1
或 χo
2
≥ λ2
λ1 < χ o2 < λ2
时，
【例】P. 202--- 例 2.4 【例５】用过去的铸造战所造的零件的强度平均值是 52．8 克重／毫米 2 ，标准差是 1．6 克重／毫米 2 ．为了降低成本，改变了铸造方法，抽取了 9 个样品，测其强度(克重／毫米 2 )
216
为: 51．9， 53．0， 52．7， 54．7，53．2， 52．3， 52．5， 51．1， 54．1．假设强度服从分布，试判断是否没有改变强度的均值和标准差．
（1）原假设： H o （2）取统计量：
: σ 2 = 1.62
9 S2 χ = 1.62
2
（3）假设 H o 成立的条件下，（4）取检验水平
χ 2 : χ 2 (8),
自由度为８
α = 0.05 ，查自由度为８的 χ 2 ?? 分布表（附表 3），得临界值
，使得
2
λ1 = 2.18, λ2 = 17.54,
（5）根据样本值计算统计量的观察值 χ o
：
8S 2 = 9.54,
χ o2 =
8S 2 9.54 = = 3.72 ， 1.62 1.62
在上述判断的基础上，可以认为已知 σ
2
= 1.62
，于是
综上所述，我们可以认为改变铸造方法后，零件强度的均值和标准差没有显著变化．
217
四．未知期望 ?? , 检验假设： H o (1)提出原假设： H o (2)选择统计量：
: σ 2 ≤ σ o2
：
: σ 2 ≤ σ o2 ( σ o2 是已知数)
χ2 =
(n ?? 1) S 2
σ o2
自由度为 n ?? 1 ,
(3)求出在假设 H o 成立的条件下，该统计量服从的概率分布：
χ 2 : χ 2 ( n ?? 1),
且有
因此
P{
(n ?? 1) S 2
σ
2 o
> χ α ( n ?? 1) )
2
} ≤ P{
( n ?? 1) S 2
σ
2
> χ 2α ( n ?? 1)
}= α
（4）选择检验水平
α ，查自由度为 n ?? 1 的 χ 2 ?? 分布表（附表
，
3），得临界值
λ = χ 2α (n ?? 1)
使得
P{
( n ?? 1) S 2
σ o2
>λ
} =α ，
2
（5）根据样本值计算统计量的观察值 χ o 当当
，且则拒绝 H。；则接受 H。．
χ o2 > λ
χ o2 ≤ λ
时，时，
218
【例 6】
且
(9 ?? 1) × 0.007 2 χ = = 15.68 > 15.5 0.0052
2 o
所以能认为这批导线的方差显著地偏大．五．小结：单个总体均值和方醚的假设检验
六.习题: P. 213
――1, 2, 3, 4, 5
第七章
回归分折
219
讨论随机变量与非随机变量之间的关系的问题称回归分析；讨论随机变量之间的关系的问题称相关分析．对于这两种问题，或统称回归分析，或统称相关分析都可以．
但是，自然界的众多的变量间，还有另一类重要关系，我们称之为相关关系．例如，施肥量与农作物产量之间的关系，这种关系虽不能用函数关系来描述，但施肥量与产量有关系，这种关系就是相关关系，又比如，人的身高与体重的关系也是相关关系，虽然人的身高不能确定体重，但总的说来，身高者，体也重些，总之，在生产斗争与科学实验中，甚至在日常生活中，变量之间的相关关系是普遍存在的．其实，即使是具有确定性关系的变量间，由于实验误差的影响，其表现形式也具有某种的不确定性．回归分折方法是数理统计中一个常用方法，是处理多个变量之间相关关系的一种数学方法,．它不仅提供了建立变量间关系的数学表达---通常称为经验公式的一般方法，而且还可以进行分析，从而能判明所建立的经验公式的有效性，以及如何利用经验公式达到预测与控制的目的．因而回归分析法得到了越来越广泛地应用．回归分析主要涉及下列内容： (1)从一组数据出发，分析变量间存在什么样的关系，建立这些变量之间的关系式(回归方程)，并对关系式的可信度进行统计检验； (2)利用回归方程式，根据一个或几个变量的值，预测或控制男一个变量的取值； (3)从影响某一个变量的许多变量中，判断哪些变量的影响是显著的，哪些是不显著的，从而可建立更实用的回归方程， (4)根据预测和控制所提出的要求，选择试验点，对试验进行设计．我们在本章，重点讨论一元线性回归，对多元回归只作简单地介绍． §1 一元线性回归
一元线性回归分析中要考察的是：随机变量 Y 与一个普通变量 x 之间的联系。对有一定联系的两个变量：
x
我们的任务是根据一组观察值
与Y ，
( x1, y1 ), ( x2, y2 ), L , ( xn , yn ),
判断 Y 与 x 是否存在线性关系
220
y = a + bx + ε ，
我们能否通过这组观察值将确定系数判断 Y 与 x 是否真存在此线性关系. 一 . 经验公式与最小二乘法: 【例 1】纤维的强度与拉伸倍数有关．下表给出的是 24 个纤维样品的强度与拉伸倍数的实测记录．我们希望通过这张表能找出强度 y 与拉伸倍数 x 之间的关系式
a 与 b 出来呢?这就是回归问题要的问题，且
们将观察值 ( xi ,
yi ) ( 1 ≤ i ≤ 24) 作为 24 个点，将它们画在平面上，这张图称
为散点图，这图启示我们，这些点虽然是的，但大体上在一线的周围．也就是说，拉伸倍数与强度之间大致成线性关系．我们用（＊）
确定，是线性的，要完全确定经验公式，就要确定(＊)中的系数 a 和 b ，这里 b 通常称为回归系数，关系式
221
叫做回归方程．从散点图来看，要找出
a 与 b 是不困难的，在图上划一线，使该直线总的来看最“接 a ，它的斜率就是所求的 b ．几
近”这 24 个点．于是，这直线在 y 轴上的截距就是所求的
何方法虽然简单，但是太祖糙，而对非线性形式的问题，就几乎无法实行．然而，它的基本思想，即“使该直线总的说来最接近这 24 个点” ，却是很可取的，问题是把这基本思想精，数量化．下面介绍一种方法，求一线使其“总的来看最接近这 24 个点” ，这就是最小二乘法．给定的 n 个点 ( x1 , y1 ), ( x2 , y2 ), L , ( xn , yn ) , ，对于平面上任意一线
l:
我们用数量
y = a + bx
[ yi ?? ( a + bxi )]2
来刻画点 ( xi ,
yi ) 到直线 l 的远近程度, 于是二元函数
Q (a, b) =
就定量的描述了直线 l 跟这随不同的
∑[ y
i =1
n
i
?? (a + bxi )]2
n 个点的总的远近程度,这个量是随不同的直线而变化,或者说是
使得该直线总的来看最“接近” 这 n 个点的
a 与 b 而变化的,于是要找一线, a 与b ,
问题就转化为: 要找两个数即使得二元函数 Q ( a ,
?? b ) 在 a = a, b = b 处达到最小, ??
?? ?? Q ( a , b ) = min(Q ( a , b ))
由于 Q ( a ,
b ) 是 n 个量平方之和，所以“使 Q ( a , b ) 最小”的原则称为平方和最
小原则，习惯上称为最小二乘原则．由最小二乘原则求法．
a 与 b 估计值的方法称为最小二乘
?? 按照最小二乘原则，具体求 a ,
?? b 的问题就是利用极值原理，求解二元一次联立
222
方程组有唯一解:
于是，
对于给定的
n 个点 ( x ,
1
?? ?? y1 ), ( x2 , y2 ), L , ( xn , yn ) ，先算出 b ，再算出 a ，
就得到了所求的回归方程: 可计算【例１】的因此所求经验公式, 即回归方程为
223
【例 2】P．236―――
例 1.2
对任意两个相关变量，即使它们不存在线性关系，都可以通过它们的一组观测值用最小二乘法，在形式上求得 Y 和
X
的回归直线方程. 实际上，如果 Y 和
X
没有线性相关关
系，所求的回归直线方程是没有意义的．因此建立了回归直线方程之后，还需要判断
Y
与
X
间是否真有线性相关关系，这就是回归效果的检验问题．称为回归效果的显著性检
验．首先介绍“平方和分解公式” ．二. 平方和分式与线性相关关系：: 对于任意的 n 组数据 ( x1 ,
y1 ), ( x2 , y2 ), L , ( xn , yn ) ,
n 2
恒有:
∑(y
i =1
n
i
?? ?? y ) = ∑ ( yi ?? yi )
2 i =1
+
?? ∑(y
i =1
n
i
?? y )2
(1) ’
其中现记
?? ?? ?? yi = a + bxi , (i = 1, 2,L , n)
l yy = ∑ ( yi ?? y )2 ，
i =1 n
?? U = ∑ ( yi ?? y ) 2
i =1
n
n
，
?? Q = ∑ ( yi ?? yi ) 2
i =1
则平方和分解公式是：
l yy = U + Q
证明：
(1)′
224
?? ?? 因为 a = y ?? b x
,
?? b=
∑ (x
i =1
n
i
?? x )( yi ?? y )
i
∑ (x
i =1
n
?? x )2
，
并且
＝0
所以
l yy = U + Q
即
∑(y
i =1
n
i
?? ?? y ) = ∑ ( yi ?? yi )
2 i =1
n
2
+
?? ∑(y
i =1
n
i
?? y )2
?? ?? ?? yi = a + bxi 是回归直线上，
其横坐标为 xi 点的纵坐标，
225
因为
?? 所以 y1 ,
?? ?? y2 , L , y n
的平均值也等于
y．
我们还可以通过 l yy ,
U , Q 的均值，进一步说明它们之间的关系．
226
有了上面这些对于 l yy , (1)
U , Q 的分析表明：
yi (i = 1, 2,L , n) 的离差平方和由两部分组成：
回归平方和 U 和残差平方和 Q , 其中 Q 完全由随机因素引起，与 Y 线性相关关系决定．因
但是当 b (2) U 中虽然也有随机因素，
≠ 0 时,主要是由 X
而 U 与 Q 之比的比值反映了这种线性相关关系与随机因素对 Y 的影响的大小．比值越大，线性相关关系越强．大到什么程度才能说明有线性相关关系，还要进行检验，因而应寻找检验的统计量．
则
) lxy ?? ?? ?? ?? b = , a = y ?? bx ; U = b 2 lxx = blxy , lxx
(参看 P.244+3, 注意: 三．相关性检验: （1）提出原假设：（2）选择统计量：这是常用的计算公式)
Q = l yy ?? U
.
Ho : b = 0
F= U Q /(n ?? 2)
F : F (1, n ?? 2) ,
（3）求出在假设 H o 成立的条件下，（4）选择检验水平
α ，查第一自由度为 1与第二自由度为 n ?? 2 .的,
F ?? 分布表（附表 4），得临界值 λ ，使得
P( F > λ ) = α ,
（5）根据样本值计算统计量的观察值 Fo ，给出拒绝或接受 H。的判断：当当
Fo > λ
时，则拒绝 H。；时, 则接受 H。．
Fo < λ
227
如果 F 值相当大则表明
X
与 Y 线性影响较大，就可以认为
X
与 Y 间有线性相关关系；反
之，如果 F 值较小，则没有理由认为
X
与 Y 间有线性相关关系．
衡量回归效果的好坏，除了采用回归问题的方差分析外, 还可以用统计量
R=
lxy lxx l yy
R
接近 0 , Y 与 X 之间的线性相关程度愈小，
来描述两个变量线性关系的密切程度，当反之，当
R
接近愈大，愈接近 1， Y 与 X 之间的线性相关就愈为密切．对一个具体问题，
只有当相关系数关系.
R 的绝对值大到一定程度时才可用回归直线来近似地表示 Y 与 X 之间的
对于假设 H o ，由 F 和 R 提供的两钟形式上不同的检验方法，实质上是一回事。
228
（参看 P. 243 --- P.244）
229
【例 3】 P.244 ―――例 1.4 【例4】钢的含碳量与抗拉强度之间具有相关关系。抽查某种钢材 12 根，测得含碳量(％) 和抗拉强度(kg／mm 2 )的观测值如下：
根据这组数据，求 Y 对 X 的线性回归方程， (α （1） x ,
= 0.05)
y , l xx , lxy , l yy
xi
1.3 1.4 1.4 1.5 1.6 1.6 1.7 1.8 1.9 2.0 2.1 2.2
与回归系数：
编号 1 2 3 4 5 6 7 8 9 10 11 12 总和
yi
41 44 45 43 46 47 47 46 46 49 49 51 20.5 554
x 2i
1.69 1.96 1.96 2.25 2.56 2.56 2.89 3.24 3.61 4.00 4.41 4.84 35.97
xi ?? yi yi ?? yi
53.3 61.6 63 64.5 73.6 75.2 79.9 82.8 87.4 98 102.9 112.2 954.4 1681 1936 2025 1849 2116 2209 2209 2116 2116 2401 2401 2601 25660
∑
∑ x 2i = 35.97 ，
i =1
16
∑ y 2i = 25660 ，
i =1
16
∑x y
i =1 i
16
i
= 954.4
230
1 12 lxx = ∑ xi ?? (∑ x i ) 2 = 0.942 12 i=1 i =1
2
12
lxy = ∑ x i yi
i=1
12
12 1 12 ?? (∑ x i )(∑ yi ) = 7.983 , 12 i=1 i =1
l yy = ∑ yi
i =1
12
2
1 12 ?? (∑ yi ) 2 = 83.67 12 i =1
?? lxy = 8.4 b= lxx
?? ?? a = y ?? bx = 31.81
Y 对 X 的线性回归方程：
?? y = 31.81 + 8.4 x
（2）检验
X
与 Y 线性相关性：
Ho : b = 0
取统计量：
F=
U , Q /(n ?? 2)
n = 12
，
在假设 H o 成立的条件下，
F : F (1, 10) ,
α = 0.05 ，得 F0.05 (1,10) = 4, 96 ，
： U
?? = b ?? lxy = 67.15
Q = l yy ?? U = 16.52
F= U = 40.64 > 4.96 Q /10
则拒绝 H。，即抗拉强度与钢的含碳量之间是真有显著的线性相关关系，【例5】为了确定老鼠血镕的减少量和注射胰岛素 A 的剂量之间的关系，将在同样条件下繁殖的 7 只老鼠注射了不同剂量的胰岛素 A，所得数据如下：
231

232
回归系数：
?? b=
?? a=
四．习题： P．254 ---- 1，2
附表
相关系数临界值表
233
§3 一．：
234
二．
：
235
预备知识
在概率的中经常要用到一些排列组合知识，也常常用到牛顿二项式定理。这里罗列一些同学们在中学里已学过的有关公式，并适当作一点推广。一. 两个原理 1. 乘法原理: 完成一项工作有 m 个步骤，第一步有 n1 种方法，第二步有 n2 种方法，…，第 m 步有 nm 种方法，且完成该项工作必须依次通过这 m 个步骤，则完成该项工作一共有
n1 n2 … nm
236
种方法，这一原理称为乘法原理。 2. 加法原理: 完成一项工作有 m 种方式，第一种方式有 n1 种方法，第二种
方式有 n2 种方法，…，第 m 种方式有 nm 种方法，且完成该项工作只需选择这 m 种方式中的一种，则完成这项工作一共有
n1 + n2 +…+ nm
种方法，这一原理称为加法原理。
二. 排列: 从 n 个元素里每次取出 r 个元素，按一定顺序排成一列，称为从 n 个元素里每次取 r 个元素的排列，这里 n 和 Z。均为正整数(以下同)。当这 n 个元素全不相同时，上述的排列称为无重复排列，我们关心的是可以做成多少个排列，即排列数。对于无重复排列，要求当时 r r＝n 时称为全排列。我们记排列数分别为即将全排列看成选排列的特例。利用乘法原理不难得到由阶乘的定义
由阶乘的定义
将上面的 n 个不同的元素改为 n 类不同的元素，每一类元素都有无数多个。今从这 n 类元素中取出 r 个元素，这 r 个元素可以有从同一类元素中的两个或两个以上，将取出的这 r 个元素 dl 成一列，称为从 n 类元素中取出 r 个元素的可重复排列，排列数记作，由乘法原理得
237
显然，此处 r 可以大于 n 例 3 将三封信投入 4 个信箱，问在下列两种情形下各有几种投法? 1)每个至多只许投入一封信； 2)每个允许投入的信的数量不受限制。解 1)显然是无重复排列问题，投法的种数为
2)是可重复排列问题，投法的种数为
三、组合从“个元素中每次取出 r 个元素，构成的一组，称为从 n 个元素里每次取出 r 个元素的组合。设这 n 个元素全不相同，即得所谓无重复组合，我们来求组合数，记作
将一个组合中的 r 个元素作全排列，全排列数为，所有组合中的元素作全排列，共有
个排列，这相当于从 n 个元素里每次取 r 个元素的选排列，排列总数为
故有
性质(2)的左端表示
从
238
中取出 r 个的组合数。我们可以固定这 n 十 1 个元素中的任意一个，不妨固定
于是考察所有取前者即从从
及所有不取
。的组合数，个中取 r—1 个的组合数，而后者即
个中取 r 个的组合数
类似于可重复排列，也有可重复组合，即从 n 类不同元素中每次取出 r 个元素，这 r 个元素可以从同一类元素中取两个或两
例 4 掷两颗银子可以有多少种点子的排列?多少种点子的组合? 解每颗银子各有六面，分别刻有 1，2，3，4，5，6 个点，掷出的结果可以重复。
四、较复杂的排列、组合问题问题 1，不全相异元素的全排列将一个包含 n 个元素的整体分成 r 个有序的部分，其中第一部分包含 n1 个元素，第二部分包含 n2 个元素，…，第 r 部分包含 nr 个元素，分法数共有
239
种，上式称为多项式系数。例 5 将 15 名新生平均分配到三个班级中去，这 15 名新生中有 3 名优秀生。问：1)15 名新生平均分配到三个班级中有多少种分法?2)每个班级各分配到一名优秀生有多少种分法?3)3 名优秀生分配在同一个班级有多少种分法? 解 1)15 名新生平均分配到三个班级中的分法总数为
2)将 3 名优秀生分配到三个班级使每个班级都有一名优秀生的分法共 3!种。对于其中每一种分法，其余 12 名新生平均到三个班级中的分法共有班级各分配到一名优秀牛的分法总数为种，由乘法原理不难得到每个
3)将 3 名优秀生分配在同一班级内的分法共有 3 种(因有 3 个班级)。对于这每一种分法，其余 12 名新生的分法是将其中的 2 名分配到已有 3 名优秀生的班级，而另二个班级各 5 名，因
此分法数为
种，由乘法原理得 3 名优秀生分配在同一班级的分法总数为
例：将 3 个白球、4 个红球和 4 个黑球排成一行．如果颜色相同的球彼此不加区别，问有多少种排法？有
240
种排法问题 2，不全相异元素的组合仍设有 r 种不同元素，第一种有 n1 个
元素，第二种有 n2 个元素，…，第 r 种有 nr 个元素，今从这 n 个元素中，每次取，其取法总数为下列乘积
例6
由
词中的字母，每次择取 4 个，共有几种
不同的选择法? 解此词中有 8 种字母，其中包括 3 个 a，2 个 m，2 个，以及
各一个，每次择取 4 个，故所求的取法数由
∴ (1 + x + x + x )(1 + x + x )(1 + x) = 1 + 8 x + 31x + 78 x + 143 x + L + x
2 3 2 5 2 3 4
12
例：要求某学生会主席指定一个委员会，包括 5 名男生和 3 名女生，在提供的候选人名单中有 10 名男生和 7 名女生。问可能有多少个委员会可供他选择？解在某一委员会中，如果改变委员的顺序，结果仍相同，
241
因此，这是一个求组合的问题。从 lo 名男生中，主席能选出每组有 5 名男生的组合数为 5．5 组合与排列个元素的整体分成 r 个有序的部分，其中第一部分包含 Rt 个元素，第二部分包含 n2 个元素，…，第 r 部分包含 n r 个元素，分法数共有组合与排列研究事物的分组与排列，在计算概串方面，它们可以用来决定一切可能情况的总数以及有利情况数。定义 5—8 每一个集合可以由给定事物的部分或全体组成，可以不管集合中事物的顺序则这一集合称作组合。定义 5—9 事物的全部集合或部分集合的每一种不同的顺序或排列即称为排列。例 5—14 在 A，B，C，D 四个字母中求每组三个字母的(a) 组合数，(b)排列数。解 (a)字母 A，B，C，D 每组可以取三个，不计顺序，有以下取法：ABC，ABD，ACD 和 BCD。因此，共有 4 种组合，即 4 个物件中每次取三个共有 4 种组合。 (b)如果还考虑顺序，在字母 A，B，C，D 中每组有三个，共有以下排列：ABC，ACB，BAC， BCA，CAB，CBA， ABD，ADB，BAD，BDA，DAB，DBA，ACD，ADC，CAD， CDA，DAC，DCA，BCD， BDC， CBD，CDB，DBC，DCB。因此，共有 24 种排列：即从 4 物件中每次取三个共有 24 种排列。例 5—15 排列数。解求四物件在每次取 4 件时的(a)组合数； (b)A，B，C，D 四个字母的顺序数容易求出为 24，于是 4 物件每次取 4 件有 24 种排列。为了求出组合数与排列数的简易公式，我们首先考虑一个特例，求 n 个物件(例如字母)每组有 n 项的排列数。把这些排列都写出来，我们就可以看到第一个字母有 n 种选择；每一种选择对应于图 5—3 中的一个分校图，这里表示的是 n＝4 的情形。在选定第一个字母后(例如 A)，在第二个字母就余下(n—1)种选择，于是对前面两个字母就有 n(n—1)种可能的选择，与固 5—3 中从左边顶端发散的分技数一样多的选择。在前两个字母选定以后，对第三个字母还有 n—2 种选择，于是对前三个字母就有 n(n—1)(n—2)种选择。继续这一过程，我们看到对第 n 个字母就只留有一种选择；因而 n 个字母有 n(n—1) (n—2)?? 。2．1 种排列法。用符号 nI(读作“n 的阶乘”)表示前面 n 个正整数的乘积，即
242
n！＝n(n—1)(n—2)??．2．1 ． (5—9) 用 Pn，n 表示 n 个物件每组有 n 个的排列数，我们已经表明 Pa，n＝n1 (5——10)
1．（P184－1）某食品厂为加强质量，对某天的生产的罐头抽查了 100 个（数据如下表）。试画直方图；它是否近似服从正态分布？ 100 个罐头样品的净重数据（单位：克）： 342 340 348 346 343 342 346 341 344 348 346 346 340 344 342 344 345 340 344 344 343 344 342 343 345 339 336 342 347 340 340 350 340 336 341 339 346 338 342 346 350 348 342 340 356 339 348 338 342 347 347 344 343 339 341 337 344 340 344 346 342 344 345 338 341 348 345 339 343 345 345 345 350 353 345 352 350 345 343 347 343 350 343 350 344 349 332 343 340 346 342 335 349 343 344 347 341 346 341 342
243
：方法 1：（1）最小值为 332，最大值为 356。（2）取起点 a=332，终点 b=356，共分 13 组，组距为 2。（3）分组数据如下：分组频数 332~334 1 334~336 1 336~338 3 338~340 8 340~342 15 342~344 20 344~346 21 346~348 15 348~350 7 350~352 6 352~354 2 354~356 0 356~358 1 （4）直方图如下：
直方图
0.25
0.2 0.21
0.2
单位=频率*1/2
0.15
0.15
0.15
0.1
0.08
0.07
0.06 0.02 0
0.05
0.01 0.01
0.03
0.01
0 332 334 336 338 340 342 344 346 348 350 352 354 356
净重（克）
方法 2： (1) 最小值 m=332，最大值 M=356。 (2) 取起点 a=331.5，终点 b=357.5，共分 13 组，组距 ?? = 2. (3) 分组数据如下：序号分组频数 i
ν
yi = 频率 f i ×
ν 1 = i ?? 200
244
1 2 3 4 5 6 7 8 9 10 11 12 13
331.5~333.5 333.5~335.5 335.5~337.5 337.5~339.5 339.5~341.5 341.5~343.5 343.5~345.5 345.5~347.5 347.5~349.5 349.5~351.5 351.5~353.5 353.5~355.5 355.5~357.5
1 1 3 8 15 21 21 14 7 6 2 0 1
0.005 0.005 0.015 0.04 0.075 0.105 0.105 0.07 0.035 0.03 0.01 0 0.005
(4) 直方图如下：
直方图 y 0.12 0.1 0.08 0.06 0.04 0.02 0
5 331. 5 335. 5 339. 5 343. 5 347. 5 351. 5 355.
（克）
245