知识点概述
负二项分布(Negative Binomial Distribution),也称为帕斯卡分布(Pascal Distribution),是几何分布的推广。它描述的是,在一系列独立的、成功概率为 的伯努利试验中,为了取得第 次成功所需要的总试验次数 的概率分布。
教材原文
(教材在目录中提及,但具体定义和解释在所提供的文本片段中未详细展开。以下内容基于标准概率论定义。)
详细解释
-
模型与定义:
- 负二项分布同样源于031-理论方法-Bernoulli试验与概型。
- 考虑一个无限系列的独立重复Bernoulli试验,每次试验成功的概率为 ()。
- 定义随机变量 为第 次成功出现时的总试验次数。
- 要使第 次试验恰好是第 次成功,必须满足两个条件:
- 在前 次试验中,必须恰好有 次成功(以及 次失败)。
- 第 次试验必须是成功的。
- 根据032-理论方法-二项分布的知识,前一个条件发生的概率为 。
- 后一个条件发生的概率为 。
- 由于试验是独立的,将两部分概率相乘,得到 的概率质量函数 (PMF) 为:
- 服从这种分布的随机变量,记为 。
-
参数:
- 负二项分布由两个参数决定:
- : 需要达成的成功总次数,是一个正整数。
- : 单次试验成功的概率,是一个在 之间的实数。
- 负二项分布由两个参数决定:
-
与几何分布的关系:
- 当 时,负二项分布就变成了033-理论方法-几何分布。即,为了取得第1次成功所需试验次数的分布就是几何分布。
- ,这正是几何分布的PMF。
- 因此,可以看作 个独立的、服从相同参数 的几何分布的随机变量之和,等于一个服从参数为 的负二项分布的随机变量。
-
名称来源:
- 公式中的组合系数 可以用带有负数的二项式系数来表示,即 ,这与负二项式级数有关,故名“负二项分布”。
学习要点
- 识别负二项分布的模型:独立重复试验,关心的是“达成第r次成功”的总时间。
- 熟练掌握负二项分布的PMF公式,并理解其推导逻辑:将问题分解为“前k-1次试验中r-1次成功”和“第k次试验成功”两部分。
- 理解负二项分布是几何分布的推广。
- 注意 的取值从 开始,因为至少需要 次试验才能获得 次成功。
实践应用
- 生产制造: 某条生产线需要生产出10件合格品才算完成一批次任务。如果每件产品合格的概率是0.9,那么完成这批次任务总共需要生产的产品数量 就服从 的负二项分布。例如,恰好生产第12件产品时完成任务的概率为 。
- 篮球比赛: 一个球员需要投中5个罚球才能结束练习。如果他的罚球命中率是80%,那么他总共需要罚球的次数 服从 。
- 招生工作: 一个大学招生办需要招满100名接受录取的学生。根据往年经验,发出一份录取通知后,学生接受的概率是60%。那么招生办需要发出的录取通知书总数 就服从 。
关联知识点
- 前置知识:
- 后续知识:
- 061-技术实现-常见分布的数学期望 (负二项分布的期望为 )