知识点概述

负二项分布(Negative Binomial Distribution),也称为帕斯卡分布(Pascal Distribution),是几何分布的推广。它描述的是,在一系列独立的、成功概率为 的伯努利试验中,为了取得第 次成功所需要的总试验次数 的概率分布。

教材原文

(教材在目录中提及,但具体定义和解释在所提供的文本片段中未详细展开。以下内容基于标准概率论定义。)

详细解释

  1. 模型与定义:

    • 负二项分布同样源于031-理论方法-Bernoulli试验与概型
    • 考虑一个无限系列的独立重复Bernoulli试验,每次试验成功的概率为 ()。
    • 定义随机变量 次成功出现时的总试验次数
    • 要使第 次试验恰好是第 次成功,必须满足两个条件:
      1. 试验中,必须恰好有 次成功(以及 次失败)。
      2. 次试验必须是成功的。
    • 根据032-理论方法-二项分布的知识,前一个条件发生的概率为
    • 后一个条件发生的概率为
    • 由于试验是独立的,将两部分概率相乘,得到 的概率质量函数 (PMF) 为:
    • 服从这种分布的随机变量,记为
  2. 参数:

    • 负二项分布由两个参数决定:
      • : 需要达成的成功总次数,是一个正整数。
      • : 单次试验成功的概率,是一个在 之间的实数。
  3. 与几何分布的关系:

    • 时,负二项分布就变成了033-理论方法-几何分布。即,为了取得第1次成功所需试验次数的分布就是几何分布。
    • ,这正是几何分布的PMF。
    • 因此,可以看作 个独立的、服从相同参数 的几何分布的随机变量之和,等于一个服从参数为 的负二项分布的随机变量。
  4. 名称来源:

    • 公式中的组合系数 可以用带有负数的二项式系数来表示,即 ,这与负二项式级数有关,故名“负二项分布”。

学习要点

  • 识别负二项分布的模型:独立重复试验,关心的是“达成第r次成功”的总时间。
  • 熟练掌握负二项分布的PMF公式,并理解其推导逻辑:将问题分解为“前k-1次试验中r-1次成功”和“第k次试验成功”两部分。
  • 理解负二项分布是几何分布的推广。
  • 注意 的取值从 开始,因为至少需要 次试验才能获得 次成功。

实践应用

  • 生产制造: 某条生产线需要生产出10件合格品才算完成一批次任务。如果每件产品合格的概率是0.9,那么完成这批次任务总共需要生产的产品数量 就服从 的负二项分布。例如,恰好生产第12件产品时完成任务的概率为
  • 篮球比赛: 一个球员需要投中5个罚球才能结束练习。如果他的罚球命中率是80%,那么他总共需要罚球的次数 服从
  • 招生工作: 一个大学招生办需要招满100名接受录取的学生。根据往年经验,发出一份录取通知后,学生接受的概率是60%。那么招生办需要发出的录取通知书总数 就服从

关联知识点