知识点概述

抽样检验是古典概型在工业质量控制和统计调查中的一个核心应用。它通过分析从总体中抽取的样本,来推断总体的某些性质(如次品率)。根据抽样方式的不同,主要分为“有放回抽样”和“不放回抽样”两种模型。

教材原文

(抽样检验)袋中有 r 个红球与 b 个黑球。现从中任取 n 个,试对有放回与不放回二方式分别求事件 E = { 取出的 n 个中恰含 k 个红球 } 的概率。

不放回情形 样本点是组合,总数 。再由乘法原理可得有利场合数 。故

放回情形 样本点是可重复的排列,样本点总数 。 … 用乘法原理知 。故有

详细解释

  • 问题模型: 将一批产品看作一个装有 r 个正品(红球)和 b 个次品(黑球)的袋子。从中抽取 n 个样本进行检验。

  • 不放回抽样 (Hypergeometric Distribution):

    • 场景: 每次抽出的样本不再放回总体中。这符合大多数实际的质检场景。
    • 模型: 样本点是组合,因为不放回,所以抽取的顺序不影响最终样本的构成。
    • 计算:
      • 总样本空间是从 r+b 个产品中抽取 n 个,共有 种组合。
      • “恰好抽到k个正品”意味着同时抽到了 n-k 个次品。有利场合数为从 r 个正品中选 k 个,再从 b 个次品中选 n-k 个,即
    • 此模型被称为超几何分布
  • 有放回抽样 (Binomial Distribution):

    • 场景: 每次抽出的样本记录后放回总体,再进行下一次抽取。在理论上,这保证了每次抽样的独立性和总体构成的不变性。
    • 模型: 样本点是可重复的排列。每次抽取都是一次独立的Bernoulli试验。
    • 计算:
      • 总样本空间是每次都有 r+b 种可能,共抽取 n 次,所以是
      • “恰好抽到k个正品”的有利场合数计算分为三步:1. 在n次抽取中选择k次为正品,有 种选法。2. 这k次都抽到正品,有 种方式。3. 另外n-k次都抽到次品,有 种方式。总数为
    • 此模型是二项分布

学习要点

  • 理解两种抽样方式的本质区别: 不放回抽样中,每次抽取的结果会影响下一次抽取的概率;有放回抽样中,每次抽取都是独立的。
  • 掌握对应的概率模型: 不放回抽样对应超几何分布,有放回抽样对应二项分布。
  • 近似关系: 当总体数量 N (即 r+b) 远大于样本数量 n 时,不放回抽样的结果可以由计算更简单的二项分布来近似。

实践应用

  • 产品质量检验: 工厂从一大批产品中抽取少量样本进行检测,根据样本中的次品数来决定是否接收或拒收整批产品。
  • 民意调查: 在社会调查中,从大量人群中抽取一部分进行问卷调查,以推断全体人群的意见分布。

关联知识点