You are on page 1of 11

专题 6 统计与概率

随着《普通高中数学课程标准(2017 年版)》地逐步实施,高考数学内容及形式的改
革也同步启动,如考查的内容与最新的科技成果、文学、艺术、美学,以及中华优秀传统
文化相结合等.其中,对概率与统计内容的考查被提升到较高的位置,如概率与统计的解
答题,原来被设置在主观题第二题的位置,2019 年被设置为高考数学全国卷Ⅰ理科的压轴
题.另外,在课标中,概率与统计属于加强内容,已被单独列为高中数学四大主题之一.
一、考纲要求
统计与概率是高中数学的重要内容.高考主要考查随机抽样、用样本估计总体、变量
的相关性、随机事件的概率、古典概型、几何概型、回归分析、独立性检验.其中,用样
本估计总体、古典概率的计算、应用回归分析与独立性检验思想方法解决简单实际问题的
能力是 考查的重点.试题强调应用性,以实际问题为背景,构建数学模型,突出考查统计
与概率的思想及考生的数据处理能力和应用意识.
二、知识精粹
1.二项式系数的性质
(1)各二项式系数之和① Cn0 + Cn1 + Cn2 + … + Cnk + … + Cnn = 2n.
② Cn0 + Cn2 + Cn4 + … = Cn1 + Cn3 + Cn5 + … = 2n-1.
(2)二项式系数的性质① Cnk = Cnn-k,Cnk + Cn+1k = Cn+1k+1.
② 二项式系数最值:中间一项或中间两项的二项式系数最大.
2.古典概型的两个特点:(1)有限性;(2)等可能性.

古典概型的计算(必须要用列举法、列表法、树状图的方法把所有基本事件表示出来,
不重复、不遗漏)
3.几何概型的特点及概率计算的关键
(1)特点:① 无限性;② 等可能性.
(2)计算概率的关键在于构成事件 A 的区域长度(面积或体积)的正确计算.
4.离散型随机变量数学期望、方差的性质.
(1)期望的性质① E(aX + b)= aE(X)+ b;② 若 X~B(n,p),则 E(X)=
np;
③ 若 X 服从两点分布,则 E(X)= p.
(2)方差的性质① D(aX + b)= a2 D(X);② 若 X~B(n,p),则 D(X)= n p(1-
p);③ 若 X 服从两点分布,则 D(X)= p(1-p).
5.平均数、方差、标准差
1 1
x= ( x1 + x 2 +⋯+ x n ) s2 = [(x 1 −x )2 +( x 2−x )2 +⋯( x n− x )2 ]
平均数: n 方差: n

标准差:
s=
√ 1
[( x −x )2 +( x 2 −x )2 +⋯( x n −x )2 ]
n 1 .

1
学科网(北京)股份有限公司
在残差分析中,相关指数 R2 越大,残差平方和越小,线性回归模型的拟合效果越好.
平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小
标准差、方差越大,数据的分散程度越大,越不稳定;标准差、方差越小,数据的分散程
度越小,越稳定.
6.频率分布直方图的关系(1)小长方形面积 = 组距× = 频率;
(2)所有小长方形面积的和 = 各组频率和 = 1.
7.线性回归方程
n n
∑ ( x i−x )( yi − y ) ∑ x i y i −n⋅x⋅y
^ i=1
b= i=1
n n

^y = b^ x+ a^ 称 为 线 性 回 归 方 程 , 其 中 ∑ ( x i−x )2 ∑ x 2i −n⋅x 2
方程 i=1 = i=1 ,
^
a^ = y− bx ,( x , y )称为样本点的中心.
n( ad−bc )2
K 2=
8.利用随机变量 (a+b)(b +c )(a+c )(b+d ) 来判断“两个分类变量有关系”的方
法称为独立性检验.K2 的观测值 k 越大,说明“两个分类变量有关系”的这种判断犯错误
的可能性越小.
三、概率统计问题求解思路
1.判断变量类型:根据已知数据和设问,判断变量个数(单变量,双变量)和变量类
型(离散、连续、数值、分类);
2.确定问题类型:根据变量类型确定分布或关系类型,并由统计图表的数据分布情况
确定离散型随机变量的分布类型;
3.提取有用信息:根据分布或关系模型中的变量或特征量,从统计表中选择恰当的数
据;
4.数据分析:对所选择的数据进行计算,求出概率模型(分布列,函数模型)或统计
模型(线性关系,回归模型,列二联表,k2 分布),并解答实际问题或给出检验结果.
概率统计题多以生产生活中的实际问题为背景,以样本的数字特征、随机事件的概率、
回归分析、独立性检验、离散型随机变量的分布列为载体,考查数据处理能力及应用意识.
其求解思路按照知识板块的不同大致分为以下几类:
1.古典概型
(1)求基本事件总数 m;(2)求事件 A 包含基本事件个数 n;
m
P( A )=
(3)代入公式 n 求概率;(4)检验基本事件是否等可能,且不重不漏.
2.几何概型
(1)第一步:求试验全部结果所构成区域长度(或面积或体积);
(2)第二步:求构成事件 A 的区域长度(或面积或体积);
A 的区域长度(面积或体积)
P( A )=
(3)第三步:代入公式 总的区域长度(面积或体积) 求概率.

2
学科网(北京)股份有限公司
3.离散型随机变量分布列
(1)写出随机变量可能取值;
(2)求出随机变量取每个值的概率(注意检验所有概率之和是否等于 1);
(3)写出分布列;(4)求数学期望,通过数学期望进行决策.
4.最小二乘法求两个线性变量的回归方程
(1)画散点图(若样本点大致分布在一条直线附近,则可判断两个变量具有线性相
关);

(2)准确计算 和 ;(3)列表计算 ;

(4)求 ,写出回归方程(运算结果保留小数位数应与题目要求).
5.两个分类变量是否有关的独立性检验
(1)用样本数据完成 2×2 列联表;
(2)计算卡方的观测值 k(处理分子的交叉相乘时应先提公因式,平方数写成乘积形
式再约分,最后除法运算保留三位小数);
(3)根据题设中的百分比找对应的经验值做比较观测值 k 与 k0;
(4)根据比较结果,把结论完整的表述出来,不能只是说有关或无关,下结论.
第一节 解答题
1.某食品厂为了检查一条自动包装流水线的生产情况,随即抽取
该流水线上 40 件产品作为样本算出他们的重量(单位:克)重量的分
组区间为(490,495 ],(495,500 ],…,(510,515 ],由此得到样
本的频率分布直方图,如图所示.
(1)根据频率分布直方图,求重量超过 505 克的产品数量;
(2)在上述抽取的 40 件产品中任取 2 件,设 X 为重量超过 505 克的产
品数量,求 X 的分布列及期望;
(3)在上述抽取的 40 件产品中任取 5 件产品,求恰有 2 件产品的重量超过 505 克的概率.

2.近年来,共享单车已经悄然进入了广大市民的日常生活,并慢慢改变了人们的出行方式.
为了更好地服务民众,某共享单车公司在其官方 APP 中设置了用户评价反馈系统,以了解
用户对车辆状况和优惠活动的评价,现从评价系统中选出 300 条较为详细的评价信息进行
统计,车辆状况和优惠活动评价的 2×2 列联表如下:

对优惠活动好 对优惠活动不
合计
评 满意

3
学科网(北京)股份有限公司
对车辆状况好评 150 50 200

对车辆状况不满 60 40 100

合计 210 90 300
(1)能否在犯错误的概率不超过 0.001 的前提下认为优惠活动好评与车辆状况好评之间有
关系?
(2)为了回馈用户,公司通过 APP 向用户随机派送每张的面额为 0 元,1 元,2 元的三种
骑行券,用户每次使用 APP 扫码用车后,都可获得一张骑行券,用户骑行一次获得 1 元券,
1 2
获得 2 元券的概率分别是
2 , 5 ,且各次获取骑行券的结果相互独立.若某用户一天使用
了两次该公司的共享单车,记该用户当天获得的骑行券面额之和为 X,求随机变量 X 的分
布列和数学期望.
附:下边的临界值表仅供参考:
P(K2≥k0 0.15 0.10 0.05 0.025 0.010

k0 2.072 2.706 3.841 5.024 6.635
2
n( ad−bc )
K 2=
(参考公式: (a+ b)(b +c )(a+c )(b+d ) ,其中 n = a + b + c + d)
说明:本题考查了 2×2 列联表、独立性检验、离散型随机变量的分布列与数学期望,
考查运用概率知识解决简单实际问题的能力.

3.某汽车美容公司为吸引顾客,推出优惠活动:对首次消费的顾客,按 200 元∕次收费,


并注册成为会员,对会员逐次消费给予相应优惠,标准如下:

消费次第 第1次 第2次 第3次 第4次 ≥5 次


收费比率 1 0.95 0.90 0.85 0.80
该公司注册的会员中没有消费超过 5 次的,从注册的会员中,随机抽取了 100 位进行
统计,得到统计数据如下:

消费次数 1次 2次 3次 4次 5次

4
学科网(北京)股份有限公司
人数 60 20 10 5 5
假设汽车美容一次,公司成本为 150 元,根据所给数据,解答下列问题:
(1)某会员仅消费两次,求这两次消费中,公司获得的平均利润;
(2)以事件发生的频率作为相应事件发生的概率,设该公司为一位会员服务的平均利
润为 X 元,求 X 的分布列和数学期望 E(X).
说明:本题考查了离散型随机变量的分布列与数学期望,考查运用概率知识解决简单
实际问题的能力、考查数据处理能力.

2
4.甲、乙两队进行一场排球比赛,根据以往经验,单局比赛甲队胜乙队的概率为
3 .本场
比赛采用五局三胜制,即先胜三局的队获胜,比赛结束.设各局比赛相互间没有影响且无
平局.求:
(1)前三局比赛甲队领先的概率;
(2)设本场比赛的局数为,求 的概率分布和数学期望.(用分数表示)

5.我国是世界上严重缺水的国家之一,为提倡节约用水,我市为了制定合理的节水方案,
对家庭用水情况进行了调查,通过抽样,获得了 2021 年 100 个家庭的月均用水量(单位:
t),将数据按照[ 0,2),[ 2,4),[ 4,6),[ 6,8),[ 8,10 ] 分成 5
组,制成了如图所示的频率分布直方图.
(1)求全市家庭月均用水量不低于 4 t 的频率;
(2)假设同组中的每个数据都用该组区间的中点值代替,求全市家庭
月均用水量平均数的估计值(精确到 0.01);
(3)求全市家庭月均用水量的 75%分位数的估计值(精确到 0.01).

5
学科网(北京)股份有限公司
8.某企业为了解某产品的销售情况,选择某个电商平台对该产品销售情况作调查.统计了
一年内的月销售数量(单位:万件),得到该电商平台月销售数量的茎叶图.
(1)求该电商平台在这一年内月销售该产品数量的中位数和平均数;
(2)该企业与电商签订销售合同时规定:如果电商平台当月的销售件数不
低于 40 万件,当月奖励该电商平台 10 万元;当月低于 40 万件没有奖励,用该样
本估计总体,从电商平台一个年度内高于该年月销售平均数的月份中任取两个月,
求这两个月企业发给电商平台的奖金为 20 万元的概率.
说明:本题考查了茎叶图中平均数、中位数的计算、考查了古典概型的概率.

9.为推进“千村百镇计划”,某新能源公司开展“电动莆田绿色出行”活动,首批投
放 200 台 P 型新能源车到莆田多个村镇,供当地村民免费试用三个月.试用到期后,为了
解男女试用者对 P 型新能源车性能的评价情况,该公司要求每位试用者填写一份性能综合
评分表(满分为 100 分).最后该公司共收回 600 份评分表,现从中随机抽取 40 份(其中
男、女的评分表各 20 份)作为样本,经统计得到如下茎叶图:

(1)求 40 个样本数据的中位数 m;

6
学科网(北京)股份有限公司
(2)已知 40 个样本数据的平均数 a = 80 ,记 m 与 a 的最大值为 M.该公司规定样本
中试用者的“认定类型”:评分不小于 M 的为“满意型”,评分小于 M 的为“需改进
型”.
① 请根据 40 个样本数据,完成下面 2×2 列联表:
认定类型
满意型 需改进型 合计
性别
女性 20
男性 20
合计 40
2 2
根据 × 列联表判断能否有 99% 的把握认为“认定类型”与性别有关?
② 为做好车辆改进工作,公司先从样本“需改进型”的试用者按性别用分层抽样的方
法,从中抽取 8 人进行回访,根据回访意见改进车辆后,再从这 8 人中随机抽取 3 人进行
二次试用,记这 3 人中男性人数为 X,求 X 的分布列及数学期望.
n( ad−bc )2
K 2=
附: (a+ b)(b +c )(a+c )(b+d ) ,其中 n = a + b + c + d)
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828

第二节 新情景题
10.希尔宾斯基三角形是一种分形,由波兰数学家希尔宾 斯基在 1915 年提出,先作一
个正三角形,挖去一个“中心三角形”(即以原三角形各边的中点为顶点的三角形),然
后在剩下的小三角形中又挖去一个“中心三角形”,我们用白色代表挖去的面积,那么黑
三角形为剩下的面积(我们称黑三角形为希尔宾斯基三角形).在如图第 3 个大正三角形
中随机取点,则落在黑色区域的概率为( )

A. B. C. D.

7
学科网(北京)股份有限公司
12.北京 2022 年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”一亮相,好评
不断,这是一次中国文化与奥林匹克精神的完美结合.为了宣传 2022 年北京冬奥会和冬残
奥会,某学校决定派小明和小李等 5 名志愿者将两个吉祥物安装在学校的体育广场,每人
参与且只参与一个吉祥物的安装,每个吉祥物都至少由两名志愿者安装.若小明和小李必
须安装不同的吉祥物,则不同的分配方案种数为( )
A.8 B.10 C.12 D.14
13.(多选)国家统计局官方网站 2021 年 2 月 28 日发布了《中华人民共和国 2020 年
国民经济和社会发展统计公报》,全面展示了一年来全国人民顽强奋斗取得的令世界瞩目
可载入史册的伟大成就.如图是 2016-2020 年国内生产总值及其增长速度统计图和三次产
业增加值占国内生产总值比重统计图.

给出下列说法:
A.从 2016 年至 2020 年国内生产总值逐年递增
B.从 2016 年至 2020 年国内生产总值增长速度逐年递减
C.从 2016 年至 2020 年第三产业增加值占国内生产总值比重逐年递增
D.从 2016 年至 2020 年第二产业增加值占国内生产总值比重逐年递减
其中正确的是( )

14.空气质量指数大小分为五级,指数越大说明污染的情况越严重,对人体危害越大.
指数范围在: [ 0 , 50 ] , [ 51 , 100 ] , [ 101 , 200 ] , [ 201 , 300 ] , [ 301 , 500 ] 分别对应
“优”、“良”、“轻度污染”、“中度污染”、“重度污染”五个等级,下面是某市连
续 14 天的空气质量指数变化趋势图,下列说法中正确的是( )

8
学科网(北京)股份有限公司
A.从 2 日到 5 日空气质量越来越好
B.这 14 天中空气质量指数的极差为 190
C.这 14 天中空气质量指数的中位数是 103.5
3
D.这 14 天中空气质量指数为“良”的频率为
14
15.我国著名数学家陈景润证明了“1 + 2”,即任意充分大的偶数都能表示为一个素
数与一个殆素数之和,其中殆素数指的是能分解成两个素数之积的数.现在 1 到 10 的自然
数中任取两个数,恰为一个素数与一个殆素数的概率为 .
16.费马大定理又称为“费马最后定理”,由 17 世纪法国数学家皮埃尔·德·费马提出,
他断言当 n>2 时,关于 x,y,z 的方程 xn + yn = zn 没有正整数解.他提出后,历经多人猜
想辩证,最终在 1994 年被英国数学家安德鲁·怀尔斯彻底证明.某同学对这个问题很感兴
趣,决定从 1,2,3,4,5,6 这 6 个自然数中随机选一个数字作为方
程 xn + yn = zn 中的指数 n,方程 xn + yn = zn 存在正整数解的概率为

17.中国北宋数学家贾宪早于西方 600 多年发现了贾宪三角(如
图所示),二项式(1 + x)7 展开式中的系数恰好对应于贾宪三角的
第八行,则该展开式中 x5 的系数为___________,所有项的系数和为_
_____.

18.某汽车美容公司为吸引顾客,推出优惠活动:对首次消费的顾客,按 200 元∕次


收费,并注册成为会员,对会员逐次消费给予相应优惠,标准如下:

消费次
第1次 第2次 第3次 第4次 ≥5 次

收费比 1 0.95 0.90 0.85 0.80

该公司注册的会员中没有消费超过 5 次的,从注册的会员中,随机抽取了 100 位进行
统计,得到统计数据如下:

消费次数 1次 2次 3次 4次 5次

人数 60 20 10 5 5
假设汽车美容一次,公司成本为 150 元,根据所给数据,解答下列问题:
(1)某会员仅消费两次,求这两次消费中,公司获得的平均利润;
(2)以事件发生的频率作为相应事件发生的概率,设该公司为一位会员服务的平均利
润为 X 元,求 X 的分布列和数学期望 E(X).

9
学科网(北京)股份有限公司
19.“移动支付、高铁、网购、共享单车”被称为中国的“新四大发明”.为 了帮助 50 岁
以上的中老年人更快地适应“移动支付”,某机构通过网络组织 50
岁以上的中老年人学习移动支付相关知识.学习结束后,每人都进
行限时答卷,得分都在 [ 50,100 ]内.在这些答卷(有大量答卷)中,
随机抽出 200 份,统计得分绘出频率分布直方图如图.
(1)求出图中 a 的值,并求样本中,答卷成绩在 [ 80 ,90)上
的人数;
(2)以样本的频率为概率,从参加这次答卷的人群中,随机抽取 4 名,记成绩在 80
分以上(含 80 分)的人数为 X,求 X 的分布列和期望.

10
学科网(北京)股份有限公司

You might also like