北京皮肤科医院在哪 http://www.jk100f.com/baidianfengzixun/jichuzhishi/yufangbaojian/7752.html
在现实世界中有两类现象:一种是确定性现象,另一种是随机性现象。所谓确定性现象是指在一定条件下可以完全预知结果的现象。例如,在标准大气压下,水℃会沸腾;在地球上,物体下落会遵循自由落体定律;在天体运行规律上,日月蚀的发生完全可以精确预测;等等。所谓随机性现象是指不能完全准确预知其结果的现象。例如,掷硬币出现正面还是反面?下期中奖彩票号码是多少?明日股市指数会是多少?车床生产的下颗螺钉直径精确值是多少?对于标准块规长度的下次精确测量结果是多少?这些全都是事先未知的,这就是随机现象。
我们在研究客观世界中的随机现象时,一定要有清醒的认识。那就是,在任何情况下,个别随机现象是绝对不可预测的。例如,有些人声称可以预测下次彩票的中奖号码等等,这是绝对不可能的。但大量随机现象将呈现明显的规律性。例如,假定生男生女的可能性相同,那么00个新生儿中,男孩将会是多少其数量的范围又如何等等。这些是可以预测的。概率论所研究的就是大量随机现象的规律性。
由于概率论是一门内容非常丰富、应用非常广泛的学科,我们不可能介绍它的所有方面,实际上小编将只介绍六西格玛管理所用到的有关基本内容。主要包括五部分:随机变量及其分布;随机变量的数字特征;常用的连续分布;常用的离散分布;中心极限定理。
1、随机变量的概念
在同一组条件下,对某事物或现象所进行的观察或实验叫随机试验(experiment),把观察或实验的结果叫随机事件(event)。例如,抛掷一枚质地均匀的骰子就是一次试验,骰子落地,可能出现1点、2点、…、6点,或为奇数点或为偶数点,点数大于5,等等,这些就是一个个事件。这些事件在一次试验中可能出现也可能不出现,我们称之为随机事件。
如果随机试验的每种结果可以用一个数字作为其代表,则我们称此变量为随机变量(randomvariable)。例如掷骰子试验中,骰子落地,将可能出现的点数作为考察的变量X,则X就是一个随机变量。此随机变量可以取的值仅限于1~6这六个正整数。在此范围内,随机变量究竟在一次试验中会出现哪一个值,在试验前是完全不能确定的。通常的随机变量都具有这种性质和特点,即事先可以肯定取值的范围,但不能肯定具体的取值是多少。同样,在掷两颗骰子试验中,我们可以定义所掷两颗骰子“点数和”为一个随机变量Y,它的取值范围就是2~12的这些整数,投掷之前不知道此随机变量取值是几。当然,你也可以定义所掷两颗骰子“点数差(绝对值)”作为另一个随机变量Z,那么它取值范围就将是0~5这六种结果。
概率论并不能确定一次试验下随机变量所取的值是多少,它所要研究的是随机变量所取之值的规律,即出现各种结果的可能性如何。例如,在掷骰子试验中,随机变量取1~6这六个整数的可能性全都相同,都是1/6。掷两颗骰子点数和的这个随机变量,取值范围是2~12的这些整数,但取这些值的可能性很不同,取值为7的可能远大于取值为2的可能。描述出现各种结果的可能性规律的就是分布律。
随机变量的取值有两种不同的类型:
第一种是离散型(discrete)随机变量。例如,检查一个产品是否合格,可能有“合格”及“不合格”两种结果,可以分别用0,1代表。例如,市场手机有A,B,C共三种,这里没有顺序可言,但可以分别以1,2,3代表。又如,车间产品分一等品、二等品及三等品;满意性分为“极不满”、“不满”、“尚可”、“满意”、“极满意”五等,这些是有顺序可言的。同样可以分别规定产品等级为1~3共三种,对于满意度可以规定为1~5共五类,等等。
另一种是连续型(continuous)随机变量。例如,自动车床生产的螺钉直径、长度,每台手机的发射功率,等等。这些随机变量的取值通常是某个实数区间,此区间可以是有限的,也可以是无限的。连续型随机变量的应用要比离散型随机变量广泛得多。
随机变量的两种数据类型不同,处理方法也不同。我们再看些例子。设X为某铸件上的缺陷点数,X可以取0,1,2,…可能值。因此,X是离散型随机变量。类似地,手机外壳透明显示框内包含的气泡数、布匹上的疵点数、车床一天内发生的故障次数、京津高速公路上的事故数等,都是取值为(0,1,2,3,…)的离散型随机变量。射击飞碟比赛,共发10枪,命中飞碟的次数也是离散型随机变量,但其取值域为(0,1,2,…,10)。
再比如,设X为某品牌手机电池的寿命(单位:小时),则X是在(0,oo)上取值的连续型随机变量。类似地,PCB板上焊锡膏涂层厚度、硝酸铵化肥反应罐每天的产量等,都是在(0,co)上取值的连续随机变量。
2、随机变量分布的概念
随机变量通常用大写字母X,Y,Z等表示,随机变量的取值常用小写字母x,y,z等表示。我们已经知道,随机变量可以分为两类:连续型随机变量和离散型随机变量。
为了描述随机变量的分布规律,我们对这两种类型分别讲述。
(1)离散型随机变量的分布律
对于离散型随机变量,我们可以将其所有可能的取值排列起来。例如,掷骰子试验中,将可能出现的点数这个随机变量记为X,则这就是一个离散型随机变量。此随机变量可以取的值x;是1~6这六个整数。由于取这六个数的概率全相等,都是1/6,因此分布律可以写成下列形式(见表2-1):
在掷2颗骰子的试验中,将可能出现的点数和这个随机变量记为Y,则此离散型随机变量可以取的值y是2~12这11个整数。由于取这11个数的概率不全相等,因此要把取每个不同值的概率分别写出,因此分布律可以写成下列形式(见表2-2):
一般说来,我们可以先将离散随机变量所有可能的取值,沿水平方向排成一行,在每个值的下方列出随机变量取此值的可能性,这个表就称为离散型随机变量的分布律。当然,这里所有的列出的概率一定是非负数,而且所有这些概率之和应恰好为1。
(2)连续型随机变量的分布
我们平时都有直方图的概念。例如,对收集到的名成年男子身高数据绘制出频率直方图,如图2-7所示。频率直方图可以清楚地显示出在不同取值处,取值可能性的大小状况,身高在cm~cm的人比别的身高人数要多很多。但要注意,这里画的只是频数直方图,它的纵坐标可能是频数,也可能是频率,观测值的个数发生变化,或区间的划分方法发生变化时,纵坐标就会发生变化。我们可以这样设想,当数据个数很多、组距很小、组数很多时,连接直方图中每个矩形上边中点的折线就接近一条光滑的曲线了,图2-7给出了这样的描述。
随着数据的不断增加,频率趋于稳定,频率的稳定值就是概率。如果要求整个曲线下方的面积恰好为1,则这条曲线就称为概率密度曲线,此密度函数就是概率密度函数(概率密度函数,pdf),如图2-8所示。
请注意比较一下,在图2-7与图2-8中,两条曲线形状完全相同,但二者的纵坐标是不相同的。图2-7中,纵坐标高度与观测值总个数及身高间隔的划分都有关系,但图2-8则不然,光滑曲线下方的面积固定为1,它的曲线高度与抽样人数及间隔的划分都无关。可是,对于概率密度曲线而言,它仍然与选用单位有关。例如,在图2-8中,身高的单位是厘米,其密度的最大值大约是0.07,如果我们把身高的单位换成米(厘米的倍),则其密度的最大值也要扩大倍,大约是7,如图2-9所示。也就是说,密度是有量纲的,它的量纲是1/[X]。
概率密度函数是描述连续随机变量分布的最重要和最基本的工具。概率密度函数应该有什么特点呢?如果p(x)是连续随机变量X的概率密度函数,则p(x)应该满足下列条件:
这就是说,概率密度函数曲线与横轴所围成的面积永远为1。
这就是说,随机变量落入[a,b]的概率就等于密度函数曲线在[a,b]上的积分。
其含义如图2-10所示。
这样一来,就看到概率密度函数的重要性。因为如果我们得到了概率密度函数,就可以直接求出随机变量落在任意一个范围内的概率。这一点在今后的统计计算中起了关键的作用。