常见分布

正太分布

XN(μ,σ2)

正态分布有两个参数,即期望(均数)μ和标准差σσ2为方差。

f(x)=1σ2πe(xμ)22σ2

μ=0,σ=1时,正态分布就成为标准正态分布

任何一个正态变量均可以通过标准化转化为标准正态变量,即若 XN(μ,σ2),则:

X=XμσN(0,1)

其中 X 为标准正态变量。

性质

常用性质:

XN(0,1)

Φ(a)=1Φ(a)
P(X>a)=1Φ(a)
P(a<x<b)=Φ(b)Φ(a)
P(|X|<c)=2Φ(c)1,(c0)

XN(μ,σ2)

P(Xc)=Φ(aμσ)
P(a<xb)=Φ(bμσ)Φ(aμσ)

其他的类似。

正态分布常用的 3σ 原则:

P(|Xμ|<kσ)=Φ(k)Φ(k)=2Φ(k)1={0.6826,k=1,0.9545,k=2,0.9973,k=3.

代码



import numpy as np          
import pandas as pd
import matplotlib.pyplot as plt

def normfunLine(mean,std):
    #normfun正态分布函数,mu: 均值,sigma:标准差,pdf:概率密度函数,np.exp():概率密度函数公式
    def normfun(x,mu, sigma):
        pdf = np.exp(-((x - mu)**2) / (2* sigma**2)) / (sigma * np.sqrt(2*np.pi))
        return pdf

    # x的范围为60-150,以1为单位,需x根据范围调试
    x = np.arange(60, 150,1)

    # x数对应的概率密度
    y = normfun(x, mean, std)

    # 参数,颜色,线宽
    plt.plot(x,y, color='g',linewidth = 1)


    plt.title('IQ distribution')
    plt.xlabel('IQ score')
    plt.ylabel('Probability')
    plt.show()

normfunLine(100,15)

二项式分

Xn重伯努利试验中成功的事件(记为 A )的次数,则 X=0,1,2,,n. X 服从二项分布。记 p 为事件 A 发生的概率, X 的分布列为:

P(X=k)=(nk)pk(1p)nk,k=0,1,,n.

Xb(n,p)

数学期望: np
方差:np(1p)

泊松分布(Poisson Distribution)

分布列:

P(X=k)=λkk!eλ,k=0,1,2,

XP(λ)。常与单位时间、单位面积、单位体积上的计数过程相联系。

数学期望: λ
方差: λ

超几何分布(Hypergeometric Distibution)

设有 NNN 件产品,其中有 MMM 件不合格品。若从中不放回地随机抽取 nnn 件,则其中含有的不合格品的件数 XXX 服从超几何分布,分布列为:

P(X=k)=(Mk)(NMnk)(Nn),k=0,1,,r

记为 Xh(n,N,M).其中 r=min{M,n},且 MN,nN.MN,nN. 均为正整数。

数学期望: nMN
方差: nM(NM)(Nn)N2(N1)

几何分布(Geometric Distribution)

在伯努利试验序列中,记每次试验中事件 A 发生的概率为 p ,如果 X 为事件 A首次出现时的试验次数,则 X=1,2,X 服从几何分布,分布列为:

P(X=k)=(1p)k1p,k=1,2,

记作 XGe(p)

应用举例:

  1. 某产品的不合格率为 0.05 ,首次查到不合格品的检查次数 XGe(0.05)
  2. 某射手的命中率为 0.8$0.8$0.8 ,首次命中的射击次数 XGe(0.8)
  3. 掷一颗骰子,首次出现六点的投掷次数 XGe(16)
  4. ……

数学期望: 1p
方差: 1pp2

均匀分布

若随机变量 X的密度函数为:

p(x)={1ba,a<x<b,0,.

X服从区间 (a,b)上的均匀分布,记作 XU(a,b) ,其分布函数:

F(x)={0,x<a,xaba,ax<b,1,xb.

均匀分布又称作平顶分布(因其概率密度为常值函数)。

数学期望: a+b2
方差: (ba)212

指数分布

若随机变量 的密度函数为:

p(x)={λeλx,x0.0,x<0.

则称 X服从参数为 λ 的指数分布,记作 XExp(λ)。指数分布的分布函数为:

F(x)={1eλx,x0, 0,x<0.

指数分布是一种偏态分布,指数分布随机变量只可能取非负实数。指数分布常被用作各种“寿命”分布,譬如电子元器件的寿命动物的寿命电话的通话时间随机服务系统中的服务时间等都可假定服从指数分布。指数分布在可靠性排队论中有着广泛的应用.。

数学期望: 1λ
方差: 1λ2

贝塔分布*

先给出贝塔函数:

B(a,b)=01xa1(1x)b1dx

其中参数 a>0,b>0 。贝塔函数具有以下性质:

  1. B(a,b)=B(b,a)

2.贝塔函数与伽玛函数有如下关系:

B(a,b)=Γ(a)Γ(b)Γ(a+b)

贝塔分布:

若随机变量 X 的密度函数为:

p(x)={Γ(a+b)Γ(a)Γ(b)xa1(1x)b1,0<x<1,0,.

则称 X服从贝塔分布,记作 XBe(a,b) ,其中 a>0,b>0 都是形状参数

数学期望: aa+b
方差: ab(a+b)2(a+b+1)