Mục lục

Block

Các công thức xác suất chung

Tổ hợp

Permutation

Số cách sắp xếp $ k $ đối tượng trong $ n $ đối tượng (không lặp lại):

P(n,k)=n!(nk)!P(n, k) = \frac{n!}{(n-k)!}
Block
Combination

Số cách chọn $ k $ đối tượng từ $ n $ đối tượng (không quan tâm thứ tự):

C(n,k)=n!k!(nk)!C(n, k) = \frac{n!}{k!(n-k)!}
Block

Xác suất cơ bản

P(A)=Soˆˊ TH thuận lợi cho ATổng soˆˊ TH coˊ thể xảy raP(A) = \frac{\text{Số TH thuận lợi cho A}}{\text{Tổng số TH có thể xảy ra}}
Block
P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B)
Block

Xác suất toàn phần

P(A)=i=1nP(AAi)P(A) = \sum^n_{i=1} P(A \cap A_i)
Block

Xác suất có điều kiện

Gọi là xác suất của $ A $ khi biết $ B $ đã xảy ra (Probability of A given B):

P(AB)=P(AB)P(B)P(A \mid B) = \frac{P(A \cap B)}{P(B)}
Block

Đại lượng của một biến ngẫu nhiên

Kỳ vọng (Expectation)

Rời rạc:
E[X]=xxP(X=x)E[X] = \sum_x x \cdot P(X=x)
Block
Liên tục:
E[X]=xfX(x)dxE[X] = \int_{-\infty}^{\infty} x \cdot f_X(x) dx
Block

Phương sai (Variance)

Ký hiệu $ D[X] $, $ \sigma^2 $ hoặc $ \text{Var}(X) $.

Rời rạc:
D[X]=E[X2](E[X])2D[X] = E[X^2] - (E[X])^2
Block
Liên tục:
D[X]=x2fX(x)dx(xfX(x)dx)2D[X] = \int_{-\infty}^{\infty} x^2 \cdot f_X(x) dx - \left( \int_{-\infty}^{\infty} x \cdot f_X(x) dx \right)^2
Block

Độ lệch chuẩn (Standard Deviation)

σ(X)=Var(X)\sigma(X) = \sqrt{\text{Var}(X)}
Block

Median

Là giá trị $ m $ sao cho:

Rời rạc:
P(Xm)0.5;P(Xm)0.5P(X \leq m) \geq 0.5 \quad ; \quad P(X \geq m) \geq 0.5
Block
Liên tục:
F(m)=0.5F(m) = 0.5
Block

Với $ F(m) $ là hàm CDF.

Mode

Rời rạc:
argmaxxΩP(X=x)\text{arg}\max_{x \in \Omega} P(X=x)
Block
Liên tục:
argmaxxRf(x)\text{arg}\max_{x \in \mathbb{R}} f(x)
Block

Moment

Rời rạc:
E[Xn]=xxnP(X=x)E[X^n] = \sum_x x^n \cdot P(X = x)
Block
Liên tục:
E[Xn]=xnfX(x)dxE[X^n] = \int_{-\infty}^{\infty} x^n \cdot f_X(x) dx
Block

Hệ số nhọn (Skewness)

Skew(X)=E[(XE[X])3](E[(X=E[X])2])3/2=E[X3]3E[X2]E[X]+2E[X]3(Var(X))3/2\text{Skew}(X) = \frac{E[(X - E[X])^3]}{(E[(X = E[X])^2])^{3/2}} = \frac{E[X^3] - 3E[X^2]E[X] + 2E[X]^3}{(\text{Var}(X))^{3/2}}
Block
  • $ \text{Skew}(X) > 0 $ thì phân phối lệch phải.
  • $ \text{Skew}(X) < 0 $ thì phân phối lệch trái.
  • $ \text{Skew}(X) = 0 $ thì phân phối đối xứng.

Hệ số bất đối xứng (Kurtosis)

Để tính dễ hơn thì ta thường phân tích theo hằng đẳng thức rồi lấy kì vọng 2 vế.

Kur(X)=E[(XE[X])4](E[(XE[X])2])2\text{Kur}(X) = \frac{E[(X - E[X])^4]}{(E[(X-E[X])^2])^2}
Block
  • $ \text{Kur}(X) - 3 > 0 $ thì phân phối có đỉnh cao, đuôi dài.
  • $ \text{Kur}(X) - 3 < 0 $ thì phân phối có đỉnh thấp, đuôi ngắn.
  • $ \text{Kur}(X) - 3 = 0 $ thì đó là phân phối chuẩn.
Ghi chú:

Việc lấy kì vọng 2 vế là khả thi và được thực hiện với tính chất:

E[aX+bY]=aE[X]+bE[Y]E[aX + bY] = aE[X] + bE[Y]
Block

Đại lượng của hai biến ngẫu nhiên

Hiệp phương sai (Covariance)

cov(X,Y)=E[(XE[X])(YE[Y])]=E[XY]E[X]E[Y]\text{cov} (X,Y) = E[(X-E[X])(Y-E[Y])] = E[XY] - E[X]E[Y]
Block
  • Nếu $cov(X, Y) > 0$, $X$ và $Y$ có xu hướng thay đổi cùng chiều.
  • Nếu $cov(X, Y) < 0$, $X$ và $Y$ có xu hướng thay đổi ngược chiều.
  • Nếu $cov(X, Y) = 0$, không có mối quan hệ tuyến tính giữa $X$ và $Y$.

Hệ số tương quan (Correlation)

ρ(X,Y)=cov(X,Y)σXσY\rho(X, Y) = \frac{cov(X, Y)}{\sigma_X \sigma_Y}
Block
  • $\rho(X, Y) = 1$: Mối quan hệ tuyến tính hoàn hảo, cùng chiều.
  • $\rho(X, Y) = -1$: Mối quan hệ tuyến tính hoàn hảo, ngược chiều.
  • $\rho(X, Y) = 0$: Không có mối quan hệ tuyến tính giữa $X$ và $Y$.

Bảng công thức phân bố xác suất

Phân bố PMF/PDF CDF
Nhị thức P(X=k)=(nk)pk(1p)nk,k=0,1,,nP(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \, k = 0, 1, \dots, n F(x)=k=0x(nk)pk(1p)nkF(x) = \sum_{k=0}^{\lfloor x \rfloor} \binom{n}{k} p^k (1 - p)^{n - k}
Hình học P(X=k)=(1p)k1p,k=1,2,3,P(X = k) = (1 - p)^{k - 1} p, \, k = 1, 2, 3, \dots F(x)=1(1p)x,x1F(x) = 1 - (1 - p)^x, \, x \geq 1
f(x)=λeλx,x0f(x) = \lambda e^{-\lambda x}, \, x \geq 0 F(x)=1eλx,x0F(x) = 1 - e^{-\lambda x}, \, x \geq 0
Poisson P(X=k)=λkeλk!,k=0,1,2,P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \, k = 0, 1, 2, \dots F(x)=k=0xλkeλk!F(x) = \sum_{k=0}^{\lfloor x \rfloor} \frac{\lambda^k e^{-\lambda}}{k!}
Đều f(x)=1ba,axbf(x) = \frac{1}{b - a}, \, a \leq x \leq b F(x)=xaba,axbF(x) = \frac{x - a}{b - a}, \, a \leq x \leq b
Chuẩn f(x)=12πσ2e(xμ)22σ2f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} F(x)=Φ(xμσ)F(x) = \Phi\left( \frac{x - \mu}{\sigma} \right)
Phân bố Kỳ vọng (E[X]) Phương sai (Var(X)) Lệch chuẩn (SD(X))
Nhị thức (Binomial) E[X]=npE[X] = n \cdot p Var(X)=np(1p)\text{Var}(X) = n \cdot p \cdot (1 - p) σ=np(1p)\sigma = \sqrt{n \cdot p \cdot (1 - p)}
Hình học (Geometric) E[X]=1pE[X] = \frac{1}{p} Var(X)=1pp2\text{Var}(X) = \frac{1 - p}{p^2} σ=1pp2\sigma = \sqrt{\frac{1 - p}{p^2}}
Mũ (Exponential) E[X]=1λE[X] = \frac{1}{\lambda} Var(X)=1λ2\text{Var}(X) = \frac{1}{\lambda^2} σ=1λ\sigma = \frac{1}{\lambda}
Poisson E[X]=λE[X] = \lambda Var(X)=λ\text{Var}(X) = \lambda σ=λ\sigma = \sqrt{\lambda}
Đều (Uniform) E[X]=a+b2E[X] = \frac{a + b}{2} Var(X)=(ba)212\text{Var}(X) = \frac{(b - a)^2}{12} σ=ba12\sigma = \frac{b - a}{\sqrt{12}}
Chuẩn (Normal) E[X]=μE[X] = \mu Var(X)=σ2\text{Var}(X) = \sigma^2 σ\sigma

Các phân bố và ứng dụng:
  1. Phân bố nhị thức: Dùng khi xét số lần thành công trong các thử nghiệm độc lập với xác suất thành công $ p $.
  2. Phân bố hình học: Dùng khi xét số lần thử nghiệm cho đến khi có lần đầu tiên thành công.
  3. Phân bố mũ: Thường dùng trong các tình huống mô tả thời gian hoặc khoảng cách giữa các sự kiện trong một quá trình Poisson.
  4. Phân bố Poisson: Dùng khi mô tả số lần xảy ra sự kiện trong một khoảng thời gian hoặc không gian cố định, với tỷ lệ xảy ra sự kiện cố định.
  5. Phân bố đều: Dùng khi các giá trị của biến ngẫu nhiên có xác suất như nhau trên một khoảng nhất định.
  6. Phân bố chuẩn: Một phân bố đặc biệt quan trọng, mô tả nhiều hiện tượng trong thực tế, đặc biệt khi có số lượng mẫu lớn hoặc khi các sự kiện là kết quả của nhiều yếu tố độc lập.
Ghi chú
Công thức Ý nghĩa Khi nào dùng?
$f_T(t) = \lambda e^{-\lambda t}$ Xác suất xảy ra ngay tại $t$ (PDF) Tính xác suất vi phân tại một điểm
$F_T(t) = 1 - e^{-\lambda t}$ Xác suất xảy ra trước hoặc bằng $t$ (CDF) Khi cần tổng xác suất đến $t$
$P(T > t) = e^{-\lambda t}$ Xác suất chưa xảy ra sau $t$ (Hàm sống sót) Khi xét “sự kiện vẫn chưa xảy ra”
Phân bố Công thức chính Ý nghĩa của $\lambda$ Diễn giải thời gian/không gian
Phân bố Mũ $f_T(t) = \lambda e^{-\lambda t}$ Tốc độ xảy ra sự kiện tức thời Nếu $\lambda = 0.2$, sự kiện trung bình xảy ra sau $1/\lambda = 5$ đơn vị thời gian
Phân bố Poisson $P(N=k) = \frac{(\lambda t)^k e^{-\lambda t}}{k!}$ Số sự kiện trung bình trong một khoảng Nếu $\lambda = 3$ sự kiện/giờ, thì trung bình có 3 sự kiện mỗi giờ
Quá trình Poisson $P(N(t)=k) = \frac{(\lambda t)^k e^{-\lambda t}}{k!}$ Sự kiện đến ngẫu nhiên theo tốc độ trung bình $\lambda$ Nếu $\lambda = 10$ cuộc gọi/phút, thì mỗi phút có trung bình 10 cuộc gọi