MAT2323 - Tổng hợp công thức xác suất
01/04/2025
7
Phút
Mục lục
Các công thức xác suất chung
Tổ hợp
Permutation
Số cách sắp xếp $ k $ đối tượng trong $ n $ đối tượng (không lặp lại):
\[P(n, k) = \frac{n!}{(n-k)!}\]
Combination
Số cách chọn $ k $ đối tượng từ $ n $ đối tượng (không quan tâm thứ tự):
\[C(n, k) = \frac{n!}{k!(n-k)!}\]
Xác suất cơ bản
\[P(A) = \frac{\text{Số TH thuận lợi cho A}}{\text{Tổng số TH có thể xảy ra}}\]
\[P(A \cup B) = P(A) + P(B) - P(A \cap B)\]
Xác suất toàn phần
\[P(A) = \sum^n_{i=1} P(A \cap A_i)\]
Xác suất có điều kiện
Gọi là xác suất của $ A $ khi biết $ B $ đã xảy ra (Probability of A given B):
\[P(A \mid B) = \frac{P(A \cap B)}{P(B)}\]
Đại lượng của một biến ngẫu nhiên
Kỳ vọng (Expectation)
Rời rạc:
\[E[X] = \sum_x x \cdot P(X=x)\]
Liên tục:
\[E[X] = \int_{-\infty}^{\infty} x \cdot f_X(x) dx\]
Phương sai (Variance)
Ký hiệu $ D[X] $, $ \sigma^2 $ hoặc $ \text{Var}(X) $.
Rời rạc:
\[D[X] = E[X^2] - (E[X])^2\]
Liên tục:
\[D[X] = \int_{-\infty}^{\infty} x^2 \cdot f_X(x) dx - \left( \int_{-\infty}^{\infty} x \cdot f_X(x) dx \right)^2\]
Độ lệch chuẩn (Standard Deviation)
\[\sigma(X) = \sqrt{\text{Var}(X)}\]
Median
Là giá trị $ m $ sao cho:
Rời rạc:
\[P(X \leq m) \geq 0.5 \quad ; \quad P(X \geq m) \geq 0.5\]
Liên tục:
\[F(m) = 0.5\]
Với $ F(m) $ là hàm CDF.
Mode
Rời rạc:
\[\text{arg}\max_{x \in \Omega} P(X=x)\]
Liên tục:
\[\text{arg}\max_{x \in \mathbb{R}} f(x)\]
Moment
Rời rạc:
\[E[X^n] = \sum_x x^n \cdot P(X = x)\]
Liên tục:
\[E[X^n] = \int_{-\infty}^{\infty} x^n \cdot f_X(x) dx\]
Hệ số nhọn (Skewness)
\[\text{Skew}(X) = \frac{E[(X - E[X])^3]}{(E[(X = E[X])^2])^{3/2}} = \frac{E[X^3] - 3E[X^2]E[X] + 2E[X]^3}{(\text{Var}(X))^{3/2}}\]
- $ \text{Skew}(X) > 0 $ thì phân phối lệch phải.
- $ \text{Skew}(X) < 0 $ thì phân phối lệch trái.
- $ \text{Skew}(X) = 0 $ thì phân phối đối xứng.
Hệ số bất đối xứng (Kurtosis)
Để tính dễ hơn thì ta thường phân tích theo hằng đẳng thức rồi lấy kì vọng 2 vế.
\[\text{Kur}(X) = \frac{E[(X - E[X])^4]}{(E[(X-E[X])^2])^2}\]
- $ \text{Kur}(X) - 3 > 0 $ thì phân phối có đỉnh cao, đuôi dài.
- $ \text{Kur}(X) - 3 < 0 $ thì phân phối có đỉnh thấp, đuôi ngắn.
- $ \text{Kur}(X) - 3 = 0 $ thì đó là phân phối chuẩn.
Ghi chú:
Việc lấy kì vọng 2 vế là khả thi và được thực hiện với tính chất:
\[E[aX + bY] = aE[X] + bE[Y]\]
Đại lượng của hai biến ngẫu nhiên
Hiệp phương sai (Covariance)
\[\text{cov} (X,Y) = E[(X-E[X])(Y-E[Y])] = E[XY] - E[X]E[Y]\]
- Nếu $cov(X, Y) > 0$, $X$ và $Y$ có xu hướng thay đổi cùng chiều.
- Nếu $cov(X, Y) < 0$, $X$ và $Y$ có xu hướng thay đổi ngược chiều.
- Nếu $cov(X, Y) = 0$, không có mối quan hệ tuyến tính giữa $X$ và $Y$.
Hệ số tương quan (Correlation)
\[\rho(X, Y) = \frac{cov(X, Y)}{\sigma_X \sigma_Y}\]
- $\rho(X, Y) = 1$: Mối quan hệ tuyến tính hoàn hảo, cùng chiều.
- $\rho(X, Y) = -1$: Mối quan hệ tuyến tính hoàn hảo, ngược chiều.
- $\rho(X, Y) = 0$: Không có mối quan hệ tuyến tính giữa $X$ và $Y$.
Bảng công thức phân bố xác suất
Phân bố | PMF/PDF | CDF |
---|---|---|
Nhị thức | \(P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \, k = 0, 1, \dots, n\) | \(F(x) = \sum_{k=0}^{\lfloor x \rfloor} \binom{n}{k} p^k (1 - p)^{n - k}\) |
Hình học | \(P(X = k) = (1 - p)^{k - 1} p, \, k = 1, 2, 3, \dots\) | \(F(x) = 1 - (1 - p)^x, \, x \geq 1\) |
Mũ | \(f(x) = \lambda e^{-\lambda x}, \, x \geq 0\) | \(F(x) = 1 - e^{-\lambda x}, \, x \geq 0\) |
Poisson | \(P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \, k = 0, 1, 2, \dots\) | \(F(x) = \sum_{k=0}^{\lfloor x \rfloor} \frac{\lambda^k e^{-\lambda}}{k!}\) |
Đều | \(f(x) = \frac{1}{b - a}, \, a \leq x \leq b\) | \(F(x) = \frac{x - a}{b - a}, \, a \leq x \leq b\) |
Chuẩn | \(f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}}\) | \(F(x) = \Phi\left( \frac{x - \mu}{\sigma} \right)\) |
Phân bố | Kỳ vọng (E[X]) | Phương sai (Var(X)) | Lệch chuẩn (SD(X)) |
---|---|---|---|
Nhị thức (Binomial) | \(E[X] = n \cdot p\) | \(\text{Var}(X) = n \cdot p \cdot (1 - p)\) | \(\sigma = \sqrt{n \cdot p \cdot (1 - p)}\) |
Hình học (Geometric) | \(E[X] = \frac{1}{p}\) | \(\text{Var}(X) = \frac{1 - p}{p^2}\) | \(\sigma = \sqrt{\frac{1 - p}{p^2}}\) |
Mũ (Exponential) | \(E[X] = \frac{1}{\lambda}\) | \(\text{Var}(X) = \frac{1}{\lambda^2}\) | \(\sigma = \frac{1}{\lambda}\) |
Poisson | \(E[X] = \lambda\) | \(\text{Var}(X) = \lambda\) | \(\sigma = \sqrt{\lambda}\) |
Đều (Uniform) | \(E[X] = \frac{a + b}{2}\) | \(\text{Var}(X) = \frac{(b - a)^2}{12}\) | \(\sigma = \frac{b - a}{\sqrt{12}}\) |
Chuẩn (Normal) | \(E[X] = \mu\) | \(\text{Var}(X) = \sigma^2\) | \(\sigma\) |
Các phân bố và ứng dụng:
- Phân bố nhị thức: Dùng khi xét số lần thành công trong các thử nghiệm độc lập với xác suất thành công $ p $.
- Phân bố hình học: Dùng khi xét số lần thử nghiệm cho đến khi có lần đầu tiên thành công.
- Phân bố mũ: Thường dùng trong các tình huống mô tả thời gian hoặc khoảng cách giữa các sự kiện trong một quá trình Poisson.
- Phân bố Poisson: Dùng khi mô tả số lần xảy ra sự kiện trong một khoảng thời gian hoặc không gian cố định, với tỷ lệ xảy ra sự kiện cố định.
- Phân bố đều: Dùng khi các giá trị của biến ngẫu nhiên có xác suất như nhau trên một khoảng nhất định.
- Phân bố chuẩn: Một phân bố đặc biệt quan trọng, mô tả nhiều hiện tượng trong thực tế, đặc biệt khi có số lượng mẫu lớn hoặc khi các sự kiện là kết quả của nhiều yếu tố độc lập.
Ghi chú
Công thức | Ý nghĩa | Khi nào dùng? |
---|---|---|
$f_T(t) = \lambda e^{-\lambda t}$ | Xác suất xảy ra ngay tại $t$ (PDF) | Tính xác suất vi phân tại một điểm |
$F_T(t) = 1 - e^{-\lambda t}$ | Xác suất xảy ra trước hoặc bằng $t$ (CDF) | Khi cần tổng xác suất đến $t$ |
$P(T > t) = e^{-\lambda t}$ | Xác suất chưa xảy ra sau $t$ (Hàm sống sót) | Khi xét “sự kiện vẫn chưa xảy ra” |
Phân bố | Công thức chính | Ý nghĩa của $\lambda$ | Diễn giải thời gian/không gian |
---|---|---|---|
Phân bố Mũ | $f_T(t) = \lambda e^{-\lambda t}$ | Tốc độ xảy ra sự kiện tức thời | Nếu $\lambda = 0.2$, sự kiện trung bình xảy ra sau $1/\lambda = 5$ đơn vị thời gian |
Phân bố Poisson | $P(N=k) = \frac{(\lambda t)^k e^{-\lambda t}}{k!}$ | Số sự kiện trung bình trong một khoảng | Nếu $\lambda = 3$ sự kiện/giờ, thì trung bình có 3 sự kiện mỗi giờ |
Quá trình Poisson | $P(N(t)=k) = \frac{(\lambda t)^k e^{-\lambda t}}{k!}$ | Sự kiện đến ngẫu nhiên theo tốc độ trung bình $\lambda$ | Nếu $\lambda = 10$ cuộc gọi/phút, thì mỗi phút có trung bình 10 cuộc gọi |