MAT2323 - Xác suất - Thống kê - Ôn tập (Chương 3)
Sách: Mở đầu về lí thuyết Xác suất và Các ứng dụng
Tác giả: Đặng Hùng Thắng
Mục lục
Chương III: Đại lượng ngẫu nhiên liên tục
Gọi ĐLNN $ X $ là liên tục nếu như:
- Tập hợp các giá trị của $ X $ lấp một khoảng của trục số hoặc lấy cả trục số đó.
- Với mọi số $ a $, $ P(X=a) = 0 $.
Bài 1: Hàm mật độ xác suất và hàm phân bố xác suất (tr. 78)
Hàm mật độ xác suất
Ta chỉ quan tâm tới xác suất $ X $ nhận một giá trị trong một khoảng $(a, b)$ nào đó chứ không quan tâm tới xác suất $ X $ nhận một giá trị cụ thể như với ĐLNN rời rạc.
Phân bố xác suất của $ X $ được xác định bởi một hàm $ f(x) $ được gọi là hàm mật độ xác suất. Trong đó:
\[(i) \quad f(x) \geq 0, \forall x \in \mathbb{R} \\[7pt] (ii) \quad \int_{-\infty}^{\infty} f(x) dx = 1 \\[7pt] (iii) \quad \text{Với mọi } a < b \text{, ta có:} \\[7pt] P(a < X < b) = P(a \leq X \leq b) = \int_a^b f(x)dx\]
Hàm phân bố xác suất
Hàm phân bố xác suất của $ X $ được xác định với mọi số thực $ x $:
\[F(x) = P(X < x)\]
Hàm phân bố $ F(x) $ có các tính chất:
- $ 0 \leq F(x) \leq 1 $.
- $ F(x) $ là một hàm không giảm ($ x_1 < x_2 \rightarrow F(x_1) \leq F(x_2) $).
- $ F(x) $ là một hàm liên tục.
- $ \lim\limits_{x \to +\infty} F(x) = 1, \quad \lim\limits_{x \to -\infty} F(x) = 0 $.
- $ f(x) = F’(x) $ và $ F(x) = \int_{-\infty}^x f(t)dt $.
Bài 2: Kì vọng, phương sai, Mod và Median. Các đặc trưng khác của ĐLNN (tr. 83)
Ta xét các tham số đặc trưng của một ĐLNN liên tục:
1. Kỳ vọng (Expectation) $E(X)$:
Kỳ vọng của một biến ngẫu nhiên liên tục $ X $ là giá trị trung bình lý thuyết mà ta mong đợi từ $ X $.
- Với biến ngẫu nhiên liên tục có hàm mật độ xác suất $ f(x) $:
\(E(X) = \int_{-\infty}^{\infty} x f(x) dx\)
Kỳ vọng giúp xác định giá trị trung tâm của phân phối.
Ví dụ: Nếu $ X \sim \text{Uniform}(a, b) $, ta có:
\(E(X) = \int_{a}^{b} x \cdot \frac{1}{b-a} dx = \frac{a + b}{2}.\)
2. Mode (Chế độ - Giá trị xuất hiện nhiều nhất):
Mode của một phân phối xác suất là giá trị mà hàm mật độ xác suất đạt cực đại.
- Mode là điểm $ x $ sao cho:
\(f(x) \geq f(y) \quad \forall y \in \mathbb{R}.\)
Ví dụ: Nếu $ X \sim \mathcal{N}(\mu, \sigma^2) $, thì mode chính là giá trị kỳ vọng $ \mu $ vì hàm mật độ đạt cực đại tại $ x = \mu $.
3. Phương sai (Variance) $ \text{Var}(X) $:
Phương sai đo lường mức độ phân tán của dữ liệu quanh giá trị kỳ vọng.
- Định nghĩa:
\(\text{Var}(X) = E[(X - E(X))^2]\) - Công thức triển khai: \(\text{Var}(X) = E(X^2) - [E(X)]^2.\)
Nếu $ \text{Var}(X) $ lớn → dữ liệu phân tán rộng.
Nếu $ \text{Var}(X) $ nhỏ → dữ liệu tập trung quanh trung bình.
Ví dụ: Nếu $ X \sim \text{Uniform}(a, b) $, ta có: \(E(X^2) = \int_{a}^{b} x^2 \cdot \frac{1}{b-a} dx = \frac{a^2 + ab + b^2}{3}.\) \(\text{Var}(X) = \frac{(b-a)^2}{12}.\)
4. Moment (Momen thống kê):
Moment giúp mô tả hình dạng phân bố xác suất.
- Moment cấp $ k $ quanh gốc:
\(E(X^k)\) - Moment cấp $ k $ quanh giá trị kỳ vọng:
\(E[(X - E(X))^k]\)
Các moment quan trọng:
- Moment cấp 1: $ E(X) $ (kỳ vọng).
- Moment cấp 2: $ E[(X - E(X))^2] = \text{Var}(X) $ (phương sai).
- Moment cấp 3, 4 dùng để tính hệ số bất đối xứng và hệ số nhọn.
5. Hệ số bất đối xứng (Skewness) $ S $:
Hệ số bất đối xứng đo lường mức độ lệch của phân phối so với trung tâm.
\[S = \frac{E[(X - E(X))^3]}{\text{Var}(X)^{3/2}}\]- $ S = 0 $: Phân phối đối xứng.
- $ S > 0 $: Phân phối lệch phải (đuôi phải dài hơn).
- $ S < 0 $: Phân phối lệch trái (đuôi trái dài hơn).
Ví dụ:
- Phân phối chuẩn có skewness bằng 0.
- Phân phối chi bình phương có skewness dương.
6. Hệ số nhọn (Kurtosis) $ K $:
Hệ số nhọn đo độ bẹt hay nhọn của phân phối so với phân phối chuẩn.
\[K = \frac{E[(X - E(X))^4]}{\text{Var}(X)^2}\]- $ K = 3 $: Phân phối chuẩn.
- $ K > 3 $: Phân phối nhọn hơn chuẩn (leptokurtic - có đỉnh cao và đuôi dài).
- $ K < 3 $: Phân phối bẹt hơn chuẩn (platykurtic - có đỉnh thấp và đuôi ngắn).
Ví dụ:
- Phân phối chuẩn có $ K = 3 $.
- Phân phối t-Student có kurtosis lớn hơn 3 nếu bậc tự do thấp.
- Phân phối đồng nhất có kurtosis nhỏ hơn 3 do có đỉnh phẳng.
Bài 3: Hàm của một ĐLNN (tr. 88)
(Phụ thuộc vào bài tập)
Bài 4: Phân bố chuẩn (tr. 82)
(Phụ thuộc vào bài tập)
Bài 5: Phân bố mũ (tr. 96)
(Phụ thuộc vào bài tập)
Bài 6: Phân bố đều (tr. 98)
(Phụ thuộc vào bài tập)