Sách: Mở đầu về lí thuyết Xác suất và Các ứng dụng

Tác giả: Đặng Hùng Thắng


Mục lục


Chương III: Đại lượng ngẫu nhiên liên tục

Gọi ĐLNN $ X $ là liên tục nếu như:

  • Tập hợp các giá trị của $ X $ lấp một khoảng của trục số hoặc lấy cả trục số đó.
  • Với mọi số $ a $, $ P(X=a) = 0 $.

Bài 1: Hàm mật độ xác suất và hàm phân bố xác suất (tr. 78)

Hàm mật độ xác suất

Ta chỉ quan tâm tới xác suất $ X $ nhận một giá trị trong một khoảng $(a, b)$ nào đó chứ không quan tâm tới xác suất $ X $ nhận một giá trị cụ thể như với ĐLNN rời rạc.

Phân bố xác suất của $ X $ được xác định bởi một hàm $ f(x) $ được gọi là hàm mật độ xác suất. Trong đó:

\[(i) \quad f(x) \geq 0, \forall x \in \mathbb{R} \\[7pt] (ii) \quad \int_{-\infty}^{\infty} f(x) dx = 1 \\[7pt] (iii) \quad \text{Với mọi } a < b \text{, ta có:} \\[7pt] P(a < X < b) = P(a \leq X \leq b) = \int_a^b f(x)dx\]
Hàm phân bố xác suất

Hàm phân bố xác suất của $ X $ được xác định với mọi số thực $ x $:

\[F(x) = P(X < x)\]

Hàm phân bố $ F(x) $ có các tính chất:

  • $ 0 \leq F(x) \leq 1 $.
  • $ F(x) $ là một hàm không giảm ($ x_1 < x_2 \rightarrow F(x_1) \leq F(x_2) $).
  • $ F(x) $ là một hàm liên tục.
  • $ \lim\limits_{x \to +\infty} F(x) = 1, \quad \lim\limits_{x \to -\infty} F(x) = 0 $.
  • $ f(x) = F’(x) $ và $ F(x) = \int_{-\infty}^x f(t)dt $.

Bài 2: Kì vọng, phương sai, Mod và Median. Các đặc trưng khác của ĐLNN (tr. 83)

Ta xét các tham số đặc trưng của một ĐLNN liên tục:

1. Kỳ vọng (Expectation) $E(X)$:

Kỳ vọng của một biến ngẫu nhiên liên tục $ X $ là giá trị trung bình lý thuyết mà ta mong đợi từ $ X $.

  • Với biến ngẫu nhiên liên tục có hàm mật độ xác suất $ f(x) $:
    \(E(X) = \int_{-\infty}^{\infty} x f(x) dx\)

Kỳ vọng giúp xác định giá trị trung tâm của phân phối.

Ví dụ: Nếu $ X \sim \text{Uniform}(a, b) $, ta có:
\(E(X) = \int_{a}^{b} x \cdot \frac{1}{b-a} dx = \frac{a + b}{2}.\)

2. Mode (Chế độ - Giá trị xuất hiện nhiều nhất):

Mode của một phân phối xác suất là giá trị mà hàm mật độ xác suất đạt cực đại.

  • Mode là điểm $ x $ sao cho:
    \(f(x) \geq f(y) \quad \forall y \in \mathbb{R}.\)

Ví dụ: Nếu $ X \sim \mathcal{N}(\mu, \sigma^2) $, thì mode chính là giá trị kỳ vọng $ \mu $ vì hàm mật độ đạt cực đại tại $ x = \mu $.

3. Phương sai (Variance) $ \text{Var}(X) $:

Phương sai đo lường mức độ phân tán của dữ liệu quanh giá trị kỳ vọng.

  • Định nghĩa:
    \(\text{Var}(X) = E[(X - E(X))^2]\)
  • Công thức triển khai: \(\text{Var}(X) = E(X^2) - [E(X)]^2.\)

Nếu $ \text{Var}(X) $ lớn → dữ liệu phân tán rộng.
Nếu $ \text{Var}(X) $ nhỏ → dữ liệu tập trung quanh trung bình.

Ví dụ: Nếu $ X \sim \text{Uniform}(a, b) $, ta có: \(E(X^2) = \int_{a}^{b} x^2 \cdot \frac{1}{b-a} dx = \frac{a^2 + ab + b^2}{3}.\) \(\text{Var}(X) = \frac{(b-a)^2}{12}.\)

4. Moment (Momen thống kê):

Moment giúp mô tả hình dạng phân bố xác suất.

  • Moment cấp $ k $ quanh gốc:
    \(E(X^k)\)
  • Moment cấp $ k $ quanh giá trị kỳ vọng:
    \(E[(X - E(X))^k]\)

Các moment quan trọng:

  • Moment cấp 1: $ E(X) $ (kỳ vọng).
  • Moment cấp 2: $ E[(X - E(X))^2] = \text{Var}(X) $ (phương sai).
  • Moment cấp 3, 4 dùng để tính hệ số bất đối xứng và hệ số nhọn.
5. Hệ số bất đối xứng (Skewness) $ S $:

Hệ số bất đối xứng đo lường mức độ lệch của phân phối so với trung tâm.

\[S = \frac{E[(X - E(X))^3]}{\text{Var}(X)^{3/2}}\]
  • $ S = 0 $: Phân phối đối xứng.
  • $ S > 0 $: Phân phối lệch phải (đuôi phải dài hơn).
  • $ S < 0 $: Phân phối lệch trái (đuôi trái dài hơn).

Ví dụ:

  • Phân phối chuẩn có skewness bằng 0.
  • Phân phối chi bình phương có skewness dương.
6. Hệ số nhọn (Kurtosis) $ K $:

Hệ số nhọn đo độ bẹt hay nhọn của phân phối so với phân phối chuẩn.

\[K = \frac{E[(X - E(X))^4]}{\text{Var}(X)^2}\]
  • $ K = 3 $: Phân phối chuẩn.
  • $ K > 3 $: Phân phối nhọn hơn chuẩn (leptokurtic - có đỉnh cao và đuôi dài).
  • $ K < 3 $: Phân phối bẹt hơn chuẩn (platykurtic - có đỉnh thấp và đuôi ngắn).

Ví dụ:

  • Phân phối chuẩn có $ K = 3 $.
  • Phân phối t-Student có kurtosis lớn hơn 3 nếu bậc tự do thấp.
  • Phân phối đồng nhất có kurtosis nhỏ hơn 3 do có đỉnh phẳng.

Bài 3: Hàm của một ĐLNN (tr. 88)

(Phụ thuộc vào bài tập)

Bài 4: Phân bố chuẩn (tr. 82)

(Phụ thuộc vào bài tập)

Bài 5: Phân bố mũ (tr. 96)

(Phụ thuộc vào bài tập)

Bài 6: Phân bố đều (tr. 98)

(Phụ thuộc vào bài tập)