Sách: Mở đầu về lí thuyết Xác suất và Các ứng dụng

Tác giả: Đặng Hùng Thắng


Mục lục

Block

Chương III: Đại lượng ngẫu nhiên liên tục

Gọi ĐLNN X X liên tục nếu như:

  • Tập hợp các giá trị của X X lấp một khoảng của trục số hoặc lấy cả trục số đó.
  • Với mọi số a a , P(X=a)=0 P(X=a) = 0 .

Bài 1: Hàm mật độ xác suất và hàm phân bố xác suất (tr. 78)

Hàm mật độ xác suất

Ta chỉ quan tâm tới xác suất X X nhận một giá trị trong một khoảng (a,b)(a, b) nào đó chứ không quan tâm tới xác suất X X nhận một giá trị cụ thể như với ĐLNN rời rạc.

Phân bố xác suất của X X được xác định bởi một hàm f(x) f(x) được gọi là hàm mật độ xác suất. Trong đó:

(i)f(x)0,xR(ii)f(x)dx=1(iii)Với mọi a<b, ta coˊ:P(a<X<b)=P(aXb)=abf(x)dx(i) \quad f(x) \geq 0, \forall x \in \mathbb{R} \\[7pt] (ii) \quad \int_{-\infty}^{\infty} f(x) dx = 1 \\[7pt] (iii) \quad \text{Với mọi } a < b \text{, ta có:} \\[7pt] P(a < X < b) = P(a \leq X \leq b) = \int_a^b f(x)dx
Block
Hàm phân bố xác suất

Hàm phân bố xác suất của X X được xác định với mọi số thực x x :

F(x)=P(X<x)F(x) = P(X < x)
Block

Hàm phân bố F(x) F(x) có các tính chất:

  • 0F(x)1 0 \leq F(x) \leq 1 .
  • F(x) F(x) là một hàm không giảm (x1<x2F(x1)F(x2) x_1 < x_2 \rightarrow F(x_1) \leq F(x_2) ).
  • F(x) F(x) là một hàm liên tục.
  • limx+F(x)=1,limxF(x)=0 \lim\limits_{x \to +\infty} F(x) = 1, \quad \lim\limits_{x \to -\infty} F(x) = 0 .
  • f(x)=F(x) f(x) = F’(x) F(x)=xf(t)dt F(x) = \int_{-\infty}^x f(t)dt .

Bài 2: Kì vọng, phương sai, Mod và Median. Các đặc trưng khác của ĐLNN (tr. 83)

Ta xét các tham số đặc trưng của một ĐLNN liên tục:

1. Kỳ vọng (Expectation) E(X)E(X):

Kỳ vọng của một biến ngẫu nhiên liên tục X X là giá trị trung bình lý thuyết mà ta mong đợi từ X X .

  • Với biến ngẫu nhiên liên tục có hàm mật độ xác suất f(x) f(x) :
    E(X)=xf(x)dxE(X) = \int_{-\infty}^{\infty} x f(x) dx

Kỳ vọng giúp xác định giá trị trung tâm của phân phối.

Ví dụ: Nếu XUniform(a,b) X \sim \text{Uniform}(a, b) , ta có:
E(X)=abx1badx=a+b2.E(X) = \int_{a}^{b} x \cdot \frac{1}{b-a} dx = \frac{a + b}{2}.

2. Mode (Chế độ - Giá trị xuất hiện nhiều nhất):

Mode của một phân phối xác suất là giá trị mà hàm mật độ xác suất đạt cực đại.

  • Mode là điểm x x sao cho:
    f(x)f(y)yR.f(x) \geq f(y) \quad \forall y \in \mathbb{R}.

Ví dụ: Nếu XN(μ,σ2) X \sim \mathcal{N}(\mu, \sigma^2) , thì mode chính là giá trị kỳ vọng μ \mu vì hàm mật độ đạt cực đại tại x=μ x = \mu .

3. Phương sai (Variance) Var(X) \text{Var}(X) :

Phương sai đo lường mức độ phân tán của dữ liệu quanh giá trị kỳ vọng.

  • Định nghĩa:
    Var(X)=E[(XE(X))2]\text{Var}(X) = E[(X - E(X))^2]
  • Công thức triển khai: Var(X)=E(X2)[E(X)]2.\text{Var}(X) = E(X^2) - [E(X)]^2.

Nếu Var(X) \text{Var}(X) lớn → dữ liệu phân tán rộng.
Nếu Var(X) \text{Var}(X) nhỏ → dữ liệu tập trung quanh trung bình.

Ví dụ: Nếu XUniform(a,b) X \sim \text{Uniform}(a, b) , ta có: E(X2)=abx21badx=a2+ab+b23.E(X^2) = \int_{a}^{b} x^2 \cdot \frac{1}{b-a} dx = \frac{a^2 + ab + b^2}{3}. Var(X)=(ba)212.\text{Var}(X) = \frac{(b-a)^2}{12}.

4. Moment (Momen thống kê):

Moment giúp mô tả hình dạng phân bố xác suất.

  • Moment cấp k k quanh gốc:
    E(Xk)E(X^k)
  • Moment cấp k k quanh giá trị kỳ vọng:
    E[(XE(X))k]E[(X - E(X))^k]

Các moment quan trọng:

  • Moment cấp 1: E(X) E(X) (kỳ vọng).
  • Moment cấp 2: E[(XE(X))2]=Var(X) E[(X - E(X))^2] = \text{Var}(X) (phương sai).
  • Moment cấp 3, 4 dùng để tính hệ số bất đối xứng và hệ số nhọn.
5. Hệ số bất đối xứng (Skewness) S S :

Hệ số bất đối xứng đo lường mức độ lệch của phân phối so với trung tâm.

S=E[(XE(X))3]Var(X)3/2S = \frac{E[(X - E(X))^3]}{\text{Var}(X)^{3/2}}
  • S=0 S = 0 : Phân phối đối xứng.
  • S>0 S > 0 : Phân phối lệch phải (đuôi phải dài hơn).
  • S<0 S < 0 : Phân phối lệch trái (đuôi trái dài hơn).

Ví dụ:

  • Phân phối chuẩn có skewness bằng 0.
  • Phân phối chi bình phương có skewness dương.
6. Hệ số nhọn (Kurtosis) K K :

Hệ số nhọn đo độ bẹt hay nhọn của phân phối so với phân phối chuẩn.

K=E[(XE(X))4]Var(X)2K = \frac{E[(X - E(X))^4]}{\text{Var}(X)^2}
  • K=3 K = 3 : Phân phối chuẩn.
  • K>3 K > 3 : Phân phối nhọn hơn chuẩn (leptokurtic - có đỉnh cao và đuôi dài).
  • K<3 K < 3 : Phân phối bẹt hơn chuẩn (platykurtic - có đỉnh thấp và đuôi ngắn).

Ví dụ:

  • Phân phối chuẩn có K=3 K = 3 .
  • Phân phối t-Student có kurtosis lớn hơn 3 nếu bậc tự do thấp.
  • Phân phối đồng nhất có kurtosis nhỏ hơn 3 do có đỉnh phẳng.

Bài 3: Hàm của một ĐLNN (tr. 88)

(Phụ thuộc vào bài tập)

Bài 4: Phân bố chuẩn (tr. 82)

(Phụ thuộc vào bài tập)

Bài 5: Phân bố mũ (tr. 96)

(Phụ thuộc vào bài tập)

Bài 6: Phân bố đều (tr. 98)

(Phụ thuộc vào bài tập)