f(x, y) =
\begin{cases}
\frac{1}{30} xy & \text{if } 0 \leq x \leq 5 \text{ and } 0 \leq y \leq 3 \\
0 & \text{otherwise}
\end{cases}
\]
Tính hàm mật độ xác suất biên của X
\[ f_X(x) = \int_{0}^{3} \frac{1}{30}xy \, dy = \frac{1}{30}x \int_{0}^{3} y \, dy = \frac{1}{30}x \left[\frac{y^2}{2}\right]_0^3 = \frac{1}{30}x \left[\frac{9}{2}\right] = \frac{3}{20}x \]
khi \( 0 \leq x \leq 5 \).
Tính Hàm Mật Độ Xác Suất Biên của Y
\[ f_Y(y) = \int_{0}^{5} \frac{1}{30}xy \, dx = \frac{1}{30}y \int_{0}^{5} x \, dx = \frac{1}{30}y \left[\frac{x^2}{2}\right]_0^5 = \frac{1}{30}y \left[\frac{25}{2}\right] = \frac{25}{60}y \]
khi \( 0 \leq y \leq 3 \).
Các hàm biên này cho phép phân tích chiều rộng của thời gian và chi phí của dự án mà không cần xem xét đến chiều kia.
Kỳ vọng của một biến ngẫu nhiên đo lường giá trị trung bình dài hạn mà biến ngẫu nhiên sẽ đạt được. Trong trường hợp biến ngẫu nhiên hai chiều (X, Y), kỳ vọng được xác định cho từng biến và cho các hàm của hai biến.
– Kỳ vọng của X: \( E(X) = \int \int x f(x,y) \, dx \, dy \)
– Kỳ vọng của Y: \( E(Y) = \int \int y f(x,y) \, dx \, dy \)
– Kỳ vọng của một hàm g(X, Y): \( E(g(X, Y)) = \int \int g(x, y) f(x, y) \, dx \, dy \)
Phương sai đo lường mức độ phân tán của các giá trị của biến ngẫu nhiên so với kỳ vọng của nó.
– Phương sai của X: \( \text{Var}(X) = E[(X – E(X))^2] = E(X^2) – [E(X)]^2 \)
– Phương sai của Y: \( \text{Var}(Y) = E[(Y – E(Y))^2] = E(Y^2) – [E(Y)]^2 \)
Hiệp phương sai đo lường mối quan hệ tuyến tính giữa hai biến ngẫu nhiên. Nếu hai biến cùng biến thiên theo cùng một hướng (cả hai tăng hoặc giảm cùng nhau), hiệp phương sai là dương. Nếu chúng biến thiên theo hướng ngược nhau, hiệp phương sai là âm.
– Hiệp phương sai giữa X và Y:
\[ \text{Cov}(X,Y) = E[(X – E(X))(Y – E(Y))] = E(XY) – E(X)E(Y)\]
Ví dụ 1
Giả sử một hàm mật độ xác suất chung \( f(x, y) \) của hai biến ngẫu nhiên \(X\) và \(Y\) được định nghĩa như sau:
\[
f(x, y) = \begin{cases}
x + y & \text{if } 0 \leq x \leq 1 \text{ and } 0 \leq y \leq 1 \\
0 & \text{otherwise}
\end{cases}
\]
Xác định tính chính xác của hàm mật độ xác suất chung
Trước tiên, cần kiểm tra tính hợp lệ của hàm PDF này bằng cách tính toán tích phân trên toàn miền giá trị:
\[ \int_0^1 \int_0^1 (x + y) \, dy \, dx \]
Tính toán tích phân:
– Tích phân theo \(y\):
\[ \int_0^1 (x + y) \, dy = x \cdot 1 + \frac{y^2}{2} \bigg|_0^1 = x + \frac{1}{2} \]
– Tích phân theo \(x\):
\[ \int_0^1 \left(x + \frac{1}{2}\right) \, dx = \frac{x^2}{2} + \frac{x}{2} \bigg|_0^1 = \frac{1}{2} + \frac{1}{2} = 1 \]
Điều này cho thấy \(f(x, y)\) là một hàm mật độ xác suất hợp lệ vì tích phân trên toàn miền giá trị bằng 1.
Tính hàm mật độ xác suất biên
Hàm mật độ xác suất biên của \(X\):
\[ f_X(x) = \int_0^1 (x + y) \, dy = x + \frac{1}{2} \quad \text{for } 0 \leq x \leq 1 \]
Hàm mật độ xác suất biên của \(Y\):
\[ f_Y(y) = \int_0^1 (x + y) \, dx = y + \frac{1}{2} \quad \text{for } 0 \leq y \leq 1 \]
Các hàm mật độ xác suất biên \(f_X(x)\) và \(f_Y(y)\) cho phép ta phân tích các biến \(X\) và \(Y\) độc lập với nhau. Ví dụ, ta có thể dùng chúng để tìm kỳ vọng, phương sai và các đặc tính thống kê khác của từng biến, mà không cần xét đến sự phụ thuộc lẫn nhau giữa chúng.
Ví dụ 2: Giả sử Hàm mật độ xác suất chung của X và Y cho bởi:
\[
f(x, y) =
\begin{cases}
2 & \text{if } 0 \leq x \leq 1 \text{ and } 0 \leq y \leq x \\
0 & \text{otherwise}
\end{cases}
\]
Tính kỳ vọng, phương sai và hiệp phương sai
Kỳ Vọng của X:
\[ E(X) = \int_0^1 \int_0^x x \cdot 2 \, dy \, dx = \int_0^1 2x^2 \, dx = \frac{2}{3}x^3 \Big|_0^1 = \frac{2}{3}\]
Kỳ Vọng của Y:
\[ E(Y) = \int_0^1 \int_0^x y \cdot 2 \, dy \, dx = \int_0^1 2 \frac{x^3}{3} \, dx = \frac{2}{3} \frac{x^4}{4} \Big|_0^1 = \frac{1}{6} \]
Kỳ Vọng của XY:
\[ E(XY) = \int_0^1 \int_0^x xy \cdot 2 \, dy \, dx = \int_0^1 2 \frac{x^3y}{2} \Big|_0^x \, dx = \int_0^1 x^4 \, dx = \frac{1}{5} \]
Hiệp Phương Sai của X và Y:
\[ \text{Cov}(X,Y) = E(XY) – E(X)E(Y) = \frac{1}{5} – \left(\frac{2}{3}\right)\left(\frac{1}{6}\right) = \frac{1}{5} – \frac{1}{9} = \frac{4}{45} \]
Hệ số tương quan Pearson, thường được ký hiệu là \( r \), là một thước đo thống kê được sử dụng để đánh giá mức độ và hướng của mối quan hệ tuyến tính giữa hai biến ngẫu nhiên. Đây là một trong những phương pháp phổ biến nhất để khảo sát sự liên quan giữa các biến trong thống kê và khoa học dữ liệu.
Công thức tính toán
Hệ số tương quan Pearson giữa hai biến ngẫu nhiên \( X \) và \( Y \) được tính như sau:
\[ r = \frac{\text{Cov}(X,Y)}{\sqrt{\text{Var}(X) \times \text{Var}(Y)}} \]
trong đó \( \text{Cov}(X,Y) \) là hiệp phương sai giữa \( X \) và \( Y \), và \( \text{Var}(X) \), \( \text{Var}(Y) \) là phương sai của \( X \) và \( Y \) tương ứng.
Giá trị của \( r \) và ý nghĩa
– \( r = 1 \): Mối quan hệ tuyến tính hoàn hảo và tích cực. Khi \( X \) tăng, \( Y \) cũng tăng.
– \( r = -1 \): Mối quan hệ tuyến tính hoàn hảo và tiêu cực. Khi \( X \) tăng, \( Y \) giảm.
– \( r = 0 \): Không có mối quan hệ tuyến tính giữa \( X \) và \( Y \).
– \( -1 < r < 0 \) hoặc \( 0 < r < 1 \): Mối quan hệ tuyến tính không hoàn hảo; mức độ mạnh yếu của mối quan hệ phụ thuộc vào giá trị tuyệt đối của \( r \).
Tính chất và ứng dụng
Tính chất
– Hệ số Pearson chỉ đo lường mối quan hệ tuyến tính; nó không phản ánh mối quan hệ phi tuyến hoặc phức tạp khác.
– Hệ số này không thay đổi khi chúng ta thực hiện phép biến đổi tuyến tính (như thêm, trừ, nhân, chia với các hằng số) trên các biến.
– Hệ số Pearson yêu cầu dữ liệu phân phối chuẩn hoặc gần chuẩn để đạt hiệu quả cao nhất.
Ứng dụng
– Phân tích dữ liệu: Trong nghiên cứu khoa học, kinh tế, xã hội học, và y tế, hệ số Pearson được sử dụng để xác định mức độ mạnh của mối quan hệ giữa các biến, từ đó hỗ trợ các quyết định về mô hình hóa dữ liệu và dự đoán.
– Kinh doanh và tài chính: Giúp phân tích rủi ro và cơ hội bằng cách khảo sát mối quan hệ giữa các yếu tố như giá cả, cầu, và nguồn cung.
– Khoa học dữ liệu: Dùng để lựa chọn hoặc loại bỏ tính năng trong các mô hình học máy, dựa trên mối quan hệ tuyến tính giữa các tính năng và nhãn hoặc giữa các tính năng với nhau.
Hiểu rõ về biến ngẫu nhiên 2 chiều mở ra cánh cửa cho nhiều ứng dụng thực tế trong các lĩnh vực như kinh tế, tài chính, khoa học máy tính, v.v. Việc phân tích và dự đoán các biến ngẫu nhiên 2 chiều giúp ta đưa ra quyết định sáng suốt hơn trong các tình huống không chắc chắn, góp phần giải quyết các vấn đề phức tạp và nâng cao hiệu quả trong nhiều lĩnh vực.
Với niềm đam mê mãnh liệt đối với toán học, tôi luôn mong muốn truyền tải kiến thức và khơi gợi niềm yêu thích môn học này cho thế hệ trẻ. Tôi luôn tận tâm trong công việc giảng dạy, sử dụng phương pháp giảng dạy sáng tạo và hiệu quả để giúp học sinh tiếp thu kiến thức một cách dễ dàng và hứng thú. Với những thành tựu xuất sắc trong lĩnh vực toán học, tôi đã nhận được nhiều giải thưởng danh giá và được cộng đồng khoa học đánh giá cao. Tôi là nguồn cảm hứng và tấm gương sáng cho các thế hệ học sinh và sinh viên yêu thích toán học.