Dwuwymiarowe zmienne losowe ciągłe

10. Dwuwymiarowe zmienne losowe ciągłe#

Dwuwymiarowa zmienna losowa ciągła

Niech \(X\) oraz \(Y\) będą zmiennymi losowymi określonymi niekoniecznie na tej samej przestrzeni probabilistycznej. Parę \((X, Y)\) zmiennych losowych \(X, Y\) nazywamy dwuwymiarową zmienną losową lub dwuwymiarowym wektorem losowym a \(X\) oraz \(Y\) jej współrzędnymi.

Dystrybuanta dwuwymiarowej zmiennej losowej

Dystrybuantą dwuwymiarowej zmiennej losowej \((X, Y)\) nazywamy funkcję \(F\) zmiennych \(x, y\), która dla każdej pary liczb rzeczywistych \((x, y) \in \mathbb{R^2}\) przyjmuje wartości równe prawdopodobieństwu zdarzenia polegającego na tym, że zmienna losowa \(X\) przyjmuje wartość mniejszą od \(x\) i zmienna losowa \(Y\) przyjmuje wartość mniejszą od \(y\):

\[\begin{equation} F(x,y) = P(X < x, Y < y)\ \text{dla} \ (x, y) \in \mathbb{R^2}. \end{equation}\]

\(F\) nazywamy także dystrybuantą łącznej zmiennej losowej \((X, Y)\).

Własności dystrybuanty:

a)

\[\begin{equation} \forall x\in\mathbb{R} \lim\limits_{y \to -\infty} F(x, y) = 0, \ \ \ \ \forall y\in\mathbb{R} \lim\limits_{x \to -\infty} F(x, y) = 0, \end{equation}\]

b)

\[\begin{split}\begin{equation} \lim\limits_{x \to \infty \\ y \to \infty} F(x, y) = 1, \end{equation}\end{split}\]

c) Dla dowolnych punktów: \((x_1, y_1)\), \((x_2, y_2)\) takich, że \(x_1 \le x_2\) i \(y_1 \le y_2\) zachodzi nierówność:

\[\begin{equation} F(x_2, y_2) - F(x_2, y_1) - F(x_1, y_2) + F(x_1, y_1) \ge 0. \end{equation}\]

d) Dystrybuanta jest funkcją niemalejącą i co najmniej lewostronnie ciągłą względem każdego z argumentów \(x\) bądź \(y\).

Dwuwymiarowa zmienna losowa (X, Y)

Dwuwymiarową zmienną losową \((X, Y)\) nazywamy typu ciągłego, jeśli istnieje nieujemna funkcja \(f\) taka, że dystrybuanta tej zmiennej losowej da się przedstawić jako całka:

\[\begin{equation} F(x, y) = \int\limits_{-\infty}^x \int\limits_{-\infty}^y f(u, v) dvdu, \ \ \ \text{dla} \ \ \ (x, y) \in\mathbb{R^2}, \end{equation}\]

funkcję \(f\) nazywamy gęstością rozkładu prawdopodobieństwa.

Własności dwuwymiarowej zmiennej losowej typu ciągłego:

Mamy:

\[\begin{equation} \int\limits_{-\infty}^\infty \int\limits_{-\infty}^\infty f(x, y) dydx = 1, \end{equation}\]
w punktach \((x, y)\) ciągłości \(f\) mamy:

\[\begin{equation} \frac{\partial^2F(x, y)}{\partial x \partial y} = f(x, y), \end{equation}\]
dla obszaru regularnego \(B \subset \mathbb{R^2}\):

\[\begin{equation} P[(X, Y) \in B] = \iint\limits_{B} f(x,y)dxdy, \end{equation}\]

w szczególności gdy \(B\) jest prostokątem, tzn. \(B = \{(x, y): a \le x \le b \land c \le y \le d\}\), wtedy:

\[\begin{equation} P(a \le X \le b \land c \le Y \le d) = \int\limits_a^b \int\limits_c^d f(x, y) dydx. \end{equation}\]

Rozkład brzegowy

Rozkład brzegowy zmiennej losowej \(X\) w rozkładzie dwuwymiarowej zmiennej losowej \((X, Y)\) określa wzór:

\[\begin{equation} f_X(x) = \int\limits_{-\infty}^\infty f(x, y) dy. \end{equation}\]

Dystrybuanta rozkładu brzegowego

Dystrybuantę rozkładu brzegowego zmiennej losowej \(X\) (ciągłej) w rozkładzie dwuwymiarowym zmiennej losowej \((X, Y)\) wyznacza wzór:

\[\begin{equation} F_X(x) = \int\limits_{-\infty}^x \int\limits_{-\infty}^\infty f(u, y) dy du = \int\limits_{-\infty}^x f_X(u)du \ \ \ \text{dla} \ \ \ x\in\mathbb{R}. \end{equation}\]

Analogicznie rozkład brzegowy zmiennej losowej \(Y\) w rozkładzie dwuwymiarowej zmiennej losowej \((X, Y)\) określa wzór:

\[\begin{equation} f_Y(y) = \int\limits_{-\infty}^\infty f(x, y) dx. \end{equation}\]

Dystrybuantę rozkładu brzegowego zmiennej losowej \(Y\) (ciągłej) w rozkładzie dwuwymiarowym zmiennej losowej \((X, Y)\) wyznacza wzór:

\[\begin{equation} F_Y(y) = \int\limits_{-\infty}^y \int\limits_{-\infty}^\infty f(x, v) dx dv = \int\limits_{-\infty}^y f_Y(v)dv \ \ \ \text{dla} \ \ \ y\in\mathbb{R}. \end{equation}\]

Związek między dystrybuantami rozkładów brzegowych, a dystrybuantą \(F\) dwuwymiarowej zmiennej losowej \((X, Y)\), a mianowicie:

\[\begin{split}\begin{equation} \begin{aligned} F_X(x) = \lim\limits_{y \to \infty} F(x, y), \\ F_Y(y) = \lim\limits_{x \to \infty} F(x, y). \end{aligned} \end{equation}\end{split}\]

Gęstość warunkowa

Gęstość warunkową zmiennej losowej \(X\) przy warunku, że zmienna \(Y\) przyjęła wartość równą \(y\) określa wzór:

\[\begin{equation} f_{X|Y}(x|y) = \frac{f_{XY}(x, y)}{f_Y(y)} \ \ \text{dla} \ \ x\in\mathbb{R} \land c < y < d, \end{equation}\]

przy założeniu, że gęstość brzegowa \(f_Y\) jest skoncentrowana na przedziale \((c, d)\).

Dystrybuantę rozkładu warunkowego wyznaczamy według wzoru:

\[\begin{equation} F_{X|Y}(x|y) = \int\limits_{-\infty}^x f_{X|Y}(u|y)du = \frac{1}{f_Y(y)} \int\limits_{-\infty}^x f_{XY}(u, y)du \ \ \ \text{dla} \ \ \ x\in\mathbb{R} \land c < y < d. \end{equation}\]

Analogicznie Gęstość warunkową zmiennej losowej \(Y\) przy warunku, że zmienna \(X\) przyjęła wartość równą \(x\) określa wzór:

\[\begin{equation} f_{Y|X}(y|x) = \frac{f_{XY}(x, y)}{f_X(x)} \ \ \text{dla} \ \ y\in\mathbb{R} \land a < x < b, \end{equation}\]

przy założeniu, że gęstość brzegowa \(f_X\) jest skoncentrowana na przedziale \((a, b)\).

Dystrybuantę tego rozkładu warunkowego wyznaczamy według wzoru:

\[\begin{equation} F_{Y|X}(y|x) = \int\limits_{-\infty}^y f_{Y|X}(v|x)dv = \frac{1}{f_X(x)} \int\limits_{-\infty}^y f_{XY}(x, v)dv \ \ \text{dla} \ \ y\in\mathbb{R} \land a < x < b. \end{equation}\]

Niezależność zmiennych losowych

Warunkiem koniecznym i wystarczającym na to, by \(X\) i \(Y\) były niezależnymi zmiennymi losowymi jest, by dla każdego \((x,y) \in \mathbb{R^2}\) dystrybuanta \(F\) dwuwymiarowej zmiennej losowej \((X,Y)\) była iloczynem dystrybuant rozkładów brzegowych \(F_X\) i \(F_Y\):

\[\begin{equation} F(x,y) = F_X(x)F_Y(y). \end{equation}\]
Warunkiem koniecznym i wystarczającym niezależności zmiennych losowych ciągłych \(X, Y\) o gęstościach odpowiednio równych \(f_X, f_Y\) jest zachodzenie równości:

\[\begin{equation} f(x,y) = f_X(x)f_Y(y) \ \ \text{dla} \ \ x, y \in\mathbb{R}, \end{equation}\]

gdzie \(f\) jest gęstością dwuwymiarowej zmiennej losowej \((X,Y)\).

Zmienne losowe \(X\) i \(Y\) typu skokowego są niezależne wtedy i tylko wtedy, gdy

\[\begin{equation} P(X=x_i, Y=y_k) = P(X=x_i)P(Y=y_k) \ \ \text{dla} \ \ i,k\in\mathbb{N}, \end{equation}\]

czyli:

\[\begin{equation} p_{ik} = p_{i.}p_{.k} \ \ \text{dla} \ \ i,k\in\mathbb{N}. \end{equation}\]
\(X\) i \(Y\) są niezależnymi zmiennymi losowymi wtedy i tylko wtedy, gdy rozkłady warunkowe są równe odpowiednim rozkładom brzegowym, co można zapisać np. tak:

\[\begin{equation} F(y|x) = F_Y(y), \ \ \ F(x|y)=F_X(x). \end{equation}\]

Charakterystyki liczbowe dwuwymiarowej zmiennej losowej

LOTUS:

\[\begin{split}\begin{equation} E[g(X,Y)]= \begin{cases} \int\limits_{-\infty}^\infty \int\limits_{-\infty}^\infty g(x,y)f(x,y)dxdy & \text{dla zmiennej } (X, Y) \text{ typu ciągłego}, \\ & \\ \sum\limits_i \sum\limits_k g(x_i, y_k)p_{ik} & \text{dla zmiennej } (X, Y) \text{typu skokowego}. \\ \end{cases} \end{equation}\end{split}\]

Kowariancja:

\[\begin{equation} Cov(X,Y) = E[(X-E(X))(Y-E(Y))], \end{equation}\]

\[\begin{equation} Cov(X,Y) = E(XY) - E(X)E(Y). \end{equation}\]

Jeżeli \(X\) i \(Y\) są niezależne to \(Cov(X,Y)=0.\)

Własności kowariancji

\(Cov(X,a)=0,\)

\(Cov(X,X)=Var(X),\)

\(Cov(X,Y)=Cov(Y,X),\)

\(Cov(aX,bY)=abCov(X,Y),\)

\(Cov(X+c,Y+d)=Cov(X,Y),\)

\(Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z),\)

bardziej ogólnie:

\(Cov\left(\sum\limits_{i=1}^m a_i X_i,\sum\limits_{j=1}^n b_jY_j\right)=\sum\limits_{i=1}^m\sum\limits_{j=1}^n a_ib_jCov(X_i,Y_j).\)

Całkowita kowariancja:

\[\begin{equation} Cov(X,Y) = E(cov(X, Y|Z)) + cov(E(X|Z), E(Y|Z)). \end{equation}\]

Macierz kowariancji:

\[\begin{split}\begin{equation} M = \begin{bmatrix} D^2(X) & Cov(X,Y) \\ Cov(X,Y) & D^2(Y) \\ \end{bmatrix}. \end{equation}\end{split}\]

Współczynnik korelacji:

\[\begin{equation} \rho = \frac{Cov(X,Y)}{\sqrt{D^2(X)D^2(Y)}} = \frac{Cov(X,Y)}{\sigma_X\sigma_Y}. \end{equation}\]