Πολυωνυμική Κατανομή
Παράμετροι
n
∈
N
{\displaystyle n\in \mathbb {N} }
(πλήθος δειγμάτων)
k
∈
N
{\displaystyle k\in \mathbb {N} }
(πλήθος αποτελεσμάτων)
p
1
,
…
,
p
k
≥
0
{\displaystyle p_{1},\ldots ,p_{k}\geq 0}
με
∑
i
=
1
k
p
i
=
1
{\textstyle \sum _{i=1}^{k}p_{i}=1}
.
Φορέας
{
(
x
1
,
…
,
x
k
)
∈
N
k
∣
∑
i
=
1
k
x
i
=
n
}
{\textstyle \left\{(x_{1},\ldots ,x_{k})\in \mathbb {N} ^{k}\mid \sum _{i=1}^{k}x_{i}=n\right\}}
Συνάρτηση Μάζας Πιθανότητας
n
!
x
1
!
x
2
!
…
x
k
!
⋅
p
1
x
1
⋅
…
⋅
p
k
x
k
{\displaystyle {\frac {n!}{x_{1}!x_{2}!\ldots x_{k}!}}\cdot p_{1}^{x_{1}}\cdot \ldots \cdot p_{k}^{x_{k}}}
Μέσος
E
[
X
i
]
=
n
⋅
p
i
{\displaystyle \operatorname {E} [X_{i}]=n\cdot p_{i}}
Διακύμανση
V
[
X
i
]
=
n
⋅
p
i
⋅
(
1
−
p
i
)
{\displaystyle \operatorname {V} [X_{i}]=n\cdot p_{i}\cdot (1-p_{i})}
Cov
(
X
i
,
X
j
)
=
−
n
p
i
p
j
{\displaystyle \operatorname {Cov} (X_{i},X_{j})=-np_{i}p_{j}}
για
i
≠
j
{\displaystyle i\neq j}
Εντροπία
−
log
2
(
n
!
)
−
n
⋅
∑
i
=
1
n
p
i
log
2
p
i
{\textstyle -\log _{2}(n!)-n\cdot \sum _{i=1}^{n}p_{i}\log _{2}p_{i}}
+
∑
i
=
1
k
∑
x
i
=
0
n
(
n
x
i
)
p
i
x
i
⋅
(
1
−
p
)
n
−
x
i
log
2
(
x
i
!
)
{\textstyle \quad +\sum _{i=1}^{k}\sum _{x_{i}=0}^{n}{\binom {n}{x_{i}}}p_{i}^{x_{i}}\cdot (1-p)^{n-x_{i}}\log _{2}(x_{i}!)}
Πιθανογεννήτρια
(
∑
i
=
1
k
p
i
t
i
)
n
{\displaystyle \left(\sum _{i=1}^{k}p_{i}t_{i}\right)^{n}}
Χαρακτηριστική
(
∑
i
=
1
k
p
i
⋅
e
t
i
)
n
{\displaystyle \left(\sum _{i=1}^{k}p_{i}\cdot e^{t_{i}}\right)^{n}}
Στην θεωρία πιθανοτήτων και τη στατιστική , η πολυωνυμική κατανομή είναι η γενίκευση της διωνυμικής κατανομής , όπου υπάρχουν
n
{\displaystyle n}
επαναλήψεις ενός πειράματος με
k
{\displaystyle k}
πιθανά αποτελέσματα. Πιο συγκεκριμένα, δίνει την πιθανότητα για κάθε δυνατό πλήθος αποτελεσμάτων
(
x
1
,
…
,
x
k
)
∈
N
n
{\displaystyle (x_{1},\ldots ,x_{k})\in \mathbb {N} ^{n}}
.[ 1] [ 2] [ 3] [ 4]
Η πολυωνυμική κατανομή εξετάζει τη συνδυαστική πιθανότητα να συμβούν ταυτόχρονα μια σειρά από k ενδεχόμενα Ε1 , Ε2 , …, Εk , σε n επαναλήψεις μιας τυχαίας διαδικασίας, το καθένα εκ των οποίων έχει τη δική του πιθανότητα p1 , p2 , …, pk να πραγματοποιηθεί σε μία εκτέλεση της διαδικασίας.
Συμβολίζουμε με x1 , x2 , …, xk , τον ακριβή αριθμό των φορών που ζητάμε να εμφανισθεί το κάθε ενδεχόμενο.
Ισχύουν οι παρακάτω σχέσεις:
∑
i
=
1
k
p
i
=
1
{\displaystyle \sum _{i=1}^{k}p_{i}=1}
και
∑
i
=
1
k
x
i
=
n
{\displaystyle \sum _{i=1}^{k}x_{i}=n}
Η πιθανότητα να εμφανισθεί το κάθε ενδεχόμενο όσες φορές ακριβώς ορίσαμε, δίνεται από τον τύπο:
P
(
X
1
=
x
1
,
…
,
X
n
=
x
n
)
=
n
!
x
1
!
x
2
!
…
x
k
!
⋅
p
1
x
1
p
2
x
2
…
p
k
x
k
{\displaystyle \operatorname {P} (X_{1}=x_{1},\ldots ,X_{n}=x_{n})={\frac {n!}{x_{1}!x_{2}!\dots x_{k}!}}\cdot p_{1}^{x_{1}}p_{2}^{x_{2}}\dots p_{k}^{x_{k}}}
.
Έστω ότι έχουμε ένα δοχείο με
n
=
22
{\displaystyle n=22}
μπάλες,
9
{\displaystyle 9}
κόκκινες,
7
{\displaystyle 7}
μαύρες και
6
{\displaystyle 6}
μπλε. Τότε αν διαλέξουμε
k
=
3
{\displaystyle k=3}
μπάλες (με αντικατάσταση), τότε η κατανομή είναι πολυωνυμική με παραμέτρους
(
p
1
,
p
2
,
p
3
)
=
(
9
22
,
7
22
,
6
22
)
{\displaystyle (p_{1},p_{2},p_{3})=\left({\frac {9}{22}},{\frac {7}{22}},{\frac {6}{22}}\right)}
,
και λαμβάνουμε τις εξής πιθανότητες για τα ενδεχόμενα:
Αποτέλεσμα
Πιθανότητα
(
3
,
0
,
0
)
{\displaystyle ({\color {red}3},0,{\color {blue}0})}
3
!
3
!
0
!
0
!
⋅
(
9
22
)
3
≈
0.0684
{\displaystyle {\frac {3!}{3!0!0!}}\cdot {\color {red}\left({\frac {9}{22}}\right)^{3}}\approx 0.0684}
(
0
,
3
,
0
)
{\displaystyle ({\color {red}0},3,{\color {blue}0})}
3
!
0
!
3
!
0
!
⋅
(
7
22
)
3
≈
0.0322
{\displaystyle {\frac {3!}{0!3!0!}}\cdot {\color {black}\left({\frac {7}{22}}\right)^{3}}\approx 0.0322}
(
0
,
0
,
3
)
{\displaystyle ({\color {red}0},0,{\color {blue}3})}
3
!
0
!
0
!
3
!
⋅
(
6
22
)
3
≈
0.0202
{\displaystyle {\frac {3!}{0!0!3!}}\cdot {\color {blue}\left({\frac {6}{22}}\right)^{3}}\approx 0.0202}
(
1
,
2
,
0
)
{\displaystyle ({\color {red}1},2,{\color {blue}0})}
3
!
1
!
2
!
0
!
⋅
(
9
22
)
1
⋅
(
7
22
)
2
≈
0.0912
{\displaystyle {\frac {3!}{1!2!0!}}\cdot {\color {red}\left({\frac {9}{22}}\right)^{1}}\cdot {\color {black}\left({\frac {7}{22}}\right)^{2}}\approx 0.0912}
(
1
,
0
,
2
)
{\displaystyle ({\color {red}1},0,{\color {blue}2})}
3
!
1
!
0
!
2
!
⋅
(
9
22
)
1
⋅
(
6
22
)
2
≈
0.1242
{\displaystyle {\frac {3!}{1!0!2!}}\cdot {\color {red}\left({\frac {9}{22}}\right)^{1}}\cdot {\color {blue}\left({\frac {6}{22}}\right)^{2}}\approx 0.1242}
(
2
,
1
,
0
)
{\displaystyle ({\color {red}2},1,{\color {blue}0})}
3
!
2
!
1
!
0
!
⋅
(
9
22
)
2
⋅
(
7
22
)
1
≈
0.159
{\displaystyle {\frac {3!}{2!1!0!}}\cdot {\color {red}\left({\frac {9}{22}}\right)^{2}}\cdot {\color {black}\left({\frac {7}{22}}\right)^{1}}\approx 0.159}
(
0
,
1
,
2
)
{\displaystyle ({\color {red}0},1,{\color {blue}2})}
3
!
0
!
1
!
2
!
⋅
(
7
22
)
1
⋅
(
6
22
)
2
≈
0.070
{\displaystyle {\frac {3!}{0!1!2!}}\cdot {\color {black}\left({\frac {7}{22}}\right)^{1}}\cdot {\color {blue}\left({\frac {6}{22}}\right)^{2}}\approx 0.070}
(
2
,
0
,
1
)
{\displaystyle ({\color {red}2},0,{\color {blue}1})}
3
!
2
!
0
!
1
!
⋅
(
9
22
)
2
⋅
(
6
22
)
1
≈
0.136
{\displaystyle {\frac {3!}{2!0!1!}}\cdot {\color {red}\left({\frac {9}{22}}\right)^{2}}\cdot {\color {blue}\left({\frac {6}{22}}\right)^{1}}\approx 0.136}
(
0
,
2
,
1
)
{\displaystyle ({\color {red}0},2,{\color {blue}1})}
3
!
0
!
2
!
1
!
⋅
(
7
22
)
2
⋅
(
6
22
)
1
≈
0.0828
{\displaystyle {\frac {3!}{0!2!1!}}\cdot {\color {black}\left({\frac {7}{22}}\right)^{2}}\cdot {\color {blue}\left({\frac {6}{22}}\right)^{1}}\approx 0.0828}
(
1
,
1
,
1
)
{\displaystyle ({\color {red}1},1,{\color {blue}1})}
3
!
1
!
1
!
1
!
⋅
(
9
22
)
1
⋅
(
7
22
)
1
⋅
(
6
22
)
1
≈
0.212
{\displaystyle {\frac {3!}{1!1!1!}}\cdot {\color {red}\left({\frac {9}{22}}\right)^{1}}\cdot {\color {black}\left({\frac {7}{22}}\right)^{1}}\cdot {\color {blue}\left({\frac {6}{22}}\right)^{1}}\approx 0.212}
Δοχείο με
22
{\displaystyle 22}
μπάλες εκ των οποίων οι
9
{\displaystyle 9}
είναι κόκκινες,
7
{\displaystyle 7}
μαύρες και
6
{\displaystyle 6}
μπλε.
Η πολυωνυμική κατανομή μπορεί να χρησιμοποιηθεί για να μοντελοποιήσει τα εξής:[ 5]
Οι ταξιδιωτικοί προορισμοί των
n
{\displaystyle n}
κατοίκων της χώρας μας στο εσωτερικό με την κατηγοριοποίησή τους στους εξής
k
{\displaystyle k}
προορισμούς: Κυκλάδες, Σποράδες, Δωδεκάνησα, Επτάνησα, Ζαγοροχώρια, Ορεινή Ναυπακτία, Πήλιο, Αράχωβα και Καλάβρυτα.
Η εξέταση ανάπτυξης του κλάδου επιχειρήσεων ανάλογα με την γεωγραφική περιοχή και την μορφολογία του εδάφους, που μπορεί να είναι καλλιέργεια εσπεριδοειδών ή οσπρίων, δημιουργία φάρμας, εξόρυξη μετάλλων.
Η περιθωριακή κατανομή του
X
i
{\displaystyle X_{i}}
είναι διωνυμική με παραμέτρους
n
∈
N
{\displaystyle n\in \mathbb {N} }
και
p
i
∈
[
0
,
1
]
{\displaystyle p_{i}\in [0,1]}
. Επομένως, η μέση τιμή του
X
i
{\displaystyle X_{i}}
, δίνεται από τον τύπο
E
[
X
i
]
=
n
⋅
p
i
{\displaystyle \operatorname {E} [X_{i}]=n\cdot p_{i}}
.
Αντίστοιχα, η διακύμανση του
X
i
{\displaystyle X_{i}}
δίνεται από τον τύπο
V
[
X
i
]
=
n
⋅
p
i
⋅
(
1
−
p
i
)
{\displaystyle \operatorname {V} [X_{i}]=n\cdot p_{i}\cdot (1-p_{i})}
.
Από τον ορισμό της συνδιακύμανσης για
X
i
{\displaystyle X_{i}}
και
X
j
{\displaystyle X_{j}}
με
i
≠
j
{\displaystyle i\neq j}
, έχουμε ότι
Cov
(
X
i
,
X
j
)
=
E
[
X
i
X
j
]
−
E
[
X
i
]
⋅
E
[
X
j
]
.
{\displaystyle \operatorname {Cov} (X_{i},X_{j})=\operatorname {E} [X_{i}X_{j}]-\operatorname {E} [X_{i}]\cdot \operatorname {E} [X_{j}].}
Από τον νόμο της ολικής πιθανότητας, και αφού η τυχαία μεταβλητή
Y
=
(
X
i
∣
X
j
=
k
)
{\displaystyle Y=(X_{i}\mid X_{j}=k)}
είναι
B
i
n
(
n
−
k
,
p
i
/
(
1
−
p
j
)
)
{\displaystyle {\mathsf {Bin}}(n-k,p_{i}/(1-p_{j}))}
, έχουμε ότι
E
[
X
i
X
j
]
=
∑
k
=
0
n
E
[
X
i
∣
X
j
=
k
]
⋅
P
(
X
j
=
k
)
=
∑
k
=
0
n
(
n
−
k
)
⋅
p
i
1
−
p
j
⋅
k
⋅
(
n
k
)
p
j
k
⋅
(
1
−
p
j
)
n
−
k
=
∑
k
=
0
n
(
n
−
k
)
⋅
p
i
1
−
p
j
⋅
k
⋅
(
n
k
)
p
j
k
⋅
(
1
−
p
j
)
n
−
k
=
n
⋅
p
i
1
−
p
j
⋅
∑
k
=
0
n
(
n
k
)
p
j
k
⋅
(
1
−
p
j
)
n
−
k
−
p
i
1
−
p
j
⋅
∑
k
=
0
n
(
n
k
)
p
j
k
⋅
(
1
−
p
j
)
n
−
k
⋅
k
=
n
⋅
p
i
1
−
p
j
⋅
∑
k
=
0
n
P
(
X
j
=
k
)
⋅
k
−
p
i
⋅
∑
k
=
0
n
P
(
X
j
=
k
)
⋅
k
2
=
n
⋅
p
i
1
−
p
j
⋅
(
n
⋅
p
j
+
n
⋅
(
n
−
1
)
⋅
p
j
2
+
n
⋅
p
j
)
=
n
2
⋅
p
i
⋅
p
j
−
n
⋅
p
i
⋅
p
j
.
{\displaystyle {\begin{aligned}\operatorname {E} [X_{i}X_{j}]&=\sum _{k=0}^{n}\operatorname {E} [X_{i}\mid X_{j}=k]\cdot \operatorname {P} (X_{j}=k)\\&=\sum _{k=0}^{n}(n-k)\cdot {\frac {p_{i}}{1-p_{j}}}\cdot k\cdot {\binom {n}{k}}p_{j}^{k}\cdot (1-p_{j})^{n-k}\\&=\sum _{k=0}^{n}(n-k)\cdot {\frac {p_{i}}{1-p_{j}}}\cdot k\cdot {\binom {n}{k}}p_{j}^{k}\cdot (1-p_{j})^{n-k}\\&=n\cdot {\frac {p_{i}}{1-p_{j}}}\cdot \sum _{k=0}^{n}{\binom {n}{k}}p_{j}^{k}\cdot (1-p_{j})^{n-k}-{\frac {p_{i}}{1-p_{j}}}\cdot \sum _{k=0}^{n}{\binom {n}{k}}p_{j}^{k}\cdot (1-p_{j})^{n-k}\cdot k\\&=n\cdot {\frac {p_{i}}{1-p_{j}}}\cdot \sum _{k=0}^{n}\operatorname {P} (X_{j}=k)\cdot k-p_{i}\cdot \sum _{k=0}^{n}\operatorname {P} (X_{j}=k)\cdot k^{2}\\&=n\cdot {\frac {p_{i}}{1-p_{j}}}\cdot \left(n\cdot p_{j}+n\cdot (n-1)\cdot p_{j}^{2}+n\cdot p_{j}\right)\\&=n^{2}\cdot p_{i}\cdot p_{j}-n\cdot p_{i}\cdot p_{j}.\end{aligned}}}
Επομένως,
Cov
(
X
i
,
X
j
)
=
n
2
⋅
p
i
⋅
p
j
−
n
⋅
p
i
⋅
p
j
−
n
2
⋅
p
i
⋅
p
j
=
−
n
⋅
p
i
⋅
p
j
.
{\displaystyle \operatorname {Cov} (X_{i},X_{j})=n^{2}\cdot p_{i}\cdot p_{j}-n\cdot p_{i}\cdot p_{j}-n^{2}\cdot p_{i}\cdot p_{j}=-n\cdot p_{i}\cdot p_{j}.}