Discussione: Estrazioni casuali
Visualizza un messaggio singolo
Vecchio 30-09-11, 09:25   #7
Erasmus
Utente Super
 
L'avatar di Erasmus
 
Data di registrazione: Feb 2008
Ubicazione: Unione Europea
Messaggi: 5,824
Predefinito Re: Estrazioni casuali

Quote:
aspesi Visualizza il messaggio
Supponiamo di estrarre dei valori a caso uniformemente distribuiti fra 0 e 1.
Ne estraggo tanti finché la loro somma non supera 1.
Quanti ne serviranno mediamente?

Che vuol dire "ne serviranno"?
Se intendi: "Quanti se ne estraggono mediamente ripetendo un enerme numero di volte l'estrazione", la risposta è .... "DUE +" (dal momento che il valor atteso – cioè la media aritmetica a lungo andare dei numeri estratti– è 1/2 e tu vuoi che, fintanto che la somma dei numeri già estratti non supera 1 si continui ad estrarre).
Quote:
aspesi Visualizza il messaggio
E qual è la probabilità che siano necessari k (2, 3, 4, ...) estrazioni?
Non capisco!!!
Siccome ho già visto la risposta di astromauh e il tuo commento «Ovviamente è giusto», sono perplesso!!!

Ma che c***o vuol dire «la probabilità che siano necessari – o necessarie? – " k estrazioni»
Che ci azzecca la necessità?
Intendi forse dire «Qual è la probabilità che la somma di k numeri estratti a caso non superi 1»?

Se intendi questa probabilità (che è una probabilità cumulativa), allora essa vale l'integrale tra 0 e 1 di dx·[x^(k–1)/(k–1)! che vale evidentemente 1/k!
Diciamola P(k). E diciamo F(x, k) la probabilità che la somma dei k numeri estratti a caso non superi x quando x è compreso tra 0 e 1.
Allora P(k) = F(1, k).

Esempio: P(2)?
Densità di probabilità y uniforme di ogni numero estratto a caso tra 0 e 1 ––> y = 1 per 0 ≤x ≤ 1.
F(x, 1) = integrale da 0 e x di 1·dx ––> F(x, 1) = x (per 0 ≤ x ≤1; F(x, 1) = 0 altrove).
Densità di probabilità y(2,x) che la somma di 2 numeri estratti a caso valga x ( con 0 ≤ x ≤ 2):
––> y = x tra 0 e 1; y = 2–x tra 1 e 2.
Integrale F(x, 2) della densità di sopra (definita distintamente nei tratti da 0 a 1 e da 1 a 2):
F(x, 2) = integrale da 0 a x di t dt per 0 ≤ x ≤ 1 ––> F(x, 2) = x^2/2; F(1, 2) = 1/2.
F(x, 2) = integrale da 1 a x di (2–t) dt + F(1, 2) per 1 ≤ x ≤2 ––> F(x, 2) = –(x^2)/2 +2x –1 ––>
––> P(2) = F(1, 2) = 1/2.

In generale, integrando successivamente, nel primo tartto 0 ≤ x ≤ 1 risulta (per ogni k > 0):
F(x, k) = (x^k)/k!

La probabilità che la somma di k numeri estratti (ciascuno con densità di prob. uniforme tra 0 e 1) è dunque: P(k) = F(1,k) = 1/k!

Pertanto:
P(2) = 1/2 =0,5
P(3) = 1/6 = 0,16666...
P(4)= 1/24 = 0,04166...
...
P(k) = 1/k!
...
--------------
Riassumo e mi spiego ... con meno formule (forse!):
• Estraendo 2 numeri fai una somma compresa tra 0 e 2.
La densità di probabilità è un triangolo isoscele con base tra 0 e 2 alto 1: rampa in salita di pendenza 1 tra 0 e 1 e in discesa di pendenza –1 tra 1 e 2.
• Estraendo 3 numeri fai una somma compresa tra 0 e 3.
La densità di probabilità è una "campana" fatta di tre archi di parabola: il primo tratto, tra 0 e 1, ha equazione y = (x^2)/2 .
Il terzo tratto, tra 2 e 3, è il simmetrico del primo, quindi di equazione:
y = [(3–x)^2]/2 = (x^2 – 6x +9)/2.
Il secondo è un arco di parabola voltata in giù che deve raccordarsi con primo e terzo arco. Fatti i conti, è:
y = –x^2 + 3x – 3/2.
[Infatti y(1) = y(2) =1/2; y' = dy/dx = –2x + 3 ––> y'(1) = 1; y'(2) = –1 = – y'(1)].
La densità di probabilità (con due estrazioni) è massima in x = 3/2 dove vale 4/3.
L'integrale tra 0 ed x di questa campana viene una curva monotona crescente (che è la probabilità [cumulativa] di fare non più di x con 3 estrazioni). Ovviamente, per x tra 0 e 1, questa è F(x, 3) = (x^3)/3! .
• La "campana" F(x, k) cambia forma al crescere di k estendendosi tra 0 e k.
E' definita a tratti: tra 0 e 1, tra 1 e 2, ..., tra k–1 e k.
In ogni tratto è un [diverso] polinomio di grado k–1.
In generale la campana si ottiene per convoluzione successiva a partire dalla forma iniziale (rettangolare se si tratta di probabilità uniforme; in particolare quadrata nel nostro caso dove il dominio è tra 0 e 1).
Al tendere di k all'infinito, la "campana" y(x, k) tende alla gaussiana. (Teorema "centrale limite")
[Questo è vero per ogni tipo di distribuzione iniziale. Ma nel caso di distribuzione iniziale uniforme la velocità di approssimazione alla gaussiana è la massima e ... davvero molto elevata]
Nel primo tratto, tra 0 e 1, la "campana" è sempre della forma y(x, k) = [x^(k–1)/(k–1)!
Pertanto la probabilità [cunulativa] di fare non più di x (con x ≤1) con k estrazioni vale:
F(x, k) = (x^k)/k!
.
[NB: Per fare la probabilità cumulativa bisogna integrare la "campana" di equazione y(x, k)]
-----------------

La media di questa distribuzione discreta P(k) = F(1, k), per k intero tra 2 e +oo, vale:
[2·(1/2) + 3·1/6 + 4/4! + ... k/k! + ...]/(1/2 + 1/6 + 1/4! + ... 1/k! + ...] =
= (1 + 1/2 + 1/3! +... 1/(k–1)! + ...]/(1/2 + 1/6 + 1/4! + ... + 1/k! + ...] = (e–1)/(e–2) = 2,39221191117...
[dove "e" è il famoso lim (n ––>oo) di (1+1/n)^n = 2,718281828459..., detto "numero di Napier" e base dei "logaritmi naturali"]

--------------

Però, visto che non sono sicuro di quel che vuoi sapere e che, secondo te, astrimauh ha risposto giusto, è molto probabile che io risponda sbagliato. E visto che voi due vi comprendete al volo, evidentemente avete un vostro linguaggio ... che differisce dal mio!
--------
(Puah!)
__________________
Erasmus
«NO a nuovi trattati intergovernativi!»
«SI' alla "Costituzione Europea" federale, democratica e trasparente!»

Ultima modifica di Erasmus : 30-09-11 09:31.
Erasmus non in linea   Rispondi citando