Coelestis - Il Forum Italiano di Astronomia

Coelestis - Il Forum Italiano di Astronomia (http://www.trekportal.it/coelestis/index.php)
-   Rudi Mathematici (http://www.trekportal.it/coelestis/forumdisplay.php?f=11)
-   -   una curiosità sulla statistica (http://www.trekportal.it/coelestis/showthread.php?t=60029)

aspesi 27-02-19 10:55

Re: una curiosità sulla statistica
 
Quote:

astromauh (Scrivi 829566)
:ok: Io lo avevo detto tanto tempo fa. ;)

Sì, ma io ho riportato una tabellina che è valida sempre e facilita molto i calcoli ;)

:hello:

Planezio 27-02-19 11:07

Re: una curiosità sulla statistica
 
Quote:

aspesi (Scrivi 829560)
Teorema di Bayes (è una probabilità di una probabilità, dopo aver visto i risultati)

Quiz di Planezio (supposto che la negativitò del test ni sani sia come la sensibilità del test nei malati = 0,9):

............................. Malati ....................... Sani .................... Totale
Test positivo .. 0,01*0,9 = 0,009 ..... 0,99*0,1 = 0,099 .......... 0,108
Test negativo . 0,01*0,1 = 0,001 ..... 0,99*0,9 = 0,891 .......... 0,892
.... Totale ............... 0,01 ........................ 0,99 ........................ 1

Quindi prob. di essere malati se il test è positivo = 0,009 / 0,108 = 0,0833.... ----> 8,33%

prob. di essere malati se il test è negativo = 0,001 / 0,892 = 0,001121 ----> 0,1121%

Bene. Vedo che abbiamo ottenuto lo stesso risultato.

astromauh 27-02-19 12:03

Re: una curiosità sulla statistica
 
Quote:

aspesi (Scrivi 829568)
Sì, ma io ho riportato una tabellina che è valida sempre e facilita molto i calcoli ;)

:hello:

Forse Planezio non sa che in questa sezione nascondiamo le soluzioni scrivendole con lo stesso colore dello sfondo. :(

:hello:

astromauh 27-02-19 15:08

Re: una curiosità sulla statistica
 
Quote:

meta (Scrivi 829557)
credo poi che quando si dice che il test produce ad es 10 falsi positivi, si debba intendere che al massimo sono 10, non che ce ne siano sempre 10.

Se viene detto che un test produce 10 falsi positivi (su 100, o su 1000) se non altrimenti specificato, si deve intendere come circa 10 falsi positivi.

Se si parla di probabilità la parola giusta è circa, e non "al massimo" o "al minimo".

Lanciando una monetina numerose volte mi aspetto che la testa esca (circa) la metà delle volte.

Non lo so se la mia è una critica esagerata e se sto diventando più pignolo di Erasmus. Il fatto è che stabilire un valore medio è molto più semplice che stabilire un valore limite. Facciamo proprio il caso di una monetina, non c'è alcuna difficoltà ad accettare che il valore medio delle uscite di croce dovrebbe essere circa la metà del numero dei lanci. Ma su 10 lanci potrebbero anche uscire 10 croci, non è un evento impossibile, è solo un evento un po' raro e possiamo anche calcolare la probabilità che questo avvenga (P = 1/2^10). Questo significa che se ripetessimo per 2^10 (1024) volte il lancio di 10 monetine ci aspetteremmo che mediamente una volta escano 10 croci di fila.

Ma che utilità potrebbe avere sapere che su 1024 test ce ne potrebbe essere uno il cui risultato è di 10 croci? Se il medico o il ricercatore deve fare un unico test?

Insomma è utile sapere il valore medio, che si può definire in modo chiaro, mentre un risultato "al massimo" non ha molto senso.

Potrebbero anche uscire 20 croci di seguito con il lancio di 20 monetine, e mediamente una volta su 1.048.576 questo succede. E allora qual è il limite massimo dell'uscita delle croci? 10 o 20 volte di seguito?

Per me l'affidabilità di un test dovrebbe indicare la percentuale media dei possibili errori, magari distinguendo tra falsi positivi e falsi negativi, anche se in realtà cosa facciano veramente i medici non lo so mica. :D

:hello:

Erasmus 27-02-19 16:32

Re: una curiosità sulla statistica
 
Cerco di spiegare perché, secondo me, ha ragione il medico a pensare che se il tewsrt è positivo e l'affidabilità del test è tot% tu hai la stessa probabilità di essere malato!
a) Nel quiz si parte da un dato (non discutibile in quanto proprio "ipotesi" data in premessa) che la percentuale dei malati (e quindi – anche se sottinteso – la percentuale di malati nel campione statistico su cui avviene il test) è 1%. Ma non conta il numero! Conta che per ipotesi si sa la percentuale di malati di quella malattia "endemica" (cioè - diffusa pressochè unudformemente "nel popolo").
Ma come è possibile questo? Se esiste un test che ha affidabilità 100% (o molto prossima al 100%) allora si può sapere (supposto che siano sufficientemente numerosi e casuali gli individui diagnosticati) la percentuale di malati, se no non è possibile!
Mettiamoci nelle brache del medico: è lui che sa che le diagnosi fatte con le macchine che lui conosee non sono infallibili! E supponiamo, allora, che sappia che quelli che vengono a farsi diagnosticare hanno il 90% di probabilità di essere nelle condizioni segnalate dal test.
Ovviamente il medico si occupa di curare i malati e di prevenire l'ammalarsi dei sani!
Quindi , in mancanza di altre informazioni, fa bene ad accettare la percentuale di affidabilità come probabilità di conoscenza della salute del diagnosticato ... anche perchè:
b) Non è in pratica accettabile l'ipotesi che si sappiua in partenza qual è la percentuale di ammalati gtra quanti si sottomettono al tewst!
• Se TUTTI costoro (e non solo pochi di essi) non sanno assolutamente se sono o no ammlati, allora ila condizione testata non è aaffatto una malattia! In pratica non è così: o uno sente di non star del tutto bene, o un medico con soli rilievi "clinici" (senza alcun preciso test) sospetta che il sottoposto alla sua "visita medica" è malato e gli consiglia il test (come diagnosi "oggettiva"), o la malattia è "epidemica", ossia con percentuale di malati (e di gravi conseguenze della malattia) tanto alte da preoccupare anche chi non percepisce alcun sintomo (ad essa relativo). E dunque non è applicabile querl metodo dtstistico (di astromauh, meta e Planezio).
• Di solito va a farsi fare il test chi sospetta di essere malato o chi vuole prevenire la malattia. Quindi esiste, anche se incerto e per niente oggettivo, un qualche precedente "test" a quello al quale vas a sottomettersi chi della propria salute vuol sapere di più! E in conclusione nella pratica capita – purtroppo! – SEMPRE che la percentuale di malati tra quanti vanno a farsi fare il test sia ben maggiore della percentuale di malati sull'intera popolazione.
Occhio: se la percentuale di malati trta chi va a farsi fare il test è "maggiore o uguale) a 50% (e quindi a priori uno che va a fafrsi fare il test sa che ha probabilità non minore del 50% di essere ammalato, anche la percentuale di positivi è non minore della percentuale di negativi (e tuttavia non maggiore della percentuale di veri ammalati).
Insomma: se dopo una PET (Positron Emission Tomography) ai polmoni il medico mi dice che, purtoppo, la PET segnala che ho un tumore polmonre e che però non è ceto che ce l'abba davvero perché in generaler quel che mostrano le PET nel 10% dei casi è dovuto a cause diverse dalla presenza di neoplasie, io mi convinco che con probabilità 90% io sono affetto da tumore polmonare. E credo a questa percentuale perché il medico mi ha mandato a farmi fare la PET dopo che io mi sono rivolto a lui perché sentivo qualcosa che non va ai polmoni e dopo avermi visitato rilevando qualcosa di molto sospetto!
Siccome la PET è un esame molo costoso in sè – pert per la "sanità" pubblica se rientra nei servizi da essa offerti e/o pewr il diagnosticato se deve sobbarcarsi a pagarne il costo – succede proprio che la percentuale di veri ammalati di tumore tra i diagnosticati è davvero molto elevata! Meglio dunque credere di essere "molto probabilmente" malato ( ma non "certamente" perché ... "Spes ukltima dea!") che pernsdare che, siccome la percentuale di ammalati di tumore è decisamente inferiore al 10% della popolazione, la probabilità di avere un tumore, nonostante l'ewsito "positivo" della PET, non aRRIVA AL 50%
–––
:hello:

Mizarino 27-02-19 17:27

Re: una curiosità sulla statistica
 
Quote:

Erasmus (Scrivi 829548)
Non sono affatto d'accordo!
E vorei sapere il parere di Miza e di aspesi (dato che in statistica io sono pittosto scarso!)

Già!
Anche io sono scarso in statistica, ma tu hai in aggiunta la peculiare virtù di complicare le cose semplici.
Il metodo di Planezio, a parte eventuali "errori di sbaglio" che non ho controllato, è perfetto, perché è al contempo inoppugnabile e semplice da capire, perché sostituisce la variabile astratta "probabilità" con quella concreta "frequenza numerica".

Si suppone per ipotesi del quiz (e vale anche per rispondere ad alcune perplessità di meta) che il test dia una uguale percentuale (10%) di falsi positivi e di falsi negativi. Vale a dire che su 100 persone sane sottoposte al test, 10 risulteranno malate, mentre su 100 persone malate sottoposte al test, 10 risulteranno sane.

Si abbia allora un campione di 100mila persone. Di queste (per ipotesi del quiz) 1000 sono malate e 99000 sane.
Le 1000 malate, sottoposte al test, daranno 100 esiti negativi e 900 esiti positivi.
Le 99000 sane, sottoposte al test, daranno 9900 esiti positivi e 89100 esiti negativi.

Avremo quindi un totale di 10800 esiti positivi, di cui però solo 900 corrispondono a veri malati. Si ha allora che la probabilità che il soggetto positivo al test sia davvero malato è 900/10800 = 8.33%

Per contro, in caso di esito negativo del test, la probabilità che il soggetto sia invece malato è 100/89200 = 0.112%

I discorsi di Astromauh sul "circa" 10% sono altre inutili leziosità.
La soluzione accademica del problema è quella qui sopra e non ci piove.

Il "circa" viene casomai dopo, ovvero se si presentasse davvero un caso corrispondente al problema, immaginando di confrontare i risultati ottenuti con quelli di un altro test che fosse assolutamente infallibile, potremmo ovviamente avere delle frequenze effettive, sia di malati che di falsi positivi o negativi che si discostano leggermente dai valori attesi.

aspesi 27-02-19 17:39

Re: una curiosità sulla statistica
 
Quote:

Erasmus (Scrivi 829581)
• Di solito va a farsi fare il test chi sospetta di essere malato
–––
:hello:

Questo è il punto su cui concordo con la tua analisi.

Bayes (e il relativo risultato che si ottiene) va bene se il test fa parte di una campagna di screening su gruppi di popolazione (es. test sangue occulto nelle feci, mammografia di prevenzione, ecc...) e anche se il test viene fatto su un individuo preso a caso dalla popolazione di cui si conosce l'incidenza endemica media per quella malattia.
Non va invece bene se l'individuo che si sottopone al test appartiene ad un gruppo critico di persone fra cui quella malattia si sospetta abbia un'incidenza maggiore (per fattori genetici o ereditari, perché era già stato ammalato, è stato curato e potrebbe esserci recidiva, perché si è rivolto al medico di famiglia che, visitandolo, sospetta possa trattarsi di quella malattia, di cui manifesta i sintomi, ecc...)

:hello:

astromauh 27-02-19 19:36

Re: una curiosità sulla statistica
 
Quote:

Mizarino (Scrivi 829582)
I discorsi di Astromauh sul "circa" 10% sono altre inutili leziosità.
La soluzione accademica del problema è quella qui sopra e non ci piove.

Il circa non c'entra con il problema, rispondevo a meta che parlava di "al massimo". Se non viene specificato nulla e si esprime una percentuale questa va intesa come circa.

OK, il problema si può risolvere anche alla maniera di Planezio, che non aveva sbagliato nulla perché i veri malati risultati positivi al test erano 9 e non 10 come diceva Erasmus, però io preferisco utilizzare le probabilità che nei calcoli possono risultare più comode se i dati del test non sono delle cifre "tonde" come in questo caso.

:hello:

Planezio 28-02-19 14:31

Re: una curiosità sulla statistica
 
Forse i quiz è tato frainteso.
Non è un trattato di medicina, non è un suggerimento a persone che rientrino da paersi a rischio sul come comportarsi ed interpretare (eventuali) risultati.
Parla di malattie perché (immagino) è la prima cosa venuta in mente all'estensore, forse quella più facilmente "visualizzabile" potrebbe parlare di mele avariate nel cesto o statistiche del gratta e vinci.i.
E' semplicemente un modo per suggerire come approcciare ed interpretare dati statistici oggettivamente e non in base a preconcetti.
Comunque le argomentazioni che ne sono nate mi hanno parecchio divertito.
Bene.


Tutti gli orari sono GMT. Attualmente sono le 10:48.

Powered by vBulletin versione 3.6.7
Copyright ©: 2000 - 2020, Jelsoft Enterprises Ltd.
Traduzione italiana a cura di: vBulletinItalia.it