Prova della media e Mycostats

traduction Systran

 

Leggi prima

 

Riassunto espresso
Le conclusioni della prova
Generalità semplificate a proposito della prova della media
Esempio pratico commentato

mycostats : premiers pas

 

Leggi prima

 

            In statistica, il concetto di verifica delle ipotesi è ben lungi da un concetto semplice e che richiede una buona padronanza dei concetti di calcolo statistico.

Eppure è un processo che Micologi molti credono a comprendere e utilizzare intuitivamente sapere. Essi sono stati ingannati dal termine fuorviante "coefficiente di fiducia" è una frase che non potrebbe essere più mal scelto come discusso sotto!.

Abbiamo provato, nelle linee che seguono, a semplificare queste nozioni al massimo allo scopo di renderle accessibili a tutti.

Per ulteriori dettagli, ci si potrà riferire utilmente ai concetti di "statistiche per Mycologue" che sono stati inviati sulla tribuna Mycomètre.



Riassunto espresso


Problema :
vi disporte una serie di misure che desiderate comparare ad un dato tipo o ad altre misure

Raffronto di un campione ad un valore
es: comparare i risultati di un insieme di misure con la media di una specie possibile
 entrare  :

- il numero di misure, la loro media ed il loro scarto tipo
- entrare la media della specie tipo  supposta


Raffronto di due campioni
es: comparare le misure di due campioni diversi

 entrare  per ogni campione:

- il numero di misure, le loro medie e la loro divergenza-tipo


 = >   la finestra inferiore pubblica immediatamente i risultati digitali della prova ed i commenti associati


    

Le conclusioni


        2 possibilità :

L'ipotesi H0 è respinta. La prova è significativa  :
                Le differenze osservate non sono dovute alla sola occasione e sono "significativamente diverse".

L'ipotesi H0 non è respinta. La prova non è significativa :
      Le differenze osservate sono può essere dovute all'occasione del campionamento (ma non occorre dedurne per altrettanto che le medie siano le stesse !)



Generalità semplificate ad opinione della prova della media

Il problema classico del mycologue iniziale è il seguente:

"Dispongo di un campione di N misure di lunghezze di spore ed ho calcolato la media ed il scarto tipo di questo campione (alla mano, calculette, ecc...)."

Quindi dire cosa queste misure sono stesse soltanto quelle ottenute dall'autore?

Non sogniamo: eccetto caso molto particolare, le prove statistiche non permettono mai di affermare, come lo intende spesso, "che c'è il 95% 'di possibilità 'perché le dimensioni siano simili" o "comprese tra tale e tale terminale".

Il calcolo statistico permette di calcolare soltanto un rischio.

Ci sono due tipi di rischi:

a/il rischio di allontanare un'ipotesi allora che è vera (rischio "alfa")

b/il risque di accettare l'ipotesi contraria, allora che la prima è vera (rischio "beta")

Contrariamente ad un'idea diffusa, questi due rischi non sono assolutamente complementari (non svilupperemo qui questa nozione delicata).

È importante sapere alla partenza quale rischio si la sceglie. Il rischio che interessa il mycologue è il rischio beta (è da dire non di volere a priori che la specie determinata sia bene "la buona", senza andare più lontano nelle indagini), che è precisamente difficile da calcolare.

Il rischio beta dipende dal rischio alfa scelta alla partenza. Per calcolare il rischio beta, occorre anche conoscere al preliminare la "regola del gioco", è da dire la legge di distribuzione della popolazione. Purtroppo, non si conosce generalmente la legge di distribuzione del campione (trovarla è ancora più delicata che cercare la risposta alla domanda posta sopra).

Con contro si conosce la distribuzione della media che è approssimativamente, quando il campione è abbastanza grande, una legge di Laplace-Gauss detta "legge normale".

Non si ha, peraltro, il diritto di comparare misure con medie. Si tratta di due popolazioni assolutamente diverse (essendo la prova che non hanno la stessa legge di distribuzione), anche se le unità di misure sono identiche, cosa che è ancora più fallace (ciò si chiama "mescolare gli asciugamani ed i panni").

Si può dunque, difetto di potere comparare direttamente e facilmente i campioni, comparare le medie conosciute tra esse. Precisiamo anche che il campionamento delle spore misurate deve essere stato fatto "onestamente", senza alcuna selezione di nessun tipo: si devono misurare sistematicamente tutte le spore che sono presenti, eccetto quelle che sono ovviamente mutilate.

Calcolo del rischio beta

Abbiamo visto che il calcolo del rischio beta non è elementare per un non statistico. Mycostats permette di ottenerlo senza alcuno sforzo, in alcune ipotesi (di normalità per il momento). Si nota anche che non conosciamo alcun altro software che fornisca questo risultato.

Ipotesi:

Nel caso della prova della media, occorre conoscere, in linea di massima, le due medie da comparare ed i loro divergenza-tipi. Ma, molto spesso, si conosce della popolazione modello soltanto la propria media o anche soltanto un intervallo indicativo.

Le alternative che possono presentarsi al mycologue sono:

a. si conosce soltanto la media della specie tipo 

 È la prova per difetto di Mycostats ("Echant/Type")

b. si conosce soltanto un intervallo tipo: si può provare a prendere il rischio (ancora uno!) di prendere per media il centro dell'intervallo e procedere come al a). Se la distribuzione della specie tipo è simmetrica, l'approssimazione può essere sufficiente.

Si riporta al caso precedente

caso particolare: connait il scarto tipo stimato della media : intaccare l'opzione corrispondente nella prova "Echant/tipo"

c. Se l'autore del raccolto di riferimento ha bene precisato la media ed il scarto tipo stimato del campione

Si sceglierà, in Mycostats, la prova "2 campioni".


Esempio trattato con Mycostats[1]


Nb: Inizialmente, si conserveranno le opzioni per difetto.

Aprire Mycomètre  (versione demo o pro)

Premere il bottone Mycostats 

Scegliere nella sbarra di piccole  prove/media

Un esempio di dati si pubblica automaticamente.

alt=fig1 border=0>

(si ignorerà il dato "colonna" che permette di entrare automaticamente i dati derivati dalla misura con Mycomètre).

alt=fig2 border=0>

 

In quest'esempio, il campione di 20 misure ha per media me = 11,1 e per scarto tipo

s = 1,25.

La media del tipo è dile TA = 11,5

Non essendo il s stimato del tipo non conosciuto qui,

Mycostats deve ammettere che è approssimativamente uguale a quello del campione.

Si sa che me < mt : dunque si effettuerà una prova unilaterale (una prova unilaterale è preferibile per le prove che le riguardano. Mycostats ne tiene conto automaticamente).

Le ipotesi da provare sono:

H0: "I campioni hanno anche media : me =mt"

H1: "mt è superiore alle me"

Il rischio scelto da difetto per alfa è 5%

alt=fig3>

Per a= 5%, l'ipotesi H0 non è respinta.

Inoltre, Mycostats dà b= 59,74% cioè circa 60%

Conclusione

il rischio 5% di fuorviarsi, non si respinge l'ipotesi che "le medie sono identiche". Le differenze osservate sono può essere dovute ai rischi del campionamento.

Inoltre, essendo il rischio di 5% scelto, c'è il 60% di rischio di fuorviarsi se si dice che me < mt (medie diverse).

Attenzione non respingere H0 non significa che si accetta!

(Opzioni: se connait il scarto tipo stimato della media, si intaccherà l'opzione corrispondente.)

 

Altra prova : 

Scegliamo un rischio a = 10%.

il rischio a =10%, l'ipotesi H0 è respinta. Ciò significa che noi polloni l'ipotesi che "le medie sono le stesse", prendendo un rischio 10% 'di fuorviarle '(dunque superiore).

alt=fig4>

Il valore di b passa al di sotto del 50%.

Ma allora, basterebbe -il allora lavorare con un rischio a diverso per avere un valore ottimale di b ?

NON! sarebbe troppo semplice, ed è anche l'opposto, poiché se si osserva il valore della potenza della prova, è migliore per a =10%.

Con i dati di quest'esempio, sarebbe difficile concludere efficacemente (rifiuto dell'uguaglianza o no, con un certo rischio)

Cosa fare allora?

Rifare misure complementari (ed indipendenti!) per provare a confermare una delle due possibilità.

alt=fig6 border=0>

alt=fig5 border=0>

Ad esempio, per gli stessi dati, a =10% ed un campione di 100 misure, la potenza della prova monta a 97 %, con  bdel 3 %, e questo le indurrebbe a concludere che occorre respingere l'ipotesi d'uguaglianza.

Attenzione ! Non occorre mai approfittare della facilità di calcolo di Mycostats per ragionare comunque:

Ci si deve dare alla partenza un rischio ha  (5% o 10% sono valori correnti), e si osserva il valore di b pubblicato.

Secondo il valore ottenuto per b, sarà può essere utile rifare misure complementari. Se il debole valore di bsi conferma, occorrerà può essere risolversi ad ammettere che la media del campione non coincide con quella del tipo.

Se un grande valore di bsi conferma, si potrà ammettere che non vi occorre respingere l'ipotesi d'uguaglianza.

Ma non si tratta in alcun caso di una prova d'accettazione!

Copia il risultato della prova: il bottone "copiare" copia il risultato della prova in preme carta.
Per le altre prove di raffronto, sola differisce l'entrata di dati. Le conclusioni si interpretano nello stesso modo.


NB : selon le nombre de mesures, Mycostats effectue les calculs selon la loi Normale ou la loi de Student-Fisher



[1] NB: Mycostat software è disponibile gratuitamente su Internet