Test de la Moyenne et Mycostats

 

à lire au préalable

Résumé express
Les conclusions du test

Généralités simplifiées à propos du test de la moyenne
Exemple pratique commenté

mycostats : premiers pas

 


A lire au préalable

En statistiques, le concept de test d'hypothèses est loin d'être une notion facile car il suppose une bonne maitrise des concepts du calcul statistiques.

Pourtant c'est un procédé que de nombreux mycologues croient comprendre et savoir utiliser intuitivement. Ils sont dupés par le vocable fallacieux "coefficient de confiance" qui est une locution on ne peut plus mal choisie comme on le verra plus loin !.

 Nous avons essayé, dans les lignes qui suivent, de simplifier ces notions au maximum afin de les rendre accessible à tous. Pour plus de détails, on pourra se reporter utilement aux notions de "Statistiques pour Mycologue" qui ont été postées sur le forum Mycomètre.


Résumé express


Problème :
vous disposez s'une série de mesures que vous désirez comparer à une donnée type ou à d'autres mesures

Comparaison d'un échantillon à une valeur
ex : comparer les résultats d'un ensemble de mesures à la moyenne d'une espèce possible
 entrer  :

- le nombre de mesures, leur moyenne et leur écart-type
- entrer la moyenne de l'espèce type  supposée


Comparaison de deux échantillons
ex : comparer les mesures de deux échantillons différents

 entrer  pour chaque échantillon :

- le nombre de mesures, leurs moyennes et leur écart-types


 = >   la fenêtre inférieure affiche immédiatement les résultats numériques du test et les commentaires associés


     Les conclusions

 


        2 possibilités :

L'hypothèse H0 est rejetée. Le test est Significatif  :
                Les différences observées ne sont pas dues au seul hasard et sont "significativement différentes".

L'hypothèse  H0 n'est pas rejetée. Le test n'est pas significatif :
                    Les  différences observées sont peut être dues au hasard de l'échantillonnage (mais il ne faut pas en déduire pour autant que les moyennes sont les mêmes !)


Généralités simplifiées à propos du test de la moyenne

           

Le problème classique du mycologue débutant est le suivant :

"Je dispose d'un échantillon de N mesures de longueurs de spores et j'ai calculé la moyenne et l'écart-type de cet échantillon (à la main, calculette, etc...).

Puis-je dire que ces mesures sont les mêmes que celles obtenues par l'auteur ? "

Ne rêvons pas : sauf cas très particulier, les tests statistiques ne permettent jamais d'affirmer, comme on l'entend souvent, "qu'il y a 95% de 'chances' pour que les dimensions soient semblables" ou "comprises entre telle et telle borne".

Le calcul statistique ne permet de calculer qu'un risque.

Il y a deux sortes de risques :

a/ le risque d'écarter une hypothèse alors qu'elle est vraie ( risque "alpha")

b/ le risque d'accepter l'hypothèse contraire, alors que la première est vraie (risque "beta")

Contrairement à un idée répandue, ces deux risques ne sont absolument pas complémentaires (nous ne développerons pas ici cette notion délicate).

Il est important de savoir au départ quel risque l'on choisit. Le risque qui intéresse le mycologue est le risque Beta (c'est à dire ne pas vouloir a priori que l'espèce déterminée soit bien" la bonne", sans aller plus loin dans les investigations), qui est justement le plus difficile à calculer.

Le risque Beta dépend du risque alpha choisi au départ. Pour calculer le risque Beta, il faut aussi connaître au préalable la "règle du jeu", c'est à dire la loi de distribution de la population. Malheureusement, on ne connaît généralement pas la loi de distribution de l'échantillon (la retrouver est encore plus délicat que chercher la réponse à la question posée ci-dessus).

Par contre on connaît la distribution de la Moyenne qui est approximativement, lorsque l'échantillon est assez grand, une loi de Laplace-Gauss dite "Loi Normale".

On n'a pas, pour autant, le droit de comparer des mesures avec des moyennes. Il s'agit de deux populations absolument différentes (la preuve étant qu'elles n'ont pas la même loi de distribution ), même si les unités de mesures sont identiques, ce qui est encore plus fallacieux ( cela s'appelle "mélanger les serviettes et les torchons").

On peut donc, faute de pouvoir comparer directement et facilement les échantillons, comparer les moyennes connues entre elles. Précisons aussi que l'échantillonnage des spores mesurées doit avoir été fait "honnêtement", sans aucun tri d'aucune sorte : on doit mesurer systématiquement toutes les spores qui sont présentes, sauf celles qui sont manifestement mutilées.

Calcul du risque beta

Nous avons vu que le calcul du risque beta n'est pas élémentaire pour un non statisticien. Mycostats permet de l'obtenir sans aucun effort, sous certaines hypothèses (de Normalité pour l'instant). Il est aussi à noter que nous ne connaissons aucun autre logiciel qui fournisse ce résultat.

Hypothèses :

Dans le cas du test de la moyenne, il faut connaître, en principe, les deux moyennes à comparer et leurs écart-types. Mais, très souvent, on ne connaît de la population modèle que sa moyenne ou même qu'un intervalle indicatif.

Les cas de figure qui peuvent se présenter au mycologue sont :

a. on ne connaît que la moyenne de l'espèce type

 C'est le test par défaut de Mycostats ( "Echant/Type")

b. on ne connaît qu'un intervalle type : on peut essayer de prendre le risque (encore un !) de prendre pour moyenne le centre de l'intervalle et de procéder comme au a). Si la distribution de l'espèce type est symétrique, l'approximation peut être suffisante.

On est ramené au cas précédent

cas particulier : on connait l'écart-type estimé de la moyenne : cocher l'option correspondante dans le test "Echant/Type"

c. Si l'auteur de la récolte de référence a bien précisé la moyenne et l'écart-type estimé de l'échantillon

On choisira, dans Mycostats, le test "2 échantillons".


Exemple traité avec Mycostats[1]


Nb : Dans un premier temps, on gardera les options par défaut.

Ouvrir Mycomètre  (version demo ou pro)

Presser le bouton Mycostats 

Choisir dans la barre de menu  tests / moyenne

Un exemple de données s'affiche automatiquement.

(on ignorera la donnée "colonne" qui permet d'entrer automatiquement les données issues de la mesure avec Mycomètre).

 

Dans cet exemple, l'échantillon de 20 mesures a pour moyenne me =11,1 et pour écart-type

s =1,25.

La moyenne du type est de mt = 11,5

Le s estimé du Type n'étant pas connu ici, Mycostats doit admettre qu'il est approximativement égal à celui de l'échantillon.

On sait que me < mt : on va donc effectuer un test unilatéral (un test unilatéral est préférable pour les tests qui nous concernent. Mycostats en tient compte automatiquement).

Les hypothèses à tester sont :

H0 : "Les échantillons ont même moyenne : me =mt "

H1 : "mt est supérieure à me "

Le risque choisi par défaut pour alpha est de 5 %

Pour a= 5%, l'hypothèse H0 n'est pas rejetée.

De plus, Mycostats donne b= 9,74 % soit environ 60%

Conclusion

Au risque 5% de se tromper, on ne rejette pas l'hypothèse que "les moyennes sont identiques". Les différences observées sont peut être dues aux aléas de l'échantillonnage.

De plus, le risque de 5% étant choisi, il y a 60% de risque de se tromper si on dit que me < mt (moyennes différentes).

Attention ne pas rejeter H0 ne signifie pas qu'on l'accepte !

(Options : si on connait l'écart-type estimé de la moyenne, on cochera l'option correspondante.)

Autre essai : 

Choisissons un risque a = 10%.

Au risque a = 10%, l'hypothèse H0 est rejetée. Cela signifie que nous rejetons l'hypothèse que "les moyennes sont les mêmes", en prenant un risque 10% 'de nous tromper' (donc supérieur).

La valeur de b passe en dessous de 50% .

Mais alors, suffirait-il alors de travailler avec un risque a différent pour avoir une valeur optimale de b ?

NON ! ce serait trop simple, et c'est même le contraire, car si on observe la valeur de la puissance du test, elle est meilleure pour a =10%.

Avec les données de cet exemple, il serait difficile de conclure efficacement (rejet de l'égalité ou non, avec un certain risque)

Que faire alors ?

Refaire des mesures complémentaires (et indépendantes !) pour essayer de confirmer une des deux possibilités.

Par exemple, pour les mêmes données, a =10% et un échantillon de 100 mesures, la puissance du test monte à 97 %, avec un b de 3 %, ce qui nous amènerait à conclure qu'il faut rejeter l'hypothèse d'égalité .

Attention ! Il ne faut jamais profiter de la facilité de calcul de Mycostats pour raisonner n'importe comment :

On doit se donner au départ un risque a  ( 5 % ou 10 % sont des valeurs courantes), et on observe la valeur de b affichée.

Selon la valeur obtenue pour b , il sera peut être utile de refaire des mesures complémentaires. Si la faible valeur de b se confirme, il faudra peut être se résoudre à admettre que la moyenne de l'échantillon ne coïncide pas avec celle du type.

Si une grande valeur de b se confirme, on pourra admettre qu'il n'y a pas lieu de rejeter l'hypothèse d'égalité.

Mais il ne s'agit en aucun cas d'un test d'acceptation !

Copie le résultat du test : le bouton "copier" copie le résultat du test dans le presse papier.
Pour les autres tests de comparaison, seule diffère l'entrée de données. Les conclusions s'interprètent de la même manière.


NB : suivant le nombre de mesures, Mycostats effectue les calculs selon la loi Normale ou la loi de Student-Fisher



[1] Nb : Mycostats est un logiciel disponible librement et gratuitement sur Internet