Mycomètre  205

Février 2011

 

Précédents compléments de documentation sur « http://mycolim.free.fr/DOC_SML/mycm202/complements_Mycm_fev_2010.htm »

 

- en mode statistiques, « nuage de points »

 

Affichage de la covariance et du coefficient de corrélation r des deux listes de données affichées. Par exemple on peut chercher la corrélation entre la valeur de L et de Q  pour un ensemble de mesures de spores.

Tracé (en option) de la droite de régression. (case à cocher à droite). Les points sont d’autant mieux répartis autour de la droite de régression que r  est voisin de  1 en valeur absolue.

Option d’affichage, pour chaque point, du numéro de ligne correspondant de la grille

 

-entrée de données externes pour traitement statistique

 

*En principe il s’agit des données mesurées par Mycomètre, mais il est possible d’importer des listes de données externes. Soit des lignes  copiées dans un tableau OpenOffice ou  Excel, soit un liste au format CSV ( liste de valeurs séparées par « ; »).

                Choisir l’entrée « texte » puis presser coller ( le format des lignes de tableur est reconnu automatiquement)

                Pour les entrées de mesures, choisir la colonne désirée.

                On peut aussi éditer ou coller directement dans la zone de données.

*Entrée de lignes multiples  (les données sont alors stockées dans la grille) :

Il est possible d’entrer d’un bloc plusieurs lignes ou colonnes d’un tableur :

                Marquer et copier (Ctrl C) les données choisies dans le tableur ( maximum 6 lignes ou 6 colonnes) et Presser « table=>grille (H)» ou « table=>grille (V)»

*Noter que pour Mycomètre le séparateur décimal reconnu est soit la virgule, soit le point, ce qui simplifie notablement l’importation de telles listes.

                Exemple : 8,95; 8,88; 9,26; 10,18; 8,35; 8,84; 9,91; 9,12; 9,07; 8,59   ou  8.95; 8.88; 9.26; 10.18; 8.35; 8.84; 9.91; 9.12; 9.07; 8.59

 

-Tests statistiques 

 

Les tests ci dessous opèrent sur les données présentes dans la zone texte de la fenêtre principale (voir entrée des données)

*Test de Möls 

Permet de tester l’ homogéneité d’un distribution.

Aucun paramètre n’est à donner. On peut choisir la colonne de données à tester

 

Résultats du test :

Soit les données sont déclarées hétérogènes  au risque 1% ou 5% de se tromper, et une valeur de coupure des proposée,

Soit le test est non significatif et la population étudiée « est peut être homogène »

Attention : le non rejet de l’homogénéité ne signifie pas l’acceptation de cette hypothèse ( voir  ref ci dessous)

 

*Test de Shapiro-Wilk

Test de Normalité :

On peut choisir le niveau de risque (par défaut 5%)

Soit l’hypothèse de Normalité est rejetée ( par ex  au risque 5% de se tromper),

Soit le test est « non-significatif », ce qui ne signifie pas du tout que la popolation peut être considérée comme ‘Normale ‘ (voir remarque ci-dessus)

 

Il est possible de tester aussi l’hypothèse d’une distribution Log-Normale (cocher l’option)

 

Références :

Fannechère ,  bulletin FMBDS 198  (2010  « Le test de la moyenne »

Athanasios Papoulis,  Probability, Random Variables And Stochastic Processes - [3rd Edition]

E.Parmasto, I.Parmasto, T.Möls. Variation of Basidiospores in the Hymenomycetes and Its Significance to Their Taxonomy. Bibliotheca Mycologica, Lubrecht & Cramer Ltd, 1987

ALAN J. MILLER,  Selection of Subsets of Regression Variables   J. R. Statist. Soc. A (1984), 147,Part 3, pp. 389-425

 

-Indice de forme F

 

La question de la caractérisation des formes par des transformations de Fourier 2D ou par Ondelettes est prévu et annoncé depuis très longtemps ( voir par ex

http://mycolim.free.fr/DOC_SML/mycm202/fonctionnalites_de_Mycometre_2.04.htm).

Si l’analyse d’une forme « propre » dessinée en noir sur fond blanc ne pose pas de grosse difficulté, il n’en est pas de même pour une image microscopique affectée, en raison de la transparence, de nombreuses défauts indésirables.

Début 2010, nous avons défini et calculé un nouvel indice de forme qui constitue un petit pas en avant vers la caractérisation numérique  des spores (par exemple).

( un article sera publié sur ce sujet)

En résumé : jusqu’à présent, les seules caractérisations de la forme des spores sont les rapports Q= L/l et L=  L/e ( voir fonction mesure 2D et 3D).

L’indice  F  est indépendant de ces indices et apportent un complément d’information sur la forme de la spore.

Par exemple si on considère une ellipse et son rectangle circonscrit : ces deux formes ont la même valeur de rapport Q.

Cependant on peut les distinguer par leur indice F qui est différent.

Deux spores pourront être séparées numériquement par les indices  Q ou F (ou les deux ). L’intérêt est de permettre un tri numérique facile dans une base de données.

L’indice F est indépendant de la taille de la spore :  Deux spores homothétiques ont la même valeur de F

Calcul de l’indice F : il est nécessaire de parcourir le pourtour de la spore pour calculer F. Pour simplifier l’interface, l’indice F est calculé dans la fonction « surface/polygone auto »

 

-Extraction d’un sous-ensemble de mesures et export de la trame

Si une population apparaît être le mélange de deux sous ensembles ( par ex si les spores sont issues de basides de type différent), il est possible de les séparer pour les traiter séparément ( la différence  peut être vérifiée par le test de Möls).

Ouvrir la fenêtre « nuage de points »

Choisir une option d’encerclement (cercle ou rectangle)

Presser extraire et entourer les points souhaités

On a alors deux possibilités (menu « outils »:

Soit de sauver les données relatives à ces points au format CSV (pour édition ou traitement avec un tableur)

Soit de sauver la trame des seuls points  choisis, dans le cas de résultats de mesure avec Mycomètre.

Il est alors possible de recharger cette dernière trame dans une autre session  de Mycomètre (on peut ouvrir plusieurs sessions parallèlement)

Les données d’origine restent intactes.

Nb  l’encerclement en rectangle permet l’extraction selon un seul axe

 

- option d’affichage des longueurs sur les segments mesurés

Les options de pointage sont réarrangées dans une  nouvelle fenêtre en dessous de "A propos".

L’option "insère dim." permet d'insérer la longueur du segment mesuré à la place du numéro de ligne.

On peut changer l'option en cours de mesure.

On peut ainsi afficher les mesures sur un seul élément parmi d'autres.

(Utile avant une copie d'écran pour insister sur une spore particulière par exemple)

Une opération de retraçage (déplacement, zoom etc...) opère sur tous les éléments.

Opérationnel pour toutes les  fonctions de mesure de longueur (y compris périmètres ouverts ou auto), en mode bipoint ou Palmer, option «Poly" comprise.

Par exemple : par défaut les numéros de mesure sont affichés sur chaque segment. Cochez "insère dim." puis pressez "Retrace" : pour chaque segment la longueur s'affiche.

 

- décimales

Par défaut le nombre de décimales est optimisé automatiquement. Il est possible de le modifier : voir Options

 

- possibilité de choisir une valeur de référence décimale

(Par défaut : 10 unités, les nombres sont décimaux accepté

 

- option d'insertion du symbole micron dans la référence

 

- références obliques auto-ajustables

Par exemple, pour illustrer la longueur d'un élément :

 

Faire Outil/Illustrer/Référence orientée

Presser le bouton gauche au début du segment de référence et le maintenir jusqu'à l'extrémité de l'élément.

 Vérifier la longueur (à gauche, du bouton d'étalonnage, la longueur en cours de mesure apparait désormais  en rouge)

Relâcher le bouton, une fenêtre de dialogue s’ouvre : valider la longueur ou modifier la valeur affichée

(Dans ce dernier cas, le segment de référence aura la direction choisie et la longueur demandée)

Dans la  fenêtre suivante on pourra valider l'unité (micron par défaut), la modifier, ou choisir le symbole "micron".

Une référence strictement verticale, de longueur quelconque, s’obtient en choisissant Outil/Illustrer/Référence orientée et en pressant simplement le bouton droit au point d’insertion choisi. Longueur ad lib.

 

-amélioration du calcul du PDM

L’algorithme est inchangé, mais les calculs se font désormais en double précision.

Des messages dans la barre d'état inférieure vous guident désormais lors du calcul des PDMS .

 

- calcul de la dominante en mode "aperçu" et en mode "notation expresse"

La "Dominante" (ou "Mode») est la donnée la plus importante pour caractériser une dimension de spore.

Il est prévu depuis longtemps un article sur ce sujet (annoncé dans Bull. Soc. Mycol. Fr., 121 (3-4), p. 255-292. 2005.). L'algorithme original de Mycomètre y sera exposé.

 

La "Dominante" est en théorie la valeur la plus fréquente dans l'ensemble des données mesurées

Presque tous les mycologues confondent à tort  Dominante et Moyenne, ce qui est fort dommage.

La confusion peut exister à condition que la distribution soit symétrique (cas particulier parmi d’autres : la distribution Normale, mais faut il encore avoir fait les tests préalables pour montrer la cohérence de cette hypothèse !)

 

Le problème qui se posait pour la Dominante est qu'elle était évaluée à partir de répartition en classes (cf.  histogrammes).

Malheureusement l'utilisation de classes et d'histogrammes sur des petits échantillons (le cas du mycologue, justement) est complètement aberrante.

C'est une des raisons pour laquelle j'ai abandonné la représentation systématique de l’histogramme lorsque Mycomètre est passé de la version 1 à la version 2 . La représentation par diagramme proposée est une bien meilleure représentation de la réalité.

(à titre d'essai, sur un échantillon de données, lancez Mycostats, Nuage de points puis Histogramme et faites varier le nombre de classes : le résultat est édifiant !)

 

Diverses raisons à cela :

Tout d'abord, il est d'usage, en statistiques, de ne travailler que sur des classes  d'effectif supérieur à 5  (certains ont peut être encore quelques souvenirs.)  Même en choisissant un nombre très réduit de classes (difficile de  descendre en dessous de 5 classes !) il est rarement possible de respecter cette condition.

Dans le cas des petits échantillons, le point de départ et la largeur des classes peut faire en sorte que la zone où les valeurs sont les plus denses (justement celle que l'on cherche) se trouve coupée en deux.  Ainsi la classe d'effectif maximal cherchée disparait.

Il suffit d'ajouter une seule valeur un peu à l'extérieur de l'ensemble des données pour que le résultat change complètement.

Les essais de calculs avec Excel sur des petits échantillons ont montré que la plupart du temps soit le résultat était stupide, soit Excel  n'arrivait pas à calculer le mode.

Il est fort à parier qu’Excel travaille classiquement avec des classes.

 

L'algorithme imaginé pour Mycomètre est totalement différent  et est totalement insensible aux points erratiques.

Il permet aussi de calculer très facilement les modes secondaires des distributions multimodales.

C'est pourquoi j'ai utilisé la définition de PDM (Point de Densité Maximale)  pour le distinguer du "Mode" habituel.

Pour les échantillons de grande taille, le PDM coïncide exactement avec le Mode.

Seul le PDM est valide pour des petits échantillons (en théorie 'seulement', l'algorithme de Mycomètre sait évaluer le PDM à partir de 2 données !).

 

- nouvelle notation par défaut

 

Une nouvelle notation est donc proposée, en abrégé  : « dMd  » ( décile 1, Mode, décile9 , ces trois données non paramétriques étant les plus importantes pour caractériser une dimension de spore... à noter d’ailleurs que la notation proposée à l'aide des déciles commence à apparaître dans les publications ... merci aux auteurs !)

 

C'est désormais la notation par défaut (en fait je n'avais pas eu le temps de l'installer auparavant !).

Vous pouvez toujours utiliser les autres notations (voir Options, choix : D1,9 / D1,5,9 / M+/- sigma / M+/- 2 sigma  et enfin ' décile, Dominante')

 

- Notation Flash

Le bouton de notation flash (à droite de « aperçu) enregistre directement dans le presse papier le résultat des données selon  la notation choisie.

Si le nombre de mesures est insuffisant pour calculer D1 et D9 (moins de 12 mesures), c’est la notation  m+/-sigma qui est prise par défaut.

 

- répertoire de sauvegarde par défaut du fichier CSV (suite à la demande judicieuse de F. Valade)

 

Désormais  le répertoire de sauvegarde proposé pour le fichier CSV est le répertoire de l'image active.

Outre le cas élémentaire où une seule image est chargée, si plusieurs images sont présentes dans le chargeur,  le répertoire proposé est celui de l'image en cours de traitement.

 

- Fenêtres mobiles

Désormais les  petites fenêtres (grilles, aperçu etc..) sont mobiles ( avec la souris cliquer dans une zone vierge et tirer à l’endroit souhaité).

 

-Fichiers de langues

 Les fichiers de langues ont été revus et certaines lacunes corrigées

 

- Fonctions nouvelles : Mesure d’angles et de surfaces

 

Fonction « Surface »

Pour les raisons évoquées ci-dessus, la mesure d’une  surface quelconque  s’effectue par approximation polygonale . La mesure automatique est toujours en projet.

Sous menus

*Triangle

                Placer le sommet du triangle puis les 2 autres extrémités.

Mycomètre retourne la surface, le périmètre et l’angle au sommet

*polygone auto

                Placer un point au centre de la forme d’ou l’on peut voir tous les points du pourtour ( si un tel point n’existe pas, la surface sera dite  non-observable)

                Parcourir le périmètre de la surface à mesurer (le pourtour de la spore par exemple) par des points d’autant plus rapprochés que le rayon de courbure est petit.

                Fermer le polygone d’approximation en cliquant sur le bouton droit.

Mycomètre retourne

                La surface, le périmètre, le rayon moyen (cf Hadwiger), l’indice de forme F

*polygone ouvert

                On opère comme  le polygone auto, mais, si nécessaire,  il faut fermer le polygone en  marquant à nouveau le premier point.

 

-Divers « gadgets »

 

Dans le menu Outils/illustrer il est possible de choisir la police pour les illustrations

Noter que :

On peut changer de police sur chaque ligne de texte

Le choix de la police opère sur les numérotations mais pas sur les indications de longueur des segments

 

-Boutons « sauve écran » et « Rappel écran »  ( à gauche de mode MC)

 

Ces bouton facilitent la confection d’écrans illustrés :

A chaque ajout d’illustration, presser « Sauve écran »

En cas d’erreur, « Rappel écran »  récupérera l’écran précédent.

Attention : l’écran récupéré n’est pas un écran de mesure, mais seulement un écran d’édition.

Pour reprendre les mesures il est nécessaire de rafraichir l’écran de travail.

Pour cela presser « retrace », ou cliquer dans la vignette de centrage ou presser Z1, Z+ ou Z-.

NB : cette fonction n’a pas été longtemps testée. Me signaler tout conflit éventuel.

 

Remarques

-Si vous trouvez une fonction que je n’aurais pas décrite (c’est fort possible car je rédige a posteriori !), veuillez m’en faire part

- Si une amélioration vous semble urgente, faites m’en part, elle est peut être déjà prévue au cahier des charges.

- D’autres tests statistiques sont prévus. Je choisi les priorités en fonction de mes propres besoins !

rappel : chargement sur http://mycolim.free.fr/DOC_SML/mycm202/Charg_Mycm202.htm