Mycomètre 205
Février 2011
Précédents compléments de
documentation sur
« http://mycolim.free.fr/DOC_SML/mycm202/complements_Mycm_fev_2010.htm »
- en mode statistiques, « nuage de points »
Affichage de la covariance et
du coefficient de corrélation r des deux listes de données
affichées. Par exemple on peut chercher la corrélation entre la valeur de L et
de Q pour un ensemble de mesures de
spores.
Tracé (en option) de la
droite de régression. (case à cocher à droite). Les
points sont d’autant mieux répartis autour de la droite de régression que r est voisin de 1 en valeur absolue.
Option d’affichage, pour
chaque point, du numéro de ligne correspondant de la grille
-entrée de données externes pour traitement statistique
*En principe il s’agit des données
mesurées par Mycomètre, mais il est possible
d’importer des listes de données externes. Soit des lignes copiées dans un tableau OpenOffice
ou Excel, soit un liste au format CSV ( liste de valeurs séparées par « ; »).
Choisir l’entrée « texte » puis presser
coller ( le format des lignes de tableur est reconnu
automatiquement)
Pour les entrées de mesures, choisir la colonne
désirée.
On peut aussi éditer ou coller directement dans la
zone de données.
*Entrée de lignes multiples (les données sont alors
stockées dans la grille) :
Il est possible d’entrer d’un
bloc plusieurs lignes ou colonnes d’un tableur :
Marquer et copier (Ctrl C) les données choisies dans le
tableur ( maximum 6 lignes ou 6 colonnes) et Presser
« table=>grille (H)» ou
*Noter que pour Mycomètre le séparateur décimal reconnu est soit la
virgule, soit le point, ce qui simplifie notablement l’importation de telles
listes.
Exemple : 8,95; 8,88; 9,26; 10,18; 8,35; 8,84; 9,91; 9,12; 9,07;
8,59 ou
8.95; 8.88; 9.26; 10.18; 8.35; 8.84; 9.91; 9.12; 9.07; 8.59
-Tests statistiques
Les tests ci dessous opèrent
sur les données présentes dans la zone texte de la fenêtre principale (voir
entrée des données)
*Test de Möls
Permet de tester l’ homogéneité d’un distribution.
Aucun paramètre n’est à
donner. On peut choisir la colonne de données à tester
Résultats du test :
Soit les données sont
déclarées hétérogènes au risque 1% ou 5%
de se tromper, et une valeur de coupure des proposée,
Soit le test est non
significatif et la population étudiée « est peut être homogène »
Attention : le non rejet
de l’homogénéité ne signifie pas l’acceptation de cette hypothèse ( voir ref ci dessous)
*Test de Shapiro-Wilk
Test de Normalité :
On peut choisir le niveau de
risque (par défaut 5%)
Soit l’hypothèse de Normalité
est rejetée ( par ex
au risque 5% de se tromper),
Soit le test est
« non-significatif », ce qui ne signifie pas du tout que la popolation peut être considérée comme ‘Normale ‘ (voir
remarque ci-dessus)
Il est possible de tester
aussi l’hypothèse d’une distribution Log-Normale (cocher l’option)
Références :
Fannechère , bulletin FMBDS 198 (2010
« Le test de la moyenne »
Athanasios Papoulis, Probability, Random Variables And
Stochastic Processes - [3rd Edition]
E.Parmasto,
I.Parmasto, T.Möls. Variation
of Basidiospores in the Hymenomycetes
and Its Significance to Their Taxonomy. Bibliotheca Mycologica, Lubrecht &
Cramer Ltd, 1987
ALAN J. MILLER, Selection of Subsets of Regression
Variables J. R. Statist. Soc. A (1984), 147,Part 3, pp. 389-425
-Indice de forme F
La question de la
caractérisation des formes par des transformations de Fourier 2D ou par
Ondelettes est prévu et annoncé depuis très longtemps ( voir
par ex
http://mycolim.free.fr/DOC_SML/mycm202/fonctionnalites_de_Mycometre_2.04.htm).
Si l’analyse d’une forme
« propre » dessinée en noir sur fond blanc ne pose pas de grosse
difficulté, il n’en est pas de même pour une image microscopique affectée, en
raison de la transparence, de nombreuses défauts
indésirables.
Début 2010, nous avons défini
et calculé un nouvel indice de forme qui constitue un petit pas en avant vers
la caractérisation numérique des spores
(par exemple).
( un article sera publié sur ce sujet)
En résumé : jusqu’à
présent, les seules caractérisations de la forme des spores sont les rapports
Q= L/l et L= L/e (
voir fonction mesure 2D et 3D).
L’indice F est
indépendant de ces indices et apportent un complément d’information sur la
forme de la spore.
Par exemple si on considère
une ellipse et son rectangle circonscrit : ces deux formes ont la même
valeur de rapport Q.
Cependant on peut les
distinguer par leur indice F qui est différent.
Deux spores pourront être
séparées numériquement par les indices Q
ou F (ou les deux ). L’intérêt est de permettre un tri
numérique facile dans une base de données.
L’indice F est indépendant de
la taille de la spore :
Deux spores homothétiques ont la même valeur de F
Calcul de l’indice F :
il est nécessaire de parcourir le pourtour de la spore pour calculer F. Pour
simplifier l’interface, l’indice F est calculé dans la fonction
« surface/polygone auto »
-Extraction d’un sous-ensemble de mesures et export de la trame
Si une population apparaît
être le mélange de deux sous ensembles ( par ex si les
spores sont issues de basides de type différent), il est possible de les
séparer pour les traiter séparément ( la différence peut être vérifiée par le test de Möls).
Ouvrir la fenêtre
« nuage de points »
Choisir une option d’encerclement
(cercle ou rectangle)
Presser extraire et entourer
les points souhaités
On a alors deux
possibilités (menu « outils »:
Soit de sauver les données
relatives à ces points au format CSV (pour édition ou traitement avec un
tableur)
Soit de sauver la trame des
seuls points choisis, dans le cas de
résultats de mesure avec Mycomètre.
Il est alors possible de
recharger cette dernière trame dans une autre session de Mycomètre (on
peut ouvrir plusieurs sessions parallèlement)
Les données d’origine restent
intactes.
Nb l’encerclement en rectangle permet
l’extraction selon un seul axe
- option d’affichage des longueurs sur les segments
mesurés
Les options de pointage sont
réarrangées dans une nouvelle fenêtre en
dessous de "A propos".
L’option "insère
dim." permet d'insérer la longueur du segment mesuré à la place du numéro
de ligne.
On peut changer l'option en
cours de mesure.
On peut ainsi afficher les
mesures sur un seul élément parmi d'autres.
(Utile avant une copie
d'écran pour insister sur une spore particulière par exemple)
Une opération de retraçage
(déplacement, zoom etc...) opère sur tous les éléments.
Opérationnel pour toutes
les fonctions de mesure de longueur (y
compris périmètres ouverts ou auto), en mode bipoint ou Palmer, option
«Poly" comprise.
Par exemple : par défaut les
numéros de mesure sont affichés sur chaque segment. Cochez "insère
dim." puis pressez "Retrace" : pour chaque segment la longueur
s'affiche.
- décimales
Par défaut le nombre de décimales
est optimisé automatiquement. Il est possible de le modifier : voir
Options
- possibilité de choisir une valeur de référence
décimale
(Par défaut : 10 unités, les
nombres sont décimaux accepté
- option d'insertion du symbole micron dans la référence
- références obliques auto-ajustables
Par exemple, pour illustrer
la longueur d'un élément :
Faire
Outil/Illustrer/Référence orientée
Presser le bouton gauche au
début du segment de référence et le maintenir jusqu'à l'extrémité de l'élément.
Vérifier la longueur (à gauche, du bouton
d'étalonnage, la longueur en cours de mesure apparait désormais en rouge)
Relâcher le bouton, une
fenêtre de dialogue s’ouvre : valider la longueur ou modifier la valeur
affichée
(Dans ce dernier cas, le
segment de référence aura la direction choisie et la longueur demandée)
Dans la fenêtre suivante on pourra valider l'unité
(micron par défaut), la modifier, ou choisir le symbole "micron".
Une référence strictement
verticale, de longueur quelconque, s’obtient en choisissant
Outil/Illustrer/Référence orientée et en pressant simplement le bouton droit au
point d’insertion choisi. Longueur ad lib.
-amélioration du calcul du PDM
L’algorithme est inchangé, mais les calculs se font désormais en double précision.
Des messages dans la barre d'état inférieure vous guident désormais lors du calcul des PDMS .
- calcul de la dominante en mode "aperçu" et
en mode "notation expresse"
La "Dominante" (ou
"Mode») est la donnée la plus importante pour caractériser une dimension
de spore.
Il est prévu depuis longtemps
un article sur ce sujet (annoncé dans Bull. Soc. Mycol. Fr., 121 (3-4), p.
255-292. 2005.). L'algorithme original de Mycomètre y sera exposé.
La "Dominante" est
en théorie la valeur la plus fréquente dans l'ensemble des données mesurées
Presque tous les mycologues
confondent à tort Dominante et Moyenne,
ce qui est fort dommage.
La confusion peut exister à
condition que la distribution soit symétrique (cas particulier parmi
d’autres : la distribution Normale, mais faut il encore avoir fait les
tests préalables pour montrer la cohérence de cette hypothèse !)
Le problème qui se posait
pour la Dominante est qu'elle était évaluée à partir de répartition en classes
(cf. histogrammes).
Malheureusement l'utilisation
de classes et d'histogrammes sur des petits échantillons (le cas du mycologue,
justement) est complètement aberrante.
C'est une des raisons pour
laquelle j'ai abandonné la représentation systématique de l’histogramme lorsque
Mycomètre est passé de la version 1 à la version 2 .
La représentation par diagramme proposée est une bien
meilleure représentation de la réalité.
(à
titre d'essai, sur un échantillon de données, lancez Mycostats, Nuage de points
puis Histogramme et faites varier le nombre de classes : le résultat est
édifiant !)
Diverses raisons à cela :
Tout d'abord, il est d'usage,
en statistiques, de ne travailler que sur des classes d'effectif supérieur à 5 (certains ont peut être encore quelques
souvenirs.) Même en choisissant un
nombre très réduit de classes (difficile de
descendre en dessous de 5 classes !) il est rarement possible de respecter
cette condition.
Dans le cas des petits
échantillons, le point de départ et la largeur des classes peut faire en sorte
que la zone où les valeurs sont les plus denses (justement celle que l'on
cherche) se trouve coupée en deux. Ainsi
la classe d'effectif maximal cherchée disparait.
Il suffit d'ajouter une seule
valeur un peu à l'extérieur de l'ensemble des données pour que le résultat
change complètement.
Les essais de calculs avec
Excel sur des petits échantillons ont montré que la plupart du temps soit le
résultat était stupide, soit Excel
n'arrivait pas à calculer le mode.
Il est fort à parier qu’Excel
travaille classiquement avec des classes.
L'algorithme imaginé pour
Mycomètre est totalement différent et
est totalement insensible aux points erratiques.
Il permet aussi de calculer
très facilement les modes secondaires des distributions multimodales.
C'est pourquoi j'ai utilisé
la définition de PDM (Point de Densité Maximale) pour le distinguer du "Mode"
habituel.
Pour les échantillons de grande
taille, le PDM coïncide exactement avec le Mode.
Seul le PDM est valide pour
des petits échantillons (en théorie 'seulement', l'algorithme de Mycomètre sait
évaluer le PDM à partir de 2 données !).
- nouvelle notation par défaut
Une nouvelle notation est
donc proposée, en abrégé : « dMd » ( décile 1, Mode, décile9 ,
ces trois données non paramétriques étant les plus importantes pour
caractériser une dimension de spore... à noter d’ailleurs que la notation
proposée à l'aide des déciles commence à apparaître dans les publications ...
merci aux auteurs !)
C'est désormais la notation
par défaut (en fait je n'avais pas eu le temps de l'installer auparavant !).
Vous pouvez toujours utiliser
les autres notations (voir Options, choix : D1,9 /
D1,5,9 / M+/- sigma / M+/- 2 sigma et
enfin ' décile, Dominante')
- Notation Flash
Le bouton de notation flash
(à droite de « aperçu) enregistre directement dans le
presse papier le résultat des données selon la notation choisie.
Si le nombre de mesures est insuffisant
pour calculer D1 et D9 (moins de 12 mesures), c’est la notation m+/-sigma qui est prise par défaut.
- répertoire de sauvegarde par défaut du fichier CSV
(suite à la demande judicieuse de F. Valade)
Désormais le répertoire de sauvegarde proposé pour le
fichier CSV est le répertoire de l'image active.
Outre le cas élémentaire où
une seule image est chargée, si plusieurs images sont présentes dans le
chargeur, le répertoire proposé est
celui de l'image en cours de traitement.
- Fenêtres mobiles
Désormais les petites fenêtres (grilles, aperçu etc..) sont
mobiles ( avec la souris cliquer dans une zone vierge
et tirer à l’endroit souhaité).
-Fichiers de langues
Les fichiers de langues ont été revus et
certaines lacunes corrigées
- Fonctions nouvelles : Mesure d’angles et de
surfaces
Fonction
« Surface »
Pour les raisons évoquées
ci-dessus, la mesure d’une surface
quelconque s’effectue par approximation polygonale . La mesure automatique est toujours en
projet.
Sous menus
*Triangle
Placer le sommet du triangle puis les 2 autres
extrémités.
Mycomètre retourne la surface, le périmètre et l’angle au
sommet
*polygone auto
Placer un point au centre de la forme d’ou l’on peut
voir tous les points du pourtour ( si un tel point
n’existe pas, la surface sera dite
non-observable)
Parcourir le périmètre de la surface à mesurer (le
pourtour de la spore par exemple) par des points d’autant plus rapprochés que
le rayon de courbure est petit.
Fermer le polygone d’approximation en cliquant sur le
bouton droit.
Mycomètre retourne
La surface, le périmètre, le rayon moyen (cf Hadwiger), l’indice de forme F
*polygone ouvert
On
opère comme le polygone auto, mais, si
nécessaire, il faut fermer le polygone
en marquant à nouveau le premier point.
-Divers « gadgets »
Dans le menu Outils/illustrer
il est possible de choisir la police pour les illustrations
Noter que :
On peut changer de police sur
chaque ligne de texte
Le choix de la police opère sur
les numérotations mais pas sur les indications de longueur des segments
-Boutons « sauve écran » et « Rappel
écran » ( à gauche de mode MC)
Ces bouton
facilitent la confection d’écrans illustrés :
A chaque ajout
d’illustration, presser « Sauve écran »
En cas d’erreur,
« Rappel écran » récupérera
l’écran précédent.
Attention : l’écran récupéré n’est pas un écran de mesure, mais
seulement un écran d’édition.
Pour reprendre les mesures il
est nécessaire de rafraichir l’écran de travail.
Pour cela presser
« retrace », ou cliquer dans la vignette de centrage ou presser Z1,
Z+ ou Z-.
NB : cette fonction n’a
pas été longtemps testée. Me signaler tout conflit éventuel.
Remarques
-Si vous trouvez une fonction
que je n’aurais pas décrite (c’est fort possible car je rédige a
posteriori !), veuillez m’en faire part
- Si une amélioration vous
semble urgente, faites m’en part, elle est peut être déjà prévue au cahier des
charges.
- D’autres tests statistiques
sont prévus. Je choisi les priorités en fonction de mes propres besoins !
rappel : chargement sur http://mycolim.free.fr/DOC_SML/mycm202/Charg_Mycm202.htm