Recherche et optimisation d'indice colorimetrique

Article Index

Une approche général des indices colorimétriques basé sur l'optimisation et l'approximation de fonctions

Abstract

Les indices colorimétriques en télédétection ont un large domaine d'application pour caractériser différents types de surface. Bien souvent, les formes d'indices de télédétection sont définies empiriquement, que ce soit en sélection des longueurs d'onde, de la forme de l’équation, ou des coefficients dans l’équation permettant de calculer le dit indice. Et un très petit nombre d'études optimisent les paramètres utilisés pour ces indices. Ces indices sont alors utilisés tel-quel pour de la classification (souvent linaire comme les RandomForest). Mais aucune étude ne semble chercher la meilleure forme de façon automatique afin d'optimiser la classification et/ou la segmentation.

Notons qu'il est important d'optimiser l'indice en amont, car la transformation engendre une perte d'information et de caractéristique essentielle à la classification. Un "mauvais indice" ne permet donc pas une bonne classification, pour pallier à cet effet les études privilégie presque toujours l'utilisation de plusieurs indices et de méthode de classification avancée

Le site www.indexdatabase.de référence ces différents indices (choix des longueurs d'ondes et des coefficients) en fonction du matériel d'acquisition. Souvent, le dit matériel est satellitaire (Landsat-5) donc moins influencé par les différences de luminosité, ce qui pose des soucis dans d'autres applications telles qu’en proxy-détection ce qui est notre cas. L'approche standard pour sélectionner l'indice qui correspond le mieux a ce que l'on cherche a caractériser consiste a tester tous les indices disponibles en fonction de nos longueurs d'ondes avec une simple corrélation entre les indices et une vérité terrain [Svitlana Kokh]. Ce n'est pas une mauvaise approche, mais elle reste sous-optimal et fastidieuse, car elle nécessite de coder l’ensemble des indices et leurs différentes versions et le niveau de corrélation n'est pas le meilleur estimateur.

Ainsi, l'objectif de cette étude est de développer une méthode de recherche de l'indice optimal grâce à une approche statistique par descente de gradient, sur différentes formes d’équation générique. Nous allons également tester de nouvelles approches par traitement du signal et analyse d'image. L'apprentissage est effectué à travers des mécanismes de deep-learning [Tensorflow 2.0]. L’étude se focalise sur une cameras particulière et en champ-proche, mais reste néanmoins transposable à n'importe quel matériel d’acquisition et hauteurs.

À titre d'illustration, l'indice le plus utilisé pour la végétation est NDVI qui offre une mean_iou de $72.7 %$ , tandis que les "meilleurs" indices empiriques offre une mean_iou au mieux de $82.3 %$ , la ou nos des formes d'indice généré automatiquement propose une mean_iou de $87 %$ . Cette différence est suffisamment significative pour améliorer la segmentation et la robustesse de l'indice a différents facteurs extérieurs, ainsi que la forme des éléments détectée.

Materiel

Les images ont été acquises grâce à la caméra multispectrale à six bandes Airphen. C'est une caméra scientifique multispectrale développée par des agronomes pour des applications agricoles. Elle peut être intégrée dans différents types de plates-formes telles que des drones, des robots de phénotypage, etc.

La caméra a été configurée en utilisant les bandes 450/570/675/710/730/850 nm avec un FWHM de 10 nm. La focal de chaque objectif est de 8 mm. Leurs résolutions brutes, pour chaque bande spectrale sont de 1280x960 px avec une précision de 12 bits. Enfin, l'appareil est équipé d'une antenne GPS interne, qui peut être utilisée pour obtenir la distance par rapport au sol.

L'alignement est affiné en deux étapes, avec (i) une estimation approximative de l'enregistrement affine et (ii) un enregistrement en perspective pour le raffinement et la précision grâce à la détection et la mise en correspondance de points clé. La méthode utilisée pour l'enregistrement est basée sur des travaux antérieurs [Two-step Multi-spectral Registration], où la méthode montre une précision de l'enregistrement jusqu'au sous-pixel.

Données

Les données ont été acquises sur le site de l'IRSTEA de Montoldre, dans l'Allier (03), en France dans le cadre de l'ANR Challenge Rose ... 12 images présentant des caractéristiques très distinctes en terme d'illumination (ombre, matin, soir, plein soleil, nuageux, ...) on été acquises et caractérise afin de proposer différents types d'indices. Ainsi 3 vérités terrain ont été définie :

Attention, cet article correspond à de premier travaux sur le sujet en utilisant des images prises en bonnes conditions.
Des résultats complémentaires sont disponibles dans la publication disponible ici.

Exemple pour la végétation :

@Article{rs13122261,
AUTHOR = {Vayssade, Jehan-Antoine and Paoli, Jean-Noël and Gée, Christelle and Jones, Gawain},
TITLE = {DeepIndices: Remote Sensing Indices Based on Approximation of Functions through Deep-Learning, Application to Uncalibrated Vegetation Images},
JOURNAL = {Remote Sensing},
VOLUME = {13},
YEAR = {2021},
NUMBER = {12},
ARTICLE-NUMBER = {2261},
URL = {https://www.mdpi.com/2072-4292/13/12/2261},
ISSN = {2072-4292},
DOI = {10.3390/rs13122261}
}

Pré-traitment de l'information

Les bandes spectrales présente par nature un bruit important associer au capteur CCD, ce qui pose des soucis lors de la normalisation. Pour palier à cette effet $1 %$ du signal minimum et maximum est supprimé par le calcul des quantiles, puis chaque bande est normalisée dans l'interval $[0, 1]$ . Nous ajoutons également quelques transformations des bandes spectrales, afin d'enrichir le pool d'information et de prendre en compte les gradients dans l'image. Le choix s'est orienté vers 5 informations importantes à différents égards :

L'image de la déviation standard entre toutes les bandes $λ_{d e v}$
Le gradient par l'utilisation d'un filtre de Sharr sur $λ_{d e v}$ noté $λ_{g r a d}$
Les valeurs propres maximum de la matrice Hessien de $λ_{d e v}$ noté $λ_{r i d g e_{m a x}}$
Les valeurs propres minimales de la matrice Hessien de $λ_{d e v}$ noté $λ_{r i d g e_{m i n}}$
Le laplacien de $λ_{d e v}$ noté $λ_{l a p l a c e}$

déviation standard

filtre de Sharr

valeurs propres maximum

valeurs propres minimum

laplacien

En effet, ces 5 transformations offrent d'une part une information importante sur le mélange spectral grâce à la déviation standard. Le filtre de Sharr et les valeurs propres maximum donne une information spatiale importante sur la rupture des gradients, donc sur la limite extérieure des objets, ce qui aidera probablement a la convergence. Les valeurs propres minimum, aussi appeler ridge, quant à elle semble détecté facilement les éléments fins tels que les monocotylédones pour des images de végétations.

Indices et forme d’équation

Les indices colorimétriques ont prouvé leur efficacité dans la description des surfaces, ainsi tous les ans différents articles de revue concernant les indices colorimétriques sortent, souvent dans le cadre d'un premier article de thèse appliqué a un domaine d’étude spécifique [Xue Jinru, Çağatay Tanrıverdi, Jiri Mezera]. Nous allons repartir de la base grâce au site www.indexdatabase.de, à partir de cette base de donnée, 89 indices de végétation ont été identifiés comme compatibles avec nos longueurs d'ondes, ils seront ainsi testés. D'autre part, ils seront comparés à nos indices conçus automatiquement. Six formes d'équations simples ont été extraites à partir de l’ensemble des 519 indices de la base de données :

	titre	équation
1	une seul bande	$I = λ_{i}$
2	soustraction de bande	$I = λ_{i} - λ_{j}$
3	différence de 2 bande	$I = λ_{i} / λ_{j}$
4	différence normalisé de 2 bande	$I = \frac{λ_{i} - λ_{j}}{λ_{i} + λ_{j}}$
5	différence normalisé de 3 bande	$I = \frac{2 * λ_{i} - λ_{j} - λ_{k}}{2 * λ_{i} + λ_{j} + λ_{k}}$
6	différence normalisé "cubique" de 2 bande	$I = \frac{λ_{i} - λ_{j}}{\sqrt{λ_{i} + λ_{j}}}$

En analysant ces différentes équations, nous pouvons définir de nouvelles formes d’équation générique qui les synthétisent, et qui prennent en compte l'ensemble des bandes spectrales ainsi qu'un certain voisinage. Deux autres formes d'équations sont également intéressantes à optimiser, qui sont respectivement les approximations de fonction continue par développement de Taylor, ainsi que les approximations de fonction continue par morceaux grâce aux opérateurs morphologiques. Ces équations seront alors optimisées permettant de définir de nouveaux indices automatiquement, dans la seconde partie. L’ensemble de ces méthodes est développé via tensorflow et les paragraphes suivants présente les différents modèles :

Linéaire : Pour synthétiser les équations 1 et 2, nous pouvons définir une simple équation linéaire telle que $I = \sum_{i = 0}^{N} α_{i} λ_{i}$ . Cette équation peut se généraliser au domaine 2D par une Convolution avec dans sa forme simple une taille de noyaux $k = 1, 1$ .

Différence Linéaire : Pour synthétisé les équation 3, 4 et 5, un modèle simple reposant sur une division de deux modèles précédents est possible. De la même façon, cette forme est généralisable au domaine 2D et correspond alors à deux Convolution2D, l'une pour le numérateur, l'autre pour le dénominateur. Nous fixons dans un premier temps la taille des noyaux à $k = 1, 1$ pour ne pas prendre en considération le voisinage. Nous avons utilisé l'opérateur "nan div"pour remplacer les résultats "not a number" par zero.

Polynomial : D'après le théorème de Stone–Weierstrass toute fonction continue définie sur un segment peut être approchée uniformément par des fonctions polynomiales. Puisque l'on restreint le segment au domaine $[0 - 1]$ les polynômes de Bernstein en sont une démonstration commune. Ainsi, toutes forment d'indices colorimétriques peut être approximé par un polynôme $I = \sum_{i = 0}^{N} {α_{i} λ_{i}}^{δ_{i}}$ . Pour des raisons d'implémentations, deux opérateurs sont défini. D'une part l'exposant $λ_{i}^{δ}$ , puis l'équation linéaire définie par une Convolution2D pour garder la possibilité de l'étendre au domaine 2D.

Différence Polynomial : En suivant l'idée de la forme précédente et pour respecter la forme d'équations 6, nous introduisons simplement une différence de polynôme, l'un au numérateur permettant d'optimiser la classe recherché et l'autre au dénominateur jouant le rôle de normalisateur $\frac{\sum_{i = 0}^{N} α_{i} λ_{i}^{δ_{i}} + A}{\sum_{j = 0}^{N} α_{j} λ_{j}^{δ_{j}} + B}$ ... (voir les réultats si pertinant -> puisque thérème de StoneWeierstrass)

Approximation Universelle de Fonction : En utilisant les développements de Taylor, nous pouvons décomposer n'importe quelle fonction $f (x)$ en $f (x) = f (0) + f^{'} (x) x + \frac{1}{2} f^{″} (x) x^{2} + \frac{1}{6} f^{‴} (x) x^{3} + o (x^{3})$ . Une approche pour apprendre cette forme de développement est proposée par [Huang et al., 2017] que l'on appelle communément DenseNet et correspond alors à la somme de la concaténation du signal et de ces dériver $x \to [x, f_{1} (x), f_{2} (x, f_{1} (x)), f_{3} (x, f_{1} (x), f_{2} (x, f_{1} (x)), \dots]$ . Les dérivées sont disponibles par l'utilisation d'une Convolution2D.

https://d2l.ai/chapter_convolutional-modern/densenet.html

Filtre d'entrée : Pour supprimer une partie du signal qui ne serait pas indispensable, nous étudieront l'ajout d'un filtre passe-bande, en amont du réseau. Effectivement, pourquoi prendre en considération l’ensemble des valeurs d'un signal ? Il est très probable que seulement une partie de ce dernier caractérise ce que l'on cherche. Un bon exemple concerne les indices de végétation, seul les valeurs fortes dans le vert et le proche infra-rouge, ainsi que les valeurs faibles dans le rouge et le bleu sont caractéristique de la végétation :

C'est d’ailleurs le principe de l'indice NDVI, en raison des couches spongieuses qui se trouvent sur leur face arrière, les feuilles réfléchissent beaucoup de lumière dans le proche infrarouge, ce qui contraste fortement avec la plupart des objets non-végétaux. Lorsque la plante est déshydratée ou stressée, la couche spongieuse se compresse et les feuilles réfléchissent moins de lumière dans le proche infrarouge, rejoignant les valeurs du rouge, dans le domaine visible. Ainsi, la combinaison mathématique de ces deux signaux peut aider à différencier les plantes des objets non-végétaux et les plantes saines des plantes malades. Cependant cet indice est alors moins intéressant lorsqu'il s’agit de détecter seulement la végétation et est fortement influencé par l’ombrage ou la chaleur.

Nous allons donc ajouter un filtre dans les équations précédentes pour supprimer les valeurs "indésirables" par l'utilisation de deux seuils a et b, qui seront également appris. S'il s’avère que l'ensemble du signal est intéressant, ces deux paramètres ne changeront pas et les valeurs seront a=0 et b=1, dans le cas contraire, a et b changeront. Pour appliquer le premier seuil, on utilise l’équation $y = max (x - a, 0) \div (1 - a)$ et permet donc de supprimer les valeurs basses. À partir de ce nouveau signal, on applique l’équation $z = max (b - y, 0) \div b$ pour supprimer les valeurs hautes.

Ces deux paramètres permettent aussi de gérer des paramètre extérieurs, en effet lorsque a devient négatif, le paramètre a pour effet de rehausser le signal, ce dernier est alors compris dans l'intervalle $[a, 1]$ . Le second paramètre b permet par exemple de supprimer les effets de spéculaires ou de bruit trop important.

Approximation de fonction par érosion-dilatation : En étendant l'idée de sélection de bandes, nous pouvons non pas en sélectionner une, mais plusieurs, grâce à des opérateurs morphologiques notés $x \oplus s = max_{k} (x_{k} + s_{k})$ et $x ⊖ s = max_{k} (s_{k} - x_{k})$ avec $x_{k}$ les différentes bandes spectrales et les $s_{k}$ le coefficient d'érosion de la bande spectrale $⊖$ ou de dilation $\oplus$ . En augmentant le nombre d'érosion dilation, c'est à dire, en définissant plusieurs $s_{k}$ noté $s_{k, i}$ , nous pouvons approximer n'importe quel fonction continue par morceaux [Ranjan Mondal]. Ont pose alors $z_{i}^{+} = x \oplus s_{i} = max_{k} (x_{k} + s_{k, i})$ qui est le neurone structurant de dilatation $i$ et $z_{i}^{-} = x ⊖ s_{i} = max_{k} (s_{k, i} - x_{k})$ qui est le neurone structurant d'érosion. Pour obtenir la sortie $I = \sum_{i = 0}^{N} z_{i}^{+} w_{i}^{+} + \sum_{i = 0}^{N} z_{i}^{-} w_{i}^{-}$ dont les $w_{i}^{+}$ et les $w_{i}^{-}$ sont les coefficients de combinaison linéaire obtenue par Convolution 2D pour rester dans le domaine 2D.

Raffinement spatial de l'indice : Pour prendre en compte différentes échelles dans l'image, nous étudions l'ajout d'une partie en aval du réseau. Appeler "Spatial Pyramide Refinement Block" et consiste en la somme de différentes Convolution2D dont les tailles de noyaux ont été fixé à 1,3,5,7. Le résultat de chaque convolution est concaténé, et le résultat final est donné par une combinaison linéaire de ces différentes échelles modélisées encore une fois par une Convolution2D avec k=1.

Fonction de perte

Dans cette partie, nous présenterons les différentes fonctions de pertes possibles en relation à la classification binaire. Cette partie est inspirée de https://lars76.github.io/neural-networks/object-detection/losses-for-segmentation/. Pour obtenir un indice et faciliter la convergence, on s’intéressera uniquement aux valeurs comprises entre 0 et 1 en sortie de la dernière couche, via une fonction d'activation de type ClippedReLU ( $0 <= x <= 1$ ), ce qui est négatif ou nul seras donc indésirable et supérieur ou égal à 1 la classe rechercher et entre les deux la frontière d’indécision a optimiser. Les valeurs correspondent alors à la probabilité que le pixel soit la surface rechercher $P (Y = 1) = 1 = p$ ou non $P (Y = 0) = 1 - p$ . Dans ce cas, 4 fonctions sont communément utilisées: Cross-Entropy, Weigthed-Cross-Entropy, Balanced-Cross-Entropy et Focal-Loss (dans la suite nous noterons $p$ la vérité terrain et $\hat{p}$ la prédiction). Dont chacune présentes des intérêts et des limites que nous présentons ci-après :

Cross-Entropy : La cross-entropy peu être défini par $C E (p, \hat{p}) = - p \log (\hat{p}) - (1 - p) \log (1 - \hat{p})$ . C'est une fonction de perte standard qui ne prend pas en compte le ratio des classes (unbalanced). Elle permet de mesurer la séparabilité des classes. Lorsque $C E \to 0$ il n'y a plus d'entropy et $\hat{p} \to p$ , dans le cas contraire, si $C E \to 1$ alors $\hat{p}$ et $p$ sont indissociable. La fonction de perte $C E$ ne semble pas être adapté à notre cas, puisque l'on utilise une vérité terrain dont le ratio entre surface rechercher et le reste, des différences pour chaque image.

Weigthed-Cross-Entropy : C'est une variente de $C E$ ou tous les membres de classes positive ( $p = 1$ sont pondéré par un coefficient $β$ , lequel permet de réguler le ratio des classe. Ont écris alors $W E C (p, \hat{p}) = - β p \log (\hat{p}) - (1 - p) \log (1 - \hat{p})$ . Pour décrémenter l’effet de la classe $Y = 0$ ont fixe $β > 1$ et $β < 1$ dans le cas contraire. Le coéficient $β$ peu être fixé pour maximisé une classe spécifique, ou contrebalancé le ratio des classes. Le coéficient $β$ pourrait néanmoins être calcule indépendamment pour chaque image.

Balanced-Cross-Entropy : Cette variente est similaire à WCE, ont introduit cependant $1 - β$ pour la classe négative. Ont à donc l'équation $B C E (p, \hat{p}) = - β p \log (\hat{p}) - (1 - β) (1 - p) \log (1 - \hat{p})$ . Cette forme est intéressante, puisque $β$ peu soit être fixé comme pour $W C E$ , soit être calculé pour chaque image, dans ce cas $β = \sum (\frac{P (Y = 1)}{P (Y = 0)})$ .

Focal Loss : Cette fonction, proche de BCE essaie décrémenté l'influence des éléments "faciles" pour améliorer en priorité les éléments difficilement séparable. Ont utilise alors deux coefficient $α$ et $γ$ sur la distribution de $\hat{p}$ . La fonction s'écrit alors $F L (p, \hat{p}) = - (α (1 - \hat{p})^{γ}) p \log (\hat{p}) - (1 - α) {\hat{p}}^{γ} (1 - p) \log (1 - \hat{p})$ . La fonction de perte $F L$ ne permet pas de prendre en considération le ratio des classes différents pour chaque image. La fonction ne permet pas d'optimiser l'indice dans l'interval $[0 - 1]$ avec efficience et donc l'optimisation des métriques définis plus loin. Bien que le coefficient $α$ peu être calculé automatiquement, le coefficient $γ$ est difficile à fixé.

Trois autres fonctions de perte sont intéressantes à étudier quand il s'agit de segmentation. Il s'agit de Dice-Loss, TverskyIndex-Loss et IntersectionOverUnion-Loss souvent utilisé dans leurs versions métrique ...

Dice-Loss : La fonction de perte est défini par $DL (p, \hat{p}) = 1 - \frac{2 p \hat{p}}{p + \hat{p}}$

IntersectionOverUnion-Loss : Récemment, [Y.Wang et al] ont proposé une solution pour optimisé une approximation de l'intersection sur l'union dans le cas de segmentation binaire. La fonction de perte est défini par $I o U = 1 - \frac{I (p, \hat{p})}{U (p, \hat{p})}$ avec $I (p, \hat{p}) = p \hat{p}$ et $U (p, \hat{p}) = p + \hat{p} - p \hat{p}$ . Les performances de cette fonction de perte semble plus éfficiant que les méthodes "simple" précédemment cité [Gell ́ert M ́attyus, Dingfu Zhou, Zhaohui Zheng]

Le choix ce feras donc sur la fonction de perte $B C E$ avec un calcule automatique de $β$ .

Métrique d’évaluation

Lorsque le nombre d'élément entre chaque classe est fortement déséquilibré, beaucoup de métrique standard sont inéficasse et donc inadapté. Par exemple notre vérité terrain sol/végétation comporte $83 %$ de sol et donc $17 %$ de végétation, une mauvaise métrique comme l'accuracy montrera de "bonne" performance. Dans le cas de l'accuracy $\frac{t p + t n}{t p + t n + f p + f n}$ si l'évaluation ne détecte que du sol alors les performances seront de $83 %$ ce qui n'est donc pas représentatif. Ce que l'on cherche alors est de trouver des métriques permettant de prendre en compte le ratio de chaque classe. Communément les performances des indices colorimétriques est calculé par une cross-entropy $- \frac{1}{N} \sum_{i = 0}^{N} y_{t r u e} \log (y_{p r e d}) + (1 - y_{t r u e}) \log (1 - y_{p r e d})$ entre l'indice et une vérité terrain. Comme nous l'avons vue précédemment cette métrique n'est pas non plus adapté car elle ne prend pas en compte le ratio des classes. Il existe beaucoup d'autres métriques [Abdel Aziz , David Martin Ward Powers, Takaya Saito, László A. Jeni] :

Blanced Accuracy : aussi appelé Youden Statistics pour prendre en compte la ratio des classes, la forme de l'accuracy est transformer afin de calculer séparément les performances de chaque classes et devient donc $\frac{1}{2} (\frac{t p}{t p + f p} + \frac{t n}{t n + f n})$

Dice : Le coefficient de Dice, également appelé indice de recouvremen, est communément utilisé pour vérifier les performances des algorithmes de segmentation $\frac{2 p \hat{p}}{p + \hat{p}}$

Mean Intersection Over Union : C'est une autre métrique souvent utiliser pour meusuré les performances de la segmentation, noté $\frac{p \hat{p}}{p + \hat{p} - p \hat{p}}$

Precision : Correspond à une partie de l'équation de balanced accuracy $\frac{t p}{t p + f p}$ et permet de répondre à la question : Quelle proportion des identifications positives a été effectivement correcte ?

Recall : Quelle proportion de vrais positif a été identifiée correctement ? $\frac{t p}{t p + f n}$

Metthews correlation : bla bla bla $\frac{t p * t n - f p * f n}{\sqrt{(} (t p + f p) * (t p + f n) * (t n + f p) * (t n + f n))}$

Comparaison avec les indices standars

Pour effectuer une comparaison juste/equitable il est necessaire d'optimiser chaque indice standar. Pour ce faire un reseaux de neuron minimal est utiliser afin d'apprendre une droite de regression. Le reseaux est donc composé de l'indice spectral, suivit d'une normalisation $x = (x - m i n) / (m i n - m a x)$ , puis d'une convolution 2D avec une taille de noyau de $k = 1, 1$ . Puisque l'indice généré une seul dimenssion, l'équation de sortie est alors $I = α * N o r m a l i z e d I n d e x + β$ . Pour effectuer la classification de la meme facons que notre méthode, une activation de type ClipedRelu est utilisé. Evidement les memes métriques et fonction de perte est utilisé.

Reseaux de neurone simple

AdventicedTransformedSoilAdjustedVI
AnthocyaninRefectanceIndex
AshburnVegetationIndex
AtmosphericallyResistantVegetationIndex2
AtmosphericallyResistantVegetationIndex
AverageReflectance750to850
BlueWideDynamicRangeVegetationIndex
BrowningReflectanceIndex
CanopyChlorophyllContentIndex
ChlorophyllAbsorptionRatioIndex2
ChlorophyllAbsorptionRatioIndex
ChlorophyllGreen
ChlorophyllIndexGreen
ChlorophyllIndexRedEdge710
ChlorophyllIndexRedEdge
ChlorophyllRedEdge
ChlorophyllVegetationIndex
ColorationIndex
CorrectedTransformedVegetationIndex
CRI700
Datt1
Datt4
Datt6
DifferencedVegetationIndexMSS
DifferenceNIRGreenVegetationIndex
DoubleDifferenceIndex
EnhancedVegetationIndex2
EnhancedVegetationIndex3
EnhancedVegetationIndex
Gitelson2

GlobalEnvironmentMonitoringIndex
GlobalVegetationMoistureIndex
GreenAtmosphericallyResistantVegetationIndex
GreenBlueNDVI
GreenLeafIndex
GreenNormalizedDifferenceVegetationIndex
GreenOptimizedSoilAdjustedVegetationIndex
GreenRedNDVI
GreenSoilAdjustedVegetationIndex
IdealVegetationIndex
InfraredPercentageVegetationIndex
Intensity
MCARI_OSAVI750
MCARI_OSAVI
mCRIRE
MisraGreenVegetationIndex
MisraNonSuchIndex
MisraSoilBrightnessIndex
MisraYellowVegetationIndex
ModifiedAnthocyaninReflectanceIndex
ModifiedChlorophyllAbsorptionInReflectanceIndex1
ModifiedChlorophyllAbsorptionInReflectanceIndex
ModifiedSimpleRatio670_800
ModifiedSimpleRatio705_750
ModifiedSimpleRatio
ModifiedSoilAdjustedVegetationIndex
ModifiedTriangularVegetationIndex1
mSR2
NDVI
NormG

NormNir
NormR
PanNDVI
RedBlueNDVI
RedEdgeInflectionPoint
RedEdgePositionLinearInterpolation
ShapeIndex
SoilAdjustedVegetationIndex
SoilAndAtmosphericallyResistantVegetationIndex2
SoilAndAtmosphericallyResistantVegetationIndex3
SoilAndAtmosphericallyResistantVegetationIndex
SpecificLeafAreaVegetationIndex
SpectralPolygonVegetationIndex
StructureIntensivePigmentIndex1
StructureIntensivePigmentIndex2
TasselledCapNonSuchIndexMSS
TasselledCapSoilBrightnessIndexMSS
TasselledCapYellowVegetationIndexMSS
TCARI_OSAVI
TransformedChlorophyllAbsorbtionRatio2
TransformedChlorophyllAbsorbtionRatio
TransformedNDVI
TriangularChlorophyllIndex
TriangularVegetationIndex
VegetationConditionIndex
VegetationIndex700
VisibleAtmosphericallyResistantIndexGreen
VisibleAtmosphericallyResistantIndices700
WideDynamicRangeVegetationIndex

Resultats sur les indices de végétations

Performance des indices généré (balanced-accuracy)

model	none	ibf	sprb	ibf-sprb
linear-1	0.920456	0.957441	0.948547	0.959523
linear-3	0.944438	0.953185	0.949021	0.948238
linear-5	0.946792	0.948180	0.948658	0.952501
linear-difference-1	0.931371	0.957029	0.950979	0.959641
linear-difference-3	0.945933	0.953706	0.948506	0.947711
linear-difference-5	0.946004	0.949275	0.946124	0.949065
polynomial-1	0.851377	0.958745	0.932263	0.960028
polynomial-3	0.926293	0.953239	0.946023	0.944787
polynomial-5	0.940114	0.945173	0.952135	0.946668
polynomial-difference-1	0.852644	0.941546	0.932263	0.960195
polynomial-difference-3	0.925979	0.952306	0.949190	0.952061
polynomial-difference-5	0.940247	0.946793	0.950396	0.946668
universal-function-1	0.960796	0.956361	0.958163	0.961680
universal-function-3	0.955876	0.960021	0.959222	0.957073
universal-function-5	0.956568	0.957891	0.949323	0.955690
dense-morphological-1	0.958957	0.961354	0.957494	0.954695
dense-morphological-3	0.957006	0.960109	0.953354	0.947386
dense-morphological-5	0.954817	0.956036	0.954024	0.947997

Performance des indices généré (dice)

model	none	ibf	sprb	ibf-sprb
linear-1	0.897379	0.919146	0.908837	0.920147
linear-3	0.905065	0.916038	0.908416	0.919359
linear-5	0.905870	0.910275	0.908126	0.917741
linear-difference-1	0.902534	0.918402	0.909899	0.920550
linear-difference-3	0.906899	0.915144	0.908671	0.916320
linear-difference-5	0.906015	0.911114	0.908691	0.916163
polynomial-1	0.715673	0.918931	0.890213	0.920157
polynomial-3	0.883776	0.915555	0.903123	0.916701
polynomial-5	0.893659	0.906864	0.909151	0.918699
polynomial-difference-1	0.715874	0.912215	0.890213	0.921199
polynomial-difference-3	0.883730	0.914634	0.905640	0.918628
polynomial-difference-5	0.893659	0.908827	0.907722	0.918699
universal-function-1	0.921699	0.916650	0.918785	0.921204
universal-function-3	0.915790	0.919687	0.919694	0.916641
universal-function-5	0.916150	0.915613	0.910322	0.914890
dense-morphological-1	0.916389	0.919247	0.920824	0.922081
dense-morphological-3	0.914703	0.918109	0.919472	0.923553
dense-morphological-5	0.912327	0.914024	0.918995	0.923483

Performance des indices généré (mean-iou) :

model	none	ibf	sprb	ibf-sprb
linear-1	0.81701	0.85370	0.83547	0.85535
linear-3	0.82911	0.84771	0.83462	0.85350
linear-5	0.83033	0.83754	0.83413	0.85051
linear-difference-1	0.82531	0.85236	0.83733	0.85602
linear-difference-3	0.83215	0.84612	0.83510	0.84793
linear-difference-5	0.83056	0.83904	0.83503	0.84762
polynomial-1	0.57002	0.85320	0.80435	0.85541
polynomial-3	0.79451	0.84673	0.82576	0.84861
polynomial-5	0.80995	0.83156	0.83609	0.85213
polynomial-difference-1	0.57025	0.84163	0.80435	0.85723
polynomial-difference-3	0.79443	0.84520	0.83009	0.85212
polynomial-difference-5	0.80995	0.83483	0.83363	0.85213
universal-function-1	0.85812	0.84949	0.85302	0.85764
universal-function-3	0.84762	0.85465	0.85436	0.84903
universal-function-5	0.84814	0.84728	0.83786	0.84580
dense-morphological-1	0.84892	0.85399	0.85672	0.85891
dense-morphological-3	0.84580	0.85185	0.85379	0.86099
dense-morphological-5	0.84156	0.84468	0.85294	0.86088

Performances des indices standars :

model	mean_iou	dice	balanced_accuracy	precision	recall	matthews_correlation
TasselledCapSoilBrightnessIndexMSS	0.8164615631	0.897600472	0.9235137105	0.9368506074	0.8546644449	0.8301048279
EnhancedVegetationIndex2	0.8144683242	0.8967437148	0.925162077	0.9092102647	0.8797735572	0.8477547765
ModifiedSoilAdjustedVegetationIndex	0.8066384196	0.8919746876	0.919921875	0.9073579907	0.8724440336	0.8362452984
EnhancedVegetationIndex3	0.8034334183	0.8899865746	0.9238960147	0.9103938341	0.8658408523	0.8410320878
SoilAndAtmosphericallyResistantVegetationIndex3	0.801486671	0.8888103962	0.9164751172	0.9019806385	0.8715785742	0.8308723569
SoilAdjustedVegetationIndex	0.8014482856	0.8887869716	0.9162079692	0.9016042948	0.8718970418	0.8309013844
MisraGreenVegetationIndex	0.7969615459	0.8855116367	0.9290137887	0.9373131394	0.8317774534	0.8277327418
AdventicedTransformedSoilAdjustedVI	0.7866845131	0.8795798421	0.9075129628	0.8919116259	0.8636738658	0.8142505288
GlobalEnvironmentMonitoringIndex	0.7567619681	0.8594646454	0.9316999316	0.9518594146	0.7797127366	0.809997499
SoilAndAtmosphericallyResistantVegetationIndex	0.7673212886	0.8672993779	0.9186453223	0.8995713592	0.8325374126	0.8209629059
SpectralPolygonVegetationIndex	0.7610459924	0.8630498052	0.9089462757	0.8748332858	0.8507961035	0.8196647763
ModifiedTriangularVegetationIndex1	0.7534039617	0.8584382534	0.9175352454	0.8952250481	0.8196260929	0.819590807
ModifiedChlorophyllAbsorptionInReflectanceIndex1	0.7533426881	0.8584012985	0.9173633456	0.8947824836	0.8199580312	0.8195903897
AshburnVegetationIndex	0.7065967917	0.8256232142	0.8877642155	0.9357358217	0.7273611426	0.7371518016
NDVI	0.7246574759	0.8383700848	0.8718431592	0.800101757	0.8800880313	0.7832633853
AtmosphericallyResistantVegetationIndex2	0.7255876064	0.8390240669	0.8753374219	0.7975414991	0.8848151565	0.7918048501
RedBlueNDVI	0.6982311606	0.8199477792	0.8583303094	0.8246154785	0.8154640794	0.7442476749
InfraredPercentageVegetationIndex	0.6959015727	0.8180093169	0.8659196496	0.8218980432	0.8130705953	0.747872591
VegetationConditionIndex	0.6839970946	0.8093613982	0.8529757857	0.8248573542	0.7933390737	0.7164512277
VegetationIndex700	0.659373939	0.7928419113	0.885335207	0.8651016355	0.7308323383	0.7377569079
DifferenceNIRGreenVegetationIndex	0.6471098065	0.782320261	0.8600678444	0.8727560043	0.7149523497	0.6935585141
AtmosphericallyResistantVegetationIndex	0.6770561337	0.8034860492	0.8464117646	0.746306181	0.8684923053	0.7448039055
GreenRedNDVI	0.6498661041	0.7846027017	0.8224272132	0.7840580344	0.7874488235	0.6870804429
SpecificLeafAreaVegetationIndex	0.6190750003	0.7618000507	0.8194820285	0.7619611025	0.7661630511	0.6655799747
GreenSoilAdjustedVegetationIndex	0.5905128717	0.7388393283	0.8279193044	0.8056836724	0.6937674284	0.6463025212
NormNir	0.5951035023	0.7413546443	0.834320128	0.8029643297	0.691034615	0.6591392159
VisibleAtmosphericallyResistantIndices700	0.5604120493	0.7159902453	0.8328130841	0.7463212609	0.6899870634	0.6619185209
TransformedChlorophyllAbsorbtionRatio	0.5139300823	0.6773368716	0.8335154653	0.7777052522	0.596609354	0.6187361479
GreenLeafIndex	0.4751126766	0.6409713626	0.8365080953	0.8406647444	0.5204018354	0.5822848678
TriangularChlorophyllIndex	0.4868407249	0.6529071927	0.7977802157	0.7446940541	0.5806494355	0.5728466511
PanNDVI	0.5621151328	0.7149507403	0.8048653603	0.6567967534	0.7964729667	0.665450573
WideDynamicRangeVegetationIndex	0.4400079548	0.5979006886	0.8667721748	0.821125567	0.4683559239	0.5846787095
ModifiedChlorophyllAbsorptionInReflectanceIndex	0.3894633353	0.5499406457	0.8392792344	0.8456571698	0.4269099236	0.5215582252
ModifiedSimpleRatio670_800	0.4327640831	0.5955750346	0.816947937	0.7429494262	0.5245443583	0.5484391451
TransformedChlorophyllAbsorbtionRatio2	0.3981522024	0.5662932992	0.7420825362	0.6672722101	0.5084164143	0.4585200846
BlueWideDynamicRangeVegetationIndex	0.3377201259	0.4973782599	0.8267631531	0.7540425658	0.3750333488	0.4852397442
ModifiedSimpleRatio705_750	0.4228568375	0.5890919566	0.7497875094	0.6299832463	0.5710561275	0.5030774474
mSR2	0.4316358864	0.5975112915	0.7513005137	0.6119061112	0.6031486988	0.5167066455
GreenOptimizedSoilAdjustedVegetationIndex	0.4525571167	0.6167977452	0.7414371967	0.600635469	0.6527581811	0.5271781087
ModifiedAnthocyaninReflectanceIndex	0.4354537725	0.6019610167	0.7592261434	0.6095924377	0.6030116677	0.5325561762
ChlorophyllIndexRedEdge710	0.4320220649	0.5978645682	0.7557243705	0.6084275246	0.6073073745	0.5241049528
GreenNormalizedDifferenceVegetationIndex	0.4695614576	0.6330704093	0.743026495	0.5869406462	0.7083061934	0.5447127819
ChlorophyllAbsorptionRatioIndex	0.2096580416	0.3384151161	0.7801399231	0.9722483754	0.2129731774	0.3352024555
ChlorophyllAbsorptionRatioIndex2	0.2095359117	0.3382484019	0.7807197571	0.9722768664	0.2128448337	0.3354943693
GreenBlueNDVI	0.479303211	0.6416514516	0.7858903408	0.5794430375	0.7396811843	0.6195572019
ChlorophyllIndexGreen	0.4296761453	0.5988509655	0.7546467781	0.5895750523	0.6247556806	0.5310488343
DifferencedVegetationIndexMSS	0.4806605875	0.6435986161	0.7237963676	0.5743008256	0.7282950878	0.5028678775
NormR	0.384023577	0.5422237515	0.7312939167	0.5876777172	0.5003208518	0.4259736538
MisraYellowVegetationIndex	0.2232471257	0.3568905592	0.6155403256	0.7171635032	0.2363708466	0.2159916312
BrowningReflectanceIndex	0.3565377891	0.5225743651	0.7159267068	0.5165106058	0.551173389	0.4472738206
TriangularVegetationIndex	0.4965699613	0.6582158208	0.7433443666	0.5066651702	0.9667960405	0.630377233
TransformedNDVI	0	0	0.4354068935	0	0	0
CorrectedTransformedVegetationIndex	0	0	0.4354068935	0	0	0
IdealVegetationIndex	0	0	0.4354068935	0	0	0
AnthocyaninRefectanceIndex	0.3368895352	0.5017370582	0.6936119199	0.4741534591	0.5543147326	0.4188344777
SoilAndAtmosphericallyResistantVegetationIndex2	0.3948488235	0.5641175508	0.6997538209	0.4506566226	0.7800628543	0.496057272
EnhancedVegetationIndex	0.3950550258	0.5643129349	0.6996979713	0.4505939186	0.7810727358	0.4960843027
Datt4	0.3611221015	0.5173488259	0.6305044293	0.4348393977	0.5972551107	0.3048333228
DoubleDifferenceIndex	0.1403269023	0.2408106178	0.5487119555	0.301677227	0.2071675956	0.0993415415
CRI700	0.3215062022	0.4812051356	0.6659790874	0.4038533866	0.6043696404	0.3957900107
mCRIRE	0.0435240716	0.0828521475	0.5039966702	0.142893672	0.0600708909	0.0010207072
Datt6	0.2247320265	0.3629664481	0.6129235625	0.3192526996	0.4265658855	0.2522099912
ModifiedSimpleRatio	0.0663518608	0.1237298548	0.5022712946	0.1423415542	0.1155181527	0.003576515
GlobalVegetationMoistureIndex	0.2471000403	0.390155673	0.5970597863	0.2962363064	0.5928331017	0.2595480382
VisibleAtmosphericallyResistantIndexGreen	0.261462301	0.4121804237	0.5958778262	0.3074308038	0.6589137912	0.2676194012
TasselledCapYellowVegetationIndexMSS	0.2188976854	0.3523357809	0.5846978426	0.2583462298	0.535658896	0.2193143815
AverageReflectance750to850	0.234171629	0.3770784438	0.5876762271	0.2716791332	0.6100656986	0.2404710054
MisraNonSuchIndex	0.2409829646	0.3858529329	0.590647161	0.2696578205	0.6738302112	0.25508371
GreenAtmosphericallyResistantVegetationIndex	0.2192117125	0.357783407	0.5903590322	0.2332133651	0.8264268041	0.2685987949
TasselledCapNonSuchIndexMSS	0.2117708176	0.3471494615	0.5721442103	0.222362712	0.7997621298	0.2150340527
ShapeIndex	0.0667118281	0.1241799071	0.4530573785	0.0794753954	0.2929819226	-0.1401988715
StructureIntensivePigmentIndex2	0.166539371	0.2841139734	0.5572855473	0.1730504632	0.8709549904	0.1628720015
ChlorophyllIndexRedEdge	0.1707038134	0.2893404663	0.5390893817	0.1736517698	0.9171173573	0.1128893569
TCARI_OSAVI	0.1497377306	0.2590892017	0.5404892564	0.1553403437	0.8263528943	0.1143891513
MisraSoilBrightnessIndex	0.1456154138	0.2528477907	0.536896646	0.1496168226	0.8342260122	0.1007303298
CanopyChlorophyllContentIndex	0.1538833231	0.2649517357	0.5632619858	0.1554475427	0.9697552323	0.151463002
StructureIntensivePigmentIndex1	0.1525883079	0.2636072338	0.5584073663	0.1551090181	0.9698882699	0.1397265643
Datt1	0.1447619796	0.2514667213	0.5366957784	0.1461048424	0.9836086631	0.0855116323
MCARI_OSAVI	0.1359213293	0.2378088981	0.5239028335	0.138000533	0.9228879809	0.05952923
ChlorophyllVegetationIndex	0.1365224272	0.2387023419	0.5263831019	0.1377362758	0.9743533134	0.0773123726
MCARI_OSAVI750	0.1277931184	0.2251502424	0.4960553348	0.1300679743	0.9091817141	-0.0033302077
Gitelson2	0.1348821372	0.2361954004	0.5510587096	0.135564059	0.9902998805	0.0898950994
ChlorophyllRedEdge	0.1292988658	0.2273297459	0.5041469932	0.1294000298	0.9951909184	0.0025310172
RedEdgeInflectionPoint	0.1286419034	0.2263026685	0.4728533924	0.1288316548	0.990344882	-0.0137032596
RedEdgePositionLinearInterpolation	0.1286419034	0.2263026685	0.4728533924	0.1288316548	0.990344882	-0.0137032596
NormG	0.1291861981	0.2271552831	0.4547115266	0.1291861981	1	-0.0178785715
ColorationIndex	0.1291861981	0.2271552831	0.511172533	0.1291861981	1	0.0271825213
ChlorophyllGreen	0.1291861981	0.2271552831	0.1650107354	0.1291861981	1	-0.0420429446
Intensity	0.1291861981	0.2271552831	0.0645930991	0.1291861981	1	0

Conclusion

A partir de ces résultats nous pouvons conclure que n'importe quelle combinaison linéaire simple permet d’obtenir des indices de végétation tout aussi performants que les indices définis empiriquement, de plus des modèles plus avancés permettent d'obtenir des résultats plus performant et adaptés aux données récoltées.
Notons également que les indices NDVI = $\frac{n - r}{n + r}$ , EnhancedVegetationIndex = $2.5 * \frac{n - r}{n + 6 r - 7.5 b + 1}$ , EnhancedVegetationIndex2 = $2.4 \frac{n - r}{n + r + 1}$ et EnhancedVegetationIndex3 = $2.5 \frac{n - r}{n + 2.4 r + 1}$ sont très proche dans leurs formes et propose des performances très différentes après optimisation. On conviendra donc qu'il est plus important d'optimiser la forme de l'équation et les coefficients des bandes spectrales qu'une simple régression, c'est pourquoi nos indices générés automatiquement sont bien plus performants !