La formation d'images implique des mesures physiques sur les dimensions spectrale, spatiale et temporelle. Les modèles de couleur gaussiens constituent une nouvelle théorie de la mesure des couleurs, ils sont une extension du cadre de la dérivée gaussienne (théorie de l'espace d'échelle) au domaine spatio-spectral. L'une des réalisations les plus importantes de la théorie de l'espace d'échelle est la remarque selon laquelle les formes gaussiennes empêchent la création de détails supplémentaires sur les images à plus grande échelle (c'est-à-dire à plus faible résolution). Les gaussiennes offrent une sonde générale pour les quotients différentiels spatio-spectraux. Soit $E(\lambda)$ la distribution spectrale d'énergie de la lumière, elle est fonction de λ, qui désigne la longueur d'onde. Supposon maintenant $G(\lambda_0,\sigma_\lambda)$  un noyau gaussien d'échelle spectrale $\sigma_\lambda$ et centré en $\lambda_0$. La distribution d'énergie spectrale$E(\lambda)$ peut être approximée par l'expansion de Taylor centré en $\lambda_0$

\begin{equation}
E(\lambda) = E^{\lambda_0} + \lambda E_\lambda^{\lambda_0} + \frac{1}{2} \lambda^2 E_{\lambda \lambda}^{\lambda_0} + \cdots
\end{equation}

En supposant que les mesures de la distribution d'énergie spectrale sont effectuées avec une intégration pondérée sur le spectre, nous avons

\begin{equation}
E^{\sigma_\lambda} = E^{\lambda_0,\sigma_\lambda} + \lambda E_\lambda^{\lambda_0,\sigma_\lambda} + \frac{1}{2} \lambda^2 E_{\lambda \lambda}^{\lambda_0,\sigma_\lambda} + \cdots
\end{equation}

Où $E^{\lambda_0,\sigma_\lambda} = \int E(\lambda) G(\lambda;\lambda_0,\sigma_\lambda)d\lambda$ mesure l'intensité spectrale. Les modèles de couleur gaussiens mesurent les coefficients $E^{\lambda_0,\sigma_\lambda}$ et $E_{\lambda \lambda}^{\lambda_0,\sigma_\lambda}$ dans l'expansion de Taylor de la distribution d'énergie spectrale pondérée gaussienne à $\lambda_0$ avec l'ouverture spectrale (échelle) $\sigma_\lambda$. 

L'information spatiale peut être introduite dans le modèle en produisant une expansion de Taylor à la longueur d'onde $\lambda_0$ et aux coordonnées $x=(x,y)$. Le résultat de ceci est l'exploration d'un volume de densité d'énergie dans un espace spatio-spectral

\begin{equation}
E(\lambda,\textbf{x}) = E + \left(\begin{array}{c} \textbf{x} \\ \lambda \end{array} \right)^T \left[ \begin{array}{c} E_\textbf{x} \\ E_\lambda \end{array} \right] + \frac{1}{2} \left(\begin{array}{c} \textbf{x} \\ \lambda \end{array} \right)^T \left[ \begin{array}{cc} E_\textbf{xx} & E_{\textbf{x}\lambda} \\ E_{\lambda \textbf{x}} & E_{\lambda \lambda} \end{array} \right] \left(\begin{array}{c} \textbf{x} \\ \lambda \end{array} \right) + \cdots,
\end{equation}

Où $E_{\lambda^m \textbf{x}^n}(\lambda,\textbf{x}) = E(\lambda,\textbf{x}) * G_{\lambda^m,\textbf{x}^n}(\lambda,\textbf{x};\sigma_\lambda,\sigma_\textbf{x})$ est la m-ième différenciation par rapport à λ (différenciation spectrale) et la n-ième par rapport à x (différenciation spatiale).

On peut supposer que les sensibilités des caméras se rapprochent des fonctions gaussiennes autour des zones rouge, verte et bleue du spectre visible. Une approximation du modèle de couleur gaussien est donnée par les espaces de couleur adverses. Ici, le canal de luminosité ou d'intensité $I=R+G+B$ peut être considéré comme une réponse spectrale pondérée gaussienne, le canal jaune-bleu $YB=R+G-2B$ se rapproche de la dérivée spectrale de premier ordre car il résulte de la comparaison d'une moitié du spectre (autour de la couleur bleue) avec l'autre moitié (autour du jaune), le canal rouge-vert $RG=R-2G+B$ peut être interprété comme une dérivée de second ordre qui compare le centre du spectre avec les extrêmes (dans la largeur de bande visuelle). L'interprétation de la couleur adverse du modèle de couleur gaussien est alors exprimée comme suit .

\begin{equation}
\left[ \begin{array}{c}
\hat{E} \\
\hat{E}_\lambda \\
\hat{E}_{\lambda \lambda}
\end{array} \right] = \frac{1}{3} \left( \begin{array}{ccc}
1 & 1 & 1 \\
1 & 1 & -2 \\
1 & -2 & 1
\end{array}\right) \left[ \begin{array}{c} R \\ G \\ B \end{array} \right].
\end{equation}

Pour les caméras étalonnées, les réponses $XYZ$ sont connues et les fonctions de base gaussiennes sont estimées avec une plus grande précision. Une caméra RGB linéarisée qui se rapproche de la base $XYZ$ de la CIE 1964 pour la colorimétrie par la transformation linéaire suivante :

\begin{equation}
\left[ \begin{array}{c}
\hat{X} \\
\hat{Y} \\
\hat{Z}
\end{array} \right] = \left( \begin{array}{ccc}
0.62 & 0.11 & 0.19 \\
0.3 & 0.56 & 0.05 \\
-0.01 & 0.03 & 1.11
\end{array}\right) \left[ \begin{array}{c} R \\ G \\ B \end{array} \right],
\label{eq:XYZcolorsystem}
\end{equation}

et la meilleure transformée linéaire du système $XYZ$ au modèle de couleur gaussien est

\begin{equation} \left[ \begin{array}{c} \hat{E} \\ \hat{E}_\lambda \\ \hat{E}_{\lambda \lambda} \end{array} \right] = \left( \begin{array}{ccc} -0.48 & 1.2 & 0.28 \\ 0.48 & 0 & -0.4 \\ 1.18 & -1.3 & 0 \end{array}\right) \left[ \begin{array}{c} \hat{X} \\ \hat{Y} \\ \hat{Z} \end{array} \right] \label{eq:XYZgaussianColor} \end{equation}

le produit des matrices de transformation dans les équations précédentes donnent finalements:

\begin{equation} \left[ \begin{array}{c} \hat{E} \\ \hat{E}_\lambda \\ \hat{E}_{\lambda \lambda} \end{array} \right] = \left( \begin{array}{ccc} 0.06 & 0.63 & 0.27 \\ 0.3 & 0.04 & -0.35 \\ 0.34 & -0.6 & 0.17 \end{array}\right) \left[ \begin{array}{c} R \\ G \\ B \end{array} \right]. \end{equation}