1) Maximums, minimums locaux, globaux
Soit $f(x_1,\ldots,x_n)$ une fonction de $n$ variables. On dit que $f$ admet un minimum local en $a=(a_1,\ldots,a_n)$ s'il existe un voisinage (= une petite région autour de $a$) $V$ de $a$ telle que pour tout
$(x_1,\ldots,x_n) \in \rm V$ :
\[f(x_1,\ldots,x_n) \ge f(a_1,\ldots,a_n)\]
De même, on dit que $f$ admet un maximum local en $a=(a_1,\ldots,a_n)$ s'il existe un voisinage $\rm V$ de $a$ telle que pour tout $(x_1,\ldots,x_n) \in \rm V$ :
\[f(x_1,\ldots,x_n) \le f(a_1,\ldots,a_n)\]
On dit que $f$ admet un minimum global si pour tout
$(x_1,\ldots,x_n) \in {\Bbb R}^n$ :
\[f(x_1,\ldots,x_n) \ge f(a_1,\ldots,a_n)\]
De même, on dit que $f$ admet un maximum global si pour tout
$(x_1,\ldots,x_n) \in {\Bbb R}^n$ :
\[f(x_1,\ldots,x_n) \le f(a_1,\ldots,a_n)\]
On dit que $f$ admet un extremum local (respectivement global) si $f$ admet un minimum ou un maximum local (respectivement global).
Remarque : un extremum global est aussi local !
Un problème courant en science est de chercher à optimiser un processus. Cela conduit à minimiser ou maximiser une fonction de plusieurs variables c'est-à-dire à chercher ses extrema.
2) Premier exemple
Considérons la fonction de deux variables :
\[f(x,y) = x^2+y^2-x-y\]
On peut voir $x^2-x$ comme le début de l'identité remarquable $(x-1/2)^2$. Plus précisément, on a :
\[x^2-x = (x-1/2)^2 - 1/4\]
De même :
\[y^2-y = (y-1/2)^2 - 1/4\]
Ainsi :
\[f(x,y) = (x-1/2)^2 - 1/4 + (y-1/2)^2 - 1/4 \\f(x,y)= (x-1/2)^2+ (y-1/2)^2 -1/2\]
Comme un carré est toujours positif, on a :
$f(x,y) \ge -1/2$ pour tout $(x,y) \in {\Bbb R}^2$
De plus, $f(1/2,1/2) = -1/2$ donc pour tout $(x,y) \in {\Bbb R}^2$, $f(x,y) \ge f(1/2,1/2)$. On a donc prouvé que $f$ admet un minimum global au point de coordonnées $(1/2,1/2)$ et que ce minimum vaut $-1/2$.
3) Point critique
Considérons une fonction de plusieurs variables $f(x_1,\ldots,x_n)$ . On dit que $a=(a_1,\ldots,a_n)$ est un point critique de $f$ si toutes les dérivées partielles de $f$ s'annulent en $a$ autrement dit :
\[\displaystyle{\forall i=1,\ldots,n, \frac{\partial}{\partial x_i} f(a) = 0}\]
Théorème : soit $f$ une fonction admettant des dérivées partielles continues sur ${\Bbb R}^n$ (ou plus généralement sur un ouvert de ${\Bbb R}^n$ - un ouvert de ${\Bbb R}^n$ est une partie de ${\Bbb R}^n$ qui n'a pas de frontière).
Si $f$ admet un extremum local en $a$ alors $a$ est un point critique.
Remarque importante : la réciproque est fausse ! Prenons par exemple $f(x,y)=xy$. Cette fonction admet les dérivées partielles :
\[\displaystyle{\frac{\partial f}{\partial x} (x,y) = y}\text{ et }\displaystyle{\frac{\partial}{\partial x} f(x,y) = x}\]
$a=(\alpha,\beta)$ est un point critique si et seulement si par définition $\displaystyle{\frac{\partial f}{\partial x} (\alpha,\beta) =0}$ et $\displaystyle{\frac{\partial f}{\partial y} (\alpha,\beta) = 0}$ si et seulement si $(\alpha,\beta) = (0,0)$
Donc $f$ admet un unique point critique sur ${\Bbb R}^2$ qui est $(0,0)$.
Or $f$ n'admet pas d'extremum local en $(0,0)$. En effet, choisissons $x=y$ dans $f(x,y)$. On a donc $f(x,y) = f(x,x)= x^2 \ge 0$ puis choisissons $x=-y$ dans $f(x,y)$. On a donc $f(x,y) = f(x,-x)= -x^2 \le 0$. Ainsi au voisinage de $(0,0)$, $f$ n'a pas un signe constant c'est-à-dire n'est pas toujours plus grande que $f(0,0)=0$ ou plus petite que $f(0,0)=0$.
On dit que $(0,0)$ est un point selle par référence à la selle d'un cheval qui serait la représentation géométrique de $f(x,y)=xy$. Le point $(0,0)$ est au creux de la selle. Lorsqu'on suit le parcours des jambes du cavalier, on est en dessous de ce point. Mais lorsqu'on suit le parcours du dos de cheval on est au-dessus ce point.
4) Méthode pour chercher les extrema d'une fonction $f$ de plusieurs variables
a) On cherche tout d'abord les points critiques de $f$
b) Parmi les points critiques $a$, il faut décider s'ils correspondent à des extremums ou pas. Pour cela il faut étudier le signe de la différence $f(x_1,\ldots,x_n) - f(a)$ et examiner si cette différence est toujours positive ou toujours négative (autrement dit garde un signe constant) au voisinage de $(0,0)$.
On fait un changement de variables pour se ramener en $0$. On pose pour tout $i=1.\ldots,n$, $h_i = x_i-a_i$. Lorsque $x=(x_1,\ldots,x_n)$ est proche de $a=(a_1,\ldots,a_n)$ ce la revient à dire que $h=(h_1,\ldots,h_n)$ est proche de $0$.
On étudie alors le signe de :
$f(x_1,\ldots,x_n) - f(a) = f(a_1+h_1,\ldots,a_n+h_n) - f(a)$ au voisinage de $0$.
5) Utilisation des dérivées secondes.
Pour le b), on peut parfois utiliser la formule de Taylor-Young à l'ordre $2$. Elle nous dit par exemple pour une fonction de deux variables qu'au voisinage de $a=(\alpha,\beta)$,
\[\displaystyle f(\alpha+h,\beta+k) \approx f(\alpha,\beta) + \frac{\partial f}{\partial x} (\alpha,\beta)h \\ \displaystyle + \frac{\partial f}{\partial y} (\alpha,\beta)k + \frac{\partial f}{\partial x^2} (\alpha,\beta)h^2 \\ \displaystyle + 2\frac{\partial f}{\partial xy} (\alpha,\beta)hk +\frac{\partial f}{\partial y^2} (\alpha,\beta)k^2\]
Si $a=(\alpha,\beta)$ est un point critique alors en posant $\displaystyle{r = \frac{\partial f}{\partial x^2} (\alpha,\beta)}$, $\displaystyle{s=\frac{\partial f}{\partial xy} (\alpha,\beta)}$ et $\displaystyle{t = \frac{\partial f}{\partial y^2} (\alpha,\beta)}$, on a :
\[f(x,y) - f(\alpha,\beta) = f(\alpha+h,\beta+k) - f(\alpha,\beta) \approx rh^2 +2shk + tk^2\]
On admet alors que le signe local (c'est-à-dire quand $h$ et $k$ sont proches de $0$ ou ce qui revient à dire quand le point $(x,y)$ est proche de $a=(\alpha,\beta)$) est le signe de la fonction $(h,k) \mapsto rh^2 +2shk + tk^2$. Cette application s'appelle une forme quadratique.
6) Exemple
On considère la fonction $f(x,y) = x^2+(x+y-1)^2+y^2$. Déterminer ses extrema locaux et globaux sur tout ${\Bbb R}^2$.
On a :
\[\begin{array}{lcl}\displaystyle{\frac{\partial f}{\partial x} (x,y) = 2x+2(x+y-1) = 4x+2y-2}\\ \text{ et }\\ \displaystyle{\frac{\partial f}{\partial y} (x,y) = 2(x+y-1)+2y = 2x+4y-2}.\end{array}\]
$(x,y)$ est un point critique $\iff \displaystyle{\frac{\partial f}{\partial x} (x,y)=0}$ et $\displaystyle{\frac{\partial f}{\partial y} (x,y)=0}$ ce qui donne le système d'équations (après simplification par le facteur $2$) :
\[2x+y=1\text{ et }x+2y=1.\]
On trouve un seul point critique le point :
\[\displaystyle{a=\left(\frac{1}{3},\frac{1}{3}\right)}\]
Posons $h=x-1/3$ et $k=y-1/3$. Lorsque $(x,y)$ est proche de $a$ alors $(h,k)$ est proche de $(0,0)$.
Après calcul on a :
\[f(x,y)-f(a) = f(h+1/3,k+1/3) - f(1/3,1/3) = 2h^2+2k^2+ 2hk\]
On peut écrire la différence :
\[\begin{array}{lll}f(x,y)-f(a) = f(h+1/3,k+1/3) - f(1/3,1/3) \\f(x,y)-f(a) = h^2+k^2+ h^2+k^2+ 2hk \\f(x,y)-f(a) = h^2+k^2 + (h+k)^2\end{array}\]
On en déduit que pour tout $(h,k) \in {\Bbb R}^2$ :
\[f(h+1/3,k+1/3) - f(1/3,1/3) \ge 0\]
Ce qui revient à dire que pour tout $(x,y) \in {\Bbb R}^2$, $f(x,y) \ge f(1/3,1/3)$. On en déduit que $f$ admet un minimum global en $(1/3,1/3)$ et ce minimum vaut :
\[f(1/3,1/3) = 1/3\]