Hessmatris

Från Rilpedia

Hoppa till: navigering, sök
Wikipedia_letter_w.pngTexten från svenska WikipediaWikipedialogo_12pt.gif
rpsv.header.diskuteraikon2.gif

En funktions hessmatris, alt. hessian, är en kvadratisk matris innehållande funktionens alla partiella andraderivator.

Låt  f (x_1, x_2, \dots , x_n) \,\! vara en funktion med existerande andraderivator. Då kan funktionens partiella andraderivator ordnas i funktionens hessian enligt:

 H (f)_{ij} (x) = D_i D_j f (x), \,\!

där   x = (x_1 , x_2, ... ,x_n), \,\! och  D_i \,\! är differentieringsoperatorn med avseende på det i:te argumentet, alltså

H(f) = \begin{pmatrix}
\frac{\partial^2 f}{\partial x_1^2} & \frac{\partial^2 f}{\partial x_1\,\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_1\,\partial x_n} \\  \\
\frac{\partial^2 f}{\partial x_2\,\partial x_1} & \frac{\partial^2 f}{\partial x_2^2} & \cdots & \frac{\partial^2 f}{\partial x_2\,\partial x_n} \\  \\
\vdots & \vdots & \ddots & \vdots \\  \\
\frac{\partial^2 f}{\partial x_n\,\partial x_1} & \frac{\partial^2 f}{\partial x_n\,\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_n^2}
\end{pmatrix}.

Hessianer används främst inom optimering.

Innehåll

Symmetri

Om funktionen  f (x) = f( x_1 , x_2 , ... , x_n) \,\! har kontinuerliga andraderivator, gäller att [1]

 f''_{jk} = f''_{kj}. \,\!

Om så är fallet kommer funktionens hessian att bli en symmetrisk matris.

Hessianer och taylorutvecklingar

Taylorutveckling av andra ordningen till en funktion med två variabler ser ut som följer:

Låt funktionen  f (x, y) \, \! vara en funktion med (åtminstone) kontinuerliga tredjederivator i den öppna mängden M, och antag att punkten (a, b) tillhör M. Då ser taylorutvecklingen kring denna punkt ut enligt följande:

 f(a+h, b+k) = f(a, b) + f^{'}_x (a, b)h + f^{'}_y (a, b)k + { \frac 1 2} (f^{''}_{xx} (a, b)h^2 + 2 f^{''}_{xy} (a,b) hk + f^{''}_{yy} (a, b) k^2 ) + (h^2 +k^2)^{3/2} B (h, k), \,\!

där B(h, k) är en begränsad funktion i en omgivning av origo.

Vid funktionsstudier är den tredje termen

 Q (h, k) =  f^{''}_{xx} (a, b)h^2 + 2 f^{''}_{xy} (a,b) hk + f^{''}_{yy} (a, b) k^2 \,\!

viktig för att avgöra om punkten (a, b) är lokalt maximum, lokalt minimum eller ingetdera. Denna term ger den kvadratiska formen. Genom att ordna termernas koefficienter (de partiella andraderivatorna) i en symmetrisk matris,

H(f) = \begin{pmatrix}
\frac{\partial^2 f}{\partial x_1^2} & \frac{\partial^2 f}{\partial x_1\,\partial x_2} \\  \\
\frac{\partial^2 f}{\partial x_2\,\partial x_1} & \frac{\partial^2 f}{\partial x_2^2}
\end{pmatrix}, \,\!

kan man ta fram fram matrisens egenvärden, och med hjälp av dessa också hur funktionen beter sig kring punkten (a, b) (se längre ner). Matrisen är, som synes, funktionens hessian.

För en funktion av n variabler fungerar det på liknande sätt. Där erhålls den kvadratiska formen för en funktion  f ( x_1 , x_2 , \cdots , x_n) kring punkten  a= (a_1 , a_2 , \cdots , a_n) enligt

 Q (h) = \sum_{j,k=1}^n f^{''}_{jk} (a)h_{j}h_{k}, \,\!

och den tillhörande hessianen får sitt karakteristiska utseende.

Funktionsstudier med hessianer

Vid funktionsstudier kan det vara av intresse att veta t.ex. om funktionen är konvex eller konkav. Vi antar att funktionen  f (x) \,\! av flera variabler, är en två gånger deriverbar funktion definierad på en konvex mängd M. Då gäller att [2]:

  •  f (x) \,\! är en konvex funktion på M om dess hessian är positivt semi-definit för alla  x \in M. \,\!
  •  f (x) \,\! är en strikt konvex funktion på M om dess hessian är positivt definit för alla  x \in M. \,\!
  •  f (x) \,\! är en konkav funktion på M om dess hessian är negativt semi-definit för alla  x \in M. \,\!
  •  f (x) \,\! är en strikt konkav funktion på M om dess hessian är negativt definit för alla  x \in M. \,\!

För att avgöra hurvida funktionen är definit eller ej, och på vilket sätt, kan man undersöka hessianens egenvärden. Genom att lösa sekularekvationen

 det ( H (f) - \lambda E ) = 0, \,\!

där E är enhetsmatrisen, kommer vi att få ut hessianens egenvärden  \lambda_1, \lambda_2, \cdots , \lambda_n. \,\! För dessa gäller:

Om alla  \lambda_i \ge 0 \,\! är hessianen positivt semi-definit.
Om alla  \lambda_i > 0 \,\! är hessianen positivt definit.
Om alla  \lambda_i \le 0 \,\! är hessianen negativt semi-definit.
Om alla  \lambda_i < 0 \,\! är hessianen negativt definit.

Om ingen av dessa gäller, är funktionen indefinit, och således varken konvex eller konkav.

Detta kan användas på en funktion för att se om den vid någon viss punkt  a = ( a_1,a_2, \cdots, a_n) \,\! har lokalt extremvärde. Det är precis detta man applicerar på kvadratiska former (se taylorutveckling av andra ordningen i flera variabler).

Referenser

  1. A Persson, L-C Böiers (2005) Analys i flera variabler, ISBN 91-44-03869-0, sid 87, sats 9
  2. J Lundgren, M Rönnqvist, P Värbrand (2003) Optimeringslära, ISBN 91-44-03104-1, sid 300, sats 9.5-9.6

Se även

Personliga verktyg