Stone-Weierstrass sats

Från Rilpedia

Hoppa till: navigering, sök
Wikipedia_letter_w.pngTexten från svenska WikipediaWikipedialogo_12pt.gif
rpsv.header.diskuteraikon2.gif
Bild över Bernsteinpolynomen f2 (...), f4 (.-.) och f6 (---) associerade med cosinus-funktionen x \longmapsto \cos(2\pi x) (heldragen kurva).

Inom matematiken -- mer specifikt inom matematisk analys -- är Stone-Weierstrass teorem ett viktigt resultat som rör approximation av kontinuerliga funktioner.

Den klassiska varianten av satsen, kallad Weierstrass approximationssats, visades först av Karl Weierstrass år 1885 och säger att det, för varje kontinuerlig funktion


 f:[0,1]\longrightarrow \mathbb{R},

går att finna en sekvens \{f_n\}_{n=1}^\infty av polynom

f_n : [0,1]\longrightarrow \mathbb{R}

som konvergerar likformigt mot funktionen f.

Weierstrass approximationssats generaliserades senare av Marshall Stone, som visade ett liknande resultat för kontinuerliga funktioner definierade på ett godtyckligt kompakt Hausdorffrum. (Det slutna och begränsade intervallet [0,1] är ett exempel på ett kompakt Hausdorffrum.) Stone-Weierstrass teorem visar även att man kan approximera kontinuerliga funktioner med andra funktioner än polynom.


Weierstrass ursprungliga resultat lyder som följer:

Låt f : [0,1] \longrightarrow \mathbb{R} vara en kontinuerlig funktion. Det existerar en sekvens \{f_n\}_{n=1}^\infty av polynom f_n :
[0,1]\longrightarrow \mathbb{R} som är sådana att

\lim_{n\to\infty} \sup_{x\in[0,1]}\left\vert f(x) - f_n(x)\right\vert = 0.

En nackdel med Weierstrass approximationssats är att den endast garanterar existensen av approximerande polynom. Det finns emellertid ett bevis av satsen som ger en explicit konstruktion av sekvensen \{f_n\}_{n=1}^\infty. Detta bevis, som ges nedan, är ett exempel på hur man kan använda sannolikhetsteori för att bevisa resultat inom matematisk analys.


Sannolikhetsteoretiskt bevis av Weierstrass approximationssats

Vi börjar med att konstruera en sekvens \{f_n\}_{n=1}^\infty av polynom; de så kallade Bernsteinpolynomen. Därefter visar vi att de fyller sin funktion.

Välj ett godtyckligt heltal n \geq 1 och ett godtyckligt tal p \in[0,1]. Låt

X_1,X_2,\dots,X_n

vara oberoende, diskreta, stokastiska variabler, alla med samma frekvensfunktion:


    \mathbb{P}\{X_i = 1\} = p
    \quad \textrm{och}\quad
    \mathbb{P}\{X_i = 0\} = 1 - p.

Summan av dessa stokastiska variabler är en diskret stokastisk variabel, S_n\,, vars frekvensfunktion är


    \mathbb{P}(S_n = k) = \binom{n}{k}p^k(1-p)^{n-k},

där heltalet k \in \{0,\dots,n\} och symbolen \binom{n}{k} är en så kallad binomialkoefficient.

Kvoten Sn / n antar värden som ligger i intervallet [0,1], vilket innebär att vi kan applicera funktionen f på dessa värden. Detta ger upphov till en diskret stokastisk variabel, f(S_n/n),\, som antar värden ur mängden \{f(0),f(1/n),\dots,f(1)\}. Väntevärdet för denna stokastiska variabel är det reella talet

 \mathbb{E}\left\{f\left(\frac{S_n}{n}\right)\right\} =
\sum_{k=0}^n f\left(\frac{k}{n}\right)\mathbb{P}\{S_n=k\}.

Den kända frekvensfunktionen för summan Sn låter oss uttrycka väntevärdet som

\mathbb{E}\left\{f\left( \frac{S_n}{n} \right)\right\}
    =
    \sum_{k=0}^n f\left(\frac{k}{n}\right)\binom{n}{k}p^k(1-p)^{n-k}.

Funktionen f_n : [0,1] \longrightarrow \mathbb{R}, definierad av


f_n(p) =  \sum_{k=0}^n f\left(\frac{k}{n}\right)
\binom{n}{k} p^k (1 - p)^{n - k},

är ett polynom av grad n. Detta polynom kallas för Bernsteinpolynomet av grad n, associerat med funktionen f.

Eftersom heltalet n\geq 1 valdes godtyckligt, har vi härmed lyckats konstruera en sekvens \{f_n\}_{n=1}^\infty av polynom.

De tre första Bernsteinpolynomen är:

  • f_1(p) = f(0)(1-p) + f(1) p\,
  • f_2(p) = f(0)(1-p)^2 + 2f(1/2)p(1-p) + f(1)p^2\,
  • f_3(p) = f(0)(1-p)^3 + 3f(1/3)p(1-p)^2 + 3f(2/3)p^2(1-p) + f(1)p^3.\,

Vi skall nu visa att sekvensen av Bernsteinpolynom konvergerar likformigt mot funktionen f, vilket, med vår konstruktion av Bernsteinpolynomen som väntevärden av en sekvens av stokastiska variabler \{f(S_n/n)\}_{n=1}^\infty,\, innebär att gränsvärdet

\lim_{n\to\infty}\sup_{p\in[0,1]} \left\vert
\mathbb{E}\left\{f\left(\frac{S_n}{n}\right) - f(p)\right\}\right\vert = 0.

För att göra detta väljer vi ett godtyckligt tal p\in[0,1] och visar att

 \left\vert \mathbb{E}\left\{f\left(\frac{S_n}{n}\right) -
f(p)\right\} \right\vert \leq \varepsilon + \max_{x\in[0,1]}\vert
f(x) \vert\frac{1}{2n\delta^2(\varepsilon)},

där \varepsilon är ett godtyckligt valt positivt tal och δ(ε) är ett positivt tal som bara beror på talet \varepsilon och inte på talet p\in[0,1]. Därmed är talet

 \varepsilon + \max_{x\in[0,1]}\vert f(x)
\vert\frac{1}{2n\delta^2(\varepsilon)}

en övre begränsning till mängden av tal

 M = \left\{\left\vert
\mathbb{E}\left\{f\left(\frac{S_n}{n}\right) - f(p)\right\}
\right\vert : p \in [0,1]\right\}.

Då är talet

 \varepsilon + \max_{x\in[0,1]}\vert f(x)
\vert\frac{1}{2n\delta^2(\varepsilon)}

större än den minsta övre begränsningen (supremum) till mängden M, det vill säga

 \sup_{p\in[0,1]}\left\vert
\mathbb{E}\left\{f\left(\frac{S_n}{n}\right) - f(p)\right\}
\right\vert \leq \varepsilon + \max_{x\in[0,1]}\vert f(x)
\vert\frac{1}{2n\delta^2(\varepsilon)}.

Denna övre begränsning är giltig för varje val av heltalet n\geq 1. Därför kan vi välja detta heltal så stort — större än ett visst heltal N_\varepsilon — att talet

\max_{x\in[0,1]}\vert f(x)
\vert\frac{1}{2n\delta^2(\varepsilon)} < \varepsilon.

Då får vi resultatet att det för varje tal \varepsilon > 0 går att finna ett heltal N_\varepsilon\geq 1 som är sådant att

 \sup_{p\in[0,1]}\left\vert
\mathbb{E}\left\{f\left(\frac{S_n}{n}\right) - f(p)\right\}
\right\vert \leq 2\varepsilon,

för varje heltal n > N_\varepsilon. Detta är detsamma som att säga att

\lim_{n\to\infty}\sup_{p\in[0,1]}\left\vert
\mathbb{E}\left\{f\left(\frac{S_n}{n}\right) - f(p)\right\}
\right\vert = 0,

vilket i sin tur är samma sak som att säga att sekvensen av Bernsteinpolynom \{f_n\}_{n=1}^\infty\, konvergerar likformigt mot den kontinuerliga funktionen f på intervallet [0,1].

Det är endast en länk som fattas för att ovanstående resonemang skall bli korrekt: Vi måste visa att vi, för varje heltal n \geq 1, kan begränsa väntevärdet

\left\vert \mathbb{E}\left\{f\left(\frac{S_n}{n}\right) -
f(p)\right\} \right\vert

uppåt enligt

 \left\vert \mathbb{E}\left\{f\left(\frac{S_n}{n}\right) -
f(p)\right\} \right\vert \leq \varepsilon + \max_{x\in[0,1]}\vert
f(x) \vert\frac{1}{2n\delta^2(\varepsilon)},

där \varepsilon är ett godtyckligt valt positivt tal och δ(ε) är ett positivt tal som bara beror på talet \varepsilon och inte på talet p\in[0,1].

Jensens olikhet tillämpad på den konvexa funktionen

x \longmapsto \vert x \vert

låter oss begränsa väntevärdet uppåt med

 \left\vert \mathbb{E}\left\{f\left(\frac{S_n}{n}\right) -
f(p)\right\} \right\vert \leq \mathbb{E}\left\{\left\vert
f\left(\frac{S_n}{n}\right) - f(p)\right\vert\right\}.

Härnäst väljer vi ett godtyckligt reellt tal δ > 0 och splittrar upp väntevärdet

\mathbb{E}\left\{\left\vert f\left(\frac{S_n}{n}\right) -
f(p)\right\vert\right\}

i en summa bestående av två termer, beroende på om den stokastiska variabeln

\vert S_n/n - p \vert

är större eller mindre än talet δ:

 \mathbb{E}\left\{\left\vert f\left(\frac{S_n}{n}\right) -
f(p)\right\vert\right\} = \mathbb{E}\left\{\left\vert
f\left(\frac{S_n}{n}\right) - f(p)\right\vert 1_{\left\{\left\vert
\frac{S_n}{n} - p \right\vert < \delta\right\}}\right\} +
\mathbb{E}\left\{\left\vert f\left(\frac{S_n}{n}\right) -
f(p)\right\vert 1_{\left\{\left\vert \frac{S_n}{n} - p \right\vert
\geq \delta\right\}}\right\}.

Eftersom funktionen

f : [0,1] \longrightarrow\mathbb{R}

är kontinuerlig på det slutna och begränsade intervallet [0,1] så är den likformigt kontinuerlig på detta intervall och värdet

\max_{x \in [0,1]} \vert f(x)\vert

är ändligt.

Välj nu ett godtyckligt tal \varepsilon > 0. Den likformiga kontinuiteten ger oss då ett tal \delta(\varepsilon) > 0 — som endast beror på talet \varepsilon — som är sådant att, om

\vert S_n/n - p \vert < \delta(\varepsilon)

så är den stokastiska variabeln

\left\vert f\left(\frac{S_n}{n}\right) - f(p)\right\vert <
\varepsilon.

Det är därför lämpligt att låta det tidigare godtyckligt valda talet talet δ vara just detta tal \delta(\varepsilon), vilket innebär att vi kan uppskatta det första väntevärdet i ovanstående summa enligt

\mathbb{E}\left\{\left\vert f\left(\frac{S_n}{n}\right) -
f(p)\right\vert 1_{\left\{\left\vert \frac{S_n}{n} - p \right\vert
< \delta(\varepsilon)\right\}}\right\} \leq \varepsilon
\mathbb{E}\{1_{\left\{\left\vert \frac{S_n}{n} - p \right\vert <
\delta(\varepsilon)\right\}}\} \leq \varepsilon.

För att uppskatta den andra summan använder vi Triangelolikheten för reella tal och de faktum att

\vert f(S_n/n) \vert \leq \max_{x\in[0,1]}\vert f(x)\vert

samt

\vert f(p) \vert \leq \max_{x\in[0,1]}\vert f(x)\vert,

för att få

\mathbb{E}\left\{\left\vert f\left(\frac{S_n}{n}\right) -
f(p)\right\vert 1_{\left\{\left\vert \frac{S_n}{n} - p \right\vert
< \delta(\varepsilon)\right\}}\right\} \leq 2\max_{x\in[0,1]}\vert
f(x)\vert \mathbb{P}\left\{\left\vert \frac{S_n}{n} - p
\right\vert \geq \delta(\varepsilon)\right\},

där vi har använt oss av sambandet

\mathbb{E}\{1_A\} = \mathbb{P}\{A\}

mellan väntevärde och sannolikhet, giltigt för varje mätbar mängd A. (Mängden

\left\{\left\vert \frac{S_n}{n} - p \right\vert \geq
\delta(\varepsilon)\right\}

är mätbar.)

Markovs olikhet låter oss uppskatta sannolikheten

\mathbb{P}\left\{\left\vert \frac{S_n}{n} - p \right\vert
\geq \delta(\varepsilon)\right\}

enligt:

 \mathbb{P}\left\{\left\vert \frac{S_n}{n} - p \right\vert
\geq \delta(\varepsilon)\right\} \leq
\frac{1}{\delta^2(\varepsilon)}\mathbb{E}\left\{\left\vert
\frac{S_n}{n} - p \right\vert^2\right\}.

Eftersom väntevärdet för den stokastiska variabeln S_n/n\, är

\mathbb{E}\left\{\frac{S_n}{n}\right\} = p,

så är väntevärdet

\mathbb{E}\left\{\left\vert \frac{S_n}{n} - p
\right\vert^2\right\} =
\textrm{Var}\left[\frac{S_n}{n}\right],

där \textrm{Var}\left[\frac{S_n}{n}\right]\, betecknar variansen för den stokastiska variabeln S_n/n\, och kan beräknas exakt:

\textrm{Var}\left[\frac{S_n}{n}\right] = \frac{p(1-p)}{n}.

En kvadratkomplettering visar att det för varje värde på talet p gäller att

p(1-p) \leq 1/4,\,

vilket låter oss uppskatta sannolikheten

\mathbb{P}\left\{\left\vert \frac{S_n}{n} - p \right\vert
\geq \delta(\varepsilon)\right\}

enligt

 \mathbb{P}\left\{\left\vert \frac{S_n}{n} - p \right\vert
\geq \delta(\varepsilon)\right\} \leq
\frac{1}{4n\delta^2(\varepsilon)}.

Sammanfattningsvis har vi funnit den sökta övre begränsningen av väntevärdet

 \left\vert \mathbb{E}\left\{f\left(\frac{S_n}{n}\right) -
f(p)\right\} \right\vert \leq \varepsilon + \max_{x\in[0,1]}\vert
f(x) \vert\frac{1}{2n\delta^2(\varepsilon)}.

Därmed är beviset av Weierstrass approximationssats fullbordat.

Stone-Weierstrass teorem för komplex-värda funktioner

Låt X vara ett kompakt Hausdorffrum och låt \mathcal{A} vara en sluten, komplex delalgebra till mängden \mathcal{C}(X) av alla komplex-värda kontinuerliga funktioner f : X
\longrightarrow \mathbb{C}. Om algebran \mathcal{A} separerar punkter i X och är sluten under komplex-konjugering, så gäller endera av följande två fall:

  • \mathcal{A} = \mathcal{C}(X).
  • Det finns en punkt x_0\in X som är sådan att

\mathcal{A} = \{ f\in \mathcal{C}(X) : f(x_0) = 0 \}.

En delmängd \mathcal{M} till mängden \mathcal{C}(X) separerar punkter i X om det, för varje val av två distinkta punkter x och y i Hausdorffrummet X, går att finna en funktion f \in
\mathcal{C}(X) som skiljer på dessa punkter i den meningen att de komplexa talen f(x) och f(y) är olika.


Stone-Weierstrass teorem medför Weierstrass resultat: Mängden av alla polynom på det kompakta Hausdorffrummet X är en delalgebra av de kontinuerliga funktionerna, eftersom summor och produkter av polynomer också är ett polynom. Vidare är den konstanta funktionen 1 ett polynom av grad 0 utan nollställe, och givet någon punkt x i ett intervall finns det polynom p,q sådana att  p(x) \neq q(x) .

Stone-Weierstrass sats har stor betydelse inom många delar av den matematiska analysen.

Lokal-kompakt version av Stone-Weierstrass teorem

Det finns även en variant av Stone-Weierstrass teorem som gäller för lokalt kompakta Hausdorffrum som inte är kompakta.

Låt X vara ett lokal-kompakt Hausdorffrum som inte är kompakt och låt \mathcal{A} vara en sluten delalgebra av mängden \mathcal{C}_0(X)\cap\mathcal{C}(X,\mathbb{R}). Om mängden \mathcal{A} separerar punkter i X så gäller endera av följande två fall:

  • \mathcal{A}=\mathcal{C}_0(X)\cap\mathcal{C}(X,\mathbb{R}).
  • Det finns en punkt x_0\in X sådan att

\mathcal{A}=\{f \in
\mathcal{C}_0(X)\cap\mathcal{C}(X,\mathbb{R}) : f(x_0) =
0\}.

Mängden \mathcal{C}_0(X) består av alla kontinuerliga funktioner

f : X \longrightarrow \mathbb{C}

som försvinner i oändligheten, i den meningen att

\{x \in X : \vert f(x) \vert > \varepsilon\}

är en kompakt delmängd av X för varje val av det reella talet \varepsilon>0.

Personliga verktyg