Normalfördelning

Från Rilpedia

Hoppa till: navigering, sök
Wikipedia_letter_w.pngTexten från svenska WikipediaWikipedialogo_12pt.gif
rpsv.header.diskuteraikon2.gif
Normalfördelningen

Normalfördelningen är inom matematiken (i synnerhet sannolikhetsteori och statistik) den absolut viktigaste fördelningen. En normalfördelad variabel antar ofta värden som ligger nära medelvärdet och mycket sällan värden som har stor avvikelse. Därför ser normalfördelningen ut som en kulle eller en klocka och internationellt används ofta beteckningen bell curve.

Normalfördelningen är statistikens absolut viktigaste fördelning. Detta hänger samman med ett matematiskt resultat som kallas centrala gränsvärdessatsen. Resultatet innebär att summan av ett stort antal oberoende slumpmässiga variabler är ungefär normalfördelad under vissa allmänna förutsättningar, oavsett vilken fördelning dessa variabler hade från början. Detta får till följd att normalfördelningen dyker upp på många ställen i naturen och samhället och mängder med skeenden kan med stor noggrannhet beskrivas av normalfördelningen. Inom naturvetenskap, sociologi, ekonomi med mera är det vanligt att man inte förstår hur en viss mekanism fungerar, men man kan teoretiskt motivera ett användande av normalfördelningar eftersom det ofta är sant att fenomen uppkommer genom många små, oberoende, slumpmässiga variationer.

Innehåll

Exempel – singla slant

Om man singlar en slant 100 gånger och kallar summan för X så kommer X att vara binomialfördelad. Men eftersom varje slantsingling är oberoende av alla övriga kommer summan X att vara ungefär normalfördelad med väntevärde 50. Ofta är det mycket enklare att approximera en slumpmässig variabel med en normalfördelning än att beräkna sannolikheter exakt, och eftersom många slumpmässiga fenomen är summor av väldigt många små slumpmässiga tillskott fungerar det mycket bra. Historiskt sett var möjligheten att approximera stora binomialfördelningar det första tillämpningsområdet för normalfördelningen.

Definition

Normalfördelningen har täthetsfunktionen:

Normalfördelningen för olika värden på μ och σ²
f(x) = {1 \over \sigma\sqrt{2\pi} }\,e^{-{(x-\mu )^2 \over 2\sigma^2}},

där μ och σ är normalfördelningens karakteristiska konstanter: μ kallas väntevärdet, och σ kallas standardavvikelsen för fördelningen. Denna normalfördelning betecknas med N(\mu,\sigma)\,.

Normalfördelningens täthetsfunktion kan inte integreras med vanliga endimensionella metoder eftersom den inte har någon primitiv funktion som kan uttryckas analytiskt. Arean under kurvan kan emellertid med andra metoder visas vara 1, vilket den måste vara för att vara en riktig sannolikhetsfördelning.

En standardiserad normalfördelning har μ = 0 och σ = 1.

Fördelningsfunktion för normalfördelning

Fördelningsfunktionen för en standardiserad normalfördelning brukar betecknas med \Phi\, och sambandet mellan fördelningsfunktion och täthetsfunktion säger att:

\Phi(x) = \int_{-\infty}^x f(x) dx.

Fördelningsfunktionen anger sannolikheten att en normalfördelad variablel Y är mindre än eller lika med ett visst tal x:

P(Y < x) = \Phi(x)\,.

Sannolikheten att en normalfördelad variabel hamnar i ett interval [a,b] är:

P(a < X < b) = \Phi(b) - \Phi(a)\,.

Egenskaper

Följande egenskaper gäller för normalfördelningar:

Fördelningsfunktion

Fördelningsfunktionen för en godtycklig normalfördelad variabel X\in N(\mu,\sigma) kan lätt erhållas från fördelningsfunktionen för en standard-normalfördelad variabel:

P(X<a)=\Phi\left(\frac{a-\mu}{\sigma}\right).

Denna egenskap gör att tabeller för normalfördelningar bara redovisar fördelningsfunktionen \Phi\,, eftersom alla andra normalfördelningar på detta sätt kan översättas till en med väntevärdet 0 och standardavvikelse 1.

Symmetri

\Phi(x) = 1 - \Phi(-x)\,.

Denna symmetri gör att alla tabeller bara redovisar \Phi(x)\, för positiva tal x.

Linjär förändring

Om X\in N(\mu,\sigma) och a,b\, är konstanter så gäller att den linjära formen

aX + b \in N(a\mu+b,a\sigma),

det vill säga väntevärdet förändras på samma linjära sätt och standardavvikelsen ökar med faktorn a.

Summa av två oberoende normalfördelade variabler

Om X \in N(\mu_X, \sigma_X) och Y \in N(\mu_Y, \sigma_Y) är oberoende så gäller att deras summa

X+Y \in N\left(\mu_X+\mu_Y, \sqrt{\sigma^2_X + \sigma^2_Y}\right).

Differenser av oberoende normalfördelade variabler fungerar analogt.


Se även

Personliga verktyg