Sannolikhetsfördelning

Från Rilpedia

Hoppa till: navigering, sök
Wikipedia_letter_w.pngTexten från svenska WikipediaWikipedialogo_12pt.gif
rpsv.header.diskuteraikon2.gif

Sannolikhetsfördelning är ett begrepp inom sannolikhetsteori, statistik och matematisk statistik som betecknar ett uttryck (ofta en funktion) för hur sannolika olika utfall i ett utfallsrum är.

Sannolikhetfördelningar, ibland kallade bara "fördelning", förekommer i både diskreta och kontinuerliga utfallsrum, och kallas därför ibland diskret fördelning eller kontinuerlig fördelning för att man skall förstå vilket utfallsrum det handlar om.

Exempelvis är en likformig fördelning en fördelning där alla utfall är lika sannolika, vilket är fallet till exempel vid en dragning av ett nummer i en lottorad: där är alla utfall i det diskreta utfallsrummet [1, 2, 3, ... 34, 35] lika sannolika med sannolikheten 1/35.

Innehåll

Matematisk beskrivning

En sannolikhetsfördelning tilldelar varje intervall tillhörande de reella talen en sannolikhet sådan att sannolikhetsaxiomen är uppfyllda. I tekniska termer är en sannolikhetsfördelning en sannolikhetsrymd vars underliggande σ-algebra är Borel-algebran på de reella talen.

Varje slumpvariabel ger upphov till en sannolikhetsfördelning, och denna fördelning innehåller den viktigaste informationen om variabeln. Om X är en slumpvariabel så tilldelar motsvarande sannolikhetsfördelning intervallet [a, b] sannolikheten P(aXb), d.v.s sannolikheten att variabeln X kommer att anta ett värde i intervallet [a, b].

Sannolikhetsfördelningen för variabeln X kan beskrivas unikt genom sin kumulativa fördelningsfunktion F(x), vilken definieras som


F(x) = P \left( X \le x \right)

för varje x i R.

En fördelning kallas diskret om dess kumulativa fördelningsfunktion består av en sekvens av ändliga steg (hopp), vilket innebär att den tillhör en diskret slumpvariabel X: en variabel som endast kan anta värden från en ändlig eller uppräknelig mängd. En fördelning kallas kontinuerlig om dess kumulativa fördelningsfunktion är kontinuerlig, vilket innebär att den tillhör en kontinuerlig slumpvariabel X för vilken det gäller att P( X = x ) = 0 för alla x i R.

De så kallade absolut kontinuerliga sannolikhetsfördelningarna kan beskrivas med en täthetsfunktion (ibland frekvensfunktion): en icke-negativ integrerbar funktion f definierad på de reella talen så att


F(x) = P \left( X \le x \right) = \int_{-\infty}^x f(t) dt

för alla x i R. Diskreta fördelningar tillåter inte en sådan täthetsfunktion, vilket inte är särskilt förvånande, men det finns kontinuerliga fördelningar som djävulens trappa som inte heller tillåter en täthetsfunktion.

Två viktiga karakteristika för en sannolikhetsfördelning är fördelningens väntevärde och dess varians.

Stödet för en fördelning är den minsta slutna mängd vars komplement har sannolikheten noll.

Flera sannolikhetsfördelningar är så viktiga att de har fått särskilda namn. Några av dessa redovisas nedan.

Diskreta fördelningar

  • Med ändligt stöd
    • Den degenererade fördelningenx0, där X antar värdet x0. Detta ser inte slumpmässigt ut, men det uppfyller definitionen för en slumpvariabel. Detta är användbart, eftersom det sätter deterministiska variabler och slumpvariabler i samma formalism.
    • Tvåpunktsfördelningen där det bara finns två utfall.
    • Den diskreta likformiga sannolikhetsfördelningen, där alla utfall i ett ändligt utfallsrum är lika sannolika.
    • Bernoullifördelningen, ett specialfall av tvåpunktsfördelningen, som antar värdet 1 med sannolikheten p och värdet 0 med sannolikheten q=1-p.
    • Binomialfördelningen, vilken beskriver antalet lyckade försök i en serie av oberoende ja/nej-försök.
    • Hypergeometriska fördelningen, som anger sannolikheten för att få k antal träffar när man drar utan återläggning m element ur en population med given andel element med en viss egenskap.
  • Med oändligt stöd
    • Den geometriska fördelningen, anger sannolikheten för att behöva göra k antal försök innan man får träff när man drar element med återläggning ur en population med given andel element med en viss egenskap.
    • Negativa binomialfördelningen, en generalisering av den geometriska fördelningen.
    • Poissonfördelningen, anger antalet sällsynta händelser som inträffar inom ett givet tidsintervall.
    • Maxwell-Boltzmann-fördelningen, som är viktig inom fysiken och som beskriver sannolikheten för olika energinivåer i ett system i jämvikt.
    • zeta-fördelningen används inom tillämpad statistik och kan kanske vara av intresse för talteoretiker.
  • med ? stöd

Kontinuerliga fördelningar

  • Med stöd på ett ändligt intervall
    • Den kontinuerliga likformiga sannolikhetsfördelningen eller rektangulärfördelningen på [a,b], där alla värden i ett ändligt intervall är lika sannolika.
    • Betafördelningen på [0,1], av vilken rektangulärfördelningen är ett specialfall, och som är användbar för att skatta sannolikheten för lyckade försök.
  • Med stöd på semi-oändliga intervall, vanligen [0,∞)
    • Exponentialfördelningen, som beskriver tiden mellan slumpmässiga oberoende händelser.
    • Gammafördelningen, vilken beskriver tiden till dess att n sällsynta slumpmässiga händelser inträffar.
    • Extremvärdesfördelningen, beskriver variabler vilkas sällsynta extremvärden är av intresse; exempel: högsta vattenståndet i Themsenmynningen, hållfastheten hos en kedjas svagaste länk.
    • Lognormalfördelningen, beskriver variabler som kan modelleras som produkten av många små oberoende positiva variabler.
    • Weibullfördelningen, använd bland annat till att modellera livstiden för tekniska anordningar. Har en parameter som kan modellera olika grader av skevhet hos fördelningen: vänster, symmetrisk, höger.
    • Chitvåfördelningen, χ2-fördelning, vilket kvadratsumman av n oberoende normalfördelade slumpvariabler. Det är ett specialfall av gammafördelningen, och används mycket vid statistiska fördelningstest.
  • Med stöd på hela den reella tallinjen
    • Normalfördelningen, också kallad gaussisk fördelning eller klockkurva. Den är allmänt förekommande i naturen och statistiken genom centrala gränsvärdessatsen (CGS): alla variabler som kan modelleras som summan av många små oberoende variabler är approximativt normalfördelade.
    • Students t-fördelning, användbar till att skatta okända medelvärden och konfidenser för små stickprov ur normalfördelningspopulationer. Vid små stickprov är nämligen stickprovets standardavvikelse en dålig skattning av fördelningens standardavvikelse.
    • Cauchyfördelningen, ett exempel på en fördelning som inte har något väntevärde eller varians. Inom fysiken kallas den vanligen Lorentzfördelning och är till exempel fördelningen för ett instabilt tillstånd inom kvantmekaniken.

Se även

Personliga verktyg