Računalniki Windows Internet

Distribucija beta. Približevanje zakona porazdelitve vsote naključnih spremenljivk, porazdeljenih po zakonu beta Generiranje naključnih števil in ocena parametrov

Razmislite o distribuciji beta, izračunajte njena matematična pričakovanja, varianco in način. S funkcijo MS EXCEL BETA.DIST () bomo narisali grafe porazdelitvene funkcije in gostoto verjetnosti. Ustvarimo matriko naključne številke in ocenite parametre distribucije.

Distribucija betaBeta- distribucijo) odvisno od dveh parametrov: α ( alfa)> 0(določa obliko porazdelitve) in b (beta)> 0(določa obseg).

Za razliko od mnogih drugih neprekinjenih porazdelitev ima obseg variacije naključne spremenljivke Distribucija beta, je omejen s segmentom. Zunaj tega segmenta gostota porazdelitve enako 0. Meje tega segmenta določi raziskovalec glede na problem. Če je A = 0 in B = 1, potem je tako Distribucija beta imenovano standard.

Distribucija beta ima oznako Beta(alfa; beta).

Opomba: Če so parametri alfa in beta= 1, potem Distribucija beta se spremeni v t.j. Beta (1; 1; A; B) = U (A; B).

Na splošno distribucijska funkcija ni mogoče izraziti v osnovnih funkcijah, zato se izračuna z numeričnimi metodami, na primer z uporabo funkcije MS EXCEL BETA.DIST ().

Opomba: Za lažje zapisovanje formul v primer datoteko za parametre distribucije alfa in beta ustvaril ustrezno.

Primer datoteke vsebuje tudi grafikone gostota verjetnosti in distribucijske funkcije z označenimi vrednostmi srednji, in.

Generiranje naključnih števil in ocena parametrov

Uporaba inverzna porazdelitvena funkcija(ali količinske vrednosti ( str- kvantil), glej) lahko ustvarite vrednosti naključne spremenljivke z Distribucija beta... Če želite to narediti, morate uporabiti formulo:

BETA.OBR (RAND (); alfa; beta; A; B)

NASVET: Ker naključna števila se ustvarijo s funkcijo RAND (), nato pa pritisnemo tipko F9, je mogoče vsakič dobiti nov vzorec in s tem novo oceno parametrov.

Funkcija RAND () generira od 0 do 1, kar natančno ustreza razponu variacije verjetnosti (glej. primer ustvarjanja lista datotek).

Zdaj imamo niz naključnih števil, ustvarjenih z danimi parametri distribucije alfa in beta(naj bo 200), ocenimo parametre distribucije.

Ocena parametrov alfa in beta je mogoče narediti s metoda trenutkov(predpostavlja se, da sta parametra A in B znana):

Kakšna je ideja verjetnostnega sklepanja?

Prvi, najbolj naraven korak pri verjetnostnem razmišljanju je naslednji: če imate neko spremenljivko, ki vzame vrednosti naključno, potem bi radi vedeli, s kakšnimi verjetnostmi ta spremenljivka prevzame določene vrednosti. Kombinacija teh verjetnosti je ravno tisto, kar določa porazdelitev verjetnosti. Na primer s kocko lahko a priori domnevati, da bo z enakimi verjetnostmi 1/6 padla na kateri koli rob. In to se zgodi pod pogojem, da je kost simetrična. Če je kost asimetrična, je mogoče na podlagi eksperimentalnih podatkov določiti visoko verjetnost za tiste obraze, ki izpadajo pogosteje, in nižjo verjetnost za tiste obraze, ki izpadajo manj pogosto. Če kakšen rob sploh ne izpade, mu lahko dodelimo verjetnost 0. To je najpreprostejši verjetnostni zakon, s katerim lahko opišemo rezultate metanja kocke. Seveda je to izredno preprost primer, vendar se podobne težave pojavljajo na primer pri aktuarskih izračunih, ko se realno tveganje izračuna na podlagi realnih podatkov pri izdaji zavarovalne police.

V tem poglavju bomo pogledali najpogostejše verjetnostne zakone v praksi.

Te distribucije je mogoče zlahka narisati v STATISTICI.

Normalna porazdelitev

Normalna porazdelitev verjetnosti se še posebej pogosto uporablja v statistiki. Normalna porazdelitev daje dober model za pojav v resničnem svetu, v katerem:

1) obstaja močna težnja po zbiranju podatkov okoli središča;

2) pozitivna in negativna odstopanja od središča so enako verjetna;

3) pogostost odstopanj se hitro zmanjša, ko odstopanja od središča postanejo velika.

Mehanizem, na katerem temelji normalna porazdelitev, razložen z uporabo tako imenovanega osrednjega mejnega izreka, lahko figurativno opišemo na naslednji način. Predstavljajte si, da imate delce cvetnega prahu, ki ste jih naključno vrgli v kozarec vode. Če pogledate posamezen delček pod mikroskopom, boste videli neverjeten pojav - delci se premikajo. Seveda se to zgodi, ker se molekule vode premikajo in svoje gibanje prenašajo na delce suspendiranega cvetnega prahu.

Kako pa točno poteka gibanje? Tukaj je bolj zanimivo vprašanje. In to gibanje je zelo bizarno!

Obstaja neskončno število neodvisnih vplivov na posamezen delček cvetnega prahu v obliki udarcev molekul vode, zaradi katerih se delci premikajo po zelo čudni poti. Pod mikroskopom to gibanje spominja na črto, ki je večkrat in kaotično prelomljena. Teh prelomov ni mogoče predvideti, v njih ni pravilnosti, ki natančno ustreza kaotičnim trkom molekul na delcu. Suspendirani delec, ki je v naključnem trenutku doživel vpliv molekule vode, spremeni smer gibanja, nato se nekaj časa premika po vztrajnosti, nato spet pade pod vpliv naslednje molekule itd. V kozarcu vode je biljard!

Ker ima gibanje molekul naključno smer in hitrost, sta tudi velikost in smer zlomov v poti popolnoma naključni in nepredvidljivi. Ta neverjeten pojav, imenovan Brownovo gibanje, odkrit v 19. stoletju, nas sprašuje v razmišljanje o marsičem.

Če uvedemo ustrezen sistem in v določenih trenutkih označimo koordinate delca, bomo dobili normalen zakon. Natančneje, premiki delcev cvetnega prahu, ki nastanejo zaradi udarca molekul, bodo v skladu z običajnim zakonom.

Prvič je zakon gibanja takega delca, imenovan Brownov, na fizični ravni strogosti opisal A. Einstein. Nato je Lenjevan razvil enostavnejši in bolj intuitiven pristop.

Matematiki 20. stoletja, posvečeni tej teoriji najboljše strani, prvi korak pa je bil narejen pred 300 leti, ko je bila odkrita najpreprostejša različica osrednjega mejnega izreka.

V teoriji verjetnosti je osrednji mejni izrek, prvotno znan v formulaciji Moivreja in Laplacea v 17. stoletju kot razvoj slavnega zakona velikih števil J. Bernoullija (1654-1705) (glej J. Bernoulli (1713), Ars Conjectandi), je zdaj izjemno razvit in dosegel svoje višine. v sodobnem načelu invariance, pri nastanku katerega je bistveno vlogo igrala ruska matematična šola. V tem načelu najde gibanje Brownovega delca svojo strogo matematično razlago.

Ideja je, da ko se v določenih razumnih pogojih sešteje veliko število neodvisnih količin (vpliv molekul na delce cvetnega prahu), dobijo ravno normalno porazdeljene količine. In to se zgodi neodvisno, torej invariantno, od porazdelitve začetnih vrednosti. Z drugimi besedami, če na spremenljivko vpliva veliko dejavnikov, so ti vplivi neodvisni, sorazmerno majhni in se seštevajo, potem ima nastala vrednost normalno porazdelitev.

Na primer, skoraj neskončno število dejavnikov določa težo osebe (na tisoče genov, nagnjenost, bolezni itd.). Tako je mogoče pričakovati normalno porazdelitev teže v populaciji vseh ljudi.

Če ste financer in igrate na borzi, se seveda zavedate primerov, ko se cene delnic obnašajo kot Brownovi delci, pri čemer doživljajo kaotične vplive številnih dejavnikov.

Formalno je gostota normalne porazdelitve zapisana na naslednji način:

kjer sta a in x 2 parametra zakona, ki se razlagata kot srednja vrednost in varianca dane naključne spremenljivke (glede na posebno vlogo normalne porazdelitve bomo za označevanje njene funkcije gostote uporabili poseben zapis in distribucijska funkcija). Vizualno je graf normalne gostote znana zvonasta krivulja.

Ustrezna porazdelitvena funkcija normalne naključne spremenljivke (a, x 2) je označena s Ф (x; a, x 2) in je podana z razmerjem:


Normalni zakon s parametri a = 0 in x 2 = 1 se imenuje standard.

Obratna standardna normalna porazdelitvena funkcija, uporabljena za z, 0

Z verjetnostnim kalkulatorjem STATISTICA izračunajte z iz x in obratno.

Osnovne značilnosti običajnega prava:

Povprečje, način, mediana: E = x mod = x med = a;

Disperzija: D = х 2;

Asimetrija:

Presežek:

Iz formul je razvidno, da normalno porazdelitev opisujeta dva parametra:

a - povprečno - povprečje;

õ - odstopanje od stožca - standardni odklon, beri: "sigma".

Včasih s standardni odklon imenujemo standardni odklon, vendar je to že zastarela terminologija.

Tu je nekaj koristnih dejstev o normalni distribuciji.

Povprečna vrednost določa merilo porazdelitve gostote. Normalna porazdelitvena gostota je simetrična glede na srednjo vrednost. Povprečje normalne porazdelitve sovpada z mediano in načinom (glej grafe).

Normalna porazdelitvena gostota z variacijo 1 in povprečjem 1

Normalna porazdelitvena gostota s povprečjem 0 in varianco 0,01

Normalna porazdelitvena gostota s povprečjem 0 in varianco 4

S povečanjem variance se gostota normalne porazdelitve širi ali širi vzdolž osi OX; z zmanjšanjem variance pa se nasprotno krči, koncentrira okoli ene točke - točke največje vrednosti, ki sovpada s povprečjem vrednost. V omejevalnem primeru ničelne variance naključna vrednost degenerira in prevzame eno samo vrednost, ki je enaka srednji vrednosti.

Koristno je poznati pravila 2- in 3-sigma ali 2- in 3 standardna odstopanja, ki so povezana z normalno porazdelitvijo in se uporabljajo v različnih aplikacijah. Pomen teh pravil je zelo preprost.

Če sta dva in tri standardna odstopanja (2- in 3-sigma) nastavljeni desno in levo od točke povprečja ali, kar je enako, od točke največje gostote normalne porazdelitve, potem površina v grafu normalne gostote, izračunana v tem intervalu, bo enaka 95,45% oziroma 99,73% celotne površine pod grafom (preverite na verjetnostnem kalkulatorju STATISTICA!).

Z drugimi besedami, to lahko izrazimo na naslednji način: 95,45% in 99,73% vseh neodvisnih opazovanj normalne populacije, na primer velikost dela ali cena delnice, ležijo v območju 2 in 3 standardnih odstopanj od povprečja.

Enakomerna distribucija

Enotna porazdelitev je uporabna pri opisovanju spremenljivk, pri katerih je vsaka vrednost enako verjetna, z drugimi besedami, vrednosti spremenljivke so na nekem področju enakomerno porazdeljene.

Spodaj so formule za gostoto in funkcijo porazdelitve enotne naključne spremenljivke, ki ima vrednosti na intervalu [a, b].

Iz teh formul je enostavno razumeti, da je verjetnost, da bo enotna naključna spremenljivka vzela vrednosti iz niza [c, d] [a, b] je enako (d - c) / (b - a).

Postavili smo a = 0, b = 1. Spodaj je grafikon enotne gostote verjetnosti s središčem na segmentu.

Numerične značilnosti enotnega zakona:

Eksponentna porazdelitev

Obstajajo dogodki, ki jih v običajnem jeziku lahko imenujemo redki. Če je T čas med začetkom redkih dogodkov, ki se v povprečju pojavijo z intenzivnostjo X, potem vrednost
T ima eksponentno porazdelitev s parametrom (lambda). Za opis intervala med zaporednimi naključnimi dogodki, na primer intervalom med obiski na nepriljubljenem spletnem mestu, se pogosto uporablja eksponentna porazdelitev, saj so ti obiski redki.

Ta porazdelitev ima zelo zanimivo lastnost odsotnosti posledic ali, kot pravijo, lastnine Markov v čast slavnega ruskega matematika A. A. Markova, kar je mogoče razložiti na naslednji način. Če je porazdelitev med trenutki pojava nekaterih dogodkov okvirna, potem se porazdelitev šteje od vsakega trenutka t do naslednjega dogodka ima tudi eksponentno porazdelitev (z istim parametrom).

Z drugimi besedami, za tok redkih dogodkov je čakalna doba za naslednjega obiskovalca vedno eksponentno porazdeljena, ne glede na to, kako dolgo ste ga že čakali.

Eksponentna porazdelitev je povezana s Poissonovo porazdelitvijo: v časovnem intervalu na enoto ima število dogodkov, med katerimi so intervali neodvisni in eksponentno porazdeljeni, Poissonovo porazdelitev. Če imajo intervali med obiski spletnega mesta eksponentno porazdelitev, se število obiskov, na primer v eni uri, porazdeli po Poissonovem zakonu.

Eksponentna porazdelitev je poseben primer Weibullove porazdelitve.

Če čas ni neprekinjen, ampak diskreten, je analog eksponentne porazdelitve geometrijska porazdelitev.

Gostota eksponentne porazdelitve je opisana s formulo:

Ta porazdelitev ima samo en parameter, ki določa njegove značilnosti.

Graf gostote eksponentne porazdelitve izgleda tako:

Glavne numerične značilnosti eksponentne porazdelitve:

Porazdelitev Erlang

Ta neprekinjena porazdelitev je osredotočena na (0,1) in ima gostoto:

Matematična pričakovanja in varianca so enaki

Porazdelitev Erlang je poimenovana po A. Erlangu, ki jo je prvi uporabil pri težavah v teoriji čakalnih vrst in telefonije.

Erlangova porazdelitev s parametri µ in n je porazdelitev vsote n neodvisnih, enako porazdeljenih naključnih spremenljivk, od katerih ima vsaka eksponentno porazdelitev s parametrom nµ

Ob Porazdelitev n = 1 Erlang je enaka eksponentni ali eksponentni porazdelitvi.

Laplaceova porazdelitev

Funkcija gostote Laplaceove porazdelitve ali, kot jo imenujejo tudi, dvojne eksponentne, se na primer uporablja za opis porazdelitve napak v regresijskih modelih. Če pogledate graf te porazdelitve, boste videli, da je sestavljena iz dveh eksponentnih porazdelitev, simetričnih glede na os OY.

Če je parameter položaja 0, potem ima Laplaceova funkcija porazdelitvene gostote obliko:

Glavne numerične značilnosti tega zakona o porazdelitvi, ob predpostavki, da je parameter položaja nič, so naslednje:

V splošnem ima Laplaceova porazdelitvena gostota obliko:

a je sredina porazdelitve; b je parameter lestvice; e je Eulerjeva številka (2,71 ...).

Porazdelitev gama

Gostota eksponentne porazdelitve ima način v točki 0, kar je včasih neprijetno za praktične aplikacije. V mnogih primerih je vnaprej znano, da način obravnavane naključne spremenljivke ni enak 0, na primer imajo intervali med prihodom strank v trgovino za e-trgovino ali obiski spletnega mesta izrazit način. Za simulacijo takšnih dogodkov se uporablja gama porazdelitev.

Gostota porazdelitve gama je naslednja:

kjer je Γ Eulerjeva Γ-funkcija, a> 0 je parameter "oblika" in b> 0 je parameter merila.

V konkretnem primeru imamo porazdelitev Erlang in eksponentno porazdelitev.

Glavne značilnosti porazdelitve gama:

Spodaj sta dve ploskvi gama gostote s parametrom lestvice 1 in parametri oblike 3 in 5.

Koristna lastnost porazdelitve gama: vsota poljubnega števila neodvisnih gama porazdeljenih naključnih spremenljivk (z istim parametrom lestvice b)

(a l, b) + (a 2, b) + --- + (a n, b) prav tako upošteva porazdelitev gama, vendar s parametri a 1 + a 2 + + a n in b.

Lognormalna porazdelitev

Naključna spremenljivka h se imenuje log-normalna ali log-normalna, če njen naravni logaritem (lnh) upošteva zakon normalne porazdelitve.

Lognormalna porazdelitev se uporablja na primer pri modeliranju spremenljivk, kot so dohodek, starost mladoporočencev ali odstopanje od standarda za škodljive snovi v hrani.

Če torej količina x ima normalno porazdelitev, potem je količina y = fx ima Lognormalno porazdelitev.

Če normalno vrednost nadomestite z eksponentno močjo, boste zlahka razumeli, da je lognormalna vrednost pridobljena kot rezultat večkratnega množenja neodvisnih spremenljivk, tako kot je normalna naključna spremenljivka rezultat večkratnega seštevanja.

Gostota lognormalne porazdelitve je:

Glavne značilnosti logno normalne porazdelitve so:


Hi-kvadratna porazdelitev

Vsota kvadratov m neodvisnih normalnih vrednosti s povprečjem 0 in varianco 1 ima hi-kvadrat porazdelitev z m stopnjami svobode. Ta porazdelitev se najpogosteje uporablja pri analizi podatkov.

Formalno ima gostota dobro kvadratne porazdelitve z m stopnjami svobode obliko:

Z negativnim x gostota se spremeni v 0.

Osnovne numerične značilnosti hi-kvadratne porazdelitve:

Graf gostote je prikazan na spodnji sliki:

Binomska porazdelitev

Binomska porazdelitev je najpomembnejša diskretna porazdelitev, ki je skoncentrirana v le nekaj točkah. Binomska porazdelitev tem točkam pripisuje pozitivne verjetnosti. Tako se binomska porazdelitev razlikuje od neprekinjenih porazdelitev (normalnih, hi-kvadratnih itd.), Ki ločeno izbranim točkam pripisujejo nič verjetnosti in se imenujejo neprekinjene.

Binomsko porazdelitev lahko bolje razumete tako, da pogledate naslednjo igro.

Predstavljajte si, da mečete kovanec. Naj bo verjetnost, da boste dobili grb p, verjetnost, da bi dobili rep, pa je q = 1 - p (upoštevamo najbolj splošen primer, ko je kovanec asimetričen in ima na primer premaknjeno težišče - v kovancu je narejena luknja).

Padanje grba velja za uspeh, padanje repa pa za neuspeh. Potem ima število padlih grbov (ali repov) binomsko porazdelitev.

Upoštevajte, da je razmislek o asimetričnih kovancih ali nepravilnih kockah praktičnega pomena. Kot je zapisal J. Neumann v svoji elegantni knjigi Uvodni tečaj teorije verjetnosti in matematične statistike, so ljudje že dolgo ugibali, da je pogostost točk, ki padejo na matrico, odvisna od lastnosti same matrice in jo je mogoče umetno spremeniti. Arheologi so v faraonski grobnici našli dva para kosti: "poštene" - z enako verjetnostjo, da bodo vse strani izpadle, in ponarejene - z namernim premikom težišča, kar je povečalo verjetnost, da bodo šestice izpadle.

Parametri binomske porazdelitve so verjetnost uspeha p (q = 1 - p) in število preskusov n.

Binomska porazdelitev je uporabna za opis porazdelitve binomskih dogodkov, kot je število moških in žensk v naključno izbranih podjetjih. Uporaba binomske porazdelitve pri problemih iger je še posebej pomembna.

Natančna formula za verjetnost t uspeha v n testov je zapisanih na naslednji način:

p-verjetnost uspeha

q je enako 1-p, q> = 0, p + q == 1

n- število preskusov, m = 0,1 ... m

Glavne značilnosti binomske porazdelitve:

Graf te porazdelitve za različno število poskusov n in verjetnosti uspeha p ima obliko:

Binomska porazdelitev je povezana z normalno porazdelitvijo in Poissonovo porazdelitvijo (glej spodaj); pri določenih vrednostih parametrov z velikim številom preskusov se spremeni v te porazdelitve. To je enostavno dokazati s STATISTICO.

Na primer ob upoštevanju grafa binomske porazdelitve s parametri p = 0,7, n = 100 (glej sliko), uporabili smo STATISTICA BASIC - vidite, da je graf zelo podoben gostoti normalne porazdelitve (res je!).

Binomska porazdelitvena ploskev s parametri p = 0,05, n = 100 je zelo podoben grafu Poissonove porazdelitve.

Kot smo že omenili, je binomska porazdelitev nastala zaradi opazovanj najpreprostejše igre na srečo - metanja pravilnega kovanca. V mnogih situacijah je ta model dober prvi približek za bolj zapletene igre in naključne procese, ki nastanejo pri igranju na borzi. Izjemno je, da je bistvene značilnosti številnih kompleksnih procesov mogoče razumeti iz preprostega binomskega modela.

Na primer, razmislite o naslednji situaciji.

Označimo padec grba kot 1 in padec repa - minus 1 in povzeli bomo dobičke in izgube v zaporednih trenutkih. Grafi prikazujejo značilne poti takšne igre z 1000 meti, 5000 meti in 10 000 metov. Bodite pozorni na to, kako dolgo je pot nad ali pod ničlo, z drugimi besedami, čas, v katerem eden od igralcev zmaga v popolnoma pošteni igri, je zelo dolg, prehodi iz zmage v poraz pa so razmeroma redki, kar je težko prilegajoč se v nepripravljen um, za katerega izraz "popolnoma poštena igra" zveni kot čarobni urok. Torej, čeprav je igra v danih pogojih poštena, vedenje tipične poti sploh ni pošteno in ne kaže ravnovesja!

Seveda je empirično to dejstvo znano vsem igralcem, z njim je povezana strategija, ko igralec ne sme oditi z zmago, ampak je prisiljen igrati naprej.


Upoštevajte število metov, med katerimi en igralec zmaga (pot nad 0), drugi pa izgubi (pot pod 0). Na prvi pogled se zdi, da je število takšnih metov približno enako. Vendar (glej vznemirljivo knjigo: Feller V. "Uvod v teorijo verjetnosti in njene uporabe." Moskva: Mir, 1984, str. 106) z 10.000 meti idealnega kovanca p = q = 0,5, n = 10.000) verjetnost, da bo ena od strank vodila več kot 9.930 sojenj, druga - manj kot 70, pa presega 0,1.

Presenetljivo je, da je v igri z 10.000 meti pravilnega kovanca verjetnost, da se vodstvo ne spremeni več kot 8 -krat, večja od 0,14, verjetnost več kot 78 sprememb vodstva pa je približno 0,12.

Tako imamo paradoksalno situacijo: pri Bernoullijevem simetričnem sprehodu so lahko "valovi" na grafikonu med zaporednimi ničelnimi donosi (glej grafikone) presenetljivo dolgi. To je povezano z drugo okoliščino, in sicer da je za T n / n (del časa, ko je graf nad osjo abscise) so najmanj verjetne vrednosti blizu 1/2.

Matematiki so odkrili tako imenovani zakon arksinusa, po katerem za vsako 0< а <1 вероятность неравенства , где Т n - число шагов, в течение которых первый игрок находится в выигрыше, стремится к

Arcsin porazdelitev

Ta neprekinjena porazdelitev je koncentrirana na intervalu (0, 1) in ima gostoto:

Inverzna porazdelitev sinusov je povezana z naključnim sprehodom. To je porazdelitev deleža časa, v katerem prvi igralec zmaga pri metanju simetričnega kovanca, to je kovanca z enako verjetnostjo S pade na grb in rep. Na drug način je takšno igro mogoče obravnavati kot naključni sprehod delca, ki od nič naprej naredi enotne skoke v desno ali levo z enakimi verjetnostmi. Ker so skoki delca - izpadanje iz grba ali repa - enako verjetni, se takšen sprehod pogosto imenuje simetričen. Če bi bile verjetnosti drugačne, bi imeli asimetrično hojo.

Graf porazdelitvene gostote arksinusa je prikazan na naslednji sliki:

Najbolj zanimiva stvar je kakovostna interpretacija grafikona, iz katere lahko izvedete neverjetne zaključke o nizu zmag in nizu porazov v pošteni igri. Če pogledate graf, lahko vidite, da je minimalna gostota na točki 1/2. "Pa kaj?!" - vprašate. Če pa pomislite na to opazovanje, potem vaše presenečenje ne bo imelo meja! Izkazalo se je, da igra, ko je opredeljena kot poštena, pravzaprav ni tako poštena, kot se morda zdi na prvi pogled.

Trajektorji simetričnega naključja, v katerem delec porabi enak čas na pozitivnem in negativnem polosu, torej na desni ali levi strani ničle, so le najmanj verjetni. Če preidemo na jezik igralcev, lahko rečemo, da so pri metanju simetričnega kovanca igre, v katerih imajo igralci enak čas zmage in poraza, najmanj verjetne.

Nasprotno, igre, pri katerih je en igralec veliko bolj verjetno zmagal, drugi pa izgubil, so najverjetnejše. Neverjeten paradoks!

Za izračun verjetnosti, da je del časa t, v katerem zmaga prvi igralec, v razponu od t1 do t2, je potrebno iz vrednosti porazdelitvene funkcije F (t2) odštejemo vrednost porazdelitvene funkcije F (t1).

Formalno dobimo:

P (t1

Na podlagi tega dejstva je mogoče z uporabo statistike STATISTICA izračunati, da delci pri 10.000 korakih ostanejo na pozitivni strani več kot 9930 časovnih trenutkov z verjetnostjo 0,1, to pomeni, da bo takšno stanje vsaj približno opaziti pri en primer od desetih. (čeprav se na prvi pogled zdi absurdno; glej izredno jasno opombo Yu. V. Prokhorova "Bernoullijeva pot" v enciklopediji "Verjetnost in matematična statistika", str. 42-43, Moskva: Velika ruska enciklopedija, 1999) ...

Negativna binomska porazdelitev

To je diskretna porazdelitev, ki pripisuje celotnim točkam k = 0,1,2, ... verjetnosti:

p k = P (X = k) = C k r + k-1 p r (l-p) k ", kjer je 0<р<1,r>0.

Negativno binomsko porazdelitev najdemo v številnih aplikacijah.

Na splošno r> 0 negativna binomska porazdelitev se razlaga kot porazdelitev čakalne dobe za r -ti "uspeh" v Bernoullijevi testni shemi z verjetnostjo "uspeha" p, na primer število zvitkov, ki jih je treba narediti pred valjanjem drugega grba, v tem primeru se včasih imenuje tudi porazdelitev Pascal in je diskreten analog porazdelitve gama.

Ob r = 1 negativna binomska porazdelitev sovpada z geometrijsko porazdelitvijo.

Če je Y naključna spremenljivka s Poissonovo porazdelitvijo z naključnim parametrom, ki ima nato porazdelitev gama z gostoto

Potem bo imel Ub negativno binomsko porazdelitev s parametri;

Poissonova porazdelitev

Poissonova porazdelitev se včasih imenuje distribucija redkih dogodkov. Primeri spremenljivk, porazdeljenih po Poissonovem zakonu, so: število nesreč, število napak v proizvodnem procesu itd. Poissonova porazdelitev je določena s formulo:

Glavne značilnosti Poissonove naključne spremenljivke:

Poissonova porazdelitev je povezana z eksponentno porazdelitvijo in Bernoullijevo porazdelitvijo.

Če ima število dogodkov Poissonovo porazdelitev, imajo intervali med dogodki eksponentno ali eksponentno porazdelitev.

Poissonova distribucijska ploskev:

Primerjajte grafikon Poissonove porazdelitve s parametrom 5 s ploskvijo Bernoullijeve porazdelitve pri p = q = 0,5, n = 100.

Videli boste, da so grafi zelo podobni. V splošnem primeru obstaja naslednji vzorec (glej na primer odlično knjigo: Shiryaev AN "Verjetnost." Moskva: Nauka, str. 76): če v Bernoullijevih testih n vzame velike vrednosti in verjetnost uspeha / ? je relativno majhen, tako da povprečno število uspehov (produkt in bp) ni majhno niti veliko, potem lahko Bernoullijevo porazdelitev s parametri n, p nadomestimo s Poissonovo porazdelitvijo s parametrom = np.

Poissonova distribucija se v praksi pogosto uporablja, na primer v tabelah za nadzor kakovosti kot distribucija redkih dogodkov.

Kot drug primer razmislite o naslednjem problemu, povezanem s telefonskimi linijami in iz prakse (glej: Feller V. Uvod v teorijo verjetnosti in njene uporabe. Moskva: Mir, 1984, str. 205 in tudi Molina E. S. (1935) Verjetnost inženiring, elektrotehnika, 54, str. 423-427; Bell Telephone System Technical Publications Monograph B-854). To nalogo je enostavno prevesti v sodoben jezik, na primer v jezik mobilnih komunikacij, kar vabijo zainteresirani bralci.

Problem je formuliran na naslednji način. Naj bosta dve telefonski centrali - A in B.

Telefonska postaja A mora zagotavljati komunikacijo za 2000 naročnikov s postajo B. Kakovost komunikacije mora biti takšna, da le 1 klic od 100 čaka, da linija postane brezplačna.

Vprašanje je: koliko telefonskih linij morate vzpostaviti, da zagotovite dano kakovost komunikacije? Očitno je nespametno ustvariti 2000 vrstic, saj bodo mnoge med njimi dolgo časa brezplačne. Iz intuitivnih premislekov je jasno, da očitno obstaja nekaj optimalnega števila vrstic N. Kako izračunati to število?

Začnimo z realnim modelom, ki opisuje intenzivnost naročnikovega dostopa do omrežja, medtem ko je treba natančnost modela seveda preveriti s standardnimi statističnimi merili.

Predpostavimo torej, da vsak naročnik uporablja linijo v povprečju 2 minuti na uro in da so naročniške povezave neodvisne (vendar, kot upravičeno ugotavlja Feller, slednje poteka, če ni dogodkov, ki bi vplivali na vse naročnike, na primer vojna ali orkan).

Nato imamo 2000 Bernoullijevih poskusov (metanje kovancev) ali omrežnih povezav z uspešnostjo p = 2/60 = 1/30.

Takšno N je treba najti, če verjetnost, da je na omrežje hkrati povezanih več kot N uporabnikov, ne presega 0,01. Te izračune je mogoče enostavno rešiti v sistemu STATISTICA.

Reševanje problema na STATISTICI.

Korak 1. Odprite modul Osnovna statistika... Ustvarite datoteko binoml.sta, ki vsebuje 110 opazovanj. Poimenujte prvo spremenljivko BINOMIALNO, druga spremenljivka je OTROV.

2. korak. BINOMIALNO, Odprite okno Spremenljivka 1(glej sliko). Vnesite formulo v okno, kot je prikazano na sliki. Kliknite gumb v redu.


3. korak. Z dvojnim klikom na naslov OTROV, Odprite okno Spremenljivka 2(glej sliko)

V okno vnesite formulo, kot je prikazano na sliki. Upoštevajte, da izračunamo parameter Poissonove porazdelitve po formuli = n × p. Zato = 2000 × 1/30. Kliknite gumb v redu.


STATISTICA bo izračunala verjetnosti in jih zapisala v ustvarjeno datoteko.

4. korak. Pomaknite se po izdelani tabeli do primerov, oštevilčenih 86. Videli boste, da je verjetnost, da 86 ali več od 2000 uporabnikov omrežja dela eno uro hkrati 0,01347, če se uporablja binomska porazdelitev.

Verjetnost, da 86 ali več ljudi od 2.000 uporabnikov omrežja hkrati dela na uro, je 0,01293, če za binomsko porazdelitev uporabimo Poissonov približek.

Ker potrebujemo verjetnost največ 0,01, bo 87 linij dovolj za zagotovitev zahtevane kakovosti komunikacije.

Podobne rezultate je mogoče dobiti z normalnim približkom za binomsko porazdelitev (preverite!).

Upoštevajte, da V. Feller ni imel na voljo sistema STATISTICA in je uporabljal tabele za binomsko in normalno porazdelitev.

Z istim sklepanjem lahko rešimo naslednji problem, o katerem je razpravljal W. Feller. Preveriti je treba, ali bo za zanesljivo storitev uporabnikov potrebnih več ali manj linij, če jih razdelimo v 2 skupini po 1000 ljudi.

Izkazalo se je, da bi za razdelitev uporabnikov v skupine potrebovali dodatnih 10 vrstic, da bi dosegli enako raven kakovosti.

Upoštevate lahko tudi spremembo intenzivnosti omrežne povezave čez dan.

Geometrijska porazdelitev

Če se izvedejo neodvisni Bernoullijevi testi in se šteje število preskusov do naslednjega "uspeha", potem ima to število geometrijsko porazdelitev. Če torej vržete kovanec, potem število metov, ki jih morate narediti, preden naslednji grb izpade, sledi geometrijskemu zakonu.

Geometrijska porazdelitev je določena s formulo:

F (x) = p (1-p) x-1

p je verjetnost uspeha, x = 1, 2,3 ...

Ime distribucije je povezano z geometrijsko progresijo.

Geometrijska porazdelitev torej določa verjetnost, da je uspeh prišel na določenem koraku.

Geometrijska porazdelitev je diskreten analog eksponentne porazdelitve. Če se čas spreminja v kvantah, potem je verjetnost uspeha v vsakem trenutku časa opisana z geometrijskim zakonom. Če je čas neprekinjen, je verjetnost opisana z eksponentnim ali eksponentnim zakonom.

Hipergeometrična porazdelitev

To je diskretna verjetnostna porazdelitev naključne spremenljivke X, ki ima celoštevilske vrednosti m = 0, 1,2, ..., n z verjetnostmi:

kjer so N, M in n ne-negativna cela števila in M< N, n < N.

Hipergeometrična porazdelitev je običajno povezana z izbiro brez ponovitve in na primer določa verjetnost, da se v naključnem vzorcu velikosti n iz splošne populacije, ki vsebuje N kroglic, vključno z M črno in N - M belo, najde natančno m črnih kroglic (glej , na primer enciklopedija "Verjetnost in matematična statistika", Moskva: Velika ruska enciklopedija, str. 144).

Matematično pričakovanje hipergeometrične porazdelitve ni odvisno od N in sovpada z matematičnim pričakovanjem µ = np ustrezne binomske porazdelitve.

Disperzija hipergeometrične porazdelitve ne presega variance binomske porazdelitve npq. Za trenutke katerega koli reda hipergeometrična porazdelitev stremi k ustreznim vrednostim trenutkov binomske porazdelitve.

Ta porazdelitev je izjemno pogosta pri nalogah nadzora kakovosti.

Polinomska porazdelitev

Polinomska ali multinomska porazdelitev seveda posplošuje distribucijo. Če se binomska porazdelitev pojavi, ko se kovanec vrže z dvema rezultatoma (rešetka ali grb), potem pride do polinomske porazdelitve, ko se zavrtlja matrica in sta možna več kot dva rezultata. Formalno je to skupna verjetnostna porazdelitev naključnih spremenljivk X 1, ..., X k, ki sprejme celoštevilčne negativne vrednosti n 1, ..., nk, ki izpolnjuje pogoj n 1 + ... + nk = n, z verjetnostmi:

Ime "polinomska porazdelitev" je razloženo z dejstvom, da se pri širjenju polinoma (р 1 + ... + p k) n pojavijo multinomske verjetnosti

Distribucija beta

Porazdelitev beta ima gostoto oblike:


Standardna porazdelitev beta je koncentrirana v območju od 0 do 1. Z linearnimi transformacijami je mogoče vrednost beta spremeniti tako, da bo sprejela vrednosti v poljubnem območju.

Glavne numerične značilnosti količine z beta porazdelitvijo:


Porazdelitev ekstremnih vrednosti

Porazdelitev ekstremnih vrednosti (tip I) ima gostoto oblike:

Ta porazdelitev se včasih imenuje tudi porazdelitev skrajne vrednosti.

Porazdelitev skrajne vrednosti se uporablja za simulacijo ekstremnih dogodkov, kot so ravni poplav, vrtinčne hitrosti, največji indeksi borz za določeno leto itd.

Ta porazdelitev se uporablja na primer v teoriji zanesljivosti za opis časa okvare električnih vezij, pa tudi pri aktuarskih izračunih.

Rayleighova distribucija

Rayleighova porazdelitev ima gostoto oblike:

kjer je b parameter merila.

Rayleighova porazdelitev je koncentrirana v območju od 0 do neskončnosti. Namesto 0 vam STATISTICA omogoča, da vnesete drugo vrednost parametra praga, ki bo odšteta od prvotnih podatkov, preden prilagodite Rayleighovo distribucijo. Zato mora biti vrednost parametra praga manjša od vseh opazovanih vrednosti.

Če sta dve spremenljivki y 1 in y 2 neodvisni drug od drugega in sta običajno porazdeljeni z isto varianco, potem spremenljivka bo imel Rayleighovo distribucijo.

Rayleighova porazdelitev se uporablja na primer v teoriji streljanja.


Weibull distribucija

Porazdelitev Weibull je poimenovana po švedskem raziskovalcu Waloddiju Weibullu, ki je s to porazdelitvijo opisal različne vrste časov odpovedi v teoriji zanesljivosti.

Formalno je Weibullova porazdelitvena gostota zapisana v obliki:

Včasih je Weibullova porazdelitvena gostota zapisana tudi v obliki:

B je parameter lestvice;

С - parameter oblike;

E je Eulerjeva konstanta (2,718 ...).

Parameter položaja. Značilno je, da je Weibullova porazdelitev osredotočena na polos od 0 do neskončnosti. Če namesto meje 0 vnesemo parameter a, ki je v praksi pogosto potreben, potem nastane tako imenovana triparametrska Weibullova porazdelitev.

Weibullova distribucija se široko uporablja v teoriji zanesljivosti in zavarovanja.

Kot je opisano zgoraj, se eksponentna porazdelitev pogosto uporablja kot model za ocenjevanje MTBF pod predpostavko, da je verjetnost okvare objekta konstantna. Če se verjetnost okvare sčasoma spremeni, se uporabi Weibull -ova porazdelitev.

Ob c = 1 ali, pri drugi parametrizaciji, pri, Weibullova porazdelitev, kot je enostavno razbrati iz formul, se spremeni v eksponentno porazdelitev in pri, v Rayleighovo porazdelitev.

Za ocenjevanje parametrov Weibullove porazdelitve so bile razvite posebne metode (glej na primer knjigo: Lawless (1982) Statistični modeli in metode za podatke za celo življenje, Belmont, Kalifornija: Življenjsko učenje, ki opisuje metode ocenjevanja, pa tudi težave, ki nastanejo pri ocenjevanju parametra položaja za triparametrično porazdelitev Weibull).

Pri analizi zanesljivosti je pogosto treba upoštevati verjetnost okvare v kratkem časovnem intervalu po določenem času. t pod pogojem, da do trenutka t ni prišlo do napake.

Taka funkcija se imenuje funkcija tveganja ali funkcija stopnje okvare in je formalno opredeljena na naslednji način:

H (t) - funkcija stopnje okvare ali funkcija tveganja v času t;

f (t) - porazdelitvena gostota časov okvare;

F (t) je porazdelitvena funkcija napak (integral gostote v intervalu).

Na splošno je funkcija stopnje napak zapisana na naslednji način:

Kadar je funkcija tveganja enaka konstanti, ki ustreza normalnemu delovanju naprave (glej formule).

Pri se zmanjša funkcija tveganja, kar ustreza utekanju naprave.

Pri se zmanjša funkcija tveganja, kar ustreza staranju naprave. Tipične funkcije tveganja so prikazane na grafu.


Spodaj so prikazane ploskve gostote Weibull z različnimi parametri. Treba je biti pozoren na tri obsege vrednosti parametra a:

Na prvem področju se funkcija tveganja zmanjša (obdobje uravnavanja), na drugem je funkcija tveganja enaka konstanti, na tretjem področju se funkcija tveganja poveča.

Z lahkoto lahko razumete, kar je bilo rečeno za primer nakupa novega avtomobila: najprej sledi obdobje prilagajanja avtomobila, nato dolgo obdobje normalnega delovanja, nato se avtomobilski deli obrabijo in nevarnost njegove okvare se močno poveča .

Pomembno je, da lahko vsa obdobja delovanja opiše ista distribucijska družina. To je ideja distribucije Weibull.


Tu so glavne numerične značilnosti Weibulove porazdelitve.


Paretova distribucija

Pri različnih težavah uporabne statistike se pogosto pojavljajo tako imenovane okrnjene distribucije.

Ta porazdelitev se na primer uporablja v zavarovalništvu ali obdavčitvi, kadar so dohodki v interesu, ki presegajo določeno vrednost c 0

Glavne numerične značilnosti distribucije Pareto:


Logistična distribucija

Logistična distribucija ima funkcijo gostote:

A - parameter položaja;

B je parameter lestvice;

E je Eulerjeva številka (2,71 ...).


Hotelling T 2 -razdelitev

Ta neprekinjena porazdelitev, koncentrirana na intervalu (0, T), ima gostoto:

kje parametri n in k, n> _k> _1, imenujemo stopnje svobode.

Ob Hotelling je k = 1, P-porazdelitev se zmanjša na študentovo distribucijo in za katero koli k> 1 lahko obravnavamo kot posplošitev Studentove distribucije na večdimenzionalni primer.

Distribucija Hotellinga temelji na normalni distribuciji.

Naj ima k-dimenzionalni naključni vektor Y normalno porazdelitev z ničelnim srednjim vektorjem in kovariančno matrico.

Upoštevajte količino

kjer so naključni vektorji Z i neodvisni drug od drugega in Y in so porazdeljeni na enak način kot Y.

Potem ima naključna spremenljivka T 2 = Y T S -1 Y razporeditev T 2 -Hotelling z n stopnjami svobode (Y je vektor stolpca, T je operator prenosa).

kjer je naključna spremenljivka t n ima študentsko distribucijo z n stopnjami svobode (glej "Verjetnost in matematična statistika", Enciklopedija, str. 792).

Če ima Y normalno porazdelitev z ničelno sredino, se pokliče ustrezna porazdelitev izven centra Hotelling T 2 -razdelitev z n stopnjami svobode in parametrom necentralnosti v.

Hotellingova T2 -porazdelitev se uporablja v matematični statistiki v enaki situaciji kot Studentova t -porazdelitev, vendar le v večdimenzionalnem primeru. Če so rezultati opazovanj X 1, ..., X n neodvisni, običajno porazdeljeni naključni vektorji s srednjim vektorjem µ in nedegenerirano matriko kovariance, potem statistika


ima Hotelling T 2 -razdelitev z n - 1 stopnja svobode. To dejstvo je osnova merila Hotelling.

V STATISTICI je merilo Hotelling na primer na voljo v modulu Osnovne statistike in tabele (glejte spodnje pogovorno okno).


Maxwellova porazdelitev

Maxwellova porazdelitev je nastala v fiziki pri opisu porazdelitve hitrosti molekul idealnega plina.

Ta neprekinjena porazdelitev je osredotočena na (0,) in ima gostoto:

Distribucijska funkcija ima obliko:

kjer je F (x) standardna normalna distribucijska funkcija. Maxwellova porazdelitev ima pozitiven koeficient poševnosti in eno točko v točki (to pomeni, da je porazdelitev unimodalna).

Maxwellova distribucija ima končne trenutke katerega koli reda; matematična pričakovanja in varianca so enaki, in

Maxwellova porazdelitev je seveda povezana z normalno porazdelitvijo.

Če so X 1, X 2, X 3 neodvisne naključne spremenljivke z normalno porazdelitvijo s parametri 0 in х 2, potem je naključna spremenljivka ima Maxwellovo porazdelitev. Tako lahko Maxwellovo porazdelitev obravnavamo kot porazdelitev dolžine naključnega vektorja, katerega koordinate v kartezijanskem koordinatnem sistemu v tridimenzionalnem prostoru so neodvisne in običajno porazdeljene s povprečjem 0 in varianco x 2.

Cauchyjeva porazdelitev

Ta neverjetna porazdelitev včasih nima povprečne vrednosti, saj se njena gostota zelo počasi nagiba k ničli s povečanjem x v absolutni vrednosti. Takšne distribucije se imenujejo distribucije s težkimi repi. Če morate najti distribucijo, ki nima smisla, takoj pokličite distribucijo Cauchy.

Cauchyjeva porazdelitev je unimodalna in simetrična glede na način, ki je hkrati mediana in ima funkcijo gostote oblike:

kje c> 0 je parameter merila in a je osrednji parameter, ki hkrati določa vrednosti načina in mediane.

Integral gostote, to je porazdelitvena funkcija, je določen z razmerjem:

Študentska porazdelitev

Angleški statistik W. Gosset, znan pod psevdonimom "študent" in je svojo kariero začel s statistično študijo kakovosti angleškega piva, je leta 1908 prejel naslednji rezultat. Naj bo x 0, x 1, .., x m - neodvisne, (0, s 2) - normalno porazdeljene naključne spremenljivke:


Ta porazdelitev, zdaj znana kot študentova t distribucija (skrajšano kot t (m) -razdelitev, kjer je m število stopenj svobode), temelji na znamenitem t -testu, namenjenem primerjanju sredstev dveh populacij.

Funkcija gostote f t (x) ni odvisna od variance x 2 naključnih spremenljivk, poleg tega pa je unimodalna in simetrična glede na točko х = 0.

Osnovne numerične značilnosti študentske distribucije:

Porazdelitev t je pomembna, če upoštevamo ocene povprečja in varianca vzorca ni znana. V tem primeru se uporablja varianca vzorca in t-porazdelitev.

Pri velikih stopnjah svobode (več kot 30) t-porazdelitev praktično sovpada s standardno normalno porazdelitvijo.

Graf funkcije gostote t-porazdelitve se z naraščajočim številom stopenj svobode deformira na naslednji način: vrh se poveča, repi gredo bolj strmo na 0 in zdi se, kot da grafi funkcije gostote t-porazdelitve bočno stisnjeni.


F-porazdelitev

Razmislite m 1 + m 2 neodvisne in (0, s 2) normalno porazdeljene količine

in dal

Očitno lahko isto naključno spremenljivko definiramo kot razmerje med dvema neodvisnima in ustrezno normaliziranima hi-kvadrat porazdeljenima količinama in to je

Znani angleški statistik R. Fisher je leta 1924 pokazal, da je gostota verjetnosti naključne spremenljivke F (m 1, m 2) podana s funkcijo:


kjer je Γ (y) vrednost Eulerjeve gama funkcije v. točka y, sam zakon pa se imenuje F-porazdelitev s številom stopenj svobode števca in imenovalca, ki sta enaka m, 1 oziroma m7.

Osnovne numerične značilnosti F-porazdelitve:


F-porazdelitev se pojavi pri diskriminatorni, regresijski analizi, analizi variance in drugih vrstah analize več variabilnih podatkov.

Samostalnik, število sopomenk: 1 porazdelitev (62) Slovar sinonimov ASIS. V.N. Trishin. 2013 ... Slovar sinonima

beta distribucija- 1,45. beta porazdelitev Porazdelitev verjetnosti neprekinjene naključne spremenljivke X, ki lahko sprejme vse vrednosti od 0 do 1, vključno z mejami, in katere gostota porazdelitve pri 0 £ x £ 1 in parametri m1> 0, m2> 0, kjer je G .. ... ... Slovar-referenčna knjiga pogojev normativne in tehnične dokumentacije

beta distribucija- Porazdelitev verjetnosti neprekinjene naključne spremenljivke, ki ima vrednosti na intervalu, katerega gostota je podana s formulo, kjer je a, b> 0 in je funkcija gama. Opomba. Njeni posebni primeri se pogosto uporabljajo ....... Slovar sociološke statistike

Glej načrt ... Slovar sinonima

V teoriji verjetnosti in matematični statistiki je Dirichletova porazdelitev (po imenu Johann Peter Gustave Lejeune Dirichlet), ki je pogosto označena z Dir (α), družina neprekinjenih več variabilnih porazdelitev verjetnosti, ki jih parametrizira vektor α ... ... Wikipedia

Beta: Wikislovar ima vnos "beta" Beta (črka) (β) je druga črka grške abecede. Testiranje beta Koeficient beta Funkcija beta (matematika) Porazdelitev beta (teorija verjetnosti ... Wikipedia

Gostota verjetnosti ... Wikipedia

Porazdelitev verjetnosti je zakon, ki opisuje obseg vrednosti naključne spremenljivke in verjetnost, da jih sprejmejo. Vsebina 1 Opredelitev 2 Načini opredelitve distribucij ... Wikipedia

Distribucija. Pearsonova porazdelitev Gostota verjetnosti ... Wikipedia

Knjige

  • Primerjava vpisa v izobraževalne programe na univerzi na podlagi rezultatov olimpijad in rezultatov USE, O. V. Poldin. V članku se za primerjavo kakovosti sprejema na univerze za različne izobraževalne programe predlaga uporaba prilagojenih krivulj povpraševanja, pridobljenih iz rezultatov enotnega državnega izpita tistih, ki so vpisani na ...
Pravilna povezava do tega članka:

Oleinikova S.A. - Približevanje zakona porazdelitve vsote naključnih spremenljivk, porazdeljenih po zakonu beta // Kibernetika in programiranje. - 2015. - št. 6. - str. 35 - 54. DOI: 10.7256/2306-4196.2015.6.17225 URL: https://nbpublish.com/library_read_article.php?id=17225

Približevanje zakona porazdelitve vsote naključnih spremenljivk, porazdeljenih po zakonu beta

Oleinikova Svetlana Alexandrovna

Doktor tehničnih znanosti

Izredni profesor, Voronežska državna tehnična univerza

394026, Rusija, Voronež, Moskovski prospekt, 14

Oleinikova Svetlana Aleksandrovna

Doktor tehničnih znanosti

Izredni profesor, Oddelek za avtomatizirane in računalniške sisteme, Voronežska državna tehnična univerza

394026, Rusija, g. Voronež, Moskovski prospekt, 14

Datum pošiljanja članka uredniku:

14-12-2015

Datum pregleda članka:

15-12-2015

Pripis.

Predmet raziskovanja v tem delu je porazdelitvena gostota naključne spremenljivke, ki je vsota končnega števila beta vrednosti, od katerih je vsaka razporejena v svojem intervalu s svojimi parametri. Ta zakon je razširjen v teoriji verjetnosti in matematični statistiki, saj se z njim lahko opiše dovolj veliko število naključnih pojavov, če so vrednosti ustrezne neprekinjene naključne spremenljivke skoncentrirane v določenem intervalu. Ker iskane vsote beta vrednosti ni mogoče izraziti z nobenim od znanih zakonov, nastane problem ocene njene gostote porazdelitve. Cilj tega dela je najti takšen približek gostote porazdelitve vsote beta vrednosti, ki bi se razlikoval po najmanjši napaki. Za dosego tega cilja je bil izveden računalniški eksperiment, zaradi česar smo pri danem številu beta vrednosti numerično vrednost porazdelitvene gostote primerjali s približkom želene gostote. Normalne in beta porazdelitve so bile uporabljene kot približki. Kot rezultat eksperimentalne analize so bili pridobljeni rezultati, ki kažejo na primernost približevanja iskanega zakona porazdelitve z zakonom beta. Kot eno od področij uporabe pridobljenih rezultatov se obravnava problem upravljanja projektov z naključnim trajanjem, pri čemer ima ključno vlogo ocena časa izvedbe projekta, ki zaradi posebnosti predmetnega področja, lahko opišemo z vsoto vrednosti beta.


Ključne besede: naključna spremenljivka, porazdelitev beta, gostota porazdelitve, zakon normalne porazdelitve, vsota naključnih spremenljivk, računalniški eksperiment, rekurzivni algoritem, približek, napaka, PERT

10.7256/2306-4196.2015.6.17225


Datum objave:

19-01-2016

Povzetek.

Predmet raziskave v tem prispevku je funkcija gostote verjetnosti (PDF) naključne spremenljivke, ki je vsota končnega števila beta vrednosti. Ta zakon je razširjen v teoriji verjetnosti in matematični statistiki, saj ga je mogoče opisati z dovolj velikim številom naključnih dogodkov, če je vrednost ustrezne neprekinjene naključne spremenljivke koncentrirana v določenem območju. Ker zahtevane vsote beta vrednosti ni mogoče izraziti z nobenim od znanih zakonov, obstaja problem ocene njene porazdelitve gostote. Cilj je najti takšen približek vsote beta-vrednosti, ki bi imel najmanj napak. Za dosego tega cilja je bil izveden računalniški eksperiment, v katerem so za dano število beta vrednosti primerjali numerično vrednost PDF s približkom želene gostote. Kot približki sta bili uporabljeni normalna in beta porazdelitev. Kot zaključek eksperimentalne analize so bili pridobljeni rezultati, ki kažejo na ustreznost približevanja želenega zakona s pomočjo porazdelitve beta. Kot eno od področij uporabe rezultatov se obravnava problem vodenja projekta z naključnim trajanjem del. Tu je ključno vprašanje vrednotenje časa izvajanja projekta, ki ga je zaradi posebnega področja mogoče opisati z vsoto beta vrednosti.

Ključne besede:

Naključna vrednost, porazdelitev beta, funkcija gostote, normalna porazdelitev, vsota naključnih spremenljivk, računalniški eksperiment, rekurzivni algoritem, približek, napaka, PERT

Uvod

Obravnava se problem ocenjevanja zakona porazdelitve vsote beta vrednosti. To je univerzalni zakon, ki ga je mogoče uporabiti za opis večine naključnih pojavov z neprekinjenim zakonom porazdelitve. Zlasti v veliki večini primerov preučevanja naključnih pojavov, ki jih je mogoče opisati z enosmernimi neprekinjenimi naključnimi spremenljivkami, ki ležijo v določenem razponu vrednosti, je mogoče takšno vrednost približati z zakonom beta. V zvezi s tem problem iskanja zakona porazdelitve za vsoto beta vrednosti ni le znanstvene narave, ampak ima tudi določen praktični interes. Poleg tega za razliko od večine zakonov o distribuciji zakon beta nima edinstvenih lastnosti, ki omogočajo analitični opis želenega zneska. Poleg tega je posebnost tega zakona takšna, da je izredno težko izvleči večkratni določen integral, potreben za določitev gostote vsote naključnih spremenljivk, rezultat pa je precej okoren izraz tudi za n = 2 in s povečanjem v številu izrazov se kompleksnost končnega izraza večkrat poveča. V zvezi s tem nastane problem približevanja porazdelitvene gostote vsote beta vrednosti z najmanjšo napako.

Ta članek predstavlja pristop k iskanju aproksimacije za želeni zakon s pomočjo računalniškega eksperimenta, ki za vsak poseben primer omogoča primerjavo napake, dobljene z oceno gostote zanimanja z uporabo najprimernejših zakonov: normalne in beta. Posledično je bilo sklenjeno, da je priporočljivo oceniti vsoto vrednosti beta z uporabo porazdelitve beta.

1. Izjava o problemu in njegovih značilnostih

Na splošno zakon beta določa gostota, določena v intervalu, kot sledi:

`f_ (xi_ (i)) (x) = ((0 ,; t<0), ((t^(p_(i)-1)(1-t)^(q_(i)-1))/(B(p_(i),q_(i))(b_(i)-a_(i))^(p_(i)+q_(i)-1)), ; 0<=t<=1;),(0, ; t>1):} (1)`

V praksi pa so praviloma zanimive beta vrednosti, določene v poljubnem intervalu. To je predvsem posledica dejstva, da je obseg praktičnih problemov v tem primeru veliko širši, in drugič, pri iskanju rešitve za splošnejši primer za posamezen primer ne bo mogoče dobiti rezultata, ki bo določi naključna spremenljivka (1). ni težav. Zato bomo v nadaljevanju obravnavali naključne spremenljivke, definirane na poljubnem intervalu. V tem primeru lahko težavo oblikujemo na naslednji način.

Razmišljamo o problemu ocenjevanja zakona porazdelitve naključne spremenljivke, ki je vsota naključnih spremenljivk `xi_ (i),` i = 1, ..., n, od katerih je vsaka porazdeljena po zakonu beta v intervalu s parametri p i in q i. Gostoto porazdelitve posameznih izrazov bomo določili s formulo:

Problem iskanja zakona vsote beta vrednosti je bil delno rešen prej. Zlasti so bile pridobljene formule za oceno vsote dveh vrednosti beta, od katerih je vsaka določena z uporabo (1). V predlaganem pristopu k iskanju vsote dveh naključnih spremenljivk z zakonom porazdelitve (2).

Vendar v splošnem primeru prvotni problem ni rešen. To je predvsem posledica posebnosti formule (2), ki ne omogoča pridobivanja kompaktnih in priročnih formul za iskanje gostote iz vsote naključnih spremenljivk. Dejansko za dve količini`xi_1` in` xi_2` zahtevana gostota bo določena na naslednji način:

`f_ (eta) (z) = int_-prop ^ propf_ (xi_1) (x) f_ (xi_2) (z-x) dx (3)"

V primeru dodajanja n naključnih spremenljivk dobimo večkratni integral. Hkrati pa pri tem problemu obstajajo težave, povezane s posebnostmi distribucije beta. Zlasti tudi pri n = 2 uporaba formule (3) vodi do precej okornega rezultata, ki je opredeljen v smislu hipergeometričnih funkcij. Ponovno jemanje integrala dobljene gostote, ki ga je treba opraviti že pri n = 3 in več, je izredno težko. Hkrati niso izključene napake, ki bodo neizogibno nastale pri zaokroževanju in izračunu tako zapletenega izraza. V zvezi s tem je treba iskati približek za formulo (3), ki omogoča uporabo znanih formul z najmanjšo napako.

2. Računalniški poskus za približevanje gostote vsote beta vrednosti

Za analizo posebnosti želene gostote porazdelitve je bil izveden poskus, ki omogoča zbiranje statističnih podatkov o naključni spremenljivki, ki je vsota vnaprej določenega števila naključnih spremenljivk z beta porazdelitvijo z danimi parametri. Poskusna postavitev je bila podrobneje opisana v. Zaradi spreminjanja parametrov posameznih vrednosti beta in njihovega števila smo zaradi velikega števila izvedenih poskusov prišli do naslednjih zaključkov.

1. Če imajo posamezne naključne spremenljivke, vključene v vsoto, simetrične gostote, potem ima histogram končne porazdelitve obliko blizu normalne. Prav tako so blizu normalnemu zakonu vrednotenja numeričnih značilnosti končne vrednosti (matematično pričakovanje, varianca, asimetrija in kurtoza).

2. Če so posamezne naključne spremenljivke asimetrične (s pozitivno in negativno asimetrijo), vendar je skupna asimetrija 0, potem je z vidika grafične predstavitve in numeričnih značilnosti tudi dobljeni zakon porazdelitve blizu normalnega.

3. V drugih primerih je iskani zakon vizualno blizu zakonu beta. Na sliki 1 je prikazana vsota petih asimetričnih naključnih spremenljivk.

Slika 1 - Vsota petih enako asimetričnih naključnih spremenljivk

Tako je na podlagi izvedenega poskusa mogoče postaviti hipotezo o možnem približevanju gostote vsote vrednosti beta z normalno ali beta porazdelitvijo.

Za potrditev te hipoteze in izbiro edinega zakona za približevanje bomo izvedli naslednji poskus. Glede na število naključnih spremenljivk z beta porazdelitvijo in njihove parametre najdemo številčno vrednost zahtevane gostote in jo primerjamo z gostoto ustrezne normalne ali beta porazdelitve. To bo zahtevalo:

1) razviti algoritem, ki vam omogoča numerično oceno gostote vsote beta vrednosti;

2) z danimi parametri in številom začetnih vrednosti določite parametre končne porazdelitve pod predpostavko normalne ali beta porazdelitve;

3) določi napako pri aproksimaciji z normalno porazdelitvijo ali porazdelitvijo beta.

Podrobneje razmislimo o teh nalogah. Numerični algoritem za iskanje gostote vsote beta vrednosti temelji na rekurziji. Vsoto n poljubnih naključnih spremenljivk lahko določimo na naslednji način:

`eta_ (n) = xi_ (1) + ... + xi_ (n) = eta_ (n-1) + xi_ (n)` , (4)

`eta_ (n-1) = xi_ (1) + ... + xi_ (n-1)` . (5)

Podobno lahko opišete gostoto porazdelitve naključne spremenljivke `eta_ (n-1)`:

`eta_ (n-1) = xi_ (1) + ... + xi_ (n-1) = eta_ (n-2) + xi_ (n-1)" , (6)

Če nadaljujemo s podobnim sklepanjem in uporabimo formulo (3), dobimo:

`f_ (eta_ (n)) (x) = int_-prop ^ prop (f_ (xi_ (n-1)) (x-x_ (n-1)) * int_-prop ^ prop (f_ (xi_ (n- 2)) (x_ (n-1) -x_ (n-2)) ... int_-prop ^ propf_ (xi_ (2)) (x_ (2) -x_ (1)) dx_ (1) ... ) dx_ (n-2)) dx_ (n-1). (7) `

Ti premisleki in posebnosti določanja gostote za količine z beta porazdelitvijo so podrobneje podani v.

Parametri končnega zakona o porazdelitvi so določeni na podlagi predpostavke o neodvisnosti naključnih spremenljivk. V tem primeru bodo matematična pričakovanja in varianca njihove vsote določeni s formulami:

`Meta_ (n) = Mxi_ (1) + ... + Mxi_ (n), (8) ')

Za normalni zakon bosta parametra a in `sigma` neposredno določena s formulama (8) in (9). Za distribucijo beta morate najprej izračunati spodnjo in zgornjo mejo. Lahko jih opredelimo na naslednji način:` `

`a = vsota_ (i = 1) ^ na_ (i)`; (deset)

,,, b = vsota_ (i = 1) ^ nb_ (i) `. (enajst)

Tu sta a i in b i meji intervalov posameznih izrazov. Nato bomo sestavili sistem enačb, ki vključuje formule za matematična pričakovanja in variacijo vrednosti beta:

`((Mxi = a + (ba) p / (p + q)), (Dxi = (ba) ^ (2) (pq) / ((p + q) ^ 2 (p + q + 1))) :) (12) `

Tu je "xi" naključna spremenljivka, ki opisuje zahtevano vsoto. Njegova matematična pričakovanja in varianca so določeni s formulama (8) in (9); parametra a in b sta podana s formulama (10) in (11). Ko smo sistem (12) rešili glede na parametre p in q, bomo imeli:

`p = ((b-Mxi) (Mxi-a) ^ 2-Dxi (Mxi-a)) / (Dxi (b-a))" . (13)

`q = ((b-Mxi) ^ 2 (Mxi-a) -Dxi (b-Mxi)) / (Dxi (b-a))" . (14)

`E = int_a ^ b | hatf (x) -f_ (eta) (x) | dx. (15) `

Tu je "hatf (x)" približek vsote beta vrednosti; `f_ (eta) (x)` - zakon porazdelitve vsote beta vrednosti.

Za oceno napak bomo zaporedno spreminjali parametre posameznih vrednosti beta. Zlasti bodo zanimiva naslednja vprašanja:

1) kako hitro se vsota beta vrednosti konvergira v normalno porazdelitev in ali je mogoče vsoto oceniti z drugim zakonom, ki bo imel minimalno napako glede na pravi zakon distribucije vsote beta vrednosti;

2) koliko se napaka poveča s povečanjem asimetrije vrednosti beta;

3) kako se bo napaka spremenila, če bodo razdelitveni intervali beta vrednosti drugačni.

Splošno shemo poskusnega algoritma za vsako posamezno vrednost beta-vrednosti lahko predstavimo na naslednji način (slika 2).

Slika 2 - Splošna shema poskusnega algoritma

PogBeta - napaka, ki izhaja iz približevanja končnega zakona z beta porazdelitvijo v intervalu;

PogNorm - napaka, ki izhaja iz približevanja končnega zakona z normalno porazdelitvijo v intervalu;

ItogBeta - končna vrednost napake, ki izhaja iz približevanja končne porazdelitve z zakonom beta;

ItogNorm - skupna vrednost napake, ki izhaja iz približevanja končne porazdelitve po običajnem zakonu.

3. Eksperimentalni rezultati

Analizirajmo rezultate prej opisanega poskusa.

Dinamika zmanjševanja napak s povečanjem števila izrazov je prikazana na sliki 3. Abscisa prikazuje število izrazov, ordinata pa velikost napake. V nadaljevanju serija "Norma" prikazuje spremembo napake pri normalni porazdelitvi, serija "Beta" - distribucija beta.

Slika 3 - Zmanjšanje napak z zmanjšanjem števila izrazov

Kot je razvidno iz te slike, je pri dveh izrazih napaka približevanja po zakonu beta približno 4 -krat manjša od napake približevanja po normalnem zakonu porazdelitve. Očitno se z naraščanjem izrazov napaka približevanja po normalnem zakonu zmanjšuje veliko hitreje kot zakon beta. Prav tako lahko domnevamo, da bo pri zelo velikem številu aproksimacija po normalnem zakonu imela manjšo napako kot aproksimacija z distribucijo beta. Toda ob upoštevanju obsega napake v tem primeru je mogoče sklepati, da je z vidika števila izrazov zaželena beta distribucija.

Slika 4 prikazuje dinamiko sprememb napak s povečanjem asimetrije naključnih spremenljivk. Brez izgube splošnosti je bil parameter p vseh začetnih beta vrednosti fiksiran z vrednostjo 2, abscisa pa predstavlja dinamiko spremembe parametra q + 1. Osi ordinatov v grafih prikazuje napako pri približevanju. Rezultati poskusa z drugimi vrednostmi parametrov so na splošno podobni.

V tem primeru je tudi očitno, da je bolje vsoto vrednosti beta približati z distribucijo beta.

Slika 4 - Sprememba napak pri približevanju z naraščajočo asimetrijo količin

Nato smo analizirali spremembo napak s spremembo območja začetnih beta vrednosti. Slika 5 prikazuje rezultate merjenja napake za vsoto štirih vrednosti beta, od katerih so tri porazdeljene v intervalu, obseg četrtega pa se zaporedno povečuje (narisan je na abscisi).

Slika 5 - Sprememba napak pri spreminjanju intervalov porazdelitve naključnih spremenljivk

Na podlagi grafičnih ilustracij, prikazanih na slikah 3-5, in ob upoštevanju podatkov, pridobljenih kot rezultat poskusa, je mogoče sklepati, da je za približevanje vsote vrednosti beta priporočljivo uporabiti porazdelitev beta.

Kot kažejo pridobljeni rezultati, bo v 98% primerov napaka pri približevanju raziskane vrednosti po zakonu beta manjša kot pri približevanju normalne porazdelitve. Povprečna vrednost napake pri približevanju beta bo odvisna predvsem od širine intervalov, po katerih je razdeljen vsak izraz. V tem primeru je ta ocena (v nasprotju z običajnim zakonom) zelo malo odvisna od simetrije naključnih spremenljivk, pa tudi od števila izrazov.

4. Aplikacije

Eno od področij uporabe dobljenih rezultatov je naloga vodenja projektov. Projekt je zbirka medsebojno odvisnih zaporedno vzporednih opravil z naključnim trajanjem storitve. V tem primeru bo trajanje projekta naključna vrednost. Očitno je, da ocena zakona o porazdelitvi te količine ni zanimiva le v fazah načrtovanja, temveč tudi pri analizi možnih situacij, povezanih z nepravočasnim dokončanjem vseh del. Ob upoštevanju dejstva, da lahko zamuda pri projektu povzroči najrazličnejše neugodne situacije, vključno z globami, se zdi ocena zakona o porazdelitvi naključne spremenljivke, ki opisuje trajanje projekta, izjemno pomembna praktična naloga.

Trenutno se za to oceno uporablja metoda PERT. Po njegovih predpostavkah je trajanje projekta običajno porazdeljena naključna spremenljivka `eta` s parametri:

`a = vsota_ (i = 1) ^ k Meta_ (i)`, (16)

`sigma = sqrt (sum_ (i = 1) ^ k D eta_ (i))` . (17)

Tu je k število del na kritični poti projekta; `eta_ (1)`, ..., `eta_ (k)` - trajanje teh del.

Razmislimo o popravku metode PERT ob upoštevanju dobljenih rezultatov. V tem primeru bomo domnevali, da je trajanje projekta porazdeljeno po zakonu beta s parametri (13) in (14).

Poskusimo pridobljene rezultate v praksi. Razmislite o projektu, ki ga definira omrežni diagram, prikazan na sliki 6.

Slika 6 - Primer diagrama omrežja

Tu robovi grafa označujejo opravila, teže robov kažejo število opravil; oglišča v kvadratih - dogodki, ki označujejo začetek ali konec dela. Naj bodo dela podana po trajanju iz tabele 1.

Tabela 1 - Časovne značilnosti projektnih del

Delo št. min maks Mat. ostani v pripravljenosti
1 5 10 9
2 3 6 4
3 6 8 7
4 4 7 6
5 4 7 7
6 2 5 3
7 4 8 6
8 4 6 5
9 6 8 7
10 2 6 4
11 9 13 12
12 2 6 3
13 5 7 6

V zgornji tabeli je min najkrajši čas, v katerem je mogoče to delo opraviti; max je najdaljši čas; Mat. ostani v pripravljenosti je matematično pričakovanje distribucije beta, ki prikazuje pričakovani čas za dokončanje danega opravila.

S pomočjo posebej razvitega simulacijskega sistema bomo simulirali postopek izvedbe projekta. Podrobneje je opisano v. Kot izhod morate dobiti:

Histogrami projektov;

Ocena verjetnosti izvedbe projekta v danem intervalu na podlagi statističnih podatkov simulacijskega sistema;

Ocena verjetnosti z uporabo normalnih in beta porazdelitev.

Med simulacijo izvajanja projekta 10.000 -krat je bil pridobljen vzorec trajanja storitve, katerega histogram je prikazan na sliki 7.

Slika 7 - Histogram trajanja projekta

Očitno je, da se videz histograma, prikazanega na sliki 7, razlikuje od grafa gostote normalnega zakona porazdelitve.

Za izračun končnih matematičnih pričakovanj in variance bomo uporabili formuli (8) in (9). Dobimo:

`M eta = 27; D eta = 1,3889.`

Verjetnost zadetka določenega intervala bo izračunana po dobro znani formuli:

`P (l (18)

kjer je "f_ (eta) (x)" zakon porazdelitve naključne spremenljivke "eta", l in r- meje zanimivega intervala.

Izračunajmo parametre za končno distribucijo beta. Za to uporabljamo formuli (13) in (14). Dobimo:

p = 13,83; q = 4,61.

Meje porazdelitve beta so določene s formulama (10) in (11). Bo imel:

Rezultati študije so prikazani v tabeli 2. Brez izgube splošnosti izberite število modelov, ki je enako 10000. V stolpcu "Statistika" se izračuna verjetnost, pridobljena na podlagi statističnih podatkov. V stolpcu "Normal" je prikazana verjetnost, izračunana po normalnem zakonu o porazdelitvi, ki se zdaj uporablja za reševanje problema. Stolpec Beta prikazuje vrednost verjetnosti, izračunano iz porazdelitve beta.

Tabela 2 - Rezultati verjetnostnih ocen

Na podlagi rezultatov, prikazanih v tabeli 2, in podobnih rezultatov, pridobljenih med modeliranjem procesa izvajanja drugih projektov, je mogoče sklepati, da dobljene ocene približevanja vsote naključnih spremenljivk (2) z beta distribucije omogočajo rešitev te težave z večjo natančnostjo v primerjavi z obstoječimi.

Cilj tega dela je bil najti takšen približek zakona porazdelitve vsote beta vrednosti, ki bi se v primerjavi z drugimi analogi razlikoval po najmanjši napaki. Dobljeni so bili naslednji rezultati.

1. Eksperimentalno je bila postavljena hipoteza o možnosti približevanja vsote vrednosti beta z distribucijo beta.

2. Razvito je programsko orodje, ki omogoča pridobivanje številske vrednosti napake, ki nastane, ko se zahtevana gostota približa normalnemu zakonu porazdelitve in zakonu beta. Ta program temelji na rekurzivnem algoritmu, ki vam omogoča numerično določanje gostote vsote vrednosti beta z določeno gostoto, ki je podrobneje opisana v.

3. Postavljen je bil računalniški poskus, katerega namen je bil s primerjalno analizo napak v različnih pogojih določiti najboljši približek. Eksperimentalni rezultati so pokazali, da je mogoče porazdelitev beta uporabiti kot najboljši približek porazdelitvene gostote vsote vrednosti beta.

4. Predstavljen je primer, v katerem so dobljeni rezultati praktičnega pomena. To so naloge vodenja projektov z naključnimi časi izvajanja za posamezna opravila. Pomemben problem pri takšnih nalogah je ocena tveganj, povezanih s pozno dokončanjem projekta. Dobljeni rezultati omogočajo natančnejše ocene želenih verjetnosti in posledično zmanjšanje verjetnosti napak pri načrtovanju.

Bibliografija

.