Računalniki Windows internet

Primer izračuna beta porazdelitve naključne spremenljivke. Beta distribucija. Neprekinjene distribucije v MS EXCEL. Izvleček, ki opisuje distribucijo Beta

Razmislite o porazdelitvi Beta, izračunajte njeno matematično pričakovanje, varianco, način. S funkcijo MS EXCEL BETA.DIST() narišemo grafe porazdelitvene funkcije in gostote verjetnosti. Ustvarimo matriko naključna števila in ocenili bomo distribucijske parametre.

beta distribucijabeta- distribucijo) odvisno od 2 parametrov: α ( alfa)>0(opredeljuje obliko porazdelitve) in b (beta)>0(opredeljuje lestvico).

Za razliko od mnogih drugih neprekinjenih distribucij je obseg variacije naključne spremenljivke, ki ima Beta distribucija, omejen s segmentom . Zunaj tega segmenta gostota porazdelitve je enak 0. Meje tega segmenta določi raziskovalec glede na nalogo. Če je A=0 in B=1, potem to Beta distribucija imenujemo standard.

Beta distribucija ima oznako beta(alfa; beta).

Opomba: Če so parametri alfa in beta= 1, torej Beta distribucija spremeni v , t.j. Beta(1; 1; A; B) = U(A; B).

Na splošno distribucijsko funkcijo ni mogoče izraziti v elementarnih funkcijah, zato se izračuna z numeričnimi metodami, na primer s funkcijo MS EXCEL BETA.DIST() .

Opomba: Za udobje pisanja formul v vzorčno datoteko za distribucijske parametre alfa in beta ustvaril ustrezen .

V vzorčni datoteki so vgrajeni tudi grafi gostota verjetnosti in distribucijske funkcije z označenimi vrednostmi sredina, in .

Generiranje naključnih števil in ocena parametrov

Uporaba inverzna porazdelitvena funkcija(ali kvantilne vrednosti ( str- kvantil), glej ) je mogoče ustvariti vrednosti naključne spremenljivke, ki ima Beta distribucija. Če želite to narediti, morate uporabiti formulo:

BETA.INV(RAND(); alfa; beta; A; B)

NASVET: Ker naključna števila se generirajo s funkcijo RAND(), nato pa s pritiskom na tipko F9, lahko vsakič dobite nov vzorec in s tem novo oceno parametrov.

Funkcija RAND() generira od 0 do 1, kar ustreza le obsegu spremembe verjetnosti (glej spodaj). Primer datotečnega lista Generacija).

Zdaj imamo niz naključnih števil, ustvarjenih z danimi distribucijskimi parametri alfa in beta(naj jih je 200), ocenimo parametre porazdelitve.

Ocena parametrov alfa in beta je mogoče storiti z trenutna metoda(ob predpostavki, da sta parametra A in B znana):

Nisi suženj!
Zaprti izobraževalni tečaj za otroke elite: "Prava ureditev sveta."
http://noslave.org

Iz Wikipedije, proste enciklopedije

Beta distribucija
Gostota verjetnosti
Funkcija gostote verjetnosti za porazdelitev beta
distribucijsko funkcijo
Kumulativna distribucijska funkcija za distribucijo beta
Poimenovanje texvc ni najdeno; Za pomoč pri nastavitvi glejte math/README.): \text(Be)(\alpha,\beta)
Parametri Izraza ni mogoče razčleniti (izvedljiva datoteka texvc ni najdeno; Za pomoč pri nastavitvi glejte math/README.): \alpha > 0
Izraza ni mogoče razčleniti (izvedljiva datoteka texvc ni najdeno; Za pomoč pri nastavitvi glejte math/README.): \beta > 0
Nosilec Izraza ni mogoče razčleniti (izvedljiva datoteka texvc ni najdeno; Za pomoč pri nastavitvi glejte math/README.): x \in
Gostota verjetnosti Izraza ni mogoče razčleniti (izvedljiva datoteka texvc ni najdeno; Za pomoč pri nastavitvi glejte math/README.): \frac(x^(\alpha-1)(1-x)^(\beta-1)) (\mathrm(B)(\alpha,\beta))
distribucijsko funkcijo Izraza ni mogoče razčleniti (izvedljiva datoteka texvc ni najdeno; Za pomoč pri nastavitvi glejte math/README.): I_x(\alpha,\beta)
Pričakovana vrednost Izraza ni mogoče razčleniti (izvedljiva datoteka texvc ni najdeno; Za pomoč pri nastavitvi glejte math/README.): \frac(\alpha)(\alpha+\beta)
Mediana
Moda Izraza ni mogoče razčleniti (izvedljiva datoteka texvc ni najdeno; Za pomoč pri nastavitvi glejte matematiko/README.): \frac(\alpha-1)(\alpha+\beta-2) za Izraza ni mogoče razčleniti (izvedljiva datoteka texvc ni najdeno; Za pomoč pri nastavitvi glejte math/README.): \alpha>1, \beta>1
Disperzija Izraza ni mogoče razčleniti (izvedljiva datoteka texvc ni najdeno; Za pomoč pri nastavitvi glejte math/README.): \frac(\alpha\beta)((\alpha+\beta)^2(\alpha+\beta+1))
Koeficient asimetrije Izraza ni mogoče razčleniti (izvedljiva datoteka texvc ni najdeno; Za pomoč pri nastavitvi glejte math/README.): \frac(2\,(\beta-\alpha)\sqrt(\alpha+\beta+1))((\alpha+\beta+2)\sqrt(\alpha \beta) ))
Koeficient kurtoze Izraza ni mogoče razčleniti (izvedljiva datoteka texvc ni najdeno; Za pomoč pri nastavitvi glejte math/README.): 6\,\frac(\alpha^3-\alpha^2(2\beta-1)+\beta^2(\beta+1)-2\alpha\ beta( \beta+2)) (\alpha \beta (\alpha+\beta+2) (\alpha+\beta+3))
Diferencialna entropija
Ustvarjalna funkcija trenutkov Izraza ni mogoče razčleniti (izvedljiva datoteka texvc ni najdeno; Za pomoč pri nastavitvi glejte math/README.): 1 +\sum_(k=1)^(\infty) \left(\prod_(r=0)^(k-1) \frac(\alpha+r) (\ alfa+\beta+r) \desno) \frac(t^k)(k !}
značilna funkcija Izraza ni mogoče razčleniti (izvedljiva datoteka texvc ni najdeno; Za pomoč pri nastavitvi glejte math/README.): ()_1F_1(\alpha; \alpha+\beta; i\,t)

Beta distribucija v teoriji verjetnosti in statistiki dvoparametrska družina absolutno neprekinjenih porazdelitev. Uporablja se za opisovanje naključne spremenljivke, katerih vrednosti so omejene na končen interval.

Opredelitev

90 slikovnih pik Porazdelitve verjetnosti
Enodimenzionalni Večdimenzionalni
Diskretno: Bernoulli | Binom | Geometrijsko | Hipergeometrična | Logaritemsko | Negativni binom | Poisson | Diskretna uniforma Multinomski
Popolnoma neprekinjeno: Beta| Weibulla | Gama | Hipereksponentno | Gompertzova distribucija | Kolmogorov | Cauchy | Laplace | Lognormalno | | | kopula

Izvleček, ki opisuje distribucijo Beta

Solze so mi sijale v očeh ... In tega se absolutno nisem sramoval. Veliko bi dal, da bi srečal enega od njih živega! .. Še posebej Magdaleno. Kakšna čudovita, starodavna magija je gorela v duši te neverjetne ženske, ko je ustvarila svoje čarobno kraljestvo?! Kraljestvo, v katerem sta vladala Znanje in Razumevanje in katerega hrbtenica je bila Ljubezen. Samo ne ljubezen, o kateri je kričala »sveta« cerkev, ki je iztrošila to čudovito besedo do te mere, da je nisem hotel več slišati, ampak tista lepa in čista, resnična in pogumna, edina in neverjetna LJUBEZEN, z imenom katerega so se rodile moči ... in z imenom katerega so starodavni bojevniki hiteli v boj ... z imenom katerega se je rodilo novo življenje ... z imenom katerega se je naš svet spremenil in postal bolje ... To Ljubezen je nosila Zlata Marija. In prav tej Mariji bi se rad poklonil... Za vse, kar je nosila, za njeno čisto svetlo ŽIVLJENJE, za njen pogum in pogum in za Ljubezen.
Ampak, na žalost, je bilo to nemogoče narediti ... Živela je pred stoletji. In nisem mogel biti tisti, ki jo je poznal. Nenadoma me je prevzela neverjetno globoka, svetla žalost in grenke solze so se ulile v potok ...
- Kaj si, prijatelj!.. Druge žalosti te čakajo! je presenečeno vzkliknil Sever. - Prosim, pomiri se ...
Nežno se je dotaknil moje roke in sčasoma je žalost izginila. Ostala je samo grenkoba, kot da sem izgubil nekaj svetlega in dragega ...
– Ne smeš se sprostiti ... Čaka te vojna, Isidora.
– Povej mi, Sever, ali se je nauk katarjev zaradi Magdalene imenoval Nauk ljubezni?
– Tukaj nimaš čisto prav, Isidora. Neposvećeni so ga imenovali Učenje ljubezni. Za tiste, ki so razumeli, je imela povsem drugačen pomen. Poslušaj zvok besed, Isidora: ljubezen zveni v francoščini - amor (amour) - kajne? In zdaj razdelite to besedo in od nje ločite črko "a" ... Izkazalo se je a'mor ("mort) - brez smrti ... To je pravi pomen naukov Magdalene - Naukov nesmrtnikov Kot sem ti že rekel - vse je preprosto, Isidora, če le pravilno pogledaš in poslušaš... No, za tiste, ki ne slišijo, naj ostane Nauk ljubezni... je tudi lepo.
Stal sem popolnoma osupel. Nauk o nesmrtnih!.. Daaria... To je bil torej nauk Radomirja in Magdalene!.. Sever me je večkrat presenetil, a še nikoli nisem bil tako šokiran!.. Katarski nauki so me pritegnili s svojo močjo. , magično moč, in nisem si mogel odpustiti, da se o tem nisem prej pogovarjal s severom.
- Povej mi, Sever, je kaj ostalo od zapisov Katarjev? Moralo je nekaj ostati? Tudi če ne sami Popolni, pa vsaj samo študenti? Mislim nekaj o njihovem resničnem življenju in naukih?
– Na žalost ne, Isidora. Inkvizicija je uničila vse in povsod. Njene podložnike so po papeževem ukazu poslali celo v druge države, da bi uničili vsak rokopis, vsak preostali kos brezovega lubja, ki so ga našli ... Iskali smo vsaj nekaj, vendar nismo mogli ničesar rešiti.
No, kaj pa ljudje sami? Ali bi lahko ostalo kaj pri ljudeh, ki bi to obdržali skozi stoletja?
– Ne vem, Isidora ... Mislim, da tudi če je kdo imel kakšno ploščo, se je sčasoma spremenila. Navsezadnje je v človeški naravi, da vse preoblikuje po svoje ... In še posebej brez razumevanja. Zato je malo verjetno, da se je kaj ohranilo, kot je bilo. Škoda ... Resda imamo še dnevnike Radomirja in Magdalene, a to je bilo pred nastankom Katarjev. Čeprav mislim, da se doktrina ni spremenila.
– Oprosti mi za moje kaotične misli in vprašanja, Sever. Vidim, da sem veliko izgubil, ker nisem prišel k tebi. Ampak še vedno sem še živ. In medtem ko diham, te lahko še vedno vprašam, kajne? Ali mi lahko poveste, kako se je končalo Svetodarjevo življenje? Oprostite, ker vas motim.
Sever se je iskreno nasmehnil. Všeč mu je bila moja nestrpnost in moja žeja, da bi "odkrili pravočasno". In z veseljem je nadaljeval.
Po vrnitvi je Svetodar le dve leti živel in poučeval v Okcitaniji, Isidora. Toda ta leta so postala najdražja in najsrečnejša leta njegovega potepuškega življenja. Njegovi dnevi, obsijani z veselim Beloyarjevim smehom, so minili v njegovem ljubljenem Montsegurju, obkroženem s Popolnimi, ki jim je Svetodar pošteno in iskreno poskušal povedati, kar ga je dolga leta učil daljni Potepuh.

Pravilna povezava k članku:

Oleinikova S.A. — Aproksimacija zakona porazdelitve vsote naključnih spremenljivk, porazdeljenih po beta zakonu // Kibernetika in programiranje. - 2015. - Št. 6. - Str. 35 - 54. DOI: 10.7256/2306-4196.2015.6.17225 URL: https://nbpublish.com/library_read_article.php?id=17225

Približek zakona porazdelitve vsote naključnih spremenljivk, porazdeljenih po beta zakonu

Oleinikova Svetlana Aleksandrovna

Doktor tehniških znanosti

Izredni profesor, Voroneška državna tehnična univerza

394026, Rusija, Voronež, Moskovsky prospect, 14

Oleinikova Svetlana Aleksandrovna

Doktor tehniških znanosti

Izredni profesor, Oddelek za avtomatizirane in računalniške sisteme, Voroneška državna tehnična univerza

394026, Rusija, g. Voronež, Moskovskii prospekt, 14

Datum oddaje članka uredniku:

14-12-2015

Datum pregleda članka:

15-12-2015

Opomba.

Predmet raziskave v tem prispevku je gostota porazdelitve naključne spremenljivke, ki je vsota končnega števila beta-vrednosti, od katerih je vsaka porazdeljena v svojem intervalu s svojimi parametri. Ta zakon je zelo razširjen v teoriji verjetnosti in matematični statistiki, saj se lahko uporablja za opis dovolj velikega števila naključnih pojavov, če so vrednosti ustrezne zvezne naključne spremenljivke koncentrirane v določenem intervalu. Ker zahtevane vsote beta vrednosti ni mogoče izraziti z nobenim od znanih zakonov, nastane problem pri oceni gostote njegove porazdelitve. Cilj dela je najti takšen približek za gostoto porazdelitve vsote beta vrednosti, ki bi imel najmanjšo napako. Za dosego tega cilja je bil izveden računalniški poskus, na podlagi katerega smo za dano število beta vrednosti primerjali številčno vrednost gostote porazdelitve s približkom želene gostote. Normalna in beta porazdelitev sta bili uporabljeni kot približki. Kot rezultat eksperimentalne analize so bili pridobljeni rezultati, ki kažejo na smotrnost aproksimacije želenega zakona porazdelitve z beta zakonom. Kot eno od področij uporabe dobljenih rezultatov je obravnavan problem vodenja projektov z naključnim trajanjem, kjer ima ključno vlogo ocena časa izvedbe projekta, ki lahko zaradi specifičnosti predmetnega področja opisati z vsoto vrednosti beta.


ključne besede: naključna spremenljivka, beta porazdelitev, gostota porazdelitve, zakon normalne porazdelitve, vsota naključnih spremenljivk, računalniški eksperiment, rekurzivni algoritem, približek, napaka, PERT

10.7256/2306-4196.2015.6.17225


Datum objave:

19-01-2016

povzetek.

Predmet raziskave v tem prispevku je funkcija gostote verjetnosti (PDF) naključne spremenljivke, ki je vsota končnega števila beta vrednosti. Ta zakon je zelo razširjen v teoriji verjetnosti in matematične statistike, saj ga lahko opišemo z dovolj velikim številom naključnih dogodkov, če je vrednost ustrezne neprekinjene naključne spremenljivke koncentrirana v določenem območju. Ker zahtevane vsote beta vrednosti ni mogoče izraziti z nobenim od znanih zakonov, obstaja težava pri oceni porazdelitve njegove gostote. Cilj je najti tak približek za PDF vsote beta vrednosti, ki bi imel najmanj napake. Za dosego tega cilja je bil izveden računalniški eksperiment, v katerem smo za dano število beta vrednosti primerjali številčno vrednost PDF s približkom želene gostote. Kot približke smo uporabili normalno in beta porazdelitev. Kot zaključek eksperimentalne analize so bili pridobljeni rezultati, ki kažejo na ustreznost aproksimacije želenega zakona s pomočjo beta porazdelitve. Kot eno od področij uporabe rezultatov je obravnavan problem vodenja projektov z naključnim trajanjem del. Pri tem je ključno vprašanje vrednotenja časa izvedbe projekta, ki ga zaradi specifičnega predmetnega področja lahko opišemo z vsoto vrednosti beta.

ključne besede:

Naključna vrednost, beta porazdelitev, funkcija gostote, normalna porazdelitev, vsota naključnih spremenljivk, računalniški eksperiment, rekurzivni algoritem, približek, napaka, PERT

Uvod

Obravnavan je problem ocenjevanja zakona porazdelitve vsote beta vrednosti. To je univerzalni zakon, ki se lahko uporablja za opis večine naključnih pojavov z neprekinjenim zakonom o porazdelitvi. Zlasti v veliki večini primerov preučevanja naključnih pojavov, ki jih je mogoče opisati z unimodalnimi neprekinjenimi naključnimi spremenljivkami, ki ležijo v določenem območju vrednosti, je takšno vrednost mogoče aproksimirati z beta zakonom. V zvezi s tem problem iskanja zakona porazdelitve vsote beta vrednosti ni le znanstvene narave, ampak tudi določenega praktičnega interesa. Hkrati, za razliko od večine zakonov o distribuciji, beta zakon nima edinstvenih lastnosti, ki bi omogočale analitično opisovanje zahtevane vsote. Poleg tega je posebnost tega zakona taka, da je ekstrakcija večkratnika določen integral, ki je potreben pri določanju gostote vsote naključnih spremenljivk, je izjemno težko, rezultat pa je precej okoren izraz že za n=2, s povečanjem števila členov pa se kompleksnost končnega izraza povečuje. večkrat. V zvezi s tem se pojavi problem približevanja gostote porazdelitve vsote beta vrednosti z minimalno napako.

V prispevku je predstavljen pristop k iskanju aproksimacije za želeni zakon s pomočjo računalniškega eksperimenta, ki omogoča za vsak posamezen primer primerjavo napake, pridobljene z oceno gostote zanimanja z uporabo najustreznejših zakonov: normalnega in beta. Posledično je bil sprejet sklep o smotrnosti ocenjevanja vsote beta vrednosti z uporabo beta porazdelitve.

1. Navedba problema in njegovih značilnosti

Na splošno je beta zakon določen z gostoto, podano v intervalu, kot sledi:

` f_(xi_(i))(x)=((0, ; t<0), ((t^(p_(i)-1)(1-t)^(q_(i)-1))/(B(p_(i),q_(i))(b_(i)-a_(i))^(p_(i)+q_(i)-1)), ; 0<=t<=1;),(0, ; t>1):} (1)`

Vendar pa so praktičnega interesa praviloma beta vrednosti, določene v poljubnem intervalu. Prvič, to je posledica dejstva, da je obseg praktičnih problemov v tem primeru veliko širši, in drugič, pri iskanju rešitve za bolj splošen primer ne bo mogoče dobiti rezultata za določen primer. , ki bo določena z naključno spremenljivko (1) ne predstavlja težav. Zato bomo v nadaljevanju obravnavali naključne spremenljivke, definirane na poljubnem intervalu. V tem primeru je težavo mogoče oblikovati na naslednji način.

Problem ocenjevanja zakona porazdelitve naključne spremenljivke, ki je vsota naključnih spremenljivk `xi_(i) ,` i=1,…,n, od katerih je vsak razporejen po beta zakonu v intervalu s parametroma p i in q i. Gostota porazdelitve posameznih izrazov bo določena s formulo:

Delno je bil problem iskanja zakona vsote beta vrednosti že rešen prej. Zlasti so bile pridobljene formule za oceno vsote dveh beta vrednosti, od katerih je vsaka definirana s pomočjo (1). Predlaga se pristop k iskanju vsote dveh naključnih spremenljivk z zakonom porazdelitve (2).

Vendar v splošnem primeru prvotni problem ni bil rešen. To je predvsem posledica posebnosti formule (2), ki ne omogoča, da bi dobili kompaktne in priročne formule za iskanje gostote iz vsote naključnih spremenljivk. Pravzaprav za dve količini"xi_1" in "xi_2". želena gostota se določi na naslednji način:

`f_(eta)(z)=int_-prop^propf_(xi_1)(x)f_(xi_2)(z-x)dx (3)`

V primeru seštevanja n naključnih spremenljivk dobimo večkratni integral. Hkrati pa za to težavo obstajajo težave, povezane s posebnostmi distribucije beta. Zlasti že pri n=2 uporaba formule (3) vodi do zelo okornega rezultata, ki je določen v smislu hipergeometričnih funkcij . Ponovno odvzem integrala dobljene gostote, ki ga je treba izvesti že pri n=3 in več, je izjemno težaven. Hkrati pa niso izključene napake, ki se bodo neizogibno pojavile pri zaokroževanju in izračunu tako zapletenega izraza. V zvezi s tem je treba najti aproksimacijo za formulo (3), ki omogoča uporabo znanih formul z minimalno napako.

2. Računski poskus za aproksimacijo gostote vsote beta vrednosti

Za analizo posebnosti želene gostote porazdelitve je bil izveden eksperiment za zbiranje statističnih informacij o naključni spremenljivki, ki je vsota vnaprej določenega števila naključnih spremenljivk, ki imajo beta porazdelitev z danimi parametri. Postavitev eksperimenta je bila podrobneje opisana v. S spreminjanjem parametrov posameznih beta vrednosti, pa tudi njihovega števila, kot posledica velikega števila poskusov, smo prišli do naslednjih zaključkov.

1. Če imajo posamezne naključne spremenljivke, vključene v vsoto, simetrične gostote, ima histogram končne porazdelitve obliko, ki je blizu normalni. Blizu normalnemu zakonu so tudi ocene številčnih značilnosti končne vrednosti (matematično pričakovanje, disperzija, asimetrija in eksces).

2. Če so posamezne naključne spremenljivke asimetrične (tako s pozitivno kot z negativno asimetrijo), skupna asimetrija pa je 0, potem je z vidika grafične predstavitve in numeričnih značilnosti tudi nastali zakon porazdelitve blizu normale.

3. V drugih primerih je želeni zakon vizualno blizu beta zakona. Zlasti vsota petih asimetričnih naključnih spremenljivk je prikazana na sliki 1.

Slika 1 – Vsota petih enako asimetričnih naključnih spremenljivk

Tako je na podlagi eksperimenta mogoče postaviti hipotezo o možni aproksimaciji gostote vsote beta vrednosti z normalno ali beta porazdelitvijo.

Da potrdimo to hipotezo in izberemo en sam zakon za aproksimacijo, bomo izvedli naslednji poskus. Ko podamo število naključnih spremenljivk z beta porazdelitvijo in njihove parametre, poiščemo številčno vrednost želene gostote in jo primerjamo z gostoto ustrezne normalne ali beta porazdelitve. To bo zahtevalo:

1) razviti algoritem, ki vam omogoča številčno oceno gostote vsote beta vrednosti;

2) za dane parametre in število začetnih vrednosti določimo parametre končne porazdelitve ob predpostavki normalne ali beta porazdelitve;

3) določimo aproksimacijsko napako z normalno porazdelitvijo ali beta porazdelitvijo.

Oglejmo si te naloge podrobneje. Numerični algoritem za iskanje gostote vsote beta vrednosti temelji na rekurziji. Vsoto n poljubnih naključnih spremenljivk je mogoče definirati na naslednji način:

`eta_(n)=xi_(1)+...+xi_(n)=eta_(n-1)+xi_(n)` , (4)

`eta_(n-1)=xi_(1)+...+xi_(n-1)` . (5)

Podobno lahko opišemo gostoto porazdelitve naključne spremenljivke `eta_(n-1)`:

`eta_(n-1)=xi_(1)+...+xi_(n-1)=eta_(n-2)+xi_(n-1)` , (6)

Če nadaljujemo podobno razmišljanje in uporabimo formulo (3), dobimo:

`f_(eta_(n))(x)=int_-prop^prop(f_(xi_(n-1))(x-x_(n-1))*int_-prop^prop(f_(xi_(n-) 2))(x_(n-1)-x_(n-2))...int_-prop^propf_(xi_(2))(x_(2)-x_(1))dx_(1)... )dx_(n-2))dx_(n-1). (7)`

Ti premisleki, pa tudi posebnosti določanja gostote za količine z beta porazdelitvijo, so podrobneje podane v.

Parametri končnega zakona o porazdelitvi so določeni na podlagi predpostavke neodvisnosti naključnih spremenljivk. V tem primeru bosta matematično pričakovanje in varianca njihove vsote določena s formulami:

`Meta_(n)=Mxi_(1)+...+Mxi_(n), (8)`

Za normalni zakon bosta parametra a in "sigma" neposredno določena s formulama (8) in (9). Za beta distribucijo je treba najprej izračunati spodnjo in zgornjo mejo. Lahko jih definiramo na naslednji način:` `

`a=vsota_(i=1)^na_(i)`; (10)

` ` `b=vsota_(i=1)^nb_(i) `. (enajst)

Tu sta a i in b i meji intervalov posameznih členov. Nato sestavimo sistem enačb, ki vključuje formule za matematično pričakovanje in disperzijo vrednosti beta:

`((Mxi=a+(ba)p/(p+q)),(Dxi=(ba)^(2)(pq)/((p+q)^2(p+q+1))): ) (12)`

Tukaj je xi naključna vrednost, ki opisuje želeni znesek. Njegovo matematično pričakovanje in varianco določata formula (8) in (9); parametra a in b - po formulah (10) in (11). Ko smo rešili sistem (12) glede na parametra p in q, bomo imeli:

`p=((b-Mxi)(Mxi-a)^2-Dxi(Mxi-a))/(Dxi(b-a))` . (13)

`q=((b-Mxi)^2(Mxi-a)-Dxi(b-Mxi))/(Dxi(b-a))` . (14)

`E=int_a^b|hatf(x)-f_(eta)(x)|dx. (15)`

Tukaj je 'hatf(x)' približek vsote vrednosti beta; `f_(eta)(x)` - zakon porazdelitve za vsoto beta vrednosti.

Za oceno napak bomo zaporedoma spreminjali parametre posameznih beta vrednosti. Zlasti bodo zanimiva naslednja vprašanja:

1) kako hitro se vsota beta vrednosti konvergira k normalni porazdelitvi in ​​ali je mogoče oceniti vsoto po drugem zakonu, ki bo imel minimalno napako glede na pravi zakon porazdelitve vsote beta vrednosti;

2) koliko se napaka poveča s povečanjem asimetrije komponent beta vrednosti;

3) kako se bo napaka spremenila, če bodo intervali porazdelitve beta vrednosti različni.

Splošno shemo eksperimentalnega algoritma za vsako posamezno vrednost parametrov beta vrednosti lahko predstavimo na naslednji način (slika 2).

Slika 2 - Splošna shema algoritma eksperimenta

PogBeta - napaka , ki izhaja iz približevanja končnega zakona z beta porazdelitvijo v intervalu ;

PogNorm - napaka, ki izhaja iz aproksimacije končnega zakona z normalno porazdelitvijo v intervalu;

ItogBeta - končna vrednost napake, ki izhaja iz aproksimacije končne porazdelitve po beta zakonu;

ItogNorm - končna vrednost napake, ki izhaja iz aproksimacije končne porazdelitve po običajnem zakonu.

3. Rezultati poskusa

Analizirajmo rezultate prej opisanega poskusa.

Dinamika upadanja napak s povečanjem števila členov je prikazana na sliki 3. Število členov je prikazano vzdolž abscise, napaka pa po ordinati. V nadaljevanju serija "Norme" prikazuje spremembo napake po normalni porazdelitvi, serija "Beta" - po beta porazdelitvi.

Slika 3 - Zmanjšanje napak z zmanjšanjem števila izrazov

Kot je razvidno iz te slike, je pri dveh členih aproksimacijska napaka po beta zakonu približno 4-krat manjša od približne napake po običajnem zakonu porazdelitve. Očitno, ko se pogoji povečajo, se napaka približevanja po normalnem zakonu zmanjša veliko hitreje kot po zakonu beta. Prav tako lahko domnevamo, da bo pri zelo velikem številu členov približek po normalnem zakonu imel manjšo napako kot približek z beta porazdelitvijo. Vendar lahko ob upoštevanju vrednosti napake v tem primeru sklepamo, da je z vidika števila izrazov boljša beta distribucija.

Slika 4 prikazuje dinamiko sprememb napak s povečanjem asimetrije naključnih spremenljivk. Brez izgube splošnosti je bil parameter p vseh začetnih vrednosti beta fiksiran na vrednost 2, abscisa pa prikazuje dinamiko parametra q + 1. Os y na grafih prikazuje napako približevanja. Rezultati poskusa z drugimi vrednostmi parametrov so na splošno podobni.

V tem primeru je očitna tudi prednost približevanja vsote beta vrednosti z beta porazdelitvijo.

Slika 4 - Sprememba napak približevanja z naraščajočo asimetrijo veličin

Nato smo analizirali spremembo napak s spremembo obsega začetnih vrednosti beta. Na sliki 5 so prikazani rezultati merjenja napake za vsoto štirih beta vrednosti, od katerih so tri razporejene v intervalu , razpon četrte pa se zaporedno povečuje (izrisana je vzdolž abscise).

Slika 5 - Sprememba napak pri spreminjanju intervalov porazdelitve naključnih spremenljivk

Na podlagi grafičnih ilustracij, prikazanih na slikah 3-5, ter ob upoštevanju podatkov, pridobljenih kot rezultat poskusa, lahko sklepamo, da je za približek vsote beta vrednosti priporočljivo uporabiti beta porazdelitev.

Kot so pokazali rezultati, bo v 98 % primerov napaka pri aproksimaciji preučevane vrednosti po beta zakonu manjša kot pri približevanju normalne porazdelitve. Povprečna vrednost aproksimacijske napake beta bo odvisna predvsem od širine intervalov, v katerih je vsak člen porazdeljen. Hkrati je ta ocena (v nasprotju z običajnim zakonom) zelo malo odvisna od simetrije naključnih spremenljivk, pa tudi od števila členov.

4. Aplikacije

Eno od področij uporabe dobljenih rezultatov je problem projektnega vodenja. Projekt je niz medsebojno odvisnih serijsko-vzporednih del z naključnim trajanjem storitve. V tem primeru bo trajanje projekta naključna spremenljivka. Očitno je ocena zakona distribucije te vrednosti zanimiva ne le v fazah načrtovanja, temveč tudi pri analizi možnih situacij, povezanih s nepravočasnim zaključkom vseh del. Ob upoštevanju dejstva, da lahko zamuda pri projektu povzroči najrazličnejše neugodne situacije, vključno z globami, se zdi ocena zakona porazdelitve naključne spremenljivke, ki opisuje trajanje projekta, izjemno pomembna praktična naloga.

Trenutno se za takšno oceno uporablja metoda PERT. Po njegovih predpostavkah je trajanje projekta normalno porazdeljena naključna spremenljivka `eta` s parametri:

`a=sum_(i=1)^k Meta_(i)`, (16)

`sigma=sqrt(sum_(i=1)^k D eta_(i))` . (17)

Tukaj je k število aktivnosti na kritični poti projekta; `eta_(1)` ,..., `eta_(k)` - trajanje teh opravil.

Razmislimo o prilagoditvi metode PERT ob upoštevanju dobljenih rezultatov. V tem primeru bomo predpostavili, da je trajanje projekta porazdeljeno po beta zakonu s parametroma (13) in (14).

Poskusimo dobljene rezultate v praksi. Razmislite o projektu, ki ga definira omrežni diagram, prikazan na sliki 6.

Slika 6 - Primer omrežnega diagrama

Tukaj robovi grafa označujejo opravila, uteži robov označujejo število opravil; oglišča v kvadratih - dogodki, ki označujejo začetek ali konec dela. Naj bo delo podano s trajanjemi, navedenimi v tabeli 1.

Tabela 1 - Časovne značilnosti projektnega dela

Št. dela min maks Mat. počakaj.
1 5 10 9
2 3 6 4
3 6 8 7
4 4 7 6
5 4 7 7
6 2 5 3
7 4 8 6
8 4 6 5
9 6 8 7
10 2 6 4
11 9 13 12
12 2 6 3
13 5 7 6

V zgornji tabeli je min najmanjši čas, v katerem je to delo mogoče dokončati; max - najdaljši čas; Mat. počakaj. - pričakovanje distribucije beta, ki prikazuje pričakovani čas za dokončanje tega dela.

Simulirajmo proces izvedbe projekta s pomočjo posebej razvitega simulacijskega sistema. Podrobneje je opisano v. Kot rezultat morate dobiti:

Histogrami projekta;

Ocena verjetnosti dokončanja projekta v danem intervalu na podlagi statističnih podatkov simulacijskega sistema;

Ocena verjetnosti z uporabo normalne in beta porazdelitve.

Med 10000-kratno simulacijo izvedbe projekta smo prejeli vzorec trajanja storitve, katerega histogram je prikazan na sliki 7.

Slika 7 - Histogram trajanja projekta

Očitno se videz histograma, prikazanega na sliki 7, razlikuje od grafa gostote običajnega zakona porazdelitve.

S formuli (8) in (9) poiščemo končno matematično pričakovanje in varianco. Dobimo:

`Meta=27; Deta=1,3889.`

Verjetnost padca v določen interval se izračuna z uporabo dobro znane formule:

`P(l (18)

kjer je `f_(eta)(x)` zakon porazdelitve naključne spremenljivke `eta`, l in r- meje interesnega intervala.

Izračunajmo parametre za končno beta distribucijo. Za to uporabimo formulo (13) in (14). Dobimo:

p=13,83; q=4,61.

Meje beta porazdelitve bomo določili s formulama (10) in (11). Bo imel:

Rezultati študije so predstavljeni v tabeli 2. Brez izgube splošnosti izberemo število modelnih potekov, ki je enako 10000. V stolpcu »Statistika« se izračuna verjetnost, pridobljena na podlagi statističnih podatkov. Stolpec "Normalno" predstavlja verjetnost, izračunano po zakonu normalne porazdelitve, ki se trenutno uporablja za reševanje problema. Stolpec Beta prikazuje vrednost verjetnosti, izračunano iz beta porazdelitve.

Tabela 2 – Rezultati verjetnostnih ocen

Na podlagi rezultatov, predstavljenih v tabeli 2, ter podobnih rezultatov, pridobljenih pri modeliranju procesa izvajanja drugih projektov, lahko sklepamo, da so ocene, pridobljene za aproksimacijo vsote naključnih spremenljivk (2) z beta porazdelitvijo nam omogočajo, da dobimo rešitev tega problema z večjo natančnostjo v primerjavi z obstoječimi analogi.

Namen tega dela je bil najti tak približek zakona porazdelitve vsote beta vrednosti, ki bi imel najmanjšo napako v primerjavi z drugimi analogi. Dobljeni so naslednji rezultati.

1. Eksperimentalno je bila postavljena hipoteza o možnosti približevanja vsote beta vrednosti z uporabo beta porazdelitve.

2. Razvito je programsko orodje, ki omogoča pridobivanje številčne vrednosti napake, ki nastane, ko se želena gostota aproksimira z zakonom normalne porazdelitve in beta zakonom. Ta program temelji na rekurzivnem algoritmu, ki vam omogoča številčno določitev gostote vsote beta vrednosti z dano gostoto, ki je podrobneje opisana v.

3. Postavljen je bil računalniški eksperiment, katerega namen je bil s primerjalno analizo napak v različnih pogojih določiti najboljši približek. Rezultati poskusa so pokazali izvedljivost uporabe beta porazdelitve kot najboljšega približka gostote porazdelitve vsote beta vrednosti.

4. Predstavljen je primer, v katerem so dobljeni rezultati praktičnega pomena. To so naloge vodenja projektov z naključnimi časi dokončanja za posamezna opravila. Pomemben problem pri tovrstnih nalogah je ocena tveganj, povezanih z nepravočasnim zaključkom projekta. Dobljeni rezultati omogočajo natančnejše ocene želenih verjetnosti in posledično zmanjšanje verjetnosti napak pri načrtovanju.

Bibliografija

.

- Bernoullijeva formula.

Samo distribucijo
poklical binomski.

Parametra binomske porazdelitve sta verjetnost uspeha p (q = 1 - p) in število poskusov n. Binomska porazdelitev je uporabna za opis porazdelitve binomskih dogodkov, kot je število moških in žensk v naključno izbranih podjetja. Posebej pomembna je uporaba binomske porazdelitve pri igrah.

Natančna formula za verjetnost m uspehov v n poskusih je:

kjer je p verjetnost uspeha; q je enak 1-p, q>=0, p+q =1; n - število testov, m =0,1...m

Glavne značilnosti binomske porazdelitve:

6. Poissonova formula in Poissonova porazdelitev.

Naj bo število poskusov n veliko, verjetnost p majhna in
np je majhen. Potem je mogoče verjetnost m uspehov v n poskusih približati z Poissonova formula:

.

Naključna spremenljivka z distribucijskim nizom m,
ima Poissonovo distribucijo. Večji kot je n, natančnejša je Poissonova formula. Za grobe izračune se uporablja formula za n = 10,
0 – 2, pri n = 100
0 - 3. Pri inženirskih izračunih se formula uporablja pri n = 20,
0 – 3, n=100,
0 - 7. Za natančne izračune se uporablja formula pri n = 100,
0 – 7, n=1000,
0 – 15.

Izračunajmo matematično pričakovanje in varianco naključne spremenljivke s Poissonovo porazdelitvijo.

Glavne značilnosti Poissonove naključne spremenljivke:

Poissonova porazdelitev:

7. Geometrijska porazdelitev.

Razmislite o Bernoullijevi shemi. Naj bo X število poskusov do prvega uspeha, če je verjetnost uspeha v enem poskusu p. Če je prvi test uspešen, potem je X = 0. Zato je
. Če je X = 1, tj. prvi preizkus je neuspešen, drugi pa uspešen, nato po izreku množenja
. Podobno, če je X \u003d n, potem so vsi poskusi do n-te neuspešni in
. Sestavite serijo porazdelitve naključne spremenljivke X

Naključna spremenljivka s tako porazdelitvijo ima geometrijska porazdelitev.

Preverimo normalizacijski pogoj:

8. Hipergeometrijska porazdelitev.

To je diskretna verjetnostna porazdelitev naključne spremenljivke X, ki ima cele vrednosti m = 0, 1,2,...,n z verjetnostmi:

kjer so N, M in n nenegativna cela števila in M< N, n < N.

Matematično pričakovanje hipergeometrične porazdelitve ni odvisno od N in sovpada z matematičnim pričakovanjem µ=np ustrezne binomske porazdelitve.

Disperzija hipergeometrijske porazdelitve ne presega variance binomske porazdelitve npq. Trenutki katerega koli reda hipergeometrične porazdelitve težijo k ustreznim vrednostim trenutkov binomske porazdelitve.

9. Beta distribucija.

Beta distribucija ima gostoto v obliki:

Standardna beta porazdelitev je osredotočena na interval od 0 do 1. Z uporabo linearnih transformacij lahko beta vrednost preoblikujemo tako, da zavzame vrednosti v katerem koli intervalu.

Glavne številčne značilnosti količine z beta porazdelitvijo:

Kakšna je ideja verjetnostnega sklepanja?

Prvi, najbolj naraven korak v verjetnostnem sklepanju je naslednji: če imate neko spremenljivko, ki naključno sprejema vrednosti, potem bi radi vedeli, s kakšnimi verjetnostmi ta spremenljivka prevzame določene vrednosti. Celota teh verjetnosti samo določa porazdelitev verjetnosti. Na primer, če imate kocko, lahko a priori predpostavimo, da bo z enakimi verjetnostmi 1/6 padel na kateri koli obraz. In to se zgodi pod pogojem, da je kost simetrična. Če je matrica asimetrična, je mogoče na podlagi eksperimentalnih podatkov določiti velike verjetnosti za tiste obraze, ki pogosteje izpadajo, in manjše verjetnosti za tiste obraze, ki manj pogosto izpadajo. Če nek obraz sploh ne izpade, mu lahko dodelimo verjetnost 0. To je najpreprostejši zakon verjetnosti, s katerim lahko opišete rezultate metanja kocke. Seveda gre za izjemno preprost primer, vendar se podobne težave pojavljajo na primer pri aktuarskih izračunih, ko se na podlagi realnih podatkov izračuna realno tveganje pri izdaji zavarovalne police.

V tem poglavju bomo obravnavali verjetnostne zakonitosti, ki se najpogosteje pojavljajo v praksi.

Grafe teh porazdelitev je mogoče enostavno narisati v STATISTICA.

Normalna porazdelitev

Normalna verjetnostna porazdelitev se uporablja predvsem v statistiki. Normalna porazdelitev daje dober model za resnične pojave, v katerih:

1) obstaja močna težnja po združevanju podatkov okoli centra;

2) pozitivna in negativna odstopanja od središča so enako verjetna;

3) pogostost odstopanj hitro pade, ko odstopanja od središča postanejo velika.

Mehanizem, na katerem temelji normalna porazdelitev, razložen s tako imenovanim osrednjim mejnim izrekom, lahko figurativno opišemo takole. Predstavljajte si, da imate delce cvetnega prahu, ki jih naključno vržete v kozarec vode. Če pogledate en sam delec pod mikroskopom, boste videli neverjeten pojav - delec se premika. Seveda se to zgodi, ker se molekule vode premikajo in prenašajo svoje gibanje na delce suspendiranega cvetnega prahu.

Toda kako natančno se gibanje zgodi? Tukaj je bolj zanimivo vprašanje. In to gibanje je zelo bizarno!

Na en sam delec cvetnega prahu je neskončno število neodvisnih vplivov v obliki udarcev vodnih molekul, zaradi katerih se delček premika po zelo čudni poti. Pod mikroskopom to gibanje spominja na večkratno in kaotično prekinjeno črto. Teh pregibov ni mogoče predvideti, v njih ni pravilnosti, kar natančno ustreza kaotičnim udarcem molekul na delec. Obušeni delec, ki je v naključnem trenutku doživel udarec molekule vode, spremeni smer svojega gibanja, nato se nekaj časa premika po vztrajnosti, nato pa spet pade pod udar naslednje molekule itd. V kozarcu vode je neverjeten biljard!

Ker ima gibanje molekul naključno smer in hitrost, sta tudi velikost in smer prelomov v trajektoriji povsem naključni in nepredvidljivi. Ta neverjetni pojav, imenovan Brownovo gibanje, ki so ga odkrili v 19. stoletju, nas da razmišljati o marsičem.

Če uvedemo ustrezen sistem in po nekaj trenutkih zapišemo koordinate delca, bomo dobili normalni zakon. Natančneje, premiki delca cvetnega prahu zaradi molekularnih udarcev bodo v skladu z običajnim zakonom.

Prvič je zakon gibanja takega delca, imenovan Brownov, opisal A. Einstein na fizični ravni strogosti. Nato je Lenjevan razvil preprostejši in bolj intuitiven pristop.

Matematiki 20. stoletja so tej teoriji posvetili najboljše strani, prvi korak pa je bil storjen pred 300 leti, ko je bila odkrita najpreprostejša različica osrednjega mejnega izreka.

V teoriji verjetnosti je osrednji mejni izrek, prvotno znan v formulaciji Moivra in Laplacea v 17. stoletju kot razvoj slavnega zakona velikih števil, ki ga je napisal J. Bernoulli (1654-1705) (glej J. Bernoulli (1713)). , Ars Conjectandi), je trenutno izjemno razvit in dosegel svoje višine. v sodobnem načelu invariantnosti, pri ustvarjanju katerega je ruska matematična šola igrala pomembno vlogo. V tem principu najde gibanje Brownovega delca svojo strogo matematično razlago.

Ideja je, da pri seštevanju velikega števila neodvisnih količin (vpliv molekul na delce cvetnega prahu) pod določenimi razumnimi pogoji dobimo natančno normalno porazdeljene količine. In to se zgodi neodvisno, torej nespremenljivo, od porazdelitve začetnih vrednosti. Z drugimi besedami, če na spremenljivko vpliva veliko dejavnikov, so ti učinki neodvisni, relativno majhni in se med seboj dodajajo, potem ima nastala vrednost normalno porazdelitev.

Na primer, skoraj neskončno število dejavnikov določa težo osebe (na tisoče genov, predispozicija, bolezni itd.). Tako je mogoče pričakovati normalno porazdelitev teže v populaciji vseh ljudi.

Če ste financer in igrate na borzi, potem seveda poznate primere, ko se cene delnic obnašajo kot Brownovski delci, pri čemer doživljajo kaotične vplive številnih dejavnikov.

Formalno je gostota normalne porazdelitve zapisana na naslednji način:

kjer sta a in õ 2 parametra zakona, ki se interpretirata kot srednja vrednost in varianca dane naključne spremenljivke (zaradi posebne vloge normalne porazdelitve bomo uporabili posebno simboliko za označevanje njene funkcije gostote in funkcije porazdelitve) . Vizualno je graf normalne gostote znamenita zvonasta krivulja.

Ustrezna porazdelitvena funkcija normalne naključne spremenljivke (a, x 2) je označena z Ф(x; a, x 2) in je podana z:


Normalni zakon s parametroma a = 0 in õ 2 = 1 se imenuje standardni.

Inverzna vrednost standardne normalne porazdelitve, uporabljena za vrednost z, 0

Za izračun z iz x in obratno uporabite verjetnostni kalkulator STATISTICA.

Glavne značilnosti običajnega prava:

Srednja vrednost, način, mediana: E=x mod=x med=a;

Disperzija: D=õ 2 ;

Asimetrija:

presežek:

Iz formul je razvidno, da normalno porazdelitev opisujeta dva parametra:

a - povprečna - povprečna;

õ - standardna deviacija - standardna deviacija, beri: "sigma".

Včasih z standardni odklon se imenuje standardni odklon, vendar je to že zastarela terminologija.

Tukaj je nekaj koristnih dejstev o normalni porazdelitvi.

Povprečna vrednost določa mero lokacije gostote. Gostota normalne porazdelitve je simetrična glede na povprečje. Srednja vrednost normalne porazdelitve sovpada z mediano in modo (glej grafe).

Normalna gostota porazdelitve z varianco 1 in povprečjem 1

Normalna gostota porazdelitve s povprečjem 0 in varianco 0,01

Normalna gostota porazdelitve s povprečjem 0 in varianco 4

S povečanjem disperzije se gostota normalne porazdelitve širi ali širi vzdolž osi OX, z zmanjšanjem disperzije, nasprotno, skrči in se koncentrira okoli ene točke - točke največje vrednosti, ki sovpada s povprečno vrednostjo . V omejujočem primeru ničelne variance se naključna spremenljivka degenerira in prevzame eno samo vrednost, enako povprečju.

Koristno je poznati pravila 2- in 3-sigma ali 2- in 3-standardnih deviacij, ki so povezana z normalno porazdelitvijo in se uporabljajo v različnih aplikacijah. Pomen teh pravil je zelo preprost.

Če dva in tri standardna odstopanja (2- in 3-sigma) postavimo na desno oziroma levo od povprečne točke oziroma, kar je enako, od točke največje gostote normalne porazdelitve, potem je površina pod graf normalne gostote, izračunan za ta interval, bo enak 95,45 % oziroma 99,73 % celotne površine pod grafom (preverite z verjetnostnim kalkulatorjem STATISTICA!).

Z drugimi besedami, lahko se izrazi takole: 95,45 % in 99,73 % vseh neodvisnih opazovanj normalne populacije, kot so velikosti delov ali cene delnic, leži znotraj 2- in 3-standardnih odstopanj od povprečja.

Enotna porazdelitev

Enotna porazdelitev je uporabna pri opisovanju spremenljivk, pri katerih je vsaka vrednost enako verjetna, z drugimi besedami, vrednosti spremenljivke so enakomerno porazdeljene po določenem območju.

Spodaj so formule za gostoto in porazdelitvene funkcije enotne naključne spremenljivke, ki ima vrednosti na intervalu [a, b].

Iz teh formul je enostavno razumeti, da je verjetnost, da bo enotna naključna spremenljivka prevzela vrednosti iz niza [c, d] [a, b] je enako (d - c)/(b - a).

Postavimo a=0,b=1. Spodaj je graf enotne gostote verjetnosti s središčem na intervalu.

Številčne značilnosti enotnega zakona:

Eksponentna porazdelitev

Odvijajo se dogodki, ki jih v običajnem jeziku lahko imenujemo redki. Če je T čas med pojavom redkih dogodkov, ki se pojavijo v povprečju z intenzivnostjo X, potem vrednost
T ima eksponentno porazdelitev s parametrom (lambda). Eksponentna porazdelitev se pogosto uporablja za opis intervalov med zaporednimi naključnimi dogodki, kot so intervali med obiski nepriljubljenega mesta, saj so ti obiski redki dogodki.

Ta porazdelitev ima v čast slavnega ruskega matematika A. Markova zelo zanimivo lastnost brez posledic ali, kot pravijo, lastnost Markova, ki jo je mogoče razložiti takole. Če je porazdelitev med trenutki nastanka nekaterih dogodkov okvirna, potem se porazdelitev šteje od katerega koli trenutka t do naslednjega dogodka ima tudi eksponentno porazdelitev (z istim parametrom).

Z drugimi besedami, za tok redkih dogodkov je čakalna doba za naslednjega obiskovalca vedno eksponentno porazdeljena, ne glede na to, kako dolgo ste nanj že čakali.

Eksponentna porazdelitev je povezana s Poissonovo porazdelitvijo: v časovnem intervalu enote ima število dogodkov, med katerimi so intervali neodvisni in eksponentno porazdeljeni, Poissonovo porazdelitev. Če imajo intervali med obiski mesta eksponentno porazdelitev, se število obiskov, na primer v eni uri, porazdeli po Poissonovem zakonu.

Eksponentna porazdelitev je poseben primer Weibullove porazdelitve.

Če čas ni neprekinjen, ampak diskreten, je analog eksponentne porazdelitve geometrijska porazdelitev.

Gostota eksponentne porazdelitve je opisana s formulo:

Ta porazdelitev ima samo en parameter, ki določa njene značilnosti.

Graf gostote eksponentne porazdelitve ima obliko:

Glavne numerične značilnosti eksponentne porazdelitve:

Erlangova distribucija

Ta neprekinjena porazdelitev je osredotočena na (0,1) in ima gostoto:

Matematično pričakovanje in varianca sta enaki

Erlangova distribucija je poimenovana po A. Erlangu, ki jo je prvi uporabil pri težavah v teoriji čakalnih vrst in telefoniji.

Erlangova porazdelitev s parametroma µ in n je porazdelitev vsote n neodvisnih, enako porazdeljenih naključnih spremenljivk, od katerih ima vsaka eksponentno porazdelitev s parametrom nµ

Pri n = 1, je Erlangova porazdelitev enaka eksponentni ali eksponentni porazdelitvi.

Laplaceova distribucija

Laplaceova funkcija gostote porazdelitve ali, kot jo imenujejo tudi dvojna eksponenta, se uporablja na primer za opis porazdelitve napak v regresijskih modelih. Če pogledate graf te porazdelitve, boste videli, da je sestavljena iz dveh eksponentnih porazdelitev, ki sta simetrični glede na os OY.

Če je parameter položaja 0, ima funkcija gostote Laplacea obliko:

Glavne numerične značilnosti tega zakona porazdelitve, ob predpostavki, da je parameter položaja nič, so naslednje:

V splošnem primeru ima Laplaceova porazdelitvena gostota obliko:

a - povprečje porazdelitve; b - parameter lestvice; e je Eulerjevo število (2,71...).

Gama porazdelitev

Gostota eksponentne porazdelitve ima način v točki 0, kar je včasih neprijetno za praktične aplikacije. V mnogih primerih je vnaprej znano, da način obravnavane naključne spremenljivke ni enak 0, na primer intervali med prihodi kupcev v trgovino z e-trgovino ali obiski spletnega mesta imajo izrazit način. Za modeliranje takšnih dogodkov se uporablja porazdelitev gama.

Gostota porazdelitve gama ima obliko:

kjer je Г Eulerjeva Г-funkcija, a > 0 je parameter "oblike" in b > 0 je parameter merila.

V določenem primeru imamo Erlangovo porazdelitev in eksponentno porazdelitev.

Glavne značilnosti porazdelitve gama:

Spodaj sta dve grafici gostote porazdelitve gama s parametrom skale, ki je enak 1, in parametrom oblike, enakim 3 in 5.

Uporabna lastnost porazdelitve gama: vsota poljubnega števila neodvisnih gama porazdeljenih naključnih spremenljivk (z enakim parametrom lestvice b)

(a l ,b) + (a 2 ,b) + --- +(a n ,b) prav tako sledi gama porazdelitvi, vendar s parametroma a 1 + a 2 + + a n in b.

lognormalna porazdelitev

Naključna spremenljivka h se imenuje logaritemsko normalna ali lognormalna, če njen naravni logaritem (lnh) ustreza zakonu normalne porazdelitve.

Lognormalna porazdelitev se uporablja na primer pri modeliranju spremenljivk, kot so dohodek, starost mladoporočencev ali sprejemljivo odstopanje od standarda škodljivih snovi v hrani.

Torej, če je vrednost x ima normalno porazdelitev, potem vrednost y = e x ima lognormalno porazdelitev.

Če normalno vrednost nadomestite s potenco eksponenta, lahko zlahka razumete, da je lognormalna vrednost rezultat večkratnega množenja neodvisnih spremenljivk, tako kot je običajna naključna spremenljivka rezultat večkratnih seštevkov.

Gostota lognormalne porazdelitve ima obliko:

Glavne značilnosti log-normalne porazdelitve so:


Porazdelitev hi-kvadrat

Vsota kvadratov m neodvisnih normal s povprečjem 0 in varianco 1 ima hi-kvadrat porazdelitev z m stopnjami svobode. Ta porazdelitev se najpogosteje uporablja pri analizi podatkov.

Formalno ima gostota dobro kvadratne porazdelitve z m stopnjami svobode obliko:

Z negativnim x gostota gre na 0.

Glavne številčne značilnosti porazdelitve hi-kvadrat:

Graf gostote je prikazan na spodnji sliki:

Binomna porazdelitev

Binomna porazdelitev je najpomembnejša diskretna porazdelitev, ki je skoncentrirana v le nekaj točkah. Binomska porazdelitev tem točkam pripiše pozitivne verjetnosti. Tako se binomska porazdelitev razlikuje od zveznih porazdelitev (normalne, hi-kvadrat itd.), ki individualno izbranim točkam dodelijo nič verjetnosti in se imenujejo neprekinjene.

Binomsko porazdelitev lahko bolje razumete, če upoštevate naslednjo igro.

Predstavljajte si, da mečete kovanec. Naj je verjetnost izgube grba p, verjetnost, da dobimo repe, pa je q = 1 - p (upoštevamo najbolj splošen primer, ko kovanec ni simetričen, ima na primer premaknjeno težišče - v kovancu je narejena luknja).

Zvitek z grbom se šteje za uspeh, zvitek repov pa za neuspeh. Potem ima število izpadlih grbov (ali repov) binomsko porazdelitev.

Upoštevajte, da je upoštevanje asimetričnih kovancev ali nepravilnih kock praktičnega pomena. Kot je zapisal J. Neumann v svoji elegantni knjigi "Uvodni tečaj verjetnosti in matematične statistike", ljudje že dolgo ugibajo, da je pogostost točk, ki padejo na kocko, odvisna od lastnosti same kocke in jo je mogoče umetno spremeniti. Arheologi so v faraonovi grobnici našli dva para kosti: "poštene" - z enako verjetnostjo, da izpadejo z vseh obrazov, in lažne - z namernim premikanjem težišča, kar je povečalo verjetnost izpadanja šestic.

Parametri binomske porazdelitve so verjetnost uspeha p (q = 1 - p) in število poskusov n.

Binomska porazdelitev je uporabna za opis porazdelitve binomskih dogodkov, kot je število moških in žensk v naključno izbranih podjetjih. Posebej pomembna je uporaba binomske porazdelitve pri igrah.

Natančna formula za verjetnost t uspeha v n poskusov je zapisano takole:

p-verjetnost uspeha

q je enak 1-p, q>=0, p+q==1

n - število testov, m = 0,1...m

Glavne značilnosti binomske porazdelitve:

Graf te porazdelitve za različno število poskusov n in verjetnosti uspeha p ima obliko:

Binomska porazdelitev je povezana z normalno porazdelitvijo in Poissonovo porazdelitvijo (glej spodaj); pri določenih vrednostih parametrov za veliko število testov se spremeni v te porazdelitve. To je enostavno dokazati z uporabo STATISTICA.

Na primer, upoštevamo graf binomske porazdelitve s parametri p=0,7, n=100 (glej sliko), uporabili smo STATISTICA BASIC - lahko vidite, da je graf zelo podoben gostoti normalne porazdelitve (res je!).

Graf binomske porazdelitve s parametri p=0,05, n=100 je zelo podoben Poissonovi distribucijski grafici.

Kot smo že omenili, je binomska porazdelitev nastala iz opazovanj najpreprostejše igre na srečo - metanja pravega kovanca. V mnogih situacijah ta model služi kot dober prvi približek za bolj zapletene igre in naključne procese, ki se pojavljajo pri igranju na borzi. Zanimivo je, da je bistvene značilnosti številnih zapletenih procesov mogoče razumeti iz preprostega binomskega modela.

Upoštevajte na primer naslednjo situacijo.

Zabeležimo si izgubo grba kot 1, izgubo repov pa - minus 1 in seštejemo zmage in poraze v zaporednih časovnih točkah. Grafi prikazujejo tipične poti takšne igre pri 1.000 strelih, pri 5.000 strelih in pri 10.000 strelih. Upoštevajte, kako dolga je trajektorija nad ali pod ničlo, z drugimi besedami, čas, ko je en igralec v zmagi v popolnoma pošteni igri, je zelo dolg, prehodi od zmage do poraza pa so razmeroma redki in to je težko prilagoditi v nepripravljenem umu, za katerega izraz "popolnoma poštena igra" zveni kot čarobni urok. Torej, čeprav je igra pravična glede na pogoje, obnašanje tipične poti sploh ni pošteno in ne kaže ravnovesja!

Seveda je to dejstvo empirično znano vsem igralcem in z njim je povezana strategija, ko igralec ne sme oditi z zmago, ampak je prisiljen igrati naprej.


Upoštevajte število metov, med katerimi en igralec zmaga (trajektorij nad 0), drugi pa izgubi (pot pod 0). Na prvi pogled se zdi, da je število takšnih metov približno enako. Vendar (glej fascinantno knjigo: Feller V. "Uvod v teorijo verjetnosti in njene aplikacije". Moskva: Mir, 1984, str. 106) pri 10.000 metah idealnega kovanca (torej za Bernoullijeve teste p = q = 0,5, n=10.000), je verjetnost, da bo ena od strank vodilna pri več kot 9.930 poskusih, druga pa pri manj kot 70, je večja od 0,1.

Presenetljivo je, da je pri igri z 10.000 žogi pravega kovanca verjetnost največ 8 menjav vodstva večja od 0,14, verjetnost več kot 78 menjav vodstva pa je približno 0,12.

Imamo torej paradoksalno situacijo: pri simetričnem Bernoullijevem sprehodu so lahko "valovi" na grafu med zaporednimi vrnitvami na nič (glej grafe) neverjetno dolgi. S tem je povezana še ena okoliščina, in sicer da za T n /n (delček časa, ko je graf nad osjo x) so najmanj verjetne vrednosti blizu 1/2.

Matematiki so odkrili tako imenovani arcsin zakon, po katerem za vsako 0< а <1 вероятность неравенства , где Т n - число шагов, в течение которых первый игрок находится в выигрыше, стремится к

Arcsinusna porazdelitev

Ta neprekinjena porazdelitev je osredotočena na interval (0, 1) in ima gostoto:

Porazdelitev arcsinusa je povezana z naključnim sprehodom. To je porazdelitev deleža časa, v katerem prvi igralec zmaga, ko vrže simetričen kovanec, to je kovanec, ki z enakimi verjetnostmi S pade na grb in rep. Na drug način lahko takšno igro obravnavamo kot naključni hod delca, ki, začenši od nič, naredi posamezne skoke v desno ali levo z enakimi verjetnostmi. Ker so skoki delca – izguba grba ali repa – enako verjetni, se tak hod pogosto imenuje simetričen. Če bi bile verjetnosti drugačne, bi imeli asimetričen hod.

Graf gostote porazdelitve arksinusa je prikazan na naslednji sliki:

Najbolj zanimiva je kvalitativna interpretacija grafa, iz katere je mogoče potegniti presenetljive zaključke o seriji zmag in porazov v pošteni igri. Če pogledate graf, lahko vidite, da je najmanjša gostota na točki 1/2. "Pa kaj?!" - vprašaš. Če pa pomislite na to opažanje, potem vaše presenečenje ne bo poznalo meja! Izkazalo se je, da igra, opredeljena kot poštena, v resnici ni tako poštena, kot se morda zdi na prvi pogled.

Simetrične naključne trajektorije, pri katerih delec preživi enak čas na pozitivni in negativni pol osi, torej desno ali levo od nič, so ravno najmanj verjetne. Če se obrnemo na jezik igralcev, lahko rečemo, da so pri metanju simetričnega kovanca najmanj verjetne igre, v katerih sta igralca enaka v času za zmago in izgubo.

Nasprotno, najverjetnejše so igre, v katerih je verjetnost za zmago enega igralca veliko večja, za drugega pa poraženca. Neverjeten paradoks!

Za izračun verjetnosti, da je del časa t, v katerem zmaga prvi igralec, med t1 do t2, je potrebno iz vrednosti porazdelitvene funkcije F(t2) odštejemo vrednost porazdelitvene funkcije F(t1).

Formalno dobimo:

P(t1

Na podlagi tega dejstva lahko s pomočjo STATISTICA izračunamo, da pri 10.000 korakih delec ostane na pozitivni strani več kot 9930-krat z verjetnostjo 0,1, to je, grobo rečeno, takšno stanje bomo opazili vsaj v enem primeru od desetih (čeprav se na prvi pogled zdi absurdno; glej izjemno jasno opombo Yu. V. Prokhorova "Bernoullijevo potepanje" v enciklopediji "Verjetnost in matematična statistika", str. 42-43, M .: Velika ruska enciklopedija, 1999).

Negativna binomska porazdelitev

To je diskretna distribucija, ki dodeljuje cele točke k = 0,1,2,... verjetnosti:

p k =P(X=k)=C k r+k-1 p r (l-p) k ", kjer je 0<р<1,r>0.

Negativno binomsko porazdelitev najdemo v številnih aplikacijah.

V celoti r > 0 negativna binomska porazdelitev se razlaga kot porazdelitev čakalne dobe r-tega "uspeha" v Bernoullijevi poskusni shemi z verjetnostjo "uspeha" p, na primer število zvitkov, ki jih je treba narediti, preden se zvije drugi grb, v tem primeru se včasih imenuje Pascal porazdelitev in je diskretni analog porazdelitve gama.

Pri r = 1 je negativna binomska porazdelitev enaka geometrijski porazdelitvi.

Če je Y naključna spremenljivka, ki ima Poissonovo porazdelitev z naključnim parametrom, ta pa ima porazdelitev gama z gostoto

Da bo U imelo negativno binomsko porazdelitev s parametri;

Poissonova porazdelitev

Poissonova porazdelitev se včasih imenuje porazdelitev redkih dogodkov. Primeri spremenljivk, porazdeljenih po Poissonovem zakonu, so: število nesreč, število napak v proizvodnem procesu itd. Poissonova porazdelitev je določena s formulo:

Glavne značilnosti Poissonove naključne spremenljivke:

Poissonova porazdelitev je povezana z eksponentno porazdelitvijo in z Bernoullijevo porazdelitvijo.

Če ima število dogodkov Poissonovo porazdelitev, imajo intervali med dogodki eksponentno ali eksponentno porazdelitev.

Poissonova porazdelitev:

Primerjaj graf Poissonove porazdelitve s parametrom 5 z grafom Bernoullijeve porazdelitve pri p=q=0,5, n=100.

Videli boste, da so si grafi zelo podobni. V splošnem primeru obstaja naslednja pravilnost (glej na primer odlično knjigo: Shiryaev AN "Verjetnost". Moskva: Nauka, str. 76): če v Bernoullijevih testih n prevzame velike vrednosti, in verjetnost uspeha /? je relativno majhno, tako da povprečno število uspehov (produkt in nar) ni ne majhno ne veliko, potem lahko Bernoullijevo porazdelitev s parametri n, p nadomestimo s Poissonovo porazdelitvijo s parametrom = np.

Poissonova porazdelitev se v praksi pogosto uporablja, na primer v grafikonih za nadzor kakovosti kot porazdelitev redkih dogodkov.

Kot drug primer upoštevajte naslednji problem, povezan s telefonskimi linijami in vzet iz prakse (glej: V. Feller. Uvod v teorijo verjetnosti in njene aplikacije. Moskva: Mir, 1984, str. 205, in tudi Molina E. S. (1935 ) Verjetnost v tehniki, Elektrotehnika, 54, str. 423-427, monografija tehničnih publikacij Bell Telephone System B-854). To nalogo je mogoče enostavno prevesti v sodoben jezik, na primer v jezik mobilnih komunikacij, k čemur vabimo zainteresirane bralce.

Naloga je oblikovana na naslednji način. Naj bosta dve telefonski centrali - A in B.

Telefonska centrala A mora zagotoviti povezavo 2.000 naročnikov s centralo B. Kakovost komunikacije mora biti taka, da le 1 klic od 100 čaka, da se linija sprosti.

Vprašanje je: koliko telefonskih linij je treba položiti, da se zagotovi dana kakovost komunikacije? Očitno je neumno ustvariti 2000 vrstic, saj bodo mnoge od njih še dolgo brezplačnih. Iz intuitivnih premislekov je jasno, da očitno obstaja nekaj optimalnega števila vrstic N. Kako izračunati to število?

Začnimo z realističnim modelom, ki opisuje intenzivnost dostopa naročnika do omrežja, pri čemer je treba opozoriti, da je točnost modela seveda mogoče preveriti s standardnimi statističnimi kriteriji.

Predpostavimo torej, da vsak naročnik uporablja linijo povprečno 2 minuti na uro in so povezave naročnikov neodvisne (vendar, kot pravilno ugotavlja Feller, se slednje zgodi, razen če se zgodi kakšen dogodek, ki vpliva na vse naročnike, na primer vojna ali orkan).

Potem imamo 2000 Bernoullijevih poskusov (metov kovanca) ali omrežnih povezav z verjetnostjo uspeha p=2/60=1/30.

Takšen N moramo poiskati, ko verjetnost, da se v omrežje poveže več kot N uporabnikov hkrati, ne presega 0,01. Te izračune je mogoče enostavno rešiti v sistemu STATISTICA.

Reševanje težav na STATISTICA.

Korak 1. Odprite modul Osnovna statistika. Ustvarite datoteko binoml.sta, ki vsebuje 110 opazovanj. Poimenujte prvo spremenljivko BINOMIALNO, druga spremenljivka - POISSON.

2. korak BINOMIALNO, Odprite okno Spremenljivka 1(glej sliko). V okno vnesite formulo, kot je prikazano na sliki. Kliknite gumb v redu.


3. korak Dvokliknite na glavo POISSON, Odprite okno Spremenljivka 2(glej sliko.)

V okno vnesite formulo, kot je prikazano na sliki. Upoštevajte, da izračunamo parameter Poissonove porazdelitve s formulo =n×p. Torej = 2000 × 1/30. Kliknite gumb v redu.


STATISTICA bo izračunala verjetnosti in jih zapisala v ustvarjeno datoteko.

4. korak Pomaknite se navzdol do opazovanja številka 86. Videli boste, da je verjetnost, da 86 ali več od 2000 uporabnikov omrežja hkrati dela v eni uri, 0,01347, če uporabite binomsko porazdelitev.

Verjetnost, da hkrati dela 86 ali več ljudi od 2000 uporabnikov omrežja, je 0,01293, če uporabimo Poissonov približek za binomsko porazdelitev.

Ker ne potrebujemo verjetnosti, ki ni večja od 0,01, bo 87 vrstic dovolj za zagotavljanje želene kakovosti komunikacije.

Tesne rezultate je mogoče dobiti z uporabo normalnega približka za binomsko porazdelitev (preverite!).

Upoštevajte, da V. Feller ni imel na voljo sistema STATISTICA in je uporabljal tabele za binomsko in normalno porazdelitev.

Z istim sklepanjem lahko rešimo naslednji problem, ki ga je razpravljal V. Feller. Preveriti je treba, ali je za zanesljivo oskrbo uporabnikov potrebnih več ali manj linij, ko so ti razdeljeni v 2 skupini po 1000 oseb.

Izkazalo se je, da bo pri delitvi uporabnikov v skupine potrebnih dodatnih 10 vrstic za doseganje enake ravni kakovosti.

Upoštevate lahko tudi spremembo intenzivnosti omrežne povezave čez dan.

Geometrijska porazdelitev

Če se izvajajo neodvisni Bernoullijevi poskusi in se šteje število poskusov do naslednjega "uspeha", potem ima to število geometrijsko porazdelitev. Če torej vržete kovanec, je število metanj, ki jih morate izvesti, preden naslednji grb pade ven, upošteva geometrijski zakon.

Geometrijska porazdelitev je določena s formulo:

F(x) = p(1-p) x-1

p - verjetnost uspeha, x = 1, 2,3...

Ime distribucije je povezano z geometrijsko progresijo.

Geometrijska porazdelitev torej določa verjetnost, da se uspeh zgodi na določenem koraku.

Geometrijska porazdelitev je diskretni analog eksponentne porazdelitve. Če se čas spremeni s kvanti, potem je verjetnost uspeha v vsakem trenutku opisana z geometrijskim zakonom. Če je čas neprekinjen, potem je verjetnost opisana z eksponentnim ali eksponentnim zakonom.

Hipergeometrijska porazdelitev

To je diskretna verjetnostna porazdelitev naključne spremenljivke X, ki ima cele vrednosti m = 0, 1,2,...,n z verjetnostmi:

kjer so N, M in n nenegativna cela števila in M< N, n < N.

Hipergeometrična porazdelitev je običajno povezana z izbiro brez zamenjave in določa, na primer, verjetnost, da se v naključnem vzorcu velikosti n najde natančno m črnih kroglic iz splošne populacije, ki vsebuje N kroglic, med katerimi je M črnih in N - M belih (glej, na primer, enciklopedijo "Verjetnost in matematična statistika", M.: Velika ruska enciklopedija, str. 144).

Matematično pričakovanje hipergeometrične porazdelitve ni odvisno od N in sovpada z matematičnim pričakovanjem µ=np ustrezne binomske porazdelitve.

Disperzija hipergeometrijske porazdelitve ne presega variance binomske porazdelitve npq. Pri , trenutki katerega koli reda hipergeometrične porazdelitve težijo k ustreznim vrednostim trenutkov binomske porazdelitve.

Ta porazdelitev je zelo pogosta pri nalogah nadzora kakovosti.

Polinomska porazdelitev

Polinomska ali večnomska porazdelitev seveda posplošuje porazdelitev. Če pride do binomske porazdelitve, ko se kovanec vrže z dvema izidoma (palica ali grb), potem pride do polinomske porazdelitve, ko je kovanec vržen in obstajata več kot dva možna izida. Formalno je to skupna verjetnostna porazdelitev naključnih spremenljivk X 1 ,...,X k , ki vzamejo nenegativne cele vrednosti n 1 ,...,nk , ki izpolnjujejo pogoj n 1 + ... + nk = n, z verjetnostmi:

Ime "polinomska porazdelitev" je razloženo z dejstvom, da se pri dekompoziciji polinoma (p 1 + ... + p k) n pojavijo večnomske verjetnosti.

Beta distribucija

Beta distribucija ima gostoto v obliki:


Standardna beta porazdelitev je osredotočena na interval od 0 do 1. Z uporabo linearnih transformacij lahko beta vrednost preoblikujemo tako, da zavzame vrednosti v katerem koli intervalu.

Glavne številčne značilnosti količine z beta porazdelitvijo:


Porazdelitev ekstremnih vrednosti

Porazdelitev ekstremnih vrednosti (tip I) ima gostoto v obliki:

To porazdelitev včasih imenujemo tudi porazdelitev robov.

Porazdelitev ekstremnih vrednosti se uporablja pri modeliranju ekstremnih dogodkov, kot so poplavne ravni, vrtinčne hitrosti, najvišji borzni indeksi v določenem letu itd.

Ta porazdelitev se uporablja v teoriji zanesljivosti, na primer za opis časa okvare električnih vezij, pa tudi v aktuarskih izračunih.

Rayleighove distribucije

Rayleighova porazdelitev ima gostoto v obliki:

kjer je b parameter merila.

Rayleighova porazdelitev je koncentrirana v intervalu od 0 do neskončnosti. Namesto vrednosti 0, STATISTICA vam omogoča, da vnesete drugo vrednost za parameter praga, ki se bo odštela od prvotnih podatkov pred prilagajanjem Rayleighove porazdelitve. Zato mora biti vrednost mejnega parametra manjša od vseh opazovanih vrednosti.

Če sta dve spremenljivki y 1 in y 2 neodvisni druga od druge in sta normalno porazdeljeni z enako varianco, potem je spremenljivka bo imela Rayleighovo distribucijo.

Rayleighova porazdelitev se uporablja na primer v teoriji streljanja.


Weibullova distribucija

Weibullova distribucija je poimenovana po švedskem raziskovalcu Waloddiju Weibullu, ki je to distribucijo uporabil za opis različnih vrst časov okvare v teoriji zanesljivosti.

Formalno je Weibullova gostota porazdelitve zapisana kot:

Včasih je gostota Weibullove porazdelitve zapisana tudi kot:

B - parameter lestvice;

С - parameter obrazca;

E - Eulerjeva konstanta (2,718...).

Parameter položaja. Običajno je Weibullova porazdelitev osredotočena na polovično črto od 0 do neskončnosti. Če namesto meje 0 uvedemo parameter a, ki je v praksi pogosto potreben, se pojavi tako imenovana triparametrska Weibullova porazdelitev.

Weibullova distribucija se široko uporablja v teoriji zanesljivosti in zavarovanju.

Kot je opisano zgoraj, se eksponentna porazdelitev pogosto uporablja kot model za ocenjevanje časa do okvare ob predpostavki, da je verjetnost okvare predmeta konstantna. Če se verjetnost napake sčasoma spremeni, se uporabi Weibullova porazdelitev.

Pri c =1 ali, v drugi parametrizaciji, ko Weibullova porazdelitev, kot je enostavno razbrati iz formul, preide v eksponentno porazdelitev, ko pa - v Rayleighovo porazdelitev.

Razvite so bile posebne metode za ocenjevanje parametrov Weibullove distribucije (glej na primer knjigo: Lawless (1982) Statistical models and methods for lifetime data, Belmont, CA: Lifetime Learning, ki opisuje metode ocenjevanja, kot tudi probleme ki nastanejo pri ocenjevanju parametra položaja za triparametrsko porazdelitev Weibull).

Pogosto je treba pri izvajanju analize zanesljivosti upoštevati verjetnost okvare v majhnem časovnem intervalu po časovni točki t pod pogojem, da pred trenutkom t do okvare ni prišlo.

Takšna funkcija se imenuje funkcija tveganja ali funkcija stopnje okvare in je formalno opredeljena na naslednji način:

H(t) - funkcija stopnje okvare ali funkcija tveganja v času t;

f(t) - porazdelitev gostote časov okvare;

F(t) - porazdelitvena funkcija časov okvare (integral gostote v intervalu ).

Na splošno je funkcija stopnje odpovedi zapisana na naslednji način:

Ko je funkcija tveganja enaka konstanti, kar ustreza normalnemu delovanju naprave (glej formule).

Ko , se funkcija tveganja zmanjša, kar ustreza utekanju naprave.

Ko , se funkcija tveganja zmanjša, kar ustreza staranju naprave. Tipične funkcije tveganja so prikazane na grafu.


Spodaj so grafikoni gostote Weibullove porazdelitve z različnimi parametri. Pozorni morate biti na tri razpone vrednosti parametra a:

V prvem območju se funkcija tveganja zmanjša (obdobje nastavitve), v drugem območju je funkcija tveganja konstantna, v tretjem pa se poveča.

Na primeru nakupa novega avtomobila lahko enostavno razumete, kaj je bilo povedano: najprej je obdobje prilagajanja avtomobila, nato dolgo obdobje normalnega delovanja, nato se avtomobilski deli obrabijo in poveča se tvegana funkcija njegove okvare. ostro.

Pomembno je, da lahko vsa obdobja delovanja opišemo z isto družino distribucij. To je ideja za distribucijo Weibull.


Naj predstavimo glavne numerične značilnosti Weibullove porazdelitve.


Paretova distribucija

V različnih problemih uporabne statistike so precej pogoste tako imenovane okrnjene distribucije.

Ta porazdelitev se na primer uporablja v zavarovalništvu ali obdavčitvi, ko gre za dohodke iz obresti, ki presegajo določeno vrednost c 0

Glavne numerične značilnosti Pareto porazdelitve:


Logistična distribucija

Logistična distribucija ima funkcijo gostote:

A - parameter položaja;

B - parameter lestvice;

E je Eulerjevo število (2,71...).


Hotellinga T 2 -distribucija

Ta neprekinjena porazdelitev s središčem na intervalu (0, r) ima gostoto:

kjer so parametri n in k, n>_k>_1, se imenujeta svobodni stopnji.

Pri k = 1 Hotelling P-distribucija se reducira na Studentovo porazdelitev in za k >1 lahko obravnavamo kot posplošitev Studentove t-razdelitve za multivariatni primer.

Hotellingova porazdelitev je sestavljena iz normalne porazdelitve.

Naj ima k-dimenzionalni naključni vektor Y normalno porazdelitev z ničelnim srednjim vektorjem in matriko kovariance.

Upoštevajte količino

kjer so naključni vektorji Z i neodvisni drug od drugega in Y in so porazdeljeni na enak način kot Y.

Potem ima naključna spremenljivka T 2 =Y T S -1 Y T 2 -Hotellingovo porazdelitev z n stopnjami svobode (Y je vektor stolpcev, T je transpozicijski operater).

kjer je naključna spremenljivka t n ima Studentovo distribucijo z n stopnjami svobode (glej Verjetnost in matematična statistika, Enciklopedija, str. 792).

Če ima Y normalno porazdelitev s povprečjem, ki ni nič, se pokliče ustrezna porazdelitev necentralni Hotelling T 2 -distribucija z n stopnjami svobode in parametrom necentralnosti v.

Hotellingova T 2 -distribucija se v matematični statistiki uporablja v enaki situaciji kot Študentova ^-distribucija, vendar le v multivariantnem primeru. Če so rezultati opazovanj X 1 ,..., X n neodvisni, normalno porazdeljeni naključni vektorji s srednjim vektorjem µ in nesingularno kovariančno matriko , potem statistika


ima Hotelling T 2 -distribucijo z n - 1 svobodne stopnje. To dejstvo je osnova hotelskega kriterija.

V STATISTICA je test Hotelling na voljo na primer v modulu Osnovna statistika in tabele (glejte spodnje pogovorno okno).


Maxwellova distribucija

Maxwellova porazdelitev je nastala v fiziki pri opisovanju porazdelitve hitrosti molekul idealnega plina.

Ta neprekinjena porazdelitev je osredotočena na (0, ) in ima gostoto:

Funkcija distribucije ima obliko:

kjer je Ф(x) - standardna normalna porazdelitvena funkcija. Maxwellova porazdelitev ima pozitivno poševnost in en sam način na točki (to pomeni, da je porazdelitev unimodalna).

Maxwellova porazdelitev ima končne trenutke katerega koli reda; matematično pričakovanje in varianca sta enaki in

Maxwellova porazdelitev je naravno povezana z normalno porazdelitvijo.

Če so X 1 , X 2 , X 3 neodvisne naključne spremenljivke z normalno porazdelitvijo s parametroma 0 in õ 2 , potem je naključna spremenljivka ima Maxwellovo distribucijo. Tako lahko Maxwellovo porazdelitev obravnavamo kot porazdelitev dolžine naključnega vektorja, katerega koordinate v kartezijanskem koordinatnem sistemu v tridimenzionalnem prostoru so neodvisne in normalno porazdeljene s povprečjem 0 in varianco õ 2 .

Cauchyjeva porazdelitev

Ta neverjetna porazdelitev včasih nima srednje vrednosti, ker se njena gostota zelo počasi nagiba k nič, ko se x poveča v absolutni vrednosti. Takšne distribucije imenujemo distribucije s težkimi repi. Če morate pripraviti distribucijo, ki nima srednje vrednosti, takoj pokličite distribucijo Cauchy.

Cauchyjeva porazdelitev je unimodalna in simetrična glede na način, ki je hkrati mediana in ima funkcijo gostote v obliki:

kje c > 0 - parameter lestvice in a je osrednji parameter, ki hkrati določa vrednosti načina in mediane.

Integral gostote, to je porazdelitvena funkcija, je podana z:

Distribucija študentov

Angleški statistik W. Gosset, znan pod psevdonimom »Študent« in ki je svojo kariero začel s statistično študijo kakovosti angleškega piva, je leta 1908 prejel naslednji rezultat. Pustiti x 0 , x 1 ,.., x m - neodvisno, (0, s 2) - normalno porazdeljene naključne spremenljivke:


Ta porazdelitev, zdaj znana kot Študentova distribucija (skrajšano kot t(m) -distribucija, kjer je m število stopenj svobode), je podlaga za slavni t-test, zasnovan za primerjavo povprečij dveh populacij.

Funkcija gostote f t (x) ni odvisna od variance õ 2 naključnih spremenljivk, poleg tega pa je unimodalna in simetrična glede na točko x = 0.

Glavne numerične značilnosti Študentove distribucije:

Porazdelitev t je pomembna, če se upoštevajo ocene srednje vrednosti in je varianca vzorca neznana. V tem primeru se uporabita vzorčna varianca in t-razdelitev.

Za velike stopnje svobode (večje od 30) t-razdelitev praktično sovpada s standardno normalno porazdelitvijo.

Graf funkcije gostote porazdelitve t se deformira, ko se število stopenj svobode poveča na naslednji način: vrh se poveča, repi gredo bolj strmo proti 0 in zdi se, da se graf funkcije gostote porazdelitve t bočno skrči.


F porazdelitev

Razmislite m 1 + m 2 neodvisne in (0, s 2) normalno porazdeljene količine

in dal

Očitno lahko isto naključno spremenljivko definiramo tudi kot razmerje dveh neodvisnih in ustrezno normaliziranih hi-kvadrat porazdeljenih spremenljivk in , t.j.

Slavni angleški statistik R. Fisher je leta 1924 pokazal, da je gostota verjetnosti naključne spremenljivke F(m 1 , m 2) podana s funkcijo:


kjer je r(y) vrednost Eulerjeve gama funkcije. točka y, sam zakon pa se imenuje F-razdelitev s številom svobodnih stopenj števca in imenovalca, ki sta enaka m, l m7

Glavne numerične značilnosti F-distribucije:


F-distribucija se pojavlja pri diskriminantni, regresijski in variančni analizi, pa tudi pri drugih vrstah multivariatne analize podatkov.