Distribucija beta. Približevanje zakona porazdelitve vsote naključnih spremenljivk, porazdeljenih po zakonu beta Generiranje naključnih števil in ocena parametrov
Razmislite o distribuciji beta, izračunajte njena matematična pričakovanja, varianco in način. S funkcijo MS EXCEL BETA.DIST () bomo narisali grafe porazdelitvene funkcije in gostoto verjetnosti. Ustvarimo matriko naključne številke in ocenite parametre distribucije.
Distribucija betaBeta- distribucijo) odvisno od dveh parametrov: α ( alfa)> 0(določa obliko porazdelitve) in b (beta)> 0(določa obseg).
Za razliko od mnogih drugih neprekinjenih porazdelitev ima obseg variacije naključne spremenljivke Distribucija beta, je omejen s segmentom. Zunaj tega segmenta gostota porazdelitve enako 0. Meje tega segmenta določi raziskovalec glede na problem. Če je A = 0 in B = 1, potem je tako Distribucija beta imenovano standard.
Distribucija beta ima oznako Beta(alfa; beta).
Opomba: Če so parametri alfa in beta= 1, potem Distribucija beta se spremeni v t.j. Beta (1; 1; A; B) = U (A; B).
Na splošno distribucijska funkcija ni mogoče izraziti v osnovnih funkcijah, zato se izračuna z numeričnimi metodami, na primer z uporabo funkcije MS EXCEL BETA.DIST ().
Opomba: Za lažje zapisovanje formul v primer datoteko za parametre distribucije alfa in beta ustvaril ustrezno.
Primer datoteke vsebuje tudi grafikone gostota verjetnosti in distribucijske funkcije z označenimi vrednostmi srednji, in.
Generiranje naključnih števil in ocena parametrov
Uporaba inverzna porazdelitvena funkcija(ali količinske vrednosti ( str- kvantil), glej) lahko ustvarite vrednosti naključne spremenljivke z Distribucija beta... Če želite to narediti, morate uporabiti formulo:
BETA.OBR (RAND (); alfa; beta; A; B)
NASVET: Ker naključna števila se ustvarijo s funkcijo RAND (), nato pa pritisnemo tipko F9, je mogoče vsakič dobiti nov vzorec in s tem novo oceno parametrov.
Funkcija RAND () generira od 0 do 1, kar natančno ustreza razponu variacije verjetnosti (glej. primer ustvarjanja lista datotek).
Zdaj imamo niz naključnih števil, ustvarjenih z danimi parametri distribucije alfa in beta(naj bo 200), ocenimo parametre distribucije.
Ocena parametrov alfa in beta je mogoče narediti s metoda trenutkov(predpostavlja se, da sta parametra A in B znana):
Prvi, najbolj naraven korak pri verjetnostnem razmišljanju je naslednji: če imate neko spremenljivko, ki vzame vrednosti naključno, potem bi radi vedeli, s kakšnimi verjetnostmi ta spremenljivka prevzame določene vrednosti. Kombinacija teh verjetnosti je ravno tisto, kar določa porazdelitev verjetnosti. Na primer s kocko lahko a priori domnevati, da bo z enakimi verjetnostmi 1/6 padla na kateri koli rob. In to se zgodi pod pogojem, da je kost simetrična. Če je kost asimetrična, je mogoče na podlagi eksperimentalnih podatkov določiti visoko verjetnost za tiste obraze, ki izpadajo pogosteje, in nižjo verjetnost za tiste obraze, ki izpadajo manj pogosto. Če kakšen rob sploh ne izpade, mu lahko dodelimo verjetnost 0. To je najpreprostejši verjetnostni zakon, s katerim lahko opišemo rezultate metanja kocke. Seveda je to izredno preprost primer, vendar se podobne težave pojavljajo na primer pri aktuarskih izračunih, ko se realno tveganje izračuna na podlagi realnih podatkov pri izdaji zavarovalne police.
V tem poglavju bomo pogledali najpogostejše verjetnostne zakone v praksi.
Te distribucije je mogoče zlahka narisati v STATISTICI.
Normalna porazdelitev
Normalna porazdelitev verjetnosti se še posebej pogosto uporablja v statistiki. Normalna porazdelitev daje dober model za pojav v resničnem svetu, v katerem:
1) obstaja močna težnja po zbiranju podatkov okoli središča;
2) pozitivna in negativna odstopanja od središča so enako verjetna;
3) pogostost odstopanj se hitro zmanjša, ko odstopanja od središča postanejo velika.
Mehanizem, na katerem temelji normalna porazdelitev, razložen z uporabo tako imenovanega osrednjega mejnega izreka, lahko figurativno opišemo na naslednji način. Predstavljajte si, da imate delce cvetnega prahu, ki ste jih naključno vrgli v kozarec vode. Če pogledate posamezen delček pod mikroskopom, boste videli neverjeten pojav - delci se premikajo. Seveda se to zgodi, ker se molekule vode premikajo in svoje gibanje prenašajo na delce suspendiranega cvetnega prahu.
Kako pa točno poteka gibanje? Tukaj je bolj zanimivo vprašanje. In to gibanje je zelo bizarno!
Obstaja neskončno število neodvisnih vplivov na posamezen delček cvetnega prahu v obliki udarcev molekul vode, zaradi katerih se delci premikajo po zelo čudni poti. Pod mikroskopom to gibanje spominja na črto, ki je večkrat in kaotično prelomljena. Teh prelomov ni mogoče predvideti, v njih ni pravilnosti, ki natančno ustreza kaotičnim trkom molekul na delcu. Suspendirani delec, ki je v naključnem trenutku doživel vpliv molekule vode, spremeni smer gibanja, nato se nekaj časa premika po vztrajnosti, nato spet pade pod vpliv naslednje molekule itd. V kozarcu vode je biljard!
Ker ima gibanje molekul naključno smer in hitrost, sta tudi velikost in smer zlomov v poti popolnoma naključni in nepredvidljivi. Ta neverjeten pojav, imenovan Brownovo gibanje, odkrit v 19. stoletju, nas sprašuje v razmišljanje o marsičem.
Če uvedemo ustrezen sistem in v določenih trenutkih označimo koordinate delca, bomo dobili normalen zakon. Natančneje, premiki delcev cvetnega prahu, ki nastanejo zaradi udarca molekul, bodo v skladu z običajnim zakonom.
Prvič je zakon gibanja takega delca, imenovan Brownov, na fizični ravni strogosti opisal A. Einstein. Nato je Lenjevan razvil enostavnejši in bolj intuitiven pristop.
Matematiki 20. stoletja, posvečeni tej teoriji najboljše strani, prvi korak pa je bil narejen pred 300 leti, ko je bila odkrita najpreprostejša različica osrednjega mejnega izreka.
V teoriji verjetnosti je osrednji mejni izrek, prvotno znan v formulaciji Moivreja in Laplacea v 17. stoletju kot razvoj slavnega zakona velikih števil J. Bernoullija (1654-1705) (glej J. Bernoulli (1713), Ars Conjectandi), je zdaj izjemno razvit in dosegel svoje višine. v sodobnem načelu invariance, pri nastanku katerega je bistveno vlogo igrala ruska matematična šola. V tem načelu najde gibanje Brownovega delca svojo strogo matematično razlago.
Ideja je, da ko se v določenih razumnih pogojih sešteje veliko število neodvisnih količin (vpliv molekul na delce cvetnega prahu), dobijo ravno normalno porazdeljene količine. In to se zgodi neodvisno, torej invariantno, od porazdelitve začetnih vrednosti. Z drugimi besedami, če na spremenljivko vpliva veliko dejavnikov, so ti vplivi neodvisni, sorazmerno majhni in se seštevajo, potem ima nastala vrednost normalno porazdelitev.
Na primer, skoraj neskončno število dejavnikov določa težo osebe (na tisoče genov, nagnjenost, bolezni itd.). Tako je mogoče pričakovati normalno porazdelitev teže v populaciji vseh ljudi.
Če ste financer in igrate na borzi, se seveda zavedate primerov, ko se cene delnic obnašajo kot Brownovi delci, pri čemer doživljajo kaotične vplive številnih dejavnikov.
Formalno je gostota normalne porazdelitve zapisana na naslednji način:
![](https://i2.wp.com/hr-portal.ru/statistica/gl3/gl3-3.jpg)
kjer sta a in x 2 parametra zakona, ki se razlagata kot srednja vrednost in varianca dane naključne spremenljivke (glede na posebno vlogo normalne porazdelitve bomo za označevanje njene funkcije gostote uporabili poseben zapis in distribucijska funkcija). Vizualno je graf normalne gostote znana zvonasta krivulja.
Ustrezna porazdelitvena funkcija normalne naključne spremenljivke (a, x 2) je označena s Ф (x; a, x 2) in je podana z razmerjem:
![](https://i2.wp.com/hr-portal.ru/statistica/gl3/gl3-4.jpg)
Normalni zakon s parametri a = 0 in x 2 = 1 se imenuje standard.
Obratna standardna normalna porazdelitvena funkcija, uporabljena za z, 0 Z verjetnostnim kalkulatorjem STATISTICA izračunajte z iz x in obratno. Osnovne značilnosti običajnega prava: Povprečje, način, mediana: E = x mod = x med = a; Disperzija: D = х 2; Asimetrija: Presežek: Iz formul je razvidno, da normalno porazdelitev opisujeta dva parametra: a - povprečno - povprečje; õ - odstopanje od stožca - standardni odklon, beri: "sigma". Včasih s standardni odklon imenujemo standardni odklon, vendar je to že zastarela terminologija. Tu je nekaj koristnih dejstev o normalni distribuciji. Povprečna vrednost določa merilo porazdelitve gostote. Normalna porazdelitvena gostota je simetrična glede na srednjo vrednost. Povprečje normalne porazdelitve sovpada z mediano in načinom (glej grafe). Normalna porazdelitvena gostota z variacijo 1 in povprečjem 1 Normalna porazdelitvena gostota s povprečjem 0 in varianco 0,01 Normalna porazdelitvena gostota s povprečjem 0 in varianco 4 S povečanjem variance se gostota normalne porazdelitve širi ali širi vzdolž osi OX; z zmanjšanjem variance pa se nasprotno krči, koncentrira okoli ene točke - točke največje vrednosti, ki sovpada s povprečjem vrednost. V omejevalnem primeru ničelne variance naključna vrednost degenerira in prevzame eno samo vrednost, ki je enaka srednji vrednosti. Koristno je poznati pravila 2- in 3-sigma ali 2- in 3 standardna odstopanja, ki so povezana z normalno porazdelitvijo in se uporabljajo v različnih aplikacijah. Pomen teh pravil je zelo preprost. Če sta dva in tri standardna odstopanja (2- in 3-sigma) nastavljeni desno in levo od točke povprečja ali, kar je enako, od točke največje gostote normalne porazdelitve, potem površina v grafu normalne gostote, izračunana v tem intervalu, bo enaka 95,45% oziroma 99,73% celotne površine pod grafom (preverite na verjetnostnem kalkulatorju STATISTICA!). Z drugimi besedami, to lahko izrazimo na naslednji način: 95,45% in 99,73% vseh neodvisnih opazovanj normalne populacije, na primer velikost dela ali cena delnice, ležijo v območju 2 in 3 standardnih odstopanj od povprečja. Enakomerna distribucija Enotna porazdelitev je uporabna pri opisovanju spremenljivk, pri katerih je vsaka vrednost enako verjetna, z drugimi besedami, vrednosti spremenljivke so na nekem področju enakomerno porazdeljene. Spodaj so formule za gostoto in funkcijo porazdelitve enotne naključne spremenljivke, ki ima vrednosti na intervalu [a, b]. Iz teh formul je enostavno razumeti, da je verjetnost, da bo enotna naključna spremenljivka vzela vrednosti iz niza [c, d] [a, b] je enako (d - c) / (b - a). Postavili smo a = 0, b = 1. Spodaj je grafikon enotne gostote verjetnosti s središčem na segmentu. Numerične značilnosti enotnega zakona: Eksponentna porazdelitev Obstajajo dogodki, ki jih v običajnem jeziku lahko imenujemo redki. Če je T čas med začetkom redkih dogodkov, ki se v povprečju pojavijo z intenzivnostjo X, potem vrednost Ta porazdelitev ima zelo zanimivo lastnost odsotnosti posledic ali, kot pravijo, lastnine Markov v čast slavnega ruskega matematika A. A. Markova, kar je mogoče razložiti na naslednji način. Če je porazdelitev med trenutki pojava nekaterih dogodkov okvirna, potem se porazdelitev šteje od vsakega trenutka t do naslednjega dogodka ima tudi eksponentno porazdelitev (z istim parametrom). Z drugimi besedami, za tok redkih dogodkov je čakalna doba za naslednjega obiskovalca vedno eksponentno porazdeljena, ne glede na to, kako dolgo ste ga že čakali. Eksponentna porazdelitev je povezana s Poissonovo porazdelitvijo: v časovnem intervalu na enoto ima število dogodkov, med katerimi so intervali neodvisni in eksponentno porazdeljeni, Poissonovo porazdelitev. Če imajo intervali med obiski spletnega mesta eksponentno porazdelitev, se število obiskov, na primer v eni uri, porazdeli po Poissonovem zakonu. Eksponentna porazdelitev je poseben primer Weibullove porazdelitve. Če čas ni neprekinjen, ampak diskreten, je analog eksponentne porazdelitve geometrijska porazdelitev. Gostota eksponentne porazdelitve je opisana s formulo: Ta porazdelitev ima samo en parameter, ki določa njegove značilnosti. Graf gostote eksponentne porazdelitve izgleda tako: Glavne numerične značilnosti eksponentne porazdelitve: Porazdelitev Erlang Ta neprekinjena porazdelitev je osredotočena na (0,1) in ima gostoto: Matematična pričakovanja in varianca so enaki Porazdelitev Erlang je poimenovana po A. Erlangu, ki jo je prvi uporabil pri težavah v teoriji čakalnih vrst in telefonije. Erlangova porazdelitev s parametri µ in n je porazdelitev vsote n neodvisnih, enako porazdeljenih naključnih spremenljivk, od katerih ima vsaka eksponentno porazdelitev s parametrom nµ Ob Porazdelitev n = 1 Erlang je enaka eksponentni ali eksponentni porazdelitvi. Laplaceova porazdelitev Funkcija gostote Laplaceove porazdelitve ali, kot jo imenujejo tudi, dvojne eksponentne, se na primer uporablja za opis porazdelitve napak v regresijskih modelih. Če pogledate graf te porazdelitve, boste videli, da je sestavljena iz dveh eksponentnih porazdelitev, simetričnih glede na os OY. Če je parameter položaja 0, potem ima Laplaceova funkcija porazdelitvene gostote obliko: Glavne numerične značilnosti tega zakona o porazdelitvi, ob predpostavki, da je parameter položaja nič, so naslednje: V splošnem ima Laplaceova porazdelitvena gostota obliko: a je sredina porazdelitve; b je parameter lestvice; e je Eulerjeva številka (2,71 ...). Porazdelitev gama Gostota eksponentne porazdelitve ima način v točki 0, kar je včasih neprijetno za praktične aplikacije. V mnogih primerih je vnaprej znano, da način obravnavane naključne spremenljivke ni enak 0, na primer imajo intervali med prihodom strank v trgovino za e-trgovino ali obiski spletnega mesta izrazit način. Za simulacijo takšnih dogodkov se uporablja gama porazdelitev. Gostota porazdelitve gama je naslednja: kjer je Γ Eulerjeva Γ-funkcija, a> 0 je parameter "oblika" in b> 0 je parameter merila. V konkretnem primeru imamo porazdelitev Erlang in eksponentno porazdelitev. Glavne značilnosti porazdelitve gama: Spodaj sta dve ploskvi gama gostote s parametrom lestvice 1 in parametri oblike 3 in 5. Koristna lastnost porazdelitve gama: vsota poljubnega števila neodvisnih gama porazdeljenih naključnih spremenljivk (z istim parametrom lestvice b) (a l, b) + (a 2, b) + --- + (a n, b) prav tako upošteva porazdelitev gama, vendar s parametri a 1 + a 2 + + a n in b. Lognormalna porazdelitev Naključna spremenljivka h se imenuje log-normalna ali log-normalna, če njen naravni logaritem (lnh) upošteva zakon normalne porazdelitve. Lognormalna porazdelitev se uporablja na primer pri modeliranju spremenljivk, kot so dohodek, starost mladoporočencev ali odstopanje od standarda za škodljive snovi v hrani. Če torej količina x ima normalno porazdelitev, potem je količina y = fx ima Lognormalno porazdelitev. Če normalno vrednost nadomestite z eksponentno močjo, boste zlahka razumeli, da je lognormalna vrednost pridobljena kot rezultat večkratnega množenja neodvisnih spremenljivk, tako kot je normalna naključna spremenljivka rezultat večkratnega seštevanja. Gostota lognormalne porazdelitve je: Glavne značilnosti logno normalne porazdelitve so: Hi-kvadratna porazdelitev Vsota kvadratov m neodvisnih normalnih vrednosti s povprečjem 0 in varianco 1 ima hi-kvadrat porazdelitev z m stopnjami svobode. Ta porazdelitev se najpogosteje uporablja pri analizi podatkov. Formalno ima gostota dobro kvadratne porazdelitve z m stopnjami svobode obliko: Z negativnim x gostota se spremeni v 0. Osnovne numerične značilnosti hi-kvadratne porazdelitve: Graf gostote je prikazan na spodnji sliki: Binomska porazdelitev Binomska porazdelitev je najpomembnejša diskretna porazdelitev, ki je skoncentrirana v le nekaj točkah. Binomska porazdelitev tem točkam pripisuje pozitivne verjetnosti. Tako se binomska porazdelitev razlikuje od neprekinjenih porazdelitev (normalnih, hi-kvadratnih itd.), Ki ločeno izbranim točkam pripisujejo nič verjetnosti in se imenujejo neprekinjene. Binomsko porazdelitev lahko bolje razumete tako, da pogledate naslednjo igro. Predstavljajte si, da mečete kovanec. Naj bo verjetnost, da boste dobili grb p, verjetnost, da bi dobili rep, pa je q = 1 - p (upoštevamo najbolj splošen primer, ko je kovanec asimetričen in ima na primer premaknjeno težišče - v kovancu je narejena luknja). Padanje grba velja za uspeh, padanje repa pa za neuspeh. Potem ima število padlih grbov (ali repov) binomsko porazdelitev. Upoštevajte, da je razmislek o asimetričnih kovancih ali nepravilnih kockah praktičnega pomena. Kot je zapisal J. Neumann v svoji elegantni knjigi Uvodni tečaj teorije verjetnosti in matematične statistike, so ljudje že dolgo ugibali, da je pogostost točk, ki padejo na matrico, odvisna od lastnosti same matrice in jo je mogoče umetno spremeniti. Arheologi so v faraonski grobnici našli dva para kosti: "poštene" - z enako verjetnostjo, da bodo vse strani izpadle, in ponarejene - z namernim premikom težišča, kar je povečalo verjetnost, da bodo šestice izpadle. Parametri binomske porazdelitve so verjetnost uspeha p (q = 1 - p) in število preskusov n. Binomska porazdelitev je uporabna za opis porazdelitve binomskih dogodkov, kot je število moških in žensk v naključno izbranih podjetjih. Uporaba binomske porazdelitve pri problemih iger je še posebej pomembna. Natančna formula za verjetnost t uspeha v n testov je zapisanih na naslednji način: p-verjetnost uspeha q je enako 1-p, q> = 0, p + q == 1 n- število preskusov, m = 0,1 ... m Glavne značilnosti binomske porazdelitve: Graf te porazdelitve za različno število poskusov n in verjetnosti uspeha p ima obliko: Binomska porazdelitev je povezana z normalno porazdelitvijo in Poissonovo porazdelitvijo (glej spodaj); pri določenih vrednostih parametrov z velikim številom preskusov se spremeni v te porazdelitve. To je enostavno dokazati s STATISTICO. Na primer ob upoštevanju grafa binomske porazdelitve s parametri p = 0,7, n = 100 (glej sliko), uporabili smo STATISTICA BASIC - vidite, da je graf zelo podoben gostoti normalne porazdelitve (res je!). Binomska porazdelitvena ploskev s parametri p = 0,05, n = 100 je zelo podoben grafu Poissonove porazdelitve. Kot smo že omenili, je binomska porazdelitev nastala zaradi opazovanj najpreprostejše igre na srečo - metanja pravilnega kovanca. V mnogih situacijah je ta model dober prvi približek za bolj zapletene igre in naključne procese, ki nastanejo pri igranju na borzi. Izjemno je, da je bistvene značilnosti številnih kompleksnih procesov mogoče razumeti iz preprostega binomskega modela. Na primer, razmislite o naslednji situaciji. Označimo padec grba kot 1 in padec repa - minus 1 in povzeli bomo dobičke in izgube v zaporednih trenutkih. Grafi prikazujejo značilne poti takšne igre z 1000 meti, 5000 meti in 10 000 metov. Bodite pozorni na to, kako dolgo je pot nad ali pod ničlo, z drugimi besedami, čas, v katerem eden od igralcev zmaga v popolnoma pošteni igri, je zelo dolg, prehodi iz zmage v poraz pa so razmeroma redki, kar je težko prilegajoč se v nepripravljen um, za katerega izraz "popolnoma poštena igra" zveni kot čarobni urok. Torej, čeprav je igra v danih pogojih poštena, vedenje tipične poti sploh ni pošteno in ne kaže ravnovesja! Seveda je empirično to dejstvo znano vsem igralcem, z njim je povezana strategija, ko igralec ne sme oditi z zmago, ampak je prisiljen igrati naprej. Upoštevajte število metov, med katerimi en igralec zmaga (pot nad 0), drugi pa izgubi (pot pod 0). Na prvi pogled se zdi, da je število takšnih metov približno enako. Vendar (glej vznemirljivo knjigo: Feller V. "Uvod v teorijo verjetnosti in njene uporabe." Moskva: Mir, 1984, str. 106) z 10.000 meti idealnega kovanca p = q = 0,5, n = 10.000) verjetnost, da bo ena od strank vodila več kot 9.930 sojenj, druga - manj kot 70, pa presega 0,1. Presenetljivo je, da je v igri z 10.000 meti pravilnega kovanca verjetnost, da se vodstvo ne spremeni več kot 8 -krat, večja od 0,14, verjetnost več kot 78 sprememb vodstva pa je približno 0,12. Tako imamo paradoksalno situacijo: pri Bernoullijevem simetričnem sprehodu so lahko "valovi" na grafikonu med zaporednimi ničelnimi donosi (glej grafikone) presenetljivo dolgi. To je povezano z drugo okoliščino, in sicer da je za T n / n (del časa, ko je graf nad osjo abscise) so najmanj verjetne vrednosti blizu 1/2. Matematiki so odkrili tako imenovani zakon arksinusa, po katerem za vsako 0< а <1 вероятность неравенства
, где Т n - число шагов, в течение которых первый игрок находится в выигрыше, стремится к Arcsin porazdelitev Ta neprekinjena porazdelitev je koncentrirana na intervalu (0, 1) in ima gostoto: Inverzna porazdelitev sinusov je povezana z naključnim sprehodom. To je porazdelitev deleža časa, v katerem prvi igralec zmaga pri metanju simetričnega kovanca, to je kovanca z enako verjetnostjo S pade na grb in rep. Na drug način je takšno igro mogoče obravnavati kot naključni sprehod delca, ki od nič naprej naredi enotne skoke v desno ali levo z enakimi verjetnostmi. Ker so skoki delca - izpadanje iz grba ali repa - enako verjetni, se takšen sprehod pogosto imenuje simetričen. Če bi bile verjetnosti drugačne, bi imeli asimetrično hojo. Graf porazdelitvene gostote arksinusa je prikazan na naslednji sliki: Najbolj zanimiva stvar je kakovostna interpretacija grafikona, iz katere lahko izvedete neverjetne zaključke o nizu zmag in nizu porazov v pošteni igri. Če pogledate graf, lahko vidite, da je minimalna gostota na točki 1/2. "Pa kaj?!" - vprašate. Če pa pomislite na to opazovanje, potem vaše presenečenje ne bo imelo meja! Izkazalo se je, da igra, ko je opredeljena kot poštena, pravzaprav ni tako poštena, kot se morda zdi na prvi pogled. Trajektorji simetričnega naključja, v katerem delec porabi enak čas na pozitivnem in negativnem polosu, torej na desni ali levi strani ničle, so le najmanj verjetni. Če preidemo na jezik igralcev, lahko rečemo, da so pri metanju simetričnega kovanca igre, v katerih imajo igralci enak čas zmage in poraza, najmanj verjetne. Nasprotno, igre, pri katerih je en igralec veliko bolj verjetno zmagal, drugi pa izgubil, so najverjetnejše. Neverjeten paradoks! Za izračun verjetnosti, da je del časa t, v katerem zmaga prvi igralec, v razponu od t1 do t2, je potrebno iz vrednosti porazdelitvene funkcije F (t2) odštejemo vrednost porazdelitvene funkcije F (t1). Formalno dobimo: P (t1 Na podlagi tega dejstva je mogoče z uporabo statistike STATISTICA izračunati, da delci pri 10.000 korakih ostanejo na pozitivni strani več kot 9930 časovnih trenutkov z verjetnostjo 0,1, to pomeni, da bo takšno stanje vsaj približno opaziti pri en primer od desetih. (čeprav se na prvi pogled zdi absurdno; glej izredno jasno opombo Yu. V. Prokhorova "Bernoullijeva pot" v enciklopediji "Verjetnost in matematična statistika", str. 42-43, Moskva: Velika ruska enciklopedija, 1999) ... Negativna binomska porazdelitev To je diskretna porazdelitev, ki pripisuje celotnim točkam k = 0,1,2, ... verjetnosti: p k = P (X = k) = C k r + k-1 p r (l-p) k ", kjer je 0<р<1,r>0.
Negativno binomsko porazdelitev najdemo v številnih aplikacijah. Na splošno r> 0 negativna binomska porazdelitev se razlaga kot porazdelitev čakalne dobe za r -ti "uspeh" v Bernoullijevi testni shemi z verjetnostjo "uspeha" p, na primer število zvitkov, ki jih je treba narediti pred valjanjem drugega grba, v tem primeru se včasih imenuje tudi porazdelitev Pascal in je diskreten analog porazdelitve gama. Ob r = 1 negativna binomska porazdelitev sovpada z geometrijsko porazdelitvijo. Če je Y naključna spremenljivka s Poissonovo porazdelitvijo z naključnim parametrom, ki ima nato porazdelitev gama z gostoto Potem bo imel Ub negativno binomsko porazdelitev s parametri; Poissonova porazdelitev Poissonova porazdelitev se včasih imenuje distribucija redkih dogodkov. Primeri spremenljivk, porazdeljenih po Poissonovem zakonu, so: število nesreč, število napak v proizvodnem procesu itd. Poissonova porazdelitev je določena s formulo: Glavne značilnosti Poissonove naključne spremenljivke: Poissonova porazdelitev je povezana z eksponentno porazdelitvijo in Bernoullijevo porazdelitvijo. Če ima število dogodkov Poissonovo porazdelitev, imajo intervali med dogodki eksponentno ali eksponentno porazdelitev. Poissonova distribucijska ploskev: Primerjajte grafikon Poissonove porazdelitve s parametrom 5 s ploskvijo Bernoullijeve porazdelitve pri p = q = 0,5, n = 100. Videli boste, da so grafi zelo podobni. V splošnem primeru obstaja naslednji vzorec (glej na primer odlično knjigo: Shiryaev AN "Verjetnost." Moskva: Nauka, str. 76): če v Bernoullijevih testih n vzame velike vrednosti in verjetnost uspeha / ? je relativno majhen, tako da povprečno število uspehov (produkt in bp) ni majhno niti veliko, potem lahko Bernoullijevo porazdelitev s parametri n, p nadomestimo s Poissonovo porazdelitvijo s parametrom = np. Poissonova distribucija se v praksi pogosto uporablja, na primer v tabelah za nadzor kakovosti kot distribucija redkih dogodkov. Kot drug primer razmislite o naslednjem problemu, povezanem s telefonskimi linijami in iz prakse (glej: Feller V. Uvod v teorijo verjetnosti in njene uporabe. Moskva: Mir, 1984, str. 205 in tudi Molina E. S. (1935) Verjetnost inženiring, elektrotehnika, 54, str. 423-427; Bell Telephone System Technical Publications Monograph B-854). To nalogo je enostavno prevesti v sodoben jezik, na primer v jezik mobilnih komunikacij, kar vabijo zainteresirani bralci. Problem je formuliran na naslednji način. Naj bosta dve telefonski centrali - A in B. Telefonska postaja A mora zagotavljati komunikacijo za 2000 naročnikov s postajo B. Kakovost komunikacije mora biti takšna, da le 1 klic od 100 čaka, da linija postane brezplačna. Vprašanje je: koliko telefonskih linij morate vzpostaviti, da zagotovite dano kakovost komunikacije? Očitno je nespametno ustvariti 2000 vrstic, saj bodo mnoge med njimi dolgo časa brezplačne. Iz intuitivnih premislekov je jasno, da očitno obstaja nekaj optimalnega števila vrstic N. Kako izračunati to število? Začnimo z realnim modelom, ki opisuje intenzivnost naročnikovega dostopa do omrežja, medtem ko je treba natančnost modela seveda preveriti s standardnimi statističnimi merili. Predpostavimo torej, da vsak naročnik uporablja linijo v povprečju 2 minuti na uro in da so naročniške povezave neodvisne (vendar, kot upravičeno ugotavlja Feller, slednje poteka, če ni dogodkov, ki bi vplivali na vse naročnike, na primer vojna ali orkan). Nato imamo 2000 Bernoullijevih poskusov (metanje kovancev) ali omrežnih povezav z uspešnostjo p = 2/60 = 1/30. Takšno N je treba najti, če verjetnost, da je na omrežje hkrati povezanih več kot N uporabnikov, ne presega 0,01. Te izračune je mogoče enostavno rešiti v sistemu STATISTICA. Reševanje problema na STATISTICI. Korak 1. Odprite modul Osnovna statistika... Ustvarite datoteko binoml.sta, ki vsebuje 110 opazovanj. Poimenujte prvo spremenljivko BINOMIALNO, druga spremenljivka je OTROV. 2. korak. BINOMIALNO, Odprite okno Spremenljivka 1(glej sliko). Vnesite formulo v okno, kot je prikazano na sliki. Kliknite gumb v redu. 3. korak. Z dvojnim klikom na naslov OTROV, Odprite okno Spremenljivka 2(glej sliko) V okno vnesite formulo, kot je prikazano na sliki. Upoštevajte, da izračunamo parameter Poissonove porazdelitve po formuli = n × p. Zato = 2000 × 1/30. Kliknite gumb v redu.
STATISTICA bo izračunala verjetnosti in jih zapisala v ustvarjeno datoteko. 4. korak. Pomaknite se po izdelani tabeli do primerov, oštevilčenih 86. Videli boste, da je verjetnost, da 86 ali več od 2000 uporabnikov omrežja dela eno uro hkrati 0,01347, če se uporablja binomska porazdelitev. Verjetnost, da 86 ali več ljudi od 2.000 uporabnikov omrežja hkrati dela na uro, je 0,01293, če za binomsko porazdelitev uporabimo Poissonov približek. Ker potrebujemo verjetnost največ 0,01, bo 87 linij dovolj za zagotovitev zahtevane kakovosti komunikacije. Podobne rezultate je mogoče dobiti z normalnim približkom za binomsko porazdelitev (preverite!). Upoštevajte, da V. Feller ni imel na voljo sistema STATISTICA in je uporabljal tabele za binomsko in normalno porazdelitev. Z istim sklepanjem lahko rešimo naslednji problem, o katerem je razpravljal W. Feller. Preveriti je treba, ali bo za zanesljivo storitev uporabnikov potrebnih več ali manj linij, če jih razdelimo v 2 skupini po 1000 ljudi. Izkazalo se je, da bi za razdelitev uporabnikov v skupine potrebovali dodatnih 10 vrstic, da bi dosegli enako raven kakovosti. Upoštevate lahko tudi spremembo intenzivnosti omrežne povezave čez dan. Geometrijska porazdelitev Če se izvedejo neodvisni Bernoullijevi testi in se šteje število preskusov do naslednjega "uspeha", potem ima to število geometrijsko porazdelitev. Če torej vržete kovanec, potem število metov, ki jih morate narediti, preden naslednji grb izpade, sledi geometrijskemu zakonu. Geometrijska porazdelitev je določena s formulo: F (x) = p (1-p) x-1 p je verjetnost uspeha, x = 1, 2,3 ... Ime distribucije je povezano z geometrijsko progresijo. Geometrijska porazdelitev torej določa verjetnost, da je uspeh prišel na določenem koraku. Geometrijska porazdelitev je diskreten analog eksponentne porazdelitve. Če se čas spreminja v kvantah, potem je verjetnost uspeha v vsakem trenutku časa opisana z geometrijskim zakonom. Če je čas neprekinjen, je verjetnost opisana z eksponentnim ali eksponentnim zakonom. Hipergeometrična porazdelitev To je diskretna verjetnostna porazdelitev naključne spremenljivke X, ki ima celoštevilske vrednosti m = 0, 1,2, ..., n z verjetnostmi: kjer so N, M in n ne-negativna cela števila in M<
N, n < N. Hipergeometrična porazdelitev je običajno povezana z izbiro brez ponovitve in na primer določa verjetnost, da se v naključnem vzorcu velikosti n iz splošne populacije, ki vsebuje N kroglic, vključno z M črno in N - M belo, najde natančno m črnih kroglic (glej , na primer enciklopedija "Verjetnost in matematična statistika", Moskva: Velika ruska enciklopedija, str. 144). Matematično pričakovanje hipergeometrične porazdelitve ni odvisno od N in sovpada z matematičnim pričakovanjem µ = np ustrezne binomske porazdelitve. Disperzija hipergeometrične porazdelitve Ta porazdelitev je izjemno pogosta pri nalogah nadzora kakovosti. Polinomska porazdelitev Polinomska ali multinomska porazdelitev seveda posplošuje distribucijo. Če se binomska porazdelitev pojavi, ko se kovanec vrže z dvema rezultatoma (rešetka ali grb), potem pride do polinomske porazdelitve, ko se zavrtlja matrica in sta možna več kot dva rezultata. Formalno je to skupna verjetnostna porazdelitev naključnih spremenljivk X 1, ..., X k, ki sprejme celoštevilčne negativne vrednosti n 1, ..., nk, ki izpolnjuje pogoj n 1 + ... + nk = n, z verjetnostmi: Ime "polinomska porazdelitev" je razloženo z dejstvom, da se pri širjenju polinoma (р 1 + ... + p k) n pojavijo multinomske verjetnosti Distribucija beta Porazdelitev beta ima gostoto oblike: Standardna porazdelitev beta je koncentrirana v območju od 0 do 1. Z linearnimi transformacijami je mogoče vrednost beta spremeniti tako, da bo sprejela vrednosti v poljubnem območju. Glavne numerične značilnosti količine z beta porazdelitvijo: Porazdelitev ekstremnih vrednosti Porazdelitev ekstremnih vrednosti (tip I) ima gostoto oblike: Ta porazdelitev se včasih imenuje tudi porazdelitev skrajne vrednosti. Porazdelitev skrajne vrednosti se uporablja za simulacijo ekstremnih dogodkov, kot so ravni poplav, vrtinčne hitrosti, največji indeksi borz za določeno leto itd. Ta porazdelitev se uporablja na primer v teoriji zanesljivosti za opis časa okvare električnih vezij, pa tudi pri aktuarskih izračunih. Rayleighova distribucija Rayleighova porazdelitev ima gostoto oblike: kjer je b parameter merila. Rayleighova porazdelitev je koncentrirana v območju od 0 do neskončnosti. Namesto 0 vam STATISTICA omogoča, da vnesete drugo vrednost parametra praga, ki bo odšteta od prvotnih podatkov, preden prilagodite Rayleighovo distribucijo. Zato mora biti vrednost parametra praga manjša od vseh opazovanih vrednosti. Če sta dve spremenljivki y 1 in y 2 neodvisni drug od drugega in sta običajno porazdeljeni z isto varianco, potem spremenljivka Rayleighova porazdelitev se uporablja na primer v teoriji streljanja. Weibull distribucija Porazdelitev Weibull je poimenovana po švedskem raziskovalcu Waloddiju Weibullu, ki je s to porazdelitvijo opisal različne vrste časov odpovedi v teoriji zanesljivosti. Formalno je Weibullova porazdelitvena gostota zapisana v obliki: Včasih je Weibullova porazdelitvena gostota zapisana tudi v obliki: B je parameter lestvice; С - parameter oblike; E je Eulerjeva konstanta (2,718 ...). Parameter položaja. Značilno je, da je Weibullova porazdelitev osredotočena na polos od 0 do neskončnosti. Če namesto meje 0 vnesemo parameter a, ki je v praksi pogosto potreben, potem nastane tako imenovana triparametrska Weibullova porazdelitev. Weibullova distribucija se široko uporablja v teoriji zanesljivosti in zavarovanja. Kot je opisano zgoraj, se eksponentna porazdelitev pogosto uporablja kot model za ocenjevanje MTBF pod predpostavko, da je verjetnost okvare objekta konstantna. Če se verjetnost okvare sčasoma spremeni, se uporabi Weibull -ova porazdelitev. Ob c = 1 ali, pri drugi parametrizaciji, pri, Weibullova porazdelitev, kot je enostavno razbrati iz formul, se spremeni v eksponentno porazdelitev in pri, v Rayleighovo porazdelitev. Za ocenjevanje parametrov Weibullove porazdelitve so bile razvite posebne metode (glej na primer knjigo: Lawless (1982) Statistični modeli in metode za podatke za celo življenje, Belmont, Kalifornija: Življenjsko učenje, ki opisuje metode ocenjevanja, pa tudi težave, ki nastanejo pri ocenjevanju parametra položaja za triparametrično porazdelitev Weibull). Pri analizi zanesljivosti je pogosto treba upoštevati verjetnost okvare v kratkem časovnem intervalu po določenem času. t pod pogojem, da do trenutka t ni prišlo do napake. Taka funkcija se imenuje funkcija tveganja ali funkcija stopnje okvare in je formalno opredeljena na naslednji način: H (t) - funkcija stopnje okvare ali funkcija tveganja v času t; f (t) - porazdelitvena gostota časov okvare; F (t) je porazdelitvena funkcija napak (integral gostote v intervalu). Na splošno je funkcija stopnje napak zapisana na naslednji način: Kadar je funkcija tveganja enaka konstanti, ki ustreza normalnemu delovanju naprave (glej formule). Pri se zmanjša funkcija tveganja, kar ustreza utekanju naprave. Pri se zmanjša funkcija tveganja, kar ustreza staranju naprave. Tipične funkcije tveganja so prikazane na grafu. Spodaj so prikazane ploskve gostote Weibull z različnimi parametri. Treba je biti pozoren na tri obsege vrednosti parametra a: Na prvem področju se funkcija tveganja zmanjša (obdobje uravnavanja), na drugem je funkcija tveganja enaka konstanti, na tretjem področju se funkcija tveganja poveča. Z lahkoto lahko razumete, kar je bilo rečeno za primer nakupa novega avtomobila: najprej sledi obdobje prilagajanja avtomobila, nato dolgo obdobje normalnega delovanja, nato se avtomobilski deli obrabijo in nevarnost njegove okvare se močno poveča . Pomembno je, da lahko vsa obdobja delovanja opiše ista distribucijska družina. To je ideja distribucije Weibull. Tu so glavne numerične značilnosti Weibulove porazdelitve. Paretova distribucija Pri različnih težavah uporabne statistike se pogosto pojavljajo tako imenovane okrnjene distribucije. Ta porazdelitev se na primer uporablja v zavarovalništvu ali obdavčitvi, kadar so dohodki v interesu, ki presegajo določeno vrednost c 0 Glavne numerične značilnosti distribucije Pareto: Logistična distribucija Logistična distribucija ima funkcijo gostote: A - parameter položaja; B je parameter lestvice; E je Eulerjeva številka (2,71 ...). Hotelling T 2 -razdelitev Ta neprekinjena porazdelitev, koncentrirana na intervalu (0, T), ima gostoto: kje parametri n in k, n> _k> _1, imenujemo stopnje svobode. Ob Hotelling je k = 1, P-porazdelitev se zmanjša na študentovo distribucijo in za katero koli k> 1 lahko obravnavamo kot posplošitev Studentove distribucije na večdimenzionalni primer. Distribucija Hotellinga temelji na normalni distribuciji. Naj ima k-dimenzionalni naključni vektor Y normalno porazdelitev z ničelnim srednjim vektorjem in kovariančno matrico. Upoštevajte količino kjer so naključni vektorji Z i neodvisni drug od drugega in Y in so porazdeljeni na enak način kot Y. Potem ima naključna spremenljivka T 2 = Y T S -1 Y razporeditev T 2 -Hotelling z n stopnjami svobode (Y je vektor stolpca, T je operator prenosa). kjer je naključna spremenljivka t n ima študentsko distribucijo z n stopnjami svobode (glej "Verjetnost in matematična statistika", Enciklopedija, str. 792). Če ima Y normalno porazdelitev z ničelno sredino, se pokliče ustrezna porazdelitev izven centra Hotelling T 2 -razdelitev z n stopnjami svobode in parametrom necentralnosti v. Hotellingova T2 -porazdelitev se uporablja v matematični statistiki v enaki situaciji kot Studentova t -porazdelitev, vendar le v večdimenzionalnem primeru. Če so rezultati opazovanj X 1, ..., X n neodvisni, običajno porazdeljeni naključni vektorji s srednjim vektorjem µ in nedegenerirano matriko kovariance, potem statistika ima Hotelling T 2 -razdelitev z n - 1 stopnja svobode. To dejstvo je osnova merila Hotelling. V STATISTICI je merilo Hotelling na primer na voljo v modulu Osnovne statistike in tabele (glejte spodnje pogovorno okno). Maxwellova porazdelitev Maxwellova porazdelitev je nastala v fiziki pri opisu porazdelitve hitrosti molekul idealnega plina. Ta neprekinjena porazdelitev je osredotočena na (0,) in ima gostoto: Distribucijska funkcija ima obliko: kjer je F (x) standardna normalna distribucijska funkcija. Maxwellova porazdelitev ima pozitiven koeficient poševnosti in eno točko v točki (to pomeni, da je porazdelitev unimodalna). Maxwellova distribucija ima končne trenutke katerega koli reda; matematična pričakovanja in varianca so enaki, in Maxwellova porazdelitev je seveda povezana z normalno porazdelitvijo. Če so X 1, X 2, X 3 neodvisne naključne spremenljivke z normalno porazdelitvijo s parametri 0 in х 2, potem je naključna spremenljivka Cauchyjeva porazdelitev Ta neverjetna porazdelitev včasih nima povprečne vrednosti, saj se njena gostota zelo počasi nagiba k ničli s povečanjem x v absolutni vrednosti. Takšne distribucije se imenujejo distribucije s težkimi repi. Če morate najti distribucijo, ki nima smisla, takoj pokličite distribucijo Cauchy. Cauchyjeva porazdelitev je unimodalna in simetrična glede na način, ki je hkrati mediana in ima funkcijo gostote oblike: kje c> 0 je parameter merila in a je osrednji parameter, ki hkrati določa vrednosti načina in mediane. Integral gostote, to je porazdelitvena funkcija, je določen z razmerjem: Študentska porazdelitev Angleški statistik W. Gosset, znan pod psevdonimom "študent" in je svojo kariero začel s statistično študijo kakovosti angleškega piva, je leta 1908 prejel naslednji rezultat. Naj bo x 0, x 1, .., x m - neodvisne, (0, s 2) - normalno porazdeljene naključne spremenljivke: Ta porazdelitev, zdaj znana kot študentova t distribucija (skrajšano kot t (m) -razdelitev, kjer je m število stopenj svobode), temelji na znamenitem t -testu, namenjenem primerjanju sredstev dveh populacij. Funkcija gostote f t (x) ni odvisna od variance x 2 naključnih spremenljivk, poleg tega pa je unimodalna in simetrična glede na točko х = 0. Osnovne numerične značilnosti študentske distribucije: Porazdelitev t je pomembna, če upoštevamo ocene povprečja in varianca vzorca ni znana. V tem primeru se uporablja varianca vzorca in t-porazdelitev. Pri velikih stopnjah svobode (več kot 30) t-porazdelitev praktično sovpada s standardno normalno porazdelitvijo. Graf funkcije gostote t-porazdelitve se z naraščajočim številom stopenj svobode deformira na naslednji način: vrh se poveča, repi gredo bolj strmo na 0 in zdi se, kot da grafi funkcije gostote t-porazdelitve bočno stisnjeni. F-porazdelitev Razmislite m 1 + m 2 neodvisne in (0, s 2) normalno porazdeljene količine Očitno lahko isto naključno spremenljivko definiramo kot razmerje med dvema neodvisnima in ustrezno normaliziranima hi-kvadrat porazdeljenima količinama in to je Znani angleški statistik R. Fisher je leta 1924 pokazal, da je gostota verjetnosti naključne spremenljivke F (m 1, m 2) podana s funkcijo: kjer je Γ (y) vrednost Eulerjeve gama funkcije v. točka y, sam zakon pa se imenuje F-porazdelitev s številom stopenj svobode števca in imenovalca, ki sta enaka m, 1 oziroma m7. Osnovne numerične značilnosti F-porazdelitve: F-porazdelitev se pojavi pri diskriminatorni, regresijski analizi, analizi variance in drugih vrstah analize več variabilnih podatkov. Samostalnik, število sopomenk: 1 porazdelitev (62) Slovar sinonimov ASIS. V.N. Trishin. 2013 ... Slovar sinonima beta distribucija- 1,45. beta porazdelitev Porazdelitev verjetnosti neprekinjene naključne spremenljivke X, ki lahko sprejme vse vrednosti od 0 do 1, vključno z mejami, in katere gostota porazdelitve pri 0 £ x £ 1 in parametri m1> 0, m2> 0, kjer je G .. ... ... Slovar-referenčna knjiga pogojev normativne in tehnične dokumentacije beta distribucija- Porazdelitev verjetnosti neprekinjene naključne spremenljivke, ki ima vrednosti na intervalu, katerega gostota je podana s formulo, kjer je a, b> 0 in je funkcija gama. Opomba. Njeni posebni primeri se pogosto uporabljajo ....... Slovar sociološke statistike Glej načrt ... Slovar sinonima V teoriji verjetnosti in matematični statistiki je Dirichletova porazdelitev (po imenu Johann Peter Gustave Lejeune Dirichlet), ki je pogosto označena z Dir (α), družina neprekinjenih več variabilnih porazdelitev verjetnosti, ki jih parametrizira vektor α ... ... Wikipedia Beta: Wikislovar ima vnos "beta" Beta (črka) (β) je druga črka grške abecede. Testiranje beta Koeficient beta Funkcija beta (matematika) Porazdelitev beta (teorija verjetnosti ... Wikipedia Gostota verjetnosti ... Wikipedia Porazdelitev verjetnosti je zakon, ki opisuje obseg vrednosti naključne spremenljivke in verjetnost, da jih sprejmejo. Vsebina 1 Opredelitev 2 Načini opredelitve distribucij ... Wikipedia Distribucija. Pearsonova porazdelitev Gostota verjetnosti ... Wikipedia
T ima eksponentno porazdelitev s parametrom (lambda). Za opis intervala med zaporednimi naključnimi dogodki, na primer intervalom med obiski na nepriljubljenem spletnem mestu, se pogosto uporablja eksponentna porazdelitev, saj so ti obiski redki.
ne presega variance binomske porazdelitve npq. Za trenutke katerega koli reda hipergeometrična porazdelitev stremi k ustreznim vrednostim trenutkov binomske porazdelitve.
bo imel Rayleighovo distribucijo.
ima Maxwellovo porazdelitev. Tako lahko Maxwellovo porazdelitev obravnavamo kot porazdelitev dolžine naključnega vektorja, katerega koordinate v kartezijanskem koordinatnem sistemu v tridimenzionalnem prostoru so neodvisne in običajno porazdeljene s povprečjem 0 in varianco x 2.
in dal
Knjige