Zakon povprečij na preprost način. Povprečne vrednosti. Šibek zakon velikih števil

Besede o velikih številih se nanašajo na število testov – upošteva se veliko število vrednosti naključne spremenljivke ali kumulativno delovanje velikega števila naključnih spremenljivk. Bistvo tega zakona je naslednje: čeprav je nemogoče napovedati, kakšno vrednost bo posamezna naključna spremenljivka prevzela v enem poskusu, pa skupni rezultat delovanja velikega števila neodvisnih naključnih spremenljivk izgubi svoj naključni značaj in lahko napovedati skoraj zanesljivo (tj. z veliko verjetnostjo). Na primer, nemogoče je predvideti, na katero stran bo padel kovanec. Če pa vržete 2 toni kovancev, potem lahko z veliko gotovostjo trdimo, da je teža kovancev, ki so padli z grbom navzgor, 1 tona.

Prvič, tako imenovana neenakost Čebiševa se nanaša na zakon velikih števil, ki v ločenem testu oceni verjetnost, da naključna spremenljivka sprejme vrednost, ki odstopa od povprečne vrednosti za največ dano vrednost.

Čebiševljeva neenakost. Pustiti X je poljubna naključna spremenljivka, a=M(X) , a D(X) je njegova razpršenost. Potem

Primer. Nazivna (tj. zahtevana) vrednost premera tulca, obdelanega na stroju, je 5 mm, in variance ni več 0.01 (to je toleranca natančnosti stroja). Ocenite verjetnost, da bo pri izdelavi ene puše odstopanje njenega premera od nazivnega manjše od 0,5 mm .

rešitev. Naj se r.v. X- premer izdelane puše. Po pogoju je njegovo matematično pričakovanje enako nazivnemu premeru (če ni sistematične napake pri nastavitvi stroja): a=M(X)=5 , in varianco D(X)≤0,01. Uporaba neenakosti Čebiševa za ε = 0,5, dobimo:

Tako je verjetnost takšnega odstopanja precej velika, zato lahko sklepamo, da v primeru enkratne izdelave dela skoraj gotovo odstopanje premera od nazivnega ne bo preseglo 0,5 mm .

V bistvu standardna deviacija σ označuje povprečje odstopanje naključne spremenljivke od njenega središča (tj. od njenega matematičnega pričakovanja). Zato, ker je povprečje odstopanja, potem so pri testiranju možna velika odstopanja (poudarek na o). Kako velika odstopanja so praktično možna? Pri preučevanju normalno porazdeljenih naključnih spremenljivk smo izpeljali pravilo "treh sigm": normalno porazdeljena naključna spremenljivka X v enem samem testu od svojega povprečja praktično ne odstopa več kot , kje σ= σ(X) je standardna deviacija r.v. X. Tako pravilo smo izpeljali iz dejstva, da smo dobili neenakost

.

Ocenimo zdaj verjetnost za arbitrarna naključna spremenljivka X sprejeti vrednost, ki se od povprečja razlikuje za največ trikratni standardni odklon. Uporaba neenakosti Čebiševa za ε = in glede na to D(X)=σ 2 , dobimo:

.

V to smer, na splošno lahko ocenimo verjetnost, da naključna spremenljivka odstopa od svoje sredine za največ tri standardne deviacije s številom 0.89 , medtem ko je za normalno porazdelitev to mogoče zagotoviti z verjetnostjo 0.997 .

Čebiševljevo neenakost lahko posplošimo na sistem neodvisnih enako porazdeljenih naključnih spremenljivk.

Posplošena Čebiševljeva neenakost. Če so neodvisne naključne spremenljivke X 1 , X 2 , … , X n M(X jaz )= a in disperzije D(X jaz )= D, potem

pri n=1 ta neenakost preide v zgoraj formulirano neenakost Čebiševa.

Neenakost Čebiševa, ki ima neodvisen pomen za reševanje ustreznih problemov, se uporablja za dokazovanje tako imenovanega izreka Čebiševa. Najprej opišemo bistvo tega izreka in nato podamo njegovo formalno formulacijo.

Pustiti X 1 , X 2 , … , X n– veliko število neodvisnih naključnih spremenljivk z matematičnimi pričakovanji M(X 1 )=a 1 , … , M(X n )=a n. Čeprav lahko vsak od njih kot rezultat poskusa prevzame vrednost, ki je daleč od svojega povprečja (tj. matematičnega pričakovanja), pa naključna spremenljivka
, enako njihovi aritmetični sredini, bo z veliko verjetnostjo prevzelo vrednost blizu fiksnega števila
(to je povprečje vseh matematičnih pričakovanj). To pomeni naslednje. Naj bodo kot rezultat testa neodvisne naključne spremenljivke X 1 , X 2 , … , X n(veliko jih je!) prevzeli vrednosti temu primerno X 1 , X 2 , … , X n oz. Potem, če se lahko izkaže, da so te vrednosti same daleč od povprečnih vrednosti ustreznih naključnih spremenljivk, njihova povprečna vrednost
je verjetno blizu
. Tako aritmetična sredina velikega števila naključnih spremenljivk že izgubi svoj naključni značaj in jo je mogoče napovedati z veliko natančnostjo. To je mogoče razložiti z dejstvom, da so naključna odstopanja vrednosti X jaz od a jaz so lahko različnih predznakov, zato so ta odstopanja v celoti kompenzirana z veliko verjetnostjo.

Terema Čebiševa (zakon velikih števil v obliki Čebiševa). Pustiti X 1 , X 2 , … , X n je zaporedje po parih neodvisnih naključnih spremenljivk, katerih variance so omejene na isto število. Potem, ne glede na to, kako majhno število ε vzamemo, je verjetnost neenakosti

bo poljubno blizu enote, če bo število n naključne spremenljivke za dovolj velike. Formalno to pomeni, da pod pogoji izreka

To vrsto konvergence imenujemo konvergenca v verjetnosti in jo označujemo z:

Tako Čebiševljev izrek pravi, da če obstaja dovolj veliko število neodvisnih naključnih spremenljivk, potem bo njihova aritmetična sredina v enem samem testu skoraj zagotovo prevzela vrednost blizu sredine njihovih matematičnih pričakovanj.

Najpogosteje se Chebyshev izrek uporablja v situaciji, ko so naključne spremenljivke X 1 , X 2 , … , X n imajo enako porazdelitev (tj. enak porazdelitveni zakon ali enako gostoto verjetnosti). Pravzaprav je to le veliko število primerkov iste naključne spremenljivke.

Posledica(posplošene Čebiševljeve neenakosti). Če so neodvisne naključne spremenljivke X 1 , X 2 , … , X n imajo enako porazdelitev z matematičnimi pričakovanji M(X jaz )= a in disperzije D(X jaz )= D, potem

, tj.
.

Dokaz sledi iz posplošene Čebiševljeve neenakosti s prehodom na limito as n→∞ .

Še enkrat opozarjamo, da zgoraj zapisane enakosti ne zagotavljajo vrednosti količine
nagiba k a pri n→∞. Ta vrednost je še vedno naključna spremenljivka in njene posamezne vrednosti so lahko precej daleč od nje a. Toda verjetnost takega (daleč od tega a) vrednosti z naraščanjem n teži k 0.

Komentiraj. Sklep posledice očitno velja tudi v splošnejšem primeru neodvisnih naključnih spremenljivk X 1 , X 2 , … , X n imajo drugačno porazdelitev, vendar enaka matematična pričakovanja (enaka a) in variance, omejene v agregatu. To omogoča napovedovanje natančnosti merjenja določene količine, tudi če te meritve izvajajo različni instrumenti.

Oglejmo si podrobneje uporabo te posledice pri merjenju količin. Uporabimo kakšno napravo n meritve iste količine, katere prava vrednost je a in ne vemo. Rezultati tovrstnih meritev X 1 , X 2 , … , X n se lahko bistveno razlikujejo med seboj (in od prave vrednosti a) zaradi različnih naključnih dejavnikov (padci tlaka, temperature, naključne vibracije itd.). Upoštevajte r.v. X- odčitavanje instrumenta za enkratno meritev količine, kot tudi niz r.v. X 1 , X 2 , … , X n- odčitek instrumenta pri prvi, drugi, ..., zadnji meritvi. Tako vsaka od količin X 1 , X 2 , … , X n obstaja samo eden od primerkov r.v. X, zato imajo vsi enako porazdelitev kot r.v. X. Ker so rezultati meritev neodvisni drug od drugega, je r.v. X 1 , X 2 , … , X n lahko štejemo za neodvisno. Če naprava ne daje sistematične napake (na primer ničla ni "podrta" na lestvici, vzmet ni raztegnjena itd.), Potem lahko domnevamo, da je matematično pričakovanje M(X) = a, in zato M(X 1 ) = ... = M(X n ) = a. Tako so pogoji zgornje posledice izpolnjeni in zato kot približna vrednost količine a lahko vzamemo "implementacijo" naključne spremenljivke
v našem poskusu (sestavljen iz niza n meritve), tj.

.

Z velikim številom meritev je praktično zanesljiv dobra natančnost izračune po tej formuli. To je utemeljitev praktičnega načela, da se pri velikem številu meritev njihova aritmetična sredina praktično ne razlikuje veliko od prave vrednosti merjene količine.

"Selektivna" metoda, ki se pogosto uporablja v matematični statistiki, temelji na zakonu velikih števil, ki omogoča pridobivanje objektivnih značilnosti s sprejemljivo natančnostjo iz relativno majhnega vzorca vrednosti naključne spremenljivke. Toda o tem bomo razpravljali v naslednjem razdelku.

Primer. Na merilni napravi, ki ne povzroča sistematičnih popačenj, se izmeri določena količina a enkrat (prejeta vrednost X 1 ), nato pa še 99-krat (dobljene vrednosti X 2 , … , X 100 ). Za pravo vrednost meritev a najprej vzemite rezultat prve meritve
, nato pa aritmetično sredino vseh meritev
. Merilna natančnost naprave je takšna, da standardna deviacija meritve σ ni večja od 1 (ker je disperzija D 2 tudi ne presega 1). Za vsako od merilnih metod ocenite verjetnost, da merilna napaka ne presega 2.

rešitev. Naj se r.v. X- odčitavanje instrumenta za eno meritev. Potem po pogoju M(X)=a. Za odgovor na zastavljena vprašanja uporabimo posplošeno neenakost Čebiševa

za ε =2 najprej za n=1 in potem za n=100 . V prvem primeru dobimo
, v drugem pa. Tako drugi primer praktično zagotavlja podano merilno natančnost, medtem ko prvi v tem smislu pušča resne dvome.

Uporabimo zgornje trditve za naključne spremenljivke, ki se pojavijo v Bernoullijevi shemi. Spomnimo se bistva te sheme. Naj se proizvaja n neodvisni testi, v vsakem izmed njih nekaj dogodkov AMPAK se lahko pojavi z enako verjetnostjo R, a q=1–r(kar pomeni, da je to verjetnost nasprotnega dogodka - ne pojava dogodka AMPAK) . Porabimo nekaj številk n takšni testi. Upoštevajte naključne spremenljivke: X 1 – število ponovitev dogodka AMPAK v 1 test, ..., X n– število ponovitev dogodka AMPAK v n th test. Vse uvedene r.v. lahko sprejme vrednosti 0 oz 1 (dogodek AMPAK se lahko pojavi v testu ali ne), in vrednost 1 pogojno sprejeti v vsakem poskusu z verjetnostjo str(verjetnost pojava dogodka AMPAK v vsakem testu) in vrednost 0 z verjetnostjo q= 1 str. Zato imajo te količine enake zakone porazdelitve:

X 1

X n

Zato so tudi povprečne vrednosti teh količin in njihove disperzije enake: M(X 1 )=0 q+1 p= p, …, M(X n )= str ; D(X 1 )=(0 2 q+1 2 str)− str 2 = str∙(1− str)= str q, …, D(X n )= str q. Če nadomestimo te vrednosti v posplošeno neenakost Čebiševa, dobimo

.

Jasno je, da je r.v. X=X 1 +…+Х n je število ponovitev dogodka AMPAK v vsem n poskusi (kot pravijo - "število uspehov" v n testi). Spustite v n testni dogodek AMPAK pojavil v k izmed njih. Potem lahko prejšnjo neenakost zapišemo kot

.

Toda velikost
, enako razmerju števila pojavitev dogodka AMPAK v n neodvisnih poskusov na skupno število poskusov, prej imenovano relativna stopnja dogodkov AMPAK v n testi. Zato obstaja neenakost

.

Prehod zdaj do meje pri n→∞, dobimo
, tj.
(glede na verjetnost). To je vsebina zakona velikih števil v obliki Bernoullija. Iz tega sledi, da za dovolj veliko število poskusov n poljubno majhna odstopanja relativne frekvence
dogodkov iz njegove verjetnosti R so skoraj gotovi dogodki, velika odstopanja pa so skoraj nemogoča. Iz tega izhaja sklep o taki stabilnosti relativnih frekvenc (ki smo jih prej imenovali eksperimentalno fact) utemeljuje prej vpeljano statistično definicijo verjetnosti dogodka kot števila, okoli katerega niha relativna frekvenca dogodka.

Glede na to, da izraz strq= str∙(1− str)= strstr 2 ne preseže intervala menjave
(to je enostavno preveriti z iskanjem minimuma te funkcije na tem segmentu), iz zgornje neenakosti
enostavno dobiti to

,

ki se uporablja pri reševanju ustreznih problemov (eden izmed njih bo podan spodaj).

Primer. Kovanec je bil obrnjen 1000-krat. Ocenite verjetnost, da bo odstopanje relativne pogostosti pojavljanja grba od njegove verjetnosti manjše od 0,1.

rešitev. Uporaba neenakosti
pri str= q=1/2 , n=1000 , ε=0,1, dobimo .

Primer. Ocenite verjetnost, da bo pod pogoji iz prejšnjega primera število k odpadlih grbov bo v obsegu 400 prej 600 .

rešitev. Pogoj 400< k<600 pomeni, da 400/1000< k/ n<600/1000 , tj. 0.4< W n (A)<0.6 oz
. Kot smo pravkar videli iz prejšnjega primera, je verjetnost takega dogodka najmanj 0.975 .

Primer. Za izračun verjetnosti nekega dogodka AMPAK Opravljenih 1000 poskusov, v katerih dogodek AMPAK pojavil 300-krat. Ocenite verjetnost, da se relativna frekvenca (enaka 300/1000=0,3) razlikuje od prave verjetnosti R ne več kot 0,1.

rešitev. Uporaba zgornje neenakosti
za n=1000, ε=0,1 , dobimo .

Zakon velikih števil

Zakon velikih števil v teoriji verjetnosti trdi, da je empirična sredina (aritmetična sredina) dovolj velikega končnega vzorca iz fiksne porazdelitve blizu teoretične sredine (pričakovanja) te porazdelitve. Glede na vrsto konvergence obstaja šibek zakon velikih števil, ko pride do konvergence v verjetnosti, in močan zakon velikih števil, ko pride do konvergence skoraj povsod.

Vedno bo tako število poskusov, da se bo s katero koli vnaprej določeno verjetnostjo relativna pogostost pojavljanja nekega dogodka poljubno malo razlikovala od njegove verjetnosti.

Splošni pomen zakona velikih števil je, da skupno delovanje velikega števila naključnih dejavnikov vodi do rezultata, ki je skoraj neodvisen od naključja.

Na tej lastnosti temeljijo metode za ocenjevanje verjetnosti na podlagi analize končnega vzorca. Dober primer je napoved volilnih rezultatov na podlagi anketiranja vzorca volivcev.

Šibek zakon velikih števil

Naj obstaja neskončno zaporedje (zaporedno štetje) enako porazdeljenih in nekoreliranih naključnih spremenljivk, definiranih na istem verjetnostnem prostoru. To je njihova kovarianca. Pustiti . Označimo vzorčno povprečje prvih členov:

Močan zakon velikih števil

Naj obstaja neskončno zaporedje neodvisnih enako porazdeljenih naključnih spremenljivk, definiranih na istem verjetnostnem prostoru. Pustiti . Označimo vzorčno povprečje prvih členov:

.

Potem skoraj gotovo.

Poglej tudi

Literatura

  • Širjajev A. N. Verjetnost, - M .: Znanost. 1989.
  • Čistjakov V.P. Tečaj teorije verjetnosti, - M., 1982.

Fundacija Wikimedia. 2010.

  • Kino Rusije
  • Gromeka, Mihail Stepanovič

Oglejte si, kaj je "Zakon velikih števil" v drugih slovarjih:

    ZAKON VELIKIH ŠTEVIL- (zakon velikih števil) V primeru, ko je vedenje posameznih članov populacije zelo distinktivno, je vedenje skupine v povprečju bolj predvidljivo kot vedenje katerega koli njenega člana. Trend, v katerih skupinah ... ... Ekonomski slovar

    ZAKON VELIKIH ŠTEVIL- glej ZAKON VELIKIH ŠTEVIL. Antinazi. Enciklopedija sociologije, 2009 ... Enciklopedija sociologije

    Zakon velikih števil- načelo, po katerem se kvantitativni vzorci, ki so lastni množičnim družbenim pojavom, najbolj jasno manifestirajo z dovolj velikim številom opazovanj. Posamezni pojavi so bolj dovzetni za učinke naključnih in ... ... Glosar poslovnih izrazov

    ZAKON VELIKIH ŠTEVIL- trdi, da se bo z verjetnostjo, ki je blizu ena, aritmetična sredina velikega števila naključnih spremenljivk približno istega reda le malo razlikovala od konstante, ki je enaka aritmetični sredini matematičnih pričakovanj teh spremenljivk. Razlika… … Geološka enciklopedija

    zakon velikih števil- — [Ya.N. Luginsky, M.S. Fezi Zhilinskaya, Yu.S. Kabirov. English Russian Dictionary of Electrical Engineering and Power Industry, Moskva, 1999] Teme elektrotehnike, osnovni pojmi EN zakon povprečjazakon velikih števil ... Priročnik tehničnega prevajalca

    zakon velikih števil- didžiųjų skaičių dėsnis statusas T sritis fizika atitikmenys: engl. zakon velikih števil vok. Gesetz der großen Zahlen, n rus. zakon velikih števil, m pranc. loi des grands nombres, f … Fizikos terminų žodynas

    ZAKON VELIKIH ŠTEVIL- splošno načelo, zaradi katerega kombinirano delovanje naključnih dejavnikov vodi pod določenimi zelo splošnimi pogoji do rezultata, ki je skoraj neodvisen od naključja. Konvergenca pogostosti pojavljanja naključnega dogodka z njegovo verjetnostjo s povečanjem števila ... ... Ruska sociološka enciklopedija

    Zakon velikih števil- zakon, ki pravi, da kumulativno delovanje velikega števila naključnih dejavnikov vodi pod določenimi zelo splošnimi pogoji do rezultata, skoraj neodvisnega od naključja ... Sociologija: slovar

    ZAKON VELIKIH ŠTEVIL- statistični zakon, ki izraža razmerje statističnih kazalcev (parametrov) vzorca in splošne populacije. Dejanske vrednosti statističnih kazalnikov, pridobljenih iz določenega vzorca, se vedno razlikujejo od t.i. teoretično ... ... Sociologija: Enciklopedija

    ZAKON VELIKIH ŠTEVIL- načelo, da je pogostost finančnih izgub določene vrste mogoče napovedati z visoko natančnostjo, kadar obstaja veliko število izgub podobne vrste ... Enciklopedični slovar ekonomije in prava

knjige

  • Komplet miz. matematika. Teorija verjetnosti in matematična statistika. 6 tabel + metodologija, . Tabele so natisnjene na debelem poligrafskem kartonu dimenzij 680 x 980 mm. Komplet vsebuje brošuro z metodološkimi priporočili za učitelje. Izobraževalni album 6 listov. Naključen…


Kaj je skrivnost uspešnih prodajalcev? Če opazujete najboljše prodajalce katerega koli podjetja, boste opazili, da imajo eno skupno stvar. Vsak od njih se sreča z več ljudmi in naredi več predstavitev kot manj uspešni prodajalci. Ti ljudje razumejo, da je prodaja igra številk, in več ko ljudem povedo o svojih izdelkih ali storitvah, več poslov sklenejo, to je vse. Zavedajo se, da če bodo komunicirali ne le s tistimi nekaj, ki jim bodo zagotovo rekli da, ampak tudi s tistimi, katerih zanimanje za njihov predlog ni tako veliko, potem bo zakon povprečja deloval njim v prid.


Vaš zaslužek bo odvisen od števila prodaj, hkrati pa bo premosorazmeren s številom vaših predstavitev. Ko boste razumeli in začeli udejanjati zakon povprečij, se bo tesnoba, povezana z ustanovitvijo novega podjetja ali delom na novem področju, začela zmanjševati. Posledično se bosta začela krepiti občutek nadzora in zaupanje v njihovo sposobnost zaslužka. Če samo naredite predstavitve in med tem izpopolnite svoje veščine, bodo posli.

Namesto da razmišljate o številu poslov, pomislite na število predstavitev. Nima smisla, da se zjutraj zbudite ali zvečer pridete domov in se sprašujete, kdo bo kupil vaš izdelek. Namesto tega je najbolje, da vsak dan načrtujete, koliko klicev morate opraviti. In potem, ne glede na vse - opravite vse te klice! Ta pristop vam bo olajšal delo – saj gre za preprost in specifičen cilj. Če veste, da imate pred seboj zelo konkreten in dosegljiv cilj, boste lažje opravili načrtovano število klicev. Če med tem postopkom nekajkrat slišite "da", toliko bolje!

In če "ne", se boste zvečer počutili, da ste pošteno naredili vse, kar ste lahko, in vas ne bodo mučile misli o tem, koliko denarja ste zaslužili ali koliko partnerjev ste pridobili v enem dnevu.

Recimo, da v vašem podjetju ali podjetju povprečen prodajalec sklene en posel na vsake štiri predstavitve. Zdaj pa si predstavljajte, da vlečete karte iz kompleta. Vsaka karta treh barv – pik, karo in palica – je predstavitev, kjer profesionalno predstavite izdelek, storitev ali priložnost. Narediš to po najboljših močeh, a vseeno ne skleneš posla. In vsaka srčna karta je dogovor, ki vam omogoča, da dobite denar ali pridobite novega spremljevalca.

Ali ne bi v takšni situaciji želeli potegniti čim več kart iz kompleta? Recimo, da vam ponudijo, da izvlečete toliko kart, kot želite, pri čemer vam vsakič, ko izvlečete srčno karto, plačate ali predlagate novega spremljevalca. Začeli boste navdušeno vleči karte in komaj opazili, katere barve je karta pravkar izvlečena.

Veste, da je v kompletu dvainpetdesetih kart trinajst srčkov. In v dveh kompletih - šestindvajset srčnih kart in tako naprej. Ali boste razočarani nad žrebom pik, karo ali kifa? Seveda ne! Mislili boste le, da vas vsaka taka "missica" približa - čemu? Na srčkovo karto!

Ampak veš kaj? To ponudbo ste že prejeli. Ste v edinstvenem položaju, da zaslužite toliko, kot želite, in izvlečete toliko srčnih kart, kot jih želite izvleči v svojem življenju. In če samo vestno "vlečeš karte", izpopolnjuješ svoje veščine in prenašaš malo pika, karo in kija, potem boš postal odličen prodajalec in uspel.

Ena od stvari, zaradi katerih je prodaja tako zabavna, je, da se vsakič, ko premešate komplet, karte premešajo drugače. Včasih se vsi srčki znajdejo na začetku kompleta in po uspešnem nizu (ko se nam že zdi, da nikoli ne bomo izgubili!) nas čaka dolga vrsta kart različnih barv. In drugič, da prideš do prvega srčka, moraš skozi neskončno število pikov, trefov in tamburin. In včasih karte različnih barv izpadejo strogo po vrsti. Toda v vsakem primeru je v vsakem kompletu dvainpetdesetih kart, v nekem vrstnem redu, vedno trinajst srčkov. Samo izvlecite karte, dokler jih ne najdete.



Od: Leylya,  

Zakon velikih števil v teoriji verjetnosti trdi, da je empirična sredina (aritmetična sredina) dovolj velikega končnega vzorca iz fiksne porazdelitve blizu teoretične sredine (pričakovanja) te porazdelitve. Glede na vrsto konvergence ločimo šibek zakon velikih števil, ko pride do konvergence v verjetnosti, in močan zakon velikih števil, ko pride do konvergence skoraj povsod.

Vedno obstaja končno število poskusov, za katere je s katero koli dano verjetnostjo manj kot 1 relativna pogostost pojavljanja nekega dogodka se bo poljubno malo razlikovala od njegove verjetnosti.

Splošni pomen zakona velikih števil: skupno delovanje velikega števila enakih in neodvisnih naključnih dejavnikov vodi do rezultata, ki v meji ni odvisen od naključja.

Na tej lastnosti temeljijo metode za ocenjevanje verjetnosti na podlagi analize končnega vzorca. Dober primer je napoved volilnih rezultatov na podlagi anketiranja vzorca volivcev.

Enciklopedični YouTube

    1 / 5

    ✪ Zakon velikih števil

    ✪ 07 - Teorija verjetnosti. Zakon velikih števil

    ✪ 42 Zakon velikih števil

    ✪ 1 - Čebiševljev zakon velikih števil

    ✪ 11. razred, lekcija 25, Gaussova krivulja. Zakon velikih števil

    Podnapisi

    Oglejmo si zakon velikih števil, ki je morda najbolj intuitiven zakon v matematiki in teoriji verjetnosti. In ker velja za toliko stvari, se včasih uporablja in napačno razume. Naj najprej podam definicijo za natančnost, nato pa bomo govorili o intuiciji. Vzemimo naključno spremenljivko, recimo X. Recimo, da poznamo njeno matematično pričakovanje ali srednjo populacijo. Zakon velikih števil preprosto pravi, da če vzamemo primer n-tega števila opazovanj naključne spremenljivke in povprečimo število vseh teh opazovanj... Vzemimo spremenljivko. Imenujmo ga X z indeksom n in pomišljajem na vrhu. To je aritmetična sredina n-tega števila opazovanj naše naključne spremenljivke. Tukaj je moja prva ugotovitev. Enkrat izvedem poskus in opazujem, nato ga ponovim in opazujem, ponovim in dobim to. Ta poskus izvedem n-krat in nato delim s številom svojih opazovanj. Tukaj je moje vzorčno povprečje. Tukaj je povprečje vseh mojih opažanj. Zakon velikih števil nam pove, da se bo moja vzorčna sredina približala sredini naključne spremenljivke. Lahko pa tudi zapišem, da se bo moje vzorčno povprečje približalo populacijskemu povprečju za n-to število, ki gre v neskončnost. Ne bom jasno razlikoval med "približevanjem" in "konvergenco", vendar upam, da intuitivno razumete, da če tukaj vzamem dokaj velik vzorec, dobim pričakovano vrednost za celotno populacijo. Mislim, da vas večina intuitivno razume, da če naredim dovolj testov z velikim vzorcem primerov, mi bodo sčasoma testi dali vrednosti, ki jih pričakujem, ob upoštevanju matematičnega pričakovanja, verjetnosti in vsega tega. Vendar mislim, da pogosto ni jasno, zakaj se to zgodi. In preden začnem razlagati, zakaj je tako, naj navedem konkreten primer. Zakon velikih števil nam pove, da... Recimo, da imamo naključno spremenljivko X. Je enaka številu glav pri 100 metih pravilnega kovanca. Najprej poznamo matematično pričakovanje te naključne spremenljivke. To je število metov kovancev ali poskusov, pomnoženo z verjetnostjo uspeha katerega koli poskusa. Torej je enako 50. To pomeni, da zakon velikih števil pravi, da če vzamemo vzorec ali če izračunam povprečje teh poskusov, dobim. .. Ko prvič delam test, vržem kovanec 100-krat ali pa vzamem škatlo s sto kovanci, jo stresem in nato preštejem, koliko glav dobim, in dobim recimo številko 55. To bo X1. Potem spet stresem škatlo in dobim številko 65. Potem spet - in dobim 45. In to naredim n-krat, nato pa to delim s številom poskusov. Zakon velikih števil nam pove, da se bo to povprečje (povprečje vseh mojih opazovanj) nagibalo k 50, medtem ko se bo n nagibalo k neskončnosti. Zdaj bi rad malo spregovoril o tem, zakaj se to zgodi. Mnogi verjamejo, da če je po 100 poskusih moj rezultat nadpovprečen, potem bi moral imeti po zakonih verjetnosti več ali manj glav, da bi lahko tako rekoč nadomestil razliko. To ni ravno to, kar se bo zgodilo. To se pogosto imenuje "hazarderjeva zmota". Naj vam pokažem razliko. Uporabil bom naslednji primer. Naj narišem graf. Spremenimo barvo. To je n, moja os x je n. To je število testov, ki jih bom opravil. In moja os y bo povprečje vzorca. Vemo, da je povprečje te poljubne spremenljivke 50. Naj narišem to. To je 50. Vrnimo se k našemu primeru. Če je n... Med prvim testom sem dobil 55, kar je moje povprečje. Imam samo eno točko za vnos podatkov. Nato po dveh poskusih dobim 65. Torej bi bilo moje povprečje 65+55 deljeno z 2. To je 60. In moje povprečje se je nekoliko povečalo. Potem sem dobil 45, kar mi je spet znižalo aritmetično sredino. Na grafikonu ne bom vrisal 45. Zdaj moram vse izračunati povprečje. Čemu je enako 45+65? Naj izračunam to vrednost, ki predstavlja točko. To je 165 deljeno s 3. To je 53. Ne, 55. Torej se povprečje spet zniža na 55. S temi testi lahko nadaljujemo. Ko opravimo tri poskuse in pridemo do tega povprečja, mnogi mislijo, da bodo bogovi verjetnosti naredili tako, da bomo v prihodnosti dobili manj glav, da bo naslednjih nekaj poskusov nižjih, da bi zmanjšali povprečje. Vendar ni vedno tako. V prihodnosti ostaja verjetnost vedno enaka. Verjetnost, da bom zavrtel glave, bo vedno 50 %. Ne, da na začetku dobim določeno število glav, več, kot pričakujem, potem pa bi nenadoma morali izpasti repi. To je "zmota igralca". Če dobite nesorazmerno veliko glav, to ne pomeni, da vam bo na neki točki začelo padati nesorazmerno število repov. To ne drži povsem. Zakon velikih števil nam pove, da ni pomembno. Recimo, da po določenem končnem številu poskusov vaše povprečje... Verjetnost za to je precej majhna, a kljub temu... Recimo, da vaše povprečje doseže to mejo - 70. Mislite si: "Vau, presegli smo pričakovanja." Toda zakon velikih števil pravi, da ni vseeno, koliko testov izvajamo. Pred nami je še neskončno število preizkušenj. Matematično pričakovanje tega neskončnega števila poskusov, zlasti v takšni situaciji, bo naslednje. Ko pridete do končnega števila, ki izraža neko veliko vrednost, bo neskončno število, ki konvergira z njim, spet vodilo do pričakovane vrednosti. To je seveda zelo ohlapna razlaga, a to nam pove zakon velikih števil. Je pomembno. Ne pove nam, da če dobimo veliko glav, potem se bodo možnosti, da dobimo repe, nekako povečale, da bi nadomestile. Ta zakon nam pove, da ni pomembno, kakšen je rezultat s končnim številom poskusov, dokler imate še vedno neskončno število poskusov pred seboj. In če jih naredite dovolj, se boste spet vrnili k pričakovanjem. To je pomembna točka. Premisli. A to se v praksi pri loterijah in igralnicah ne uporablja vsakodnevno, čeprav je znano, da če narediš dovolj testov ... Lahko celo izračunamo ... kakšna je verjetnost, da resno odstopimo od norme? Ampak igralnice in loterije vsak dan delujejo po principu, če vzameš dovolj ljudi, seveda v kratkem času, z majhnim vzorcem, potem nekaj ljudi zadene jackpot. Dolgoročno pa bo igralnica vedno imela koristi od parametrov iger, v katere vas povabi. To je pomembno načelo verjetnosti, ki je intuitivno. Čeprav včasih, ko ti to formalno pojasnijo z naključnimi spremenljivkami, izgleda vse skupaj nekoliko zmedeno. Vse, kar ta zakon pravi, je, da več kot je vzorcev, bolj se bo aritmetična sredina teh vzorcev približala pravi sredini. In če smo natančnejši, se bo aritmetična sredina vašega vzorca zbližala z matematičnim pričakovanjem naključne spremenljivke. To je vse. Se vidimo v naslednjem videu!

Šibek zakon velikih števil

Šibek zakon velikih števil se imenuje tudi Bernoullijev izrek po Jacobu Bernoulliju, ki ga je dokazal leta 1713.

Naj obstaja neskončno zaporedje (zaporedno štetje) enako porazdeljenih in nekoreliranih naključnih spremenljivk. To je njihova kovarianca c o v (X i , X j) = 0 , ∀ i ≠ j (\displaystyle \mathrm (cov) (X_(i),X_(j))=0,\;\forall i\not =j). Pustiti . Označimo z vzorčno srednjo vrednostjo prvega n (\displaystyle n)člani:

.

Potem X ¯ n → P μ (\displaystyle (\bar (X))_(n)\to ^(\!\!\!\!\!\!\mathbb (P) )\mu ).

Se pravi za vsako pozitivno ε (\displaystyle \varepsilon )

lim n → ∞ Pr (| X ¯ n − μ |< ε) = 1. {\displaystyle \lim _{n\to \infty }\Pr \!\left(\,|{\bar {X}}_{n}-\mu |<\varepsilon \,\right)=1.}

Močan zakon velikih števil

Naj obstaja neskončno zaporedje neodvisnih enako porazdeljenih naključnih spremenljivk ( X i ) i = 1 ∞ (\displaystyle \(X_(i)\)_(i=1)^(\infty )) definirana na enem verjetnostnem prostoru (Ω , F , P) (\displaystyle (\Omega ,(\mathcal (F)),\mathbb (P))). Pustiti E X i = μ , ∀ i ∈ N (\displaystyle \mathbb (E) X_(i)=\mu ,\;\forall i\in \mathbb (N) ). Označimo z X¯n (\displaystyle (\bar(X))_(n)) vzorčno povprečje prvega n (\displaystyle n)člani:

X ¯ n = 1 n ∑ i = 1 n X i , n ∈ N (\displaystyle (\bar (X))_(n)=(\frac (1)(n))\sum \limits _(i= 1)^(n)X_(i),\;n\in \mathbb (N) ).

Potem X ¯ n → μ (\displaystyle (\bar (X))_(n)\to \mu ) skoraj vedno.

Pr (lim n → ∞ X ¯ n = μ) = 1. (\displaystyle \Pr \!\left(\lim _(n\to \infty )(\bar (X))_(n)=\mu \ desno)=1.) .

Tako kot vsak matematični zakon je tudi zakon velikih števil mogoče uporabiti v resničnem svetu le pod znanimi predpostavkami, ki jih je mogoče izpolniti le z določeno stopnjo natančnosti. Tako na primer pogojev zaporednih testov pogosto ni mogoče vzdrževati v nedogled in z absolutno natančnostjo. Poleg tega zakon velikih števil govori le o neverjetnost pomembno odstopanje srednje vrednosti od matematičnega pričakovanja.

Povprečna vrednost je najsplošnejši kazalnik v statistiki. To je posledica dejstva, da ga je mogoče uporabiti za karakterizacijo populacije glede na kvantitativno spremenljive lastnosti. Na primer, za primerjavo plač delavcev dveh podjetij ni mogoče vzeti plače dveh določenih delavcev, saj deluje kot spremenljiv kazalnik. Prav tako ni mogoče vzeti skupnega zneska izplačanih plač v podjetjih, saj je odvisen od števila zaposlenih. Če celoten znesek plač posameznega podjetja delimo s številom zaposlenih, jih lahko primerjamo in ugotovimo, katero podjetje ima višjo povprečno plačo.

Z drugimi besedami, plače proučevane populacije delavcev dobijo posplošeno karakteristiko v povprečni vrednosti. Izraža splošno in tipično, ki je značilno za celoto delavcev v zvezi s proučevano lastnostjo. V tej vrednosti prikazuje splošno mero tega atributa, ki ima drugačno vrednost za enote populacije.

Določitev povprečne vrednosti. Povprečna vrednost v statistiki je posplošena značilnost niza podobnih pojavov glede na neko kvantitativno spremenljivo lastnost. Povprečna vrednost kaže stopnjo te lastnosti glede na populacijsko enoto. S pomočjo povprečne vrednosti je možno primerjati različne agregate med seboj glede na različne značilnosti (dohodek na prebivalca, pridelki, proizvodni stroški v različnih podjetjih).

Povprečna vrednost vedno posplošuje kvantitativno variacijo lastnosti, s katero označujemo proučevano populacijo in je enako lastna vsem enotam populacije. To pomeni, da za vsako povprečno vrednostjo vedno obstaja vrsta porazdelitve enot populacije po nekem spremenljivem atributu, tj. variacijske serije. V tem pogledu se povprečna vrednost bistveno razlikuje od relativnih vrednosti in zlasti od indikatorjev intenzivnosti. Kazalnik intenzivnosti je razmerje med obsegoma dveh različnih agregatov (npr. proizvodnja BDP na prebivalca), medtem ko povprečje posplošuje značilnosti elementov agregata po eni od značilnosti (npr. povprečje plača delavca).

Srednja vrednost in zakon velikih števil. V spremembi povprečnih kazalcev se kaže splošni trend, pod vplivom katerega se oblikuje proces razvoja pojavov kot celote, v posameznih posameznih primerih pa se ta trend morda ne kaže jasno. Pomembno je, da povprečja temeljijo na množični posplošitvi dejstev. Samo pod tem pogojem bodo razkrili splošni trend, na katerem temelji proces kot celota.


Bistvo zakona velikih števil in njegov pomen za povprečja, z večanjem števila opazovanj vse bolj popolnoma izničuje odstopanja, ki jih povzročajo naključni vzroki. To pomeni, da zakon velikih števil ustvarja pogoje, da se tipična raven spremenljivega atributa pojavi v povprečni vrednosti pod določenimi pogoji kraja in časa. Vrednost te ravni je določena z bistvom tega pojava.

Vrste povprečij. Povprečne vrednosti, ki se uporabljajo v statistiki, spadajo v razred moči, katerih splošna formula je naslednja:

kjer je x povprečje moči;

X - spreminjanje vrednosti atributa (možnosti)

- možnost številke

Eksponent srednje vrednosti;

Znak za seštevek.

Za različne vrednosti eksponenta povprečja dobimo različne vrste povprečja:

Aritmetična sredina;

Srednji kvadrat;

Povprečna kubična;

Povprečni harmonični;

Geometrijska sredina.

Različne vrste povprečij imajo različne pomene pri uporabi iste izvorne statistike. Hkrati pa velja, da večji kot je eksponent povprečja, višja je njegova vrednost.

V statistiki daje pravilno karakterizacijo populacije v vsakem posameznem primeru le povsem določena vrsta povprečnih vrednosti. Za določitev te vrste povprečne vrednosti se uporablja kriterij, ki določa lastnosti povprečja: povprečna vrednost bo šele tedaj prava generalizacijska značilnost populacije glede na spremenljivi atribut, ko bodo vse različice zamenjane s povprečjem. vrednosti, skupna prostornina spremenljivega atributa ostane nespremenjena. To pomeni, da je pravilna vrsta povprečja določena s tem, kako se oblikuje skupni obseg spremenljive lastnosti. Torej, aritmetična sredina se uporablja, ko je obseg spremenljivke oblikovan kot vsota posameznih možnosti, srednji kvadrat - ko je obseg spremenljivke oblikovan kot vsota kvadratov, harmonična sredina - kot vsota recipročne vrednosti posameznih opcij, geometrična sredina - kot produkt posameznih opcij. Poleg povprečnih vrednosti v statistiki

Uporabljene so opisne značilnosti porazdelitve spremenljivke (strukturna povprečja), mod (najpogostejša varianta) in mediana (srednja varianta).