Statistika je že dolgo sestavni del življenja. Ljudje se s tem soočajo povsod. Na podlagi statističnih podatkov se sklepajo, kje in katere bolezni so pogoste, kaj je v določeni regiji ali med določenim segmentom prebivalstva bolj iskano. Tudi konstrukcija političnih programov kandidatov za državne organe temelji na statističnih podatkih. Uporabljajo jih tudi trgovske verige pri nakupu blaga, proizvajalci pa se v svojih predlogih vodijo po teh podatkih.
Statistika igra pomembno vlogo v življenju družbe in vpliva na vsakega posameznega člana, tudi v majhnih stvareh. Na primer, če po statističnih podatkih večina ljudi raje temne barve v oblačilih v določenem mestu ali regiji, bo v lokalnih prodajalnah zelo težko najti svetlo rumen dežni plašč s cvetličnim tiskom. Toda kakšne količineali se ti podatki seštevajo, da imajo takšen vpliv? Na primer, kaj je »statistično pomembno«? Kaj točno pomeni ta definicija?
Kaj je to?
Statistika kot znanost je sestavljena iz kombinacije različnih količin in konceptov. Eden izmed njih je koncept "statističnega pomena". To je ime vrednosti spremenljivk, pri katerih je verjetnost pojava drugih kazalnikov zanemarljiva.
Na primer, 9 od 10 ljudi si je med jutranjim sprehodom po gobe v jesenskem gozdu po deževni noči na noge obulo gumijaste čevlje. Verjetnost, da si jih v nekem trenutku 8 natakne platnene mokasine, je zanemarljiva. Tako je v tem konkretnem primeru število 9 tisto, kar se imenuje »statistični pomen«.
V skladu s tem, če nadalje razvijamo podani praktični primer, trgovine s čevlji do konca poletne sezone kupujejo gumijaste škornje v večjih količinah kot v drugih letnih časih. Tako velikost statistične vrednosti vpliva na običajno življenje.
Seveda se pri zapletenih izračunih, recimo pri napovedovanju širjenja virusov, upošteva veliko število spremenljivk. Toda samo bistvo določanja pomembnega kazalnika statističnih podatkov je podobno, ne glede na zapletenost izračunov in število spremenljivih vrednosti.
Kako se izračuna?
Uporablja se pri izračunu vrednosti indikatorja "statističnega pomena" enačbe. Se pravi, lahko trdimo, da v tem primeru vse odloča matematika. Najenostavnejša možnost izračuna je veriga matematičnih operacij, v kateri so vključeni naslednji parametri:
- dve vrsti rezultatov, pridobljenih z anketami ali študijo objektivnih podatkov, kot je količina nakupov, označenih z a in b;
- indikator velikosti vzorca za obe skupini – n;
- vrednost kombiniranega vzorčnega deleža - p;
- standardna napaka - SE.
Naslednji korak je določitev skupne ocene testa - t, njena vrednost se primerja s številko 1,96. 1,96 je povprečna vrednost, ki predstavlja razpon 95 % v skladu s Študentovo funkcijo t-distribucije.
Velikokrat se pojavi vprašanje, kakšna je razlika med vrednostma n in p. Ta odtenek je enostavno razjasniti s primerom. Recimo, da se izračuna statistični pomen zvestobe kateremu koli izdelku ali blagovni znamki moških in žensk.
V tem primeru bodo črkam sledile naslednje:
- n - število anketirancev;
- p - število zadovoljnih z izdelkom.
Število anketiranih žensk v tem primeru bo označeno kot n1. V skladu s tem moški - n2. Enako vrednost bosta imela številki "1" in "2" simbola p.
Primerjava rezultatov testa s povprečjem študentskih preglednic postane tisto, kar imenujemo "statistična pomembnost".
Kaj pomeni preverjanje?
Rezultate katerega koli matematičnega izračuna je vedno mogoče preveriti, tega se učijo otroci v osnovni šoli. Logično je domnevatiker je statistika določena z uporabo verige izračunov, potem se preveri.
Vendar testiranje statistične pomembnosti ni le matematika. Statistika se ukvarja z velikim številom spremenljivk in različnimi verjetnostmi, ki jih še zdaleč ni vedno mogoče izračunati. Se pravi, če se vrnemo k primeru gumijastih čevljev na začetku članka, potem lahko logično konstrukcijo statističnih podatkov, na katere se bodo zanašali kupci blaga za trgovine, lahko zmoti suho in vroče vreme, ki ni značilno za jesen.. Zaradi tega pojava se bo število ljudi, ki kupujejo gumijaste škornje, zmanjšalo, prodajalne pa bodo utrpele izgube. Seveda matematična formula ne more predvideti vremenske anomalije. Ta trenutek se imenuje "napaka".
To je le verjetnost takšnih napak in upošteva preverjanje stopnje izračunane pomembnosti. Upošteva tako izračunane kazalnike kot sprejete ravni pomembnosti, kot tudi količine, ki se običajno imenujejo hipoteze.
Kakšna je stopnja pomembnosti?
Koncept "raven" je vključen v glavna merila za statistično pomembnost. Uporablja se v uporabni in praktični statistiki. To je nekakšna vrednost, ki upošteva verjetnost možnih odstopanj ali napak.
Raven temelji na identifikaciji razlik v že pripravljenih vzorcih, omogoča vam, da ugotovite njihov pomen ali, nasprotno, naključnost. Ta koncept nima samo digitalnih pomenov, temveč tudi njihove posebne interpretacije. Pojasnijokako morate razumeti vrednost, sama raven pa se določi s primerjavo rezultata s povprečnim indeksom, to razkrije stopnjo zanesljivosti razlik.
Tako si lahko predstavljamo koncept nivoja preprosto - je indikator sprejemljive, verjetne napake ali napake v sklepih, ki izhajajo iz pridobljenih statističnih podatkov.
Katere stopnje pomembnosti so uporabljene?
Statistični pomen koeficientov verjetnosti napake v praksi temelji na treh osnovnih ravneh.
Prva raven je prag, pri katerem je vrednost 5%. To pomeni, da verjetnost napake ne presega ravni pomembnosti 5%. To pomeni, da je zaupanje v brezhibnost in nezmotljivost sklepov, narejenih na podlagi podatkov statističnih raziskav, 95-odstotno.
Druga raven je 1-odstotni prag. V skladu s tem ta številka pomeni, da se lahko vodimo po podatkih, pridobljenih med statističnimi izračuni, z 99-odstotno zanesljivostjo.
Tretja stopnja - 0,1%. S to vrednostjo je verjetnost napake enaka delčku odstotka, kar pomeni, da so napake praktično odpravljene.
Kaj je hipoteza v statistiki?
Napake kot koncept so razdeljene na dve področji, ki se nanašata na sprejemanje ali zavrnitev ničelne hipoteze. Hipoteza je koncept, za katerim se po definiciji skriva niz rezultatov ankete, drugih podatkov ali trditev. To je opis porazdelitve verjetnosti nečesa, ki je povezano s predmetom statističnega računovodstva.
Pri preprostih izračunih obstajata dve hipotezi - nič in alternativna. Razlika med njima je v tem, da ničelna hipoteza temelji na ideji, da med vzorci, ki sodelujejo pri določanju statistične pomembnosti, ni bistvenih razlik, alternativna hipoteza pa ji je popolnoma nasprotna. To pomeni, da alternativna hipoteza temelji na prisotnosti pomembne razlike v teh vzorcih.
Kaj so napake?
Napake kot pojem v statistiki so premosorazmerne s sprejetjem te ali one hipoteze kot resnične. Lahko jih razdelimo v dve smeri oziroma vrsti:
- prva vrsta je posledica sprejetja ničelne hipoteze, ki se je izkazala za napačno;
- sekunda - posledica sledenja alternativi.
Prva vrsta napake se imenuje lažno pozitivna in je precej pogosta na vseh področjih, kjer se uporabljajo statistike. V skladu s tem se napaka druge vrste imenuje lažno negativna.
Zakaj potrebujemo regresijo v statistiki?
Statistični pomen regresije je v tem, da je z njeno pomočjo mogoče ugotoviti, koliko model različnih odvisnosti, izračunanih na podlagi podatkov, ustreza realnosti; vam omogoča, da ugotovite zadostnost ali pomanjkanje dejavnikov za obračunavanje in sklepe.
Vrednost regresije se določi s primerjavo rezultatov s podatki, navedenimi v Fisherjevih tabelah. Ali pa z analizo variance. Kazalniki regresije so pomembni, kozapletene statistične študije in izračuni, ki vključujejo veliko število spremenljivk, naključne podatke in verjetne spremembe.