class: center, middle, inverse, title-slide # PRIMJENJENA STATISTIKA ## Predavanje 7: Statistička teorija - testiranje hipoteza ### Luka Sikic, PhD ### Fakultet hrvatskih studija |
Github PS
--- class: inverse, middle # PREGLED PREDAVANJA --- layout: true # PREGLED PREDAVANJA --- <br> ## CILJEVI - Ključni koncepti - Vrste pogrešaka - Testna statistika i sampling distribucija - Kritičke vrijednosti i granice - p-vrijednosti - Interpretacija rezultata - Testiranje hipoteza u R - Efekt veličine, i snaga testa - Dodatni koncepti - Intervali pouzdanosti --- layout:false class: middle, inverse # KLJUČNI KONCEPTI <html><div style='float:left'></div><hr color='#EB811B' size=1px width=796px></html> (Terminologija!) --- layout:true # KLJUČNI KONCEPTI --- <br> <br> - Istraživačke hipoteze <br> - Statističke hipoteze <br> - Nulta i alternativna hipoteza --- layout:false class: middle, inverse # VRSTE POGREŠAKA KOD TESTIRANJA HIPOTEZA <html><div style='float:left'></div><hr color='#EB811B' size=1px width=796px></html> (Error I vs Error II) --- layout:true # VRSTE POGREŠAKA KOD TESTIRANJA HIPOTEZA --- .hi[Pogreške kod testiranja hipoteza] <table> <thead> <tr> <th style="text-align:left;"> </th> <th style="text-align:left;"> zadrži `\(H_0\)` </th> <th style="text-align:left;"> odbaci `\(H_0\)` </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> `\(H_0\)` je točna: </td> <td style="text-align:left;"> ispravna odluka </td> <td style="text-align:left;"> greška (tip I) </td> </tr> <tr> <td style="text-align:left;"> `\(H_0\)` nije točna: </td> <td style="text-align:left;"> greška (tip II) </td> <td style="text-align:left;"> ispravna odluka </td> </tr> </tbody> </table> .hi[Razine signifikantnosti] <table> <thead> <tr> <th style="text-align:left;"> </th> <th style="text-align:left;"> zadrži `\(H_0\)` </th> <th style="text-align:left;"> odbaci `\(H_0\)` </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> `\(H_0\)` je točna: </td> <td style="text-align:left;"> `\(1-\alpha\)` (vjerojatnost zadržavanja točne hipoteze) </td> <td style="text-align:left;"> `\(\alpha\)` (tip I pogreške) </td> </tr> <tr> <td style="text-align:left;"> `\(H_0\)` nije točna: </td> <td style="text-align:left;"> `\(\beta\)` (tip II pogreške) </td> <td style="text-align:left;"> `\(1-\beta\)` (snaga testa) </td> </tr> </tbody> </table> --- layout:false class: middle, inverse # TESTNA STATISTIKA I SAMPLING DISTRIBUCIJA <html><div style='float:left'></div><hr color='#EB811B' size=1px width=796px></html> (Osnova za odluku.) --- layout:true # TESTNA STATISTIKA I SAMPLING DISTRIBUCIJA --- .hi[Testna statistika(primjer)] `\(X \sim \mbox{Binomial}(\theta,N)\)` .hi[Sampling distribucija testne statistike] ```r # Distribucija x <- 0:100 y <- dbinom(x,100,.5) # Vizualizacija plot(x,y,type="h",lwd=3, col=ifelse(colour,emphCol,"black"), xlab="Broj točnih odgovora (X)", ylab="Vjerojatnost", main="Sampling distribucija za X kada je nulta hipoteza točna", font.main=1, frame.plot=FALSE ) ``` --- .hi[Sampling distribucija testne statistike] <img src="07_HIPOTEZE_files/figure-html/samplingdist1-1.svg" style="display: block; margin: auto;" /> .footnote[[*] Sampling distribucija testne statistike `\(X\)` kad je nulta hipoteza istinita. U našem prmjeru je riječ o binomnoj distribuciji. Pod nultom hipotezom je vjerojatnost `\(theta = .5\)`, pa sampling distribucija implicira vrijednost 50 (od 100) točnih odgovora. Većina mase vjerojatnosti se nalazi izmedju vrijednosti 40 i 60.] --- layout:false class: middle, inverse # KRITIČKE VRIJEDNOSTI I GRANICE <html><div style='float:left'></div><hr color='#EB811B' size=1px width=796px></html> (Kriterij za odluku.) --- layout:true # KRITIČKE VRIJEDNOSTI I GRANICE --- .hi[Kritičke vrijednosti za dvostrani test] <img src="07_HIPOTEZE_files/figure-html/crit2-1.svg" style="display: block; margin: auto;" /> .footnote[[*] Kritičke vrijednosti vezane uz hipotezu testa ESP istraživanja, za test sa razinama signifikantnosti `alpha = .05`. Grafikon prikazuje sampling distribuciju `X` pod nultom hipotezom: prostor u sredini odgovara vrijednostima sampling distribucije za `X` za koje bismo zadržali nultu hipotezu.Stupci se odnose na kritičke vrijednosti: vrijednosti `X` za koje bismo odbacili nultu hipotezu.] --- .hi[Kritičke vrijednosti za jednostrani test] <img src="07_HIPOTEZE_files/figure-html/crit1-1.svg" style="display: block; margin: auto;" /> .footnote[[*] Kritička regija za jednostrani test. U ovom slučaju je alternativna hipoteza `theta > .05`, tako da nultu hipotezu odbacujemo samo za velike vrijednosti `X`. Zbog toga kritička regija pokriva samo gornji dio distribucije; točnije 5% distribucije.] --- layout:false class: middle, inverse #p-VRIJEDNOSTI <html><div style='float:left'></div><hr color='#EB811B' size=1px width=796px></html> (Kriterij za odluku.) --- layout:true # p-VRIJEDNOSTI --- .hi[**Neyman**(granice prihvaćanja/odbacivanja)] <table> <thead> <tr> <th style="text-align:right;"> Vrijednost alpha </th> <th style="text-align:left;"> Odbaci nultu hipotezu? </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 0.05 </td> <td style="text-align:left;"> Da </td> </tr> <tr> <td style="text-align:right;"> 0.04 </td> <td style="text-align:left;"> Da </td> </tr> <tr> <td style="text-align:right;"> 0.03 </td> <td style="text-align:left;"> Da </td> </tr> <tr> <td style="text-align:right;"> 0.02 </td> <td style="text-align:left;"> Ne </td> </tr> <tr> <td style="text-align:right;"> 0.01 </td> <td style="text-align:left;"> Ne </td> </tr> </tbody> </table> .hi[**Fisher** (vjerojatnost ekstremnih podataka i.e. vrijednosti)] --- .hi[Izvještavanje o rezultatima testa] <table> <caption></caption> <thead> <tr> <th style="text-align:left;"> Notacija </th> <th style="text-align:left;"> Zvjezdice </th> <th style="text-align:left;"> Značajnost </th> <th style="text-align:left;"> Nulta hipoteza </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> `\(p>.05\)` </td> <td style="text-align:left;"> NA </td> <td style="text-align:left;"> Test nije značajan </td> <td style="text-align:left;"> Zadrži </td> </tr> <tr> <td style="text-align:left;"> `\(p<.05\)` </td> <td style="text-align:left;"> * </td> <td style="text-align:left;"> Test značajan na razini alpha = .05 ali ne alpha =.01 niti alpha = .001 </td> <td style="text-align:left;"> Odbaci </td> </tr> <tr> <td style="text-align:left;"> `\(p<.01\)` </td> <td style="text-align:left;"> ** </td> <td style="text-align:left;"> Test značajan na razini alpha = .05 i alpha = .01 ali ne alpha = .001 </td> <td style="text-align:left;"> Odbaci </td> </tr> <tr> <td style="text-align:left;"> `\(p<.001\)` </td> <td style="text-align:left;"> *** </td> <td style="text-align:left;"> Test značajan na svim razinama </td> <td style="text-align:left;"> Odbaci </td> </tr> </tbody> </table> .footnote[[*] Standardne konvencije za prihvaćanje `p `vrijednosti: konvencija je prikazati rezultate na jedan od navedenih načina (e.g., `p<.05`). Prikazane "zvjezdice značajnosti" (i.e., označava `p<.05`) su često output u statističkim programima. Nekada se sreće notacija n.s. (not significant) umjesto `p>.05`.] --- layout:false class: middle, inverse # TESTIRANJE HIPOTEZA U R <html><div style='float:left'></div><hr color='#EB811B' size=1px width=796px></html> (Jednostavno!) --- layout:true # TESTIRANJE HIPOTEZA U R --- .hi[Provedi test] ```r # provedi testiranje hipoteza ESP istraživanja za 62 točna odgovora binom.test( x=62, n=100, p=.5 ) ``` ``` #> #> Exact binomial test #> #> data: 62 and 100 #> number of successes = 62, number of trials = 100, p-value = 0.02098 #> alternative hypothesis: true probability of success is not equal to 0.5 #> 95 percent confidence interval: #> 0.5174607 0.7152325 #> sample estimates: #> probability of success #> 0.62 ``` --- layout:false class: middle, inverse # EFEKT VELIČINE I SNAGA TESTA <html><div style='float:left'></div><hr color='#EB811B' size=1px width=796px></html> (Uvjerljivost testa!) --- layout:true # EFEKT VELIČINE I SNAGA TESTA --- .hi[Sampling distribucije za različite vrijednosti `X`] <img src="07_HIPOTEZE_files/figure-html/crit3-1.svg" style="display: block; margin: auto;" /> .footnote[[*] Sampling distribucija pod "alternativnom" hipotezom, za populacijski parametar `theta = 0.55`. Značajan dio populacije leži u gornjoj kritičkoj regiji.] --- <img src="07_HIPOTEZE_files/figure-html/crit4-1.svg" style="display: block; margin: auto;" /> .footnote[[*] Sampling distribucija pod "alternativnom" hipotezom, za populacijski parametar `theta = 0.70`. Skoro cijela populacija leži u gornjoj kritičkoj regiji.] --- .hi[Funkcija snage testa] <img src="07_HIPOTEZE_files/figure-html/powerfunction-1.svg" style="display: block; margin: auto;" /> .footnote[[*] Vjerojatnost odbacivanja nulte hipoteze, prikazana kao funkcija od `theta.` Test ima veću snagu (veća vjerojatnost ispravnog odbacivanja nulte hipoteze) što je `theta` različitija od vrijednosti koju implicira nulta hipoteza (i.e., `theta=.5`). Kada je `theta = .5` (točka na grafikonu), nulta hipoteza je točna.] --- .hi[Efekt veličine] <br> <br> <table> <thead> <tr> <th style="text-align:left;"> </th> <th style="text-align:left;"> veliki_efekt </th> <th style="text-align:left;"> malen_efekt </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> značajno </td> <td style="text-align:left;"> razlika je stvarna i važna </td> <td style="text-align:left;"> razlika je stvarna ali nevažna </td> </tr> <tr> <td style="text-align:left;"> neznačajno </td> <td style="text-align:left;"> bez efekta </td> <td style="text-align:left;"> bez efekta </td> </tr> </tbody> </table> --- layout:false class: middle, inverse # DODATNI KONCEPTI <html><div style='float:left'></div><hr color='#EB811B' size=1px width=796px></html> (Razlike u shvaćanju testiranja hipoteza i Bayes-ov princip!) --- layout:true # DODATNI KONCEPTI --- - Neyman vs. Fisher - Bayesovo pravilo $$ P(A | B) = \frac{P(B|A) P(A)}{P(B)} $$ - Bayes i nulta hipoteza $$ P(H_0:točna | podatci:X) = \frac{P(podatci:X | H_0:točna) P(H_0:točna)}{P(podatci:X)} $$ - *Posteriorni* omjer $$ \frac{P( H_1:točna | podatci:X)}{P(H_0:točna | podatci:X)} $$