Učitano 229,886 članaka
Vremenski raspon: 01.01.2021 do 08.01.2024
Semantička analiza, konstrukcija indeksa i vremenske dinamike
U ovom izvještaju se predstavlja sveobuhvatna analiza medijske pokrivenosti sigurnosti i stabilnosti u Hrvatskoj. Analizom se obuhvaća praćenje kriminaliteta, prometnih nesreća, požara, prirodnih katastrofa, rada hitnih službi i institucionalnog odgovora na sigurnosne prijetnje temeljem članaka iz hrvatskih online medija.
Sigurnost i stabilnost predstavljaju temeljne preduvjete za funkcioniranje društva i gospodarstva. Ovim izvještajem se nastoji odgovoriti na ključna pitanja:
U izvještaju se obrađuju sljedeće teme: metodologija identifikacije relevantnih članaka, eksploratorni pregled dataseta, semantička taksonomija sigurnosnih pojmova, konstrukcija specijaliziranih indeksa, vizualizacija indeksa, sektorska analiza, volatilnost i momentum te koncentracija tema.
Učitano 229,886 članaka
Vremenski raspon: 01.01.2021 do 08.01.2024
Identifikacija relevantnih članaka se provodi kroz sedmostupanjski proces filtriranja koji kombinira strukturne kriterije, ključne riječi i kontekstualnu validaciju. Proces osigurava da u analizu ulaze samo članci koji su stvarno relevantni za tematiku sigurnosti i stabilnosti u hrvatskom kontekstu.
Filter 1: Tip izvora
Odabiru se samo web izvori kako bi se osigurala konzistentnost formata i dostupnost punog teksta članka.
Filter 2: Relevantni news portali
Koristi se lista verificiranih hrvatskih news portala kategoriziranih u pet skupina: nacionalni mediji, poslovni mediji, regionalni mediji, specijalizirani mediji (uključujući policija.hr, vatrogasci.hr, morh.hr) i opinion portali.
Filter 3: Minimalna duljina teksta
Članci moraju sadržavati minimalno 500 znakova u punom tekstu.
Filter 4: Naslov članka
Naslov članka mora sadržavati sigurnosne pojmove: kriminal, nesreće, požari, katastrofe, hitne službe, terorizam.
Filter 5: Core sigurnosni pojmovi
Puni tekst članka mora sadržavati core sigurnosne pojmove s institucionalnim okvirom (policija, DORH, USKOK, vatrogasci, HGSS).
Filter 6: Isključivanje irelevantnog sadržaja
Isključuju se članci o sportu, zabavi i fikcionalnom kriminalu (serije, filmovi), osim ako sadrže snažne override pojmove.
Filter 7: Hrvatski kontekst
Članci moraju sadržavati reference na hrvatske sigurnosne institucije, gradove i lokacije.
| Metrika | Vrijednost |
|---|---|
| Ukupan broj članaka | 229,886 |
| Vremenski raspon | 01.01.2021 do 08.01.2024 |
| Broj dana | 1102 |
| Prosječno članaka dnevno | 208.61 |
| Broj izvora (portala) | 113 |
| Broj kategorija izvora | 5 |
Semantički rječnik se temelji na pojmovima identificiranima u procesu filtriranja članaka. Pojmovi se definiraju pomoću korijena riječi (stem) kako bi se osigurala šira morfološka pokrivenost hrvatskog jezika. Taksonomija se organizira u 12 kategorija koje obuhvaćaju različite aspekte sigurnosnih prijetnji i institucionalnog odgovora u hrvatskom kontekstu.
Princip konstrukcije rječnika:
Morfološka pokrivenost:
Za hrvatski jezik koji ima bogatu morfologiju, koriste se korijenski oblici s opcionalnim nastavcima: ubojstv[a-zčćžšđ]* prepoznaje ubojstvo, ubojstva, ubojstvom. Alternativni oblici za palatalizaciju: [sš], [cč], [zž]}. Wildcard znakovi: .{0,15} dopušta do 15 bilo kojih znakova između riječi.
Formula za brojanje:
\[ \text{count}_{c,d} = \sum_{p \in P_c} \text{matches}(p, d) \]
gdje je \(P_c\) skup regex uzoraka za kategoriju \(c\), a \(d\) je tekst dokumenta.
| Kategorija | Broj pojmova | Primjeri regex uzoraka |
|---|---|---|
| Nasilni kriminal | 9 | ubojstv[a-zčćžšđ]*, ubij[a-zčćžšđ]* |
| Imovinski kriminal | 8 | pljačk[a-zčćžšđ]*, razbojni[sš]tv[a-zčćžšđ]* |
| Organizirani kriminal | 9 | organiziran[a-zčćžšđ]*.{0,10}kriminal, kriminaln[a-zčćžšđ]*.{0,10}(skupin|organ|mre[zž]) |
| Uhićenja i pritvori | 6 | uhi[cć]en[a-zčćžšđ]*, priveden[a-zčćžšđ]* |
| Tužiteljstvo i sudstvo | 10 | \bdorh\b, dr[zž]avn[a-zčćžšđ]*.{0,10}odvjetni[sš]tv |
| Prometne nesreće | 9 | prometn[a-zčćžšđ]*.{0,10}nesre[cć], sudar[a-zčćžšđ]* |
| Požari | 9 | po[zž]ar[a-zčćžšđ]*, [sš]umski.{0,5}po[zž]ar |
| Prirodne katastrofe | 11 | potres[a-zčćžšđ]*, magnitud[a-zčćžšđ]* |
| Hitne službe | 8 | \bhgss\b, hrvatska gorska slu[zž]ba |
| Terorizam | 7 | teroriz[a-zčćžšđ]*, terorist[a-zčćžšđ]* |
| Cyber kriminal | 7 | cyber.{0,5}(napad|kriminal|sigurnost), hakersk[a-zčćžšđ]*.{0,10}napad |
| Žrtve i štete | 10 | (smrtn|smrtno).{0,5}stradal, [zž]rtv[a-zčćžšđ]* |
VCI kvantificira intenzitet medijskog diskursa o nasilnim kaznenim djelima u hrvatskim medijima. Konstrukcija se temelji na prebrojavanju pojavljivanja korijena riječi koje signaliziraju nasilni kriminal, kao što su ubojstv, silovanj, nasilj, napad i slično. Suma tih pojavljivanja normalizira se brojem članaka kako bi se dobila prosječna mjesečna frekvencija pojmova nasilnog kriminala. Rezultat se skalira na raspon 0 do 100 standardnom min max normalizacijom. Povišene vrijednosti VCI indeksa indiciraju razdoblja intenzivnog medijskog izvještavanja o nasilnom kriminalu.
Formula:
\[ \text{VCI}_t = \text{normalize}_{0-100}\left(\frac{\text{count}_{nasilni,t}}{N_t}\right) \]
Uključeni pojmovi: ubojstvo, fizički napad, napad nožem/oružjem, silovanje, seksualno nasilje, obiteljsko nasilje
Interpretacija: Visoke vrijednosti ukazuju na intenzivan medijski diskurs o nasilnom kriminalu.
PCI mjeri intenzitet medijskog diskursa o imovinskom kriminalu uključujući krađe, provale, pljačke i vandalizam. Indeks se konstruira prebrojavanjem pojavljivanja relevantnih pojmova normaliziranih ukupnim brojem članaka u mjesecu. Visoke vrijednosti indiciraju pojačano izvještavanje o imovinskim kaznenim djelima.
Formula:
\[ \text{PCI}_t = \text{normalize}_{0-100}\left(\frac{\text{count}_{imovinski,t}}{N_t}\right) \]
Uključeni pojmovi: pljačka, razbojništvo, krađa, provale, vandalizam, palež
OCI prati intenzitet medijskog diskursa o organiziranom kriminalu, krijumčarenju, trgovini ljudima i narkomafiji. Konstrukcija slijedi istu metodologiju normalizacije broja pojavljivanja relevantnih pojmova. Povišene vrijednosti mogu indicirati velike policijske akcije protiv organiziranih kriminalnih skupina.
Formula:
\[ \text{OCI}_t = \text{normalize}_{0-100}\left(\frac{\text{count}_{organizirani,t}}{N_t}\right) \]
Uključeni pojmovi: organizirani kriminal, krijumčarenje, trgovina ljudima, narkokartel, mafija, droga
PAI mjeri intenzitet diskursa o uhićenjima, pritvorima i radu pravosudnih institucija. Indeks kombinira pojmove vezane uz policijske akcije (uhićenja, pritvori) i tužiteljske aktivnosti (DORH, USKOK, optužnice). Visoke vrijednosti signaliziraju intenzivne policijske i pravosudne aktivnosti.
Formula:
\[ \text{PAI}_t = \text{normalize}_{0-100}\left(\frac{\text{count}_{uhicenja,t} + \text{count}_{tuziteljstvo,t}}{N_t}\right) \]
Uključeni pojmovi: uhićen, priveden, pritvor, DORH, USKOK, PNUSKOK, optužnica, kaznena prijava, presuda
TAI prati intenzitet medijskog diskursa o prometnim nesrećama i sigurnosti u prometu. Indeks pokazuje izražene sezonske obrasce s vrhovima tijekom ljetne sezone i blagdana kada je promet intenzivniji.
Formula:
\[ \text{TAI}_t = \text{normalize}_{0-100}\left(\frac{\text{count}_{prometne,t}}{N_t}\right) \]
Uključeni pojmovi: prometna nesreća, sudar, slijetanje, poginuo u prometu, alkohol za volanom, autocesta
FRI mjeri intenzitet diskursa o požarima i vatrogasnim intervencijama. Indeks pokazuje snažan sezonski obrazac s vrhovima u ljetnim mjesecima kada su šumski požari najučestaliji.
Formula:
\[ \text{FRI}_t = \text{normalize}_{0-100}\left(\frac{\text{count}_{pozari,t}}{N_t}\right) \]
Uključeni pojmovi: požar, šumski požar, stambeni požar, vatrogasci, JVP, DVD, gašenje požara
NDI prati intenzitet diskursa o potresima, poplavama, olujama i drugim prirodnim nepogodama. Vrhovi koincidiraju s velikim prirodnim katastrofama poput petrinjskog potresa 2020. godine.
Formula:
\[ \text{NDI}_t = \text{normalize}_{0-100}\left(\frac{\text{count}_{katastrofe,t}}{N_t}\right) \]
Uključeni pojmovi: potres, magnituda, Richter, seizmološki, poplava, bujica, oluja, nevrijeme, klizište, odron
ESI mjeri intenzitet diskursa o radu hitnih službi uključujući HGSS, civilnu zaštitu i intervencije spašavanja. Povišene vrijednosti indiciraju razdoblja pojačanih intervencija i kriznih situacija.
Formula:
\[ \text{ESI}_t = \text{normalize}_{0-100}\left(\frac{\text{count}_{hitne,t}}{N_t}\right) \]
Uključeni pojmovi: HGSS, Hrvatska gorska služba spašavanja, civilna zaštita, evakuacija, spašavanje
TRI prati intenzitet diskursa o terorizmu, radikalizaciji i sigurnosnim prijetnjama. Indeks je generalno nizak u hrvatskom kontekstu s povremenim skokovima vezanim uz međunarodne događaje.
Formula:
\[ \text{TRI}_t = \text{normalize}_{0-100}\left(\frac{\text{count}_{terorizam,t}}{N_t}\right) \]
Uključeni pojmovi: terorizam, teroristi, radikalizacija, eksplozija, bomba
CYI mjeri intenzitet diskursa o cyber kriminalu, hakerskim napadima i digitalnoj sigurnosti. Trend je rastući s obzirom na digitalizaciju društva i sve veću učestalost cyber prijetnji.
Formula:
\[ \text{CYI}_t = \text{normalize}_{0-100}\left(\frac{\text{count}_{cyber,t}}{N_t}\right) \]
Uključeni pojmovi: cyber napad, hakerski napad, krađa podataka, ransomware, phishing, malware
CSI predstavlja kompozitni indeks sigurnosti koji agregira sve pojedinačne indekse u jednu mjeru ukupnog sigurnosnog diskursa. Izračunava se kao jednostavni prosjek svih 11 specijaliziranih indeksa. Visoke vrijednosti indiciraju razdoblja intenzivnog medijskog izvještavanja o sigurnosnim temama općenito.
Formula:
\[ \text{CSI}_t = \frac{1}{11} \sum_{i=1}^{11} \text{Indeks}_{i,t} \]
Interpretacija vrijednosti:
Raspon 0 do 25 indicira nisku razinu sigurnosnog diskursa. Raspon 25 do 50 indicira umjerenu razinu. Raspon 50 do 75 indicira visoku razinu. Raspon 75 do 100 indicira vrlo visoku razinu tipičnu za krizna razdoblja i velike incidente.
| Indeks | Naziv | Opis |
|---|---|---|
| VCI | Violent Crime Index | Nasilni kriminal (ubojstva, napadi, nasilje) |
| PCI | Property Crime Index | Imovinski kriminal (krađe, provale, pljačke) |
| OCI | Organized Crime Index | Organizirani kriminal i krijumčarenje |
| PAI | Prosecution and Arrests Index | Uhićenja, pritvori i pravosudne aktivnosti |
| TAI | Traffic Accident Index | Prometne nesreće i sigurnost u prometu |
| FRI | Fire Index | Požari i vatrogasne intervencije |
| NDI | Natural Disaster Index | Prirodne katastrofe (potresi, poplave, oluje) |
| ESI | Emergency Services Index | Rad hitnih službi i spašavanje |
| TRI | Terrorism Index | Terorizam i radikalizacija |
| CYI | Cyber Crime Index | Cyber kriminal i digitalna sigurnost |
| CSI | Composite Security Index | Kompozitni indeks svih kategorija |
| Mjesec | Broj članaka | CSI | VCI | TAI | FRI | NDI | PAI |
|---|---|---|---|---|---|---|---|
| vlj 2023 | 6,669 | 40.3 | 25.6 | 10.5 | 8.8 | 46.1 | 65.7 |
| ožu 2023 | 6,079 | 34.0 | 42.8 | 21.2 | 9.2 | 8.7 | 79.9 |
| tra 2023 | 5,740 | 42.0 | 100.0 | 33.4 | 9.3 | 2.1 | 88.8 |
| svi 2023 | 5,605 | 42.2 | 53.9 | 20.8 | 7.5 | 27.0 | 54.0 |
| lip 2023 | 6,049 | 33.3 | 24.8 | 57.3 | 11.1 | 9.5 | 59.3 |
| srp 2023 | 8,112 | 28.0 | 2.3 | 30.0 | 47.0 | 26.5 | 27.5 |
| kol 2023 | 7,499 | 30.4 | 69.9 | 39.1 | 14.6 | 20.0 | 39.6 |
| ruj 2023 | 5,889 | 38.5 | 96.2 | 35.1 | 9.7 | 6.5 | 67.6 |
| lis 2023 | 5,986 | 38.3 | 56.4 | 46.0 | 30.2 | 2.7 | 34.2 |
| stu 2023 | 5,557 | 37.4 | 45.1 | 49.8 | 0.0 | 8.8 | 90.4 |
| pro 2023 | 5,310 | 35.7 | 88.5 | 29.7 | 4.8 | 16.4 | 73.5 |
| sij 2024 | 1,633 | 34.1 | 17.3 | 100.0 | 1.5 | 14.0 | 79.9 |
Herfindahl Hirschman Index (HHI) mjeri koncentraciju tema u medijskom prostoru. Izračunava se kao suma kvadrata udjela svake kategorije. Vrijednosti bliže 1 indiciraju visoku koncentraciju (dominacija jedne teme), dok vrijednosti bliže 0 indiciraju ravnomjerniju raspodjelu pozornosti.
Formula:
\[ \text{HHI}_t = \sum_{i=1}^{n} s_{i,t}^2 \]
gdje je \(s_{i,t}\) udio kategorije \(i\) u ukupnom broju spominjanja u mjesecu \(t\).
| Indeks | Korelacija s CSI |
|---|---|
| TRI | 0.581 |
| OCI | 0.580 |
| VCI | 0.507 |
| CYI | 0.468 |
| PCI | 0.379 |
| PAI | 0.288 |
| VDI | 0.103 |
| TAI | 0.098 |
| ESI | -0.190 |
| FRI | -0.223 |
| NDI | -0.281 |
| Nalaz | Vrijednost |
|---|---|
| Ukupno analiziranih članaka | 229,886 |
| Vremenski raspon analize | 01/2021 do 01/2024 |
| Broj izvora | 113 |
| Vrh CSI indeksa | studeni 2022 |
| Vrijednost vrha | 44 |
| Dominantna kategorija | Uhićenja/Progon |
| Prosječna vrijednost | 57.5 |
| Prosječni CSI | 34.5 |
| Standardna devijacija CSI | 4.9 |
Izvještaj generiran: 2026-01-02 13:27:07.294504
GIMES Research | Analiza medijske pokrivenosti sigurnosti i stabilnosti v2.0