Učitano 46,107 članaka
Vremenski raspon: 01.01.2021 do 08.01.2024
Eksploratorni pregled, konstrukcija indeksa i analiza prediktivnosti
U ovom izvještaju se predstavlja sveobuhvatna analiza medijske pokrivenosti inflacije u Hrvatskoj. Analizom se obuhvaća praćenje inflacijskih tema, cijena, troškova života, energetskih cijena i monetarne politike temeljem članaka iz hrvatskih online medija.
Inflacija je tijekom 2022. i 2023. godine postala središnja tema ekonomske rasprave u Hrvatskoj i šire. Ovim izvještajem se nastoji odgovoriti na ključna pitanja:
U izvještaju se obrađuju sljedeće teme: metodologija identifikacije relevantnih članaka, eksploratorni pregled dataseta, semantička taksonomija inflacijskih pojmova, konstrukcija specijaliziranih indeksa, vizualizacija indeksa, sektorska analiza, sentiment analiza, volatilnost i momentum, koncentracija tema te validacija sa službenim Eurostat HICP podacima.
Učitano 46,107 članaka
Vremenski raspon: 01.01.2021 do 08.01.2024
Identifikacija relevantnih članaka se provodi kroz sedmostupanjski proces filtriranja koji kombinira strukturne kriterije, ključne riječi i kontekstualnu validaciju. Procesom se osigurava da u analizu ulaze samo članci koji su stvarno relevantni za hrvatsku inflacijsku tematiku.
Filter 1: Tip izvora
Odabiru se samo web izvori kako bi se osigurala konzistentnost formata i dostupnost punog teksta članka.
Filter 2: Relevantni news portali
Koristi se lista verificiranih hrvatskih news portala kategoriziranih u pet skupina: nacionalni mediji, poslovni mediji, regionalni mediji, specijalizirani mediji i opinion portali.
Filter 3: Minimalna duljina teksta
Članci moraju sadržavati minimalno 500 znakova u punom tekstu kako bi se osigurala sadržajna relevantnost.
Filter 4: Naslov članka
Naslov članka mora sadržavati inflacijske pojmove definirane regularnim izrazima koji obuhvaćaju morfološke varijante.
Filter 5: Core inflacijski pojmovi
Puni tekst članka mora sadržavati core inflacijske pojmove koji potvrđuju da se članak bavi inflacijskom tematikom.
Filter 6: Isključivanje irelevantnog sadržaja
Isključuju se članci koji ne tretiraju inflaciju kao primarnu temu.
Filter 7: Hrvatski kontekst
Članci moraju sadržavati reference na hrvatsku ekonomiju (Hrvatska, hrvatski, HNB, eurozona HR kontekst).
| Metrika | Vrijednost |
|---|---|
| Ukupan broj članaka | 46,107 |
| Vremenski raspon | 01.01.2021 do 08.01.2024 |
| Broj dana | 1102 |
| Prosječno članaka dnevno | 41.8 |
| Broj izvora (portala) | 115 |
| Broj kategorija izvora | 5 |
Semantička taksonomija se organizira u osam kategorija koje obuhvaćaju različite aspekte inflacije. Svaka kategorija predstavlja specifičan sektor ili tematsko područje vezano uz inflaciju. Pojmovi se definiraju pomoću korijena riječi (stem) kako bi se osigurala šira morfološka pokrivenost hrvatskog jezika.
Princip konstrukcije rječnika:
Formula za brojanje:
\[ \text{count}_{c,d} = \sum_{p \in P_c} \text{matches}(p, d) \]
gdje je \(P_c\) skup regex uzoraka za kategoriju \(c\), a \(d\) je tekst dokumenta.
| Kategorija | Broj pojmova | Primjeri regex uzoraka |
|---|---|---|
| Inflacija (direktno) | 4 | inflacij[a-zčćžšđ]*, dezinflacij[a-zčćžšđ]* |
| Cijene i poskupljenja | 8 | poskupljenj[a-zčćžšđ]*, poskupi[a-zčćžšđ]* |
| Troškovi života | 4 | tro[sš]kov[a-zčćžšđ]*.{0,10}[zž]ivot[a-zčćžšđ]*, [zž]ivotn[a-zčćžšđ]*.{0,10}standard[a-zčćžšđ]* |
| Energija i gorivo | 5 | cijen[a-zčćžšđ]*.{0,10}energij[a-zčćžšđ]*, cijen[a-zčćžšđ]*.{0,10}goriv[a-zčćžšđ]* |
| Hrana | 5 | cijen[a-zčćžšđ]*.{0,10}hran[a-zčćžšđ]*, cijen[a-zčćžšđ]*.{0,10}namirnic[a-zčćžšđ]* |
| Monetarna politika | 6 | kamatn[a-zčćžšđ]*.{0,10}stop[a-zčćžšđ]*, kamat[a-zčćžšđ]* |
| Plaće i primanja | 5 | pla[cć][a-zčćžšđ]*, primanj[a-zčćžšđ]* |
| Indeksi i mjere | 5 | \bhicp\b, indeks.{0,10}potro[sš][a-zčćžšđ]* |
VII kvantificira obujam medijskog izvještavanja o inflaciji mjeren brojem objavljenih članaka. Konstrukcija se temelji na prebrojavanju članaka koji su prošli filter relevantnosti za inflacijsku tematiku. Mjesečni broj članaka normalizira se na raspon 0 do 100 standardnom min max normalizacijom. Povišene vrijednosti VII indeksa indiciraju razdoblja intenzivnog medijskog izvještavanja o inflaciji.
Formula:
\[ \text{VII}_t = \text{normalize}_{0-100}(N_t) \]
gdje je \(N_t\) broj članaka u mjesecu \(t\).
Interpretacija: Visoke vrijednosti ukazuju na veliku količinu medijskog sadržaja o inflaciji.
SII mjeri intenzitet korištenja inflacijske terminologije u medijskom diskursu. Indeks se konstruira zbrajanjem pojavljivanja svih semantičkih pojmova iz svih kategorija normaliziranih brojem članaka. Viša vrijednost indicira dublju i analitičniju obradu inflacijske tematike u medijima.
Formula:
\[ \text{SII}_t = \text{normalize}_{0-100}\left(\frac{\sum_{c} \text{count}_{c,t}}{N_t}\right) \]
Uključene kategorije: inflacija direktno, cijene i poskupljenja, troškovi života, energija i gorivo, hrana, monetarna politika, plaće i primanja, indeksi i mjere
SAI mjeri ton medijskog izvještavanja o inflaciji na skali od negativnog (zabrinutost, kriza) do pozitivnog (stabilizacija, oporavak). Konstrukcija se temelji na leksičkom pristupu koji broji pozitivne i negativne pojmove u tekstu. Sentiment svakog članka se izračunava kao normalizirana razlika pozitivnih i negativnih pojmova, a mjesečna vrijednost predstavlja prosjek sentimenta svih članaka.
Formula za članak:
\[ S_d = \frac{P_d - N_d}{P_d + N_d + 1} \]
gdje je \(P_d\) broj pozitivnih pojmova, \(N_d\) broj negativnih pojmova.
Mjesečna agregacija:
\[ \text{SAI}_t = \text{normalize}_{0-100}(\bar{S}_t) \]
Napomena: Za GIMES indeks se koristi invertirana vrijednost (100 minus SAI) tako da viša vrijednost indicira veću zabrinutost.
GCI predstavlja kompozitni indeks koji kombinira četiri dimenzije medijskog izvještavanja o inflaciji. Indeks agregira volumen izvještavanja, intenzitet analize (duljina članaka), ton sentimenta i doseg članaka. Težine komponenti su: volumen 40%, intenzitet 20%, sentiment 20% i doseg 20%. Viša vrijednost indicira veću ukupnu medijsku pozornost i zabrinutost oko inflacije.
Formula:
\[ \text{GCI}_t = 0.40 \times V_{norm,t} + 0.20 \times I_{norm,t} + 0.20 \times (100 - S_{norm,t}) + 0.20 \times R_{norm,t} \]
gdje su: V = normalizirani volumen članaka, I = normalizirani intenzitet (prosječna duljina), S = normalizirani sentiment (invertiran), R = normalizirani doseg (reach)
Interpretacija vrijednosti:
Raspon 0 do 25 indicira nisku medijsku pozornost na inflaciju. Raspon 25 do 50 indicira umjerenu medijsku pozornost. Raspon 50 do 75 indicira visoku medijsku pozornost. Raspon 75 do 100 indicira vrlo visoku medijsku pozornost tipičnu za krizna razdoblja.
| Indeks | Naziv | Opis |
|---|---|---|
| VII | Volume Inflation Index | Obujam medijskog izvještavanja (broj članaka) |
| SII | Semantic Inflation Index | Intenzitet korištenja inflacijske terminologije |
| SAI | Sentiment Inflation Index | Ton izvještavanja (negativan do pozitivan) |
| GCI | GIMES Composite Index | Kompozitni indeks svih dimenzija |
| Mjesec | Broj članaka | VII | SII | SAI | GCI |
|---|---|---|---|---|---|
| vlj 2023 | 1,405 | 40.0 | 61.6 | 38.6 | 35.7 |
| ožu 2023 | 1,848 | 54.5 | 45.9 | 58.6 | 36.9 |
| tra 2023 | 959 | 25.3 | 62.4 | 51.6 | 28.8 |
| svi 2023 | 793 | 19.9 | 60.5 | 59.0 | 18.8 |
| lip 2023 | 904 | 23.5 | 49.8 | 63.1 | 22.4 |
| srp 2023 | 964 | 25.5 | 19.8 | 38.7 | 37.5 |
| kol 2023 | 1,184 | 32.7 | 46.2 | 63.0 | 26.6 |
| ruj 2023 | 1,451 | 41.5 | 39.6 | 96.8 | 27.5 |
| lis 2023 | 874 | 22.5 | 24.6 | 13.4 | 30.5 |
| stu 2023 | 728 | 17.7 | 36.2 | 14.5 | 27.9 |
| pro 2023 | 702 | 16.9 | 70.0 | 46.9 | 32.2 |
| sij 2024 | 246 | 1.9 | 69.1 | 94.0 | 5.8 |
Herfindahl Hirschman Index (HHI) mjeri koncentraciju tema u medijskom prostoru. Izračunava se kao suma kvadrata udjela svake kategorije. Vrijednosti bliže 1 indiciraju visoku koncentraciju (dominacija jedne teme), dok vrijednosti bliže 0 indiciraju ravnomjerniju raspodjelu pozornosti.
Formula:
\[ \text{HHI}_t = \sum_{i=1}^{n} s_{i,t}^2 \]
gdje je \(s_{i,t}\) udio kategorije \(i\) u ukupnom broju spominjanja u mjesecu \(t\).
| Usporedba | Korelacija |
|---|---|
| GCI vs Eurostat HICP | 0.429 |
| VII (volumen) vs Eurostat HICP | 0.723 |
| SII (semantički) vs Eurostat HICP | -0.055 |
| SAI (sentiment inv.) vs Eurostat HICP | -0.061 |
| Nalaz | Vrijednost |
|---|---|
| Ukupno analiziranih članaka | 46,107 |
| Vremenski raspon analize | 01/2021 do 01/2024 |
| Broj izvora | 115 |
| Vrh GCI indeksa | siječanj 2023 |
| Vrijednost vrha | 58.7 |
| Vrh inflacije (HICP) | studeni 2022 |
| Vrijednost vrha | 13% |
| Korelacija GCI vs HICP | 0.429 |
| Prosječni GCI | 34.1 |
Izvještaj generiran: 2026-01-02 13:37:21.174956
GIMES Research | Analiza medijske pokrivenosti inflacije v2.0