Semantički indeks institucionalnog okruženja

Mjerenje kvalitete institucija kroz analizu medijskog diskursa

Author

GIMES Research

Published

2. siječnja 2026.

1 Uvod

U ovom dokumentu se konstruiraju semantički indeksi kvalitete institucionalnog okruženja temeljeni na analizi medijskog diskursa. Indeksima se mjeri percepcija korupcije, funkcioniranje pravosuđa, transparentnost vlasti i drugi aspekti institucionalnog funkcioniranja. Metodologija se temelji na brojanju pojmova iz unaprijed definirane semantičke taksonomije, pri čemu se za svaki članak zbrajaju pojavljivanja relevantnih pojmova, a zatim se provodi mjesečna agregacija i normalizacija.

Učitano 72446 članaka
Vremenski raspon: 2021-01-01 do 2024-01-08 

2 Eksploratorni pregled

U ovom poglavlju se prikazuju osnovne deskriptivne statistike dataseta. Analizom se obuhvaćaju broj članaka, vremenski raspon, distribucija izvora i dinamika objavljivanja kroz vrijeme.

Osnovne statistike dataseta
Metrika Vrijednost
Ukupan broj članaka 72,446
Vremenski raspon 01.01.2021 do 08.01.2024
Broj dana 1102
Prosječno članaka dnevno 65.74
Broj izvora 115
Medijan duljine članka 2,906

Top 20 izvora po broju članaka

Distribucija po kategorijama izvora

Mjesečni broj članaka

3 Semantička taksonomija

3.1 Hijerarhijska struktura pojmova

Semantička taksonomija se organizira u hijerarhijsku strukturu s makro kategorijama (npr. korupcija, pravosuđe) i meso kategorijama (npr. opća korupcija, trgovina utjecajem). Za svaku kategoriju se definira skup regularnih izraza (regex pattern) koji obuhvaćaju relevantne pojmove i njihove morfološke varijante.

Pojmovi se definiraju pomoću korijena riječi (stem) kako bi se osigurala šira morfološka pokrivenost. Na primjer, korijen “korupcij” će prepoznati “korupcija”, “korupcije”, “korupciju”, “korupcijom” itd.

Princip konstrukcije taksonomije:

  1. Makro kategorije predstavljaju široke institucionalne domene (npr. korupcija, pravosuđe, izvršna vlast)
  2. Meso kategorije predstavljaju specifičnije podteme unutar makro kategorija
  3. Regex uzorci se koriste za fleksibilno prepoznavanje morfoloških varijanti

Morfološka pokrivenost:

Za hrvatski jezik koji ima bogatu morfologiju, koriste se:

  • Korijenski oblici s opcionalnim nastavcima: korupcij[aeiou]? prepoznaje korupcija, korupcije, korupciji, korupciju
  • Alternativni oblici: (sud|tribunal) prepoznaje oba sinonima
  • Wildcard znakovi: .{0,10} dopušta do 10 bilo kojih znakova između riječi

Formula za brojanje:

\[ \text{count}_{c,d} = \sum_{p \in P_c} \text{matches}(p, d) \]

gdje je \(P_c\) skup regex uzoraka za kategoriju \(c\), a \(d\) je tekst dokumenta.

Kliknite za prikaz kompletne tablice semantičke taksonomije
Struktura semantičke taksonomije institucija
Makro_kategorija Meso_kategorija Broj_pojmova
korupcija opca_korupcija 8
korupcija trgovina_utjecajem 7
korupcija pranje_novca 6
korupcija organizirani_kriminal 5
korupcija afere 5
pravosude sudovi 9
pravosude postupci 5
pravosude presude 7
pravosude optuznice 6
pravosude odvjetnistvo 6
pravosude efikasnost 6
izvrsna_vlast vlada 7
izvrsna_vlast ministarstva 4
izvrsna_vlast smjene_ostavke 7
izvrsna_vlast imenovanja 5
izvrsna_vlast reforme 4
parlament sabor 6
parlament zakonodavstvo 7
parlament odbori 4
parlament rasprave 4
parlament oporba 5
lokalna_samouprava zupanija 4
lokalna_samouprava gradovi 4
lokalna_samouprava opcine 3
lokalna_samouprava komunalni_poslovi 4
kontrolne_institucije revizija 4
kontrolne_institucije povjerenstva 4
kontrolne_institucije pucki_pravobranitelj 3
kontrolne_institucije informacijski_povjerenik 4
kontrolne_institucije antikorupcijska_tijela 5
izbori_demokracija izbori 6
izbori_demokracija izborni_proces 6
izbori_demokracija politicke_stranke 8
izbori_demokracija kandidati 4
transparentnost javnost_rada 4
transparentnost informiranje 4
transparentnost tajnost 5
transparentnost e_uprava 4
javna_uprava drzavni_sluzbenici 4
javna_uprava zaposljavanja 4
javna_uprava agencije 7
javna_uprava birokratizacija 5
policija_sigurnost policija 5
policija_sigurnost kriminalistika 4
policija_sigurnost sigurnosne_sluzbe 4
policija_sigurnost javna_sigurnost 4
eu_medjunarodno eu_institucije 6
eu_medjunarodno eu_evaluacije 5
eu_medjunarodno medjunarodne_organizacije 6
eu_medjunarodno diplomatski_odnosi 5
mediji sloboda_medija 4
mediji javni_mediji 4
mediji dezinformacije 4
mediji medijski_pluralizam 3

3.2 Leksikoni sentimenta i kvalitete

Za mjerenje sentimenta i kvalitete institucija koriste se specijalizirani leksikoni. Leksikon sentimenta se dijeli na pozitivne i negativne institucionalne pojmove, dok leksikon kvalitete obuhvaća pojmove koji signaliziraju visoku ili nisku kvalitetu institucionalnog funkcioniranja. Svi pojmovi se definiraju pomoću korijena riječi (stem) kako bi se osigurala šira morfološka pokrivenost.

Pozitivni institucionalni sentiment se mjeri brojenjem pojmova koji signaliziraju dobro funkcioniranje, transparentnost i integritet. Koriste se korijenski oblici riječi poput transparent, učinkovit, pošten, reform, napred.

Negativni institucionalni sentiment se mjeri brojenjem pojmova koji signaliziraju disfunkcionalnost, korupciju i nepravilnosti. Koriste se korijenski oblici poput korupcij, nezakonit, afer, skandal, zlouporab.

Formula za neto sentiment:

\[ \text{Sentiment}_{net} = \text{Pozitivno} - \text{Negativno} \]

Formula za omjer sentimenta:

\[ \text{Sentiment}_{ratio} = \frac{\text{Pozitivno} - \text{Negativno}}{\text{Pozitivno} + \text{Negativno}} \]

Vrijednosti omjera se kreću od -1 (potpuno negativan sentiment) do +1 (potpuno pozitivan sentiment).

Kvaliteta institucija se mjeri omjerom pojmova koji signaliziraju visoku kvalitetu (reformirano, modernizirano, učinkovito) i nisku kvalitetu (korumpirano, nefunkcionalno, sporo).

Definirano 26 pozitivnih i 29 negativnih institucionalnih pojmova
Definirano 26 pojmova neizvjesnosti
Definirano 16 pojmova urgentnosti
Definirano 20 pojmova polarizacije

3.3 Brojanje pojmova

Za svaki članak se zbrajaju pojavljivanja pojmova iz svake kategorije. Brojanje se provodi korištenjem regularnih izraza (regex) koji prepoznaju morfološke varijante pojmova. Rezultati se agregiraju na razini makro kategorija zbrajanjem svih pripadajućih meso kategorija.

Izračunato 54 semantičkih varijabli

4 Konstrukcija indeksa

4.1 Mjesečna agregacija

Podaci se agregiraju na mjesečnoj razini kako bi se omogućila analiza vremenskih trendova. Za svaki mjesec se izračunavaju zbroji i prosjeci svih institucionalnih varijabli, te se dodaju pomoćne mjere poput broja članaka i prosječne duljine teksta.

Agregirano 37 mjeseci podataka

4.2 Definicija indeksa

U ovom poglavlju se definira deset institucionalnih indeksa. Svaki indeks se konstruira na temelju specifične kombinacije varijabli i normalizira se na skalu 0-100. Normalizacija se provodi korištenjem min-max skaliranja kako bi se omogućila usporedivost indeksa kroz vrijeme.

4.2.1 Pregled indeksa

PCA: PC1 objašnjava 55.2 % varijance
Konstruirano 10 indeksa

4.2.2 Detaljni opis indeksa

U nastavku se pruža detaljan opis svakog od deset konstruiranih indeksa. Za svaki indeks se navodi formula, interpretacija vrijednosti i praktična primjena.

Pregled konstruiranih institucionalnih indeksa
Indeks Naziv Opis
IAI Institutional Attention Index Ukupna medijska pozornost na institucije normalizirana po broju članaka
CPI Corruption Perception Index Intenzitet medijskog izvještavanja o korupciji i aferama
JEI Judicial Efficiency Index Fokusiranost diskursa na pravosuđe i sudske procese
GQI Governance Quality Index Kompozit izvršne vlasti, transparentnosti i javne uprave s prilagodbom za sentiment
ISI Institutional Sentiment Index Neto sentiment o institucijama (pozitivno vs negativno izvještavanje)
IUI Institutional Uncertainty Index Razina neizvjesnosti i nedorečenosti u institucionalnom diskursu
PPI Political Polarization Index Intenzitet političke polarizacije i sukoba u medijskom prostoru
IQC Institutional Quality Composite Omjer pozitivnih i negativnih signala o kvaliteti institucija
URI Urgency Index Urgentnost i intenzitet institucionalnog diskursa
PCI Principal Component Index Prva glavna komponenta svih makro kategorija

4.2.2.1 Institutional Attention Index (IAI)

IAI mjeri ukupnu razinu medijske pozornosti usmjerene na institucionalne teme. Indeks se izračunava kao zbroj svih institucionalnih pojmova normaliziran po broju članaka u danom mjesecu. Viša vrijednost ukazuje na intenzivnije pokrivanje institucionalnih tema u medijima.

\[ \text{IAI}_t = \text{normalize}_{0-100}\left(\frac{\sum_{c \in C} \text{count}_{c,t}}{N_t}\right) \]

gdje je \(C\) skup svih institucionalnih kategorija, \(\text{count}_{c,t}\) zbroj pojmova kategorije \(c\) u mjesecu \(t\), a \(N_t\) broj članaka u mjesecu \(t\).

Normalizacija: Koristi se min-max skaliranje na raspon 0-100:

\[ \text{normalize}(x) = \frac{x - \min(x)}{\max(x) - \min(x)} \times 100 \]

Interpretacija vrijednosti:

  • 0-25: Niska medijska pozornost na institucije
  • 25-50: Umjerena medijska pozornost
  • 50-75: Povišena medijska pozornost
  • 75-100: Visoka medijska pozornost (razdoblja institucionalnih kriza ili reformi)

Prednosti i ograničenja:

  • Obuhvaća sve institucionalne teme jednako
  • Normalizacija po broju članaka kontrolira za varijacije u volumenu vijesti
  • Ne razlikuje pozitivno od negativnog izvještavanja o institucijama

4.2.2.2 Corruption Perception Index (CPI)

CPI mjeri intenzitet medijskog izvještavanja o korupciji i povezanim aferama. Indeks se temelji na makro kategoriji korupcija koja obuhvaća opću korupciju, trgovinu utjecajem, pranje novca, organizirani kriminal i afere. Viša vrijednost ukazuje na intenzivnije pokrivanje korupcijskih tema.

\[ \text{CPI}_t = \text{normalize}_{0-100}\left(\frac{\text{Korupcija}_t}{N_t}\right) \]

Komponente makro kategorije korupcija:

  • Opća korupcija: korupcija, mito, podmićivanje, pronevjera
  • Trgovina utjecajem: zlouporaba položaja, pogodovanje, nepotizam
  • Pranje novca: sumnjive transakcije, offshore, porezna evazija
  • Organizirani kriminal: mafijaške strukture, klanovi
  • Afere: skandali, istrage

Interpretacija:

  • Visoki CPI može signalizirati izbijanje novih afera ili pojačanu istraživačku aktivnost
  • Padajući CPI može ukazivati na smirivanje situacije ili pomak fokusa na druge teme
  • CPI treba interpretirati zajedno s ISI za razumijevanje tona izvještavanja

4.2.2.3 Judicial Efficiency Index (JEI)

JEI mjeri fokusiranost medijskog diskursa na pravosuđe i sudske procese. Indeks obuhvaća sudove, postupke, presude, optužnice, odvjetništvo i efikasnost pravosuđa. Viša vrijednost ukazuje na veću medijsku pažnju posvećenu pravosudnim temama.

\[ \text{JEI}_t = \text{normalize}_{0-100}\left(\frac{\text{Pravosuđe}_t}{N_t}\right) \]

Komponente makro kategorije pravosuđe:

  • Sudovi: Vrhovni sud, županijski sudovi, općinski sudovi, Ustavni sud
  • Postupci: kazneni postupci, parnični postupci
  • Presude: pravomoćne i nepravomoćne presude, osude, oslobođenja
  • Optužnice: optuženi, okrivljenici, osumnjičenici
  • Odvjetništvo: DORH, USKOK, tužiteljstvo
  • Efikasnost: trajanje postupaka, zaostali predmeti

Primjena:

JEI je koristan za praćenje ciklusa velikih sudskih procesa i reformi pravosuđa. Naglo povećanje JEI često signalizira početak značajnih sudskih postupaka.

4.2.2.4 Governance Quality Index (GQI)

GQI mjeri percepciju kvalitete upravljanja kroz kombinaciju izvršne vlasti, transparentnosti i javne uprave, uz prilagodbu za sentiment. Indeks integrira kvantitativnu mjeru (frekvenciju pojmova) s kvalitativnom mjerom (sentiment omjer).

\[ \text{GQI}_t = \text{normalize}_{0-100}\left(\frac{\overline{\text{Governance}}_t}{N_t} \times (1 + \text{Sentiment}_{ratio,t})\right) \]

gdje je \(\overline{\text{Governance}}_t\) prosjek vrijednosti kategorija izvršna_vlast, transparentnost i javna_uprava.

Komponente:

  • Izvršna vlast: Vlada, ministarstva, smjene, imenovanja, reforme
  • Transparentnost: javnost rada, informiranje, e-uprava
  • Javna uprava: državni službenici, agencije, birokratizacija

Sentiment prilagodba:

Multiplikator \((1 + \text{Sentiment}_{ratio})\) povećava ili smanjuje indeks ovisno o tonu izvještavanja:

  • Pozitivan sentiment (ratio > 0): povećava GQI
  • Negativan sentiment (ratio < 0): smanjuje GQI
  • Neutralan sentiment (ratio ≈ 0): bez promjene

Interpretacija:

GQI kombinira količinu i kvalitetu izvještavanja, pružajući sveobuhvatniju mjeru percepcije kvalitete upravljanja.

4.2.2.5 Institutional Sentiment Index (ISI)

ISI mjeri neto sentiment o institucijama, odnosno prevladava li pozitivno ili negativno izvještavanje. Indeks se temelji na omjeru pozitivnih i negativnih institucionalnih pojmova, transformiranom na skalu 0-100.

\[ \text{ISI}_t = \text{normalize}_{0-100}\left(\text{Sentiment}_{ratio,t} + 1\right) \]

Transformacija:

Originalni sentiment ratio se kreće od -1 do +1. Dodavanjem 1 dobiva se raspon 0-2, koji se zatim normalizira na 0-100.

Referentna vrijednost:

  • ISI = 50: neutralan diskurs (jednaka zastupljenost pozitivnih i negativnih pojmova)
  • ISI > 50: dominira pozitivan sentiment o institucijama
  • ISI < 50: dominira negativan sentiment o institucijama

Primjena:

ISI je posebno koristan za praćenje promjena u percepciji institucija nakon reformi, afera ili promjena vlasti.

4.2.2.6 Institutional Uncertainty Index (IUI)

IUI mjeri razinu neizvjesnosti i nedorečenosti u institucionalnom diskursu. Indeks se temelji na frekvenciji pojmova koji signaliziraju nesigurnost, uvjetnost i neodređenost. Viša vrijednost ukazuje na veću neizvjesnost oko institucionalnih pitanja.

\[ \text{IUI}_t = \text{normalize}_{0-100}\left(\frac{\text{Neizvjesnost}_t}{N_t}\right) \]

Kategorije neizvjesnosti:

  1. Eksplicitna neizvjesnost: “neizvjesno”, “nesigurno”, “upitno”
  2. Neriješenost: “neriješeno”, “sporno”, “kontroverzno”
  3. Uvjetnost: “možda”, “eventualno”, “ako”, “ukoliko”
  4. Status: “čeka se”, “odgođeno”, “u proceduri”

Interpretacija:

  • Visoki IUI prije važnih odluka: neizvjesnost oko ishoda
  • Visoki IUI nakon događaja: nesigurnost oko posljedica
  • Niski IUI: jasna situacija ili konsenzus

4.2.2.7 Political Polarization Index (PPI)

PPI mjeri intenzitet političke polarizacije i sukoba u medijskom prostoru. Indeks obuhvaća pojmove koji signaliziraju konfrontaciju, kritiku i političke podjele. Viša vrijednost ukazuje na polariziranije političko ozračje.

\[ \text{PPI}_t = \text{normalize}_{0-100}\left(\frac{\text{Polarizacija}_t}{N_t}\right) \]

Kategorije polarizacije:

  1. Konfrontacija: sukob, svađa, podjela, konfrontacija
  2. Kritika: napada, optužuje, proziva, kritizira
  3. Negacija: osporava, demantira, pobija, negira
  4. Politički spektar: lijevo, desno, konzervativno, liberalno, ekstremno

Interpretacija:

  • Visoki PPI u izbornim razdobljima: pojačana politička konfrontacija
  • Visoki PPI izvan izbora: politička kriza ili duboke podjele
  • Niski PPI: konsenzus ili smirivanje političkih tenzija

4.2.2.8 Institutional Quality Composite (IQC)

IQC je kompozitni indeks koji mjeri omjer pozitivnih i negativnih signala o kvaliteti institucija. Indeks se temelji na leksikonu kvalitete koji razlikuje signale visoke kvalitete (reformirano, učinkovito) od signala niske kvalitete (korumpirano, nefunkcionalno).

\[ \text{IQC}_t = \text{normalize}_{0-100}\left(\frac{\text{Visoka kvaliteta}_t - \text{Niska kvaliteta}_t}{\text{Visoka kvaliteta}_t + \text{Niska kvaliteta}_t + 1} + 1\right) \]

Signali visoke kvalitete:

  • Reformirano, modernizirano, digitalizirano
  • Transparentno, učinkovito, brzo
  • Neovisno, nepristrano, pravedno

Signali niske kvalitete:

  • Korumpirano, nefunkcionalno, sporo
  • Pristrano, politizirano, netransparentno
  • Birokratizirano, blokirano, paralizirano

Referentna vrijednost:

  • IQC = 50: jednak broj pozitivnih i negativnih signala
  • IQC > 50: prevladavaju pozitivni signali
  • IQC < 50: prevladavaju negativni signali

4.2.2.9 Urgency Index (URI)

URI mjeri urgentnost i intenzitet institucionalnog diskursa. Indeks se temelji na pojmovima koji signaliziraju hitnost, kritičnost i izvanrednost. Viša vrijednost ukazuje na percepciju hitnosti institucionalnih pitanja.

\[ \text{URI}_t = \text{normalize}_{0-100}\left(\frac{\text{Urgentnost}_t}{N_t}\right) \]

Kategorije urgentnosti:

  1. Hitnost: hitno, odmah, žurno
  2. Kritičnost: kritično, alarmantno, dramatično
  3. Eskalacija: eskalira, pogoršava, intenzivira
  4. Izvanrednost: rekordno, povijesno, bez presedana

Primjena:

URI je koristan za identifikaciju kriznih razdoblja i situacija koje zahtijevaju hitnu intervenciju.

4.2.2.10 Principal Component Index (PCI)

PCI se konstruira korištenjem analize glavnih komponenata (PCA) na svim makro kategorijama. Prva glavna komponenta se koristi kao sintetički indeks koji maksimalno objašnjava varijabilitet svih institucionalnih tema.

\[ \text{PCI}_t = \text{normalize}_{0-100}\left(\sum_{i=1}^{k} w_i \cdot z_{i,t}\right) \]

gdje su \(w_i\) težine iz prve glavne komponente, a \(z_{i,t}\) standardizirane vrijednosti makro kategorija.

Postupak konstrukcije:

  1. Standardizacija svih makro kategorija (z-score)
  2. Izračun kovarijacijske/korelacijske matrice
  3. Dekompozicija na svojstvene vrijednosti i vektore
  4. Odabir prve glavne komponente
  5. Projekcija podataka na prvu komponentu
  6. Normalizacija na skalu 0-100

Prednosti:

  • Objektivno ponderiranje tema prema njihovom doprinosu varijabilnosti
  • Reducira dimenzionalnost na jednu sintetičku mjeru
  • Koristi informaciju iz svih tema

Ograničenja:

  • Interpretacija ovisi o strukturi podataka
  • Težine se mogu mijenjati s novim podacima

5 Vizualizacija indeksa

5.1 Glavni indeksi

Na sljedećim grafikonima se prikazuje dinamika glavnih institucionalnih indeksa kroz vrijeme. IAI, CPI i JEI prikazuju pozornost na institucije, korupciju i pravosuđe, ISI prikazuje sentiment, a IUI prikazuje neizvjesnost.

Glavni institucionalni indeksi

5.2 Governance Quality Index

Na sljedećem grafikonu se prikazuje GQI koji kombinira izvršnu vlast, transparentnost i javnu upravu s prilagodbom za sentiment.

Governance Quality Index s kliznim prosjekom

5.3 Institutional Quality Composite

IQC prikazuje omjer pozitivnih i negativnih signala o kvaliteti institucija. Vrijednosti iznad 50 ukazuju na prevladavanje pozitivnih signala.

Institutional Quality Composite

6 Sektorska analiza

6.1 Konstrukcija sektorskih indeksa

Sektorski indeksi se konstruiraju za svaku od 12 makro kategorija semantičke taksonomije. Za svaki sektor se izračunava mjesečni zbroj pojmova, koji se zatim normalizira na skalu 0-100 korištenjem min-max skaliranja unutar svakog sektora.

Sektorski indeksi omogućuju praćenje dinamike specifičnih institucionalnih tema neovisno o ostalim temama. Na primjer, sektor “pravosuđe” može rasti dok sektor “korupcija” pada, što bi signaliziralo pomak fokusa s afera na sudske procese.

Formula za sektorski indeks:

\[ \text{Sektor}_{s,t} = \text{normalize}_{0-100}\left(\text{macro}_{s,t}\right) \]

gdje je \(\text{macro}_{s,t}\) zbroj svih pojmova iz makro kategorije \(s\) u mjesecu \(t\).

Napomena o normalizaciji:

Sektorski indeksi se normaliziraju unutar svakog sektora, što znači da vrijednosti različitih sektora nisu izravno usporedive. Vrijednost 80 u sektoru “pravosuđe” ne znači nužno veću aktivnost od vrijednosti 60 u sektoru “korupcija” - znači da je aktivnost u pravosuđu visoka u odnosu na povijesne vrijednosti tog sektora.

Primjena LOESS izglađivanja:

Na grafikonima se koristi LOESS (Locally Estimated Scatterplot Smoothing) za prikaz trenda. LOESS koristi lokalno ponderirane regresije za izglađivanje podataka, što omogućuje vizualizaciju srednjoročnih trendova bez pretpostavki o funkcionalnom obliku.

6.2 Dinamika sektorskih indeksa

Na sljedećim grafikonima se prikazuje dinamika 10 ključnih institucionalnih sektora kroz vrijeme. Svaki panel prikazuje normalizirani indeks za jedan sektor, zajedno s LOESS trendom koji izglađuje kratkoročne fluktuacije.

Dinamika institucionalnih sektora kroz vrijeme

6.3 Heatmapa sektorske aktivnosti

Heatmapa pruža vizualni pregled intenziteta svih sektorskih indeksa kroz vrijeme na jednom grafikonu. Svaki redak predstavlja jedan sektor, svaki stupac predstavlja jedan mjesec, a boja ćelije predstavlja normalizirani intenzitet aktivnosti u tom sektoru za taj mjesec.

Toplije boje (žuta, narančasta) označavaju veći intenzitet aktivnosti, dok hladnije boje (ljubičasta, tamno plava) označavaju manji intenzitet. Heatmapa omogućuje brzu identifikaciju razdoblja pojačane aktivnosti u specifičnim sektorima i usporedbu dinamike različitih sektora.

Konstrukcija heatmape:

  1. Za svaki sektor se uzimaju mjesečne normalizirane vrijednosti (0-100)
  2. Podaci se organiziraju u matricu (sektori × mjeseci)
  3. Vrijednosti se mapiraju na kontinuiranu skalu boja (plasma paleta)

Interpretacija:

  • Horizontalni uzorci: promjene aktivnosti jednog sektora kroz vrijeme
  • Vertikalni uzorci: usporedba aktivnosti različitih sektora u istom mjesecu
  • Dijagonalni uzorci: prijenos fokusa s jednog sektora na drugi

Plasma paleta:

Koristi se Viridis plasma paleta koja je dizajnirana za:

  • Perceptualnu uniformnost (jednake razlike u vrijednosti = jednake vizualne razlike)
  • Pristupačnost za osobe s poremećajima razlikovanja boja
  • Čitljivost i na zaslonu i u ispisu

Heatmapa institucionalne medijske aktivnosti

6.4 Korelacijska struktura

Korelacijska matrica prikazuje međusobne odnose između svih konstruiranih indeksa i sektorskih kategorija. Pozitivna korelacija (crvena) ukazuje na to da dva indeksa/sektora tendiraju rasti i padati zajedno, dok negativna korelacija (plava) ukazuje na obrnuti odnos.

Korelacijska matrica sektora i indeksa

7 Korupcijski fokus

7.1 Dinamika korupcijskog diskursa

U ovom poglavlju se detaljnije analizira struktura korupcijskog diskursa. Prikazuje se zastupljenost pojedinih podkategorija korupcije (opća korupcija, trgovina utjecajem, pranje novca, organizirani kriminal, afere) kroz vrijeme.

Detaljnija analiza korupcijskog diskursa

8 Sentiment analiza

8.1 Konstrukcija sentiment indeksa

Sentiment analiza u institucionalnom kontekstu se fokusira na razlikovanje pozitivnog i negativnog izvještavanja o institucijama. Za svaki članak se broje pojmovi iz pozitivnog leksikona (transparentnost, učinkovitost, reforma, napredak) i negativnog leksikona (korupcija, skandal, zlouporaba, nefunkcionalnost).

Na temelju ovih brojeva se izračunavaju tri mjere:

  1. Neto sentiment: razlika između pozitivnih i negativnih pojmova
  2. Omjer sentimenta: normalizirana razlika na skalu -1 do +1
  3. ISI (Institutional Sentiment Index): transformirani omjer na skalu 0-100

Formule:

\[ \text{Neto sentiment}_t = \sum_{p \in P} \text{count}_{p,t} - \sum_{n \in N} \text{count}_{n,t} \]

gdje je \(P\) skup pozitivnih pojmova, a \(N\) skup negativnih pojmova.

\[ \text{Omjer sentimenta}_t = \frac{\text{Pozitivno}_t - \text{Negativno}_t}{\text{Pozitivno}_t + \text{Negativno}_t} \]

Signali kvalitete:

Dodatno se mjere signali kvalitete institucija korištenjem leksikona kvalitete:

  • Visoka kvaliteta: “reformirano”, “modernizirano”, “učinkovito”, “transparentno”
  • Niska kvaliteta: “korumpirano”, “nefunkcionalno”, “sporo”, “blokirano”

\[ \text{Kvaliteta}_{net,t} = \text{Visoka}_t - \text{Niska}_t \]

Institucionalni sentiment kroz vrijeme

9 Volatilnost i momentum

9.1 Konstrukcija mjera volatilnosti i momenta

Volatilnost i momentum se koriste za procjenu stabilnosti i smjera kretanja institucionalnih indeksa. Volatilnost mjeri koliko indeks varira u kratkom roku, dok momentum mjeri smjer i intenzitet promjene.

Volatilnost se izračunava kao standardna devijacija indeksa u kliznom prozoru od 3 mjeseca. Viša volatilnost ukazuje na nestabilniji institucionalni kontekst s čestim promjenama intenziteta.

Momentum se izračunava kao razlika između trenutne vrijednosti i vrijednosti u prethodnom razdoblju. Pozitivan momentum ukazuje na rastući trend, dok negativan momentum ukazuje na padajući trend.

Formula za volatilnost (3M rolling SD):

\[ \text{Vol}_{t} = \sqrt{\frac{1}{2}\sum_{i=t-2}^{t}(x_i - \bar{x}_{t-2:t})^2} \]

gdje je \(\bar{x}_{t-2:t}\) prosjek vrijednosti u prozoru od 3 mjeseca.

Formula za mjesečni momentum:

\[ \text{Mom}_{1M,t} = x_t - x_{t-1} \]

Formula za tromjesečni momentum:

\[ \text{Mom}_{3M,t} = x_t - x_{t-3} \]

Interpretacija:

  • Visoka volatilnost + pozitivan momentum: brzi rast s nestabilnošću
  • Visoka volatilnost + negativan momentum: brzi pad s nestabilnošću
  • Niska volatilnost + pozitivan momentum: stabilan rast
  • Niska volatilnost + negativan momentum: stabilan pad

Primjena:

Kombinacija volatilnosti i momenta omogućuje razlikovanje:

  • Strukturnih promjena (trajni pomaci u razini aktivnosti)
  • Cikličkih fluktuacija (povratne oscilacije oko trenda)
  • Šokova (nagle kratkotrajne promjene)

Volatilnost i momentum indeksa

10 Koncentracija tema

10.1 Konstrukcija mjera koncentracije

Koncentracija tema mjeri koliko je medijski diskurs fokusiran na mali broj tema nasuprot disperziji na mnogo tema. Za mjerenje koncentracije koristi se Herfindahl-Hirschman indeks (HHI).

Visoki HHI (bliže 1) ukazuje na fokus medija na jednu ili nekoliko dominantnih tema, što je tipično za razdoblja velikih afera ili institucionalnih kriza kada jedna tema dominira.

Niski HHI (bliže 0) ukazuje na disperziju pažnje na mnogo tema, što je tipično za mirnija razdoblja ili višestruke istovremene institucionalne teme.

Herfindahl-Hirschman Index (HHI):

\[ \text{HHI}_t = \sum_{s=1}^{S} \left(\frac{x_{s,t}}{\sum_{s=1}^{S} x_{s,t}}\right)^2 \]

gdje je \(x_{s,t}\) vrijednost sektora \(s\) u mjesecu \(t\), a \(S\) broj sektora.

Interpretacija HHI:

  • HHI = 1: potpuna koncentracija (samo jedna tema)
  • HHI = 1/S: potpuna disperzija (sve teme jednako zastupljene)
  • Za S = 12 sektora, minimalni HHI ≈ 0.083

Broj aktivnih tema:

Dodatno se prati broj sektora s pozitivnom aktivnošću:

\[ \text{Aktivne teme}_t = \sum_{s=1}^{S} \mathbb{1}(x_{s,t} > 0) \]

Primjena:

  • Rastući HHI: fokusiranje pažnje na dominantnu temu (npr. velika afera)
  • Padajući HHI: disperzija pažnje ili pojava novih tema
  • Nagli skok HHI: izbijanje nove dominantne institucionalne krize

Koncentracija institucionalnih tema

11 Korelacije između indeksa

U sljedećoj tablici se prikazuje korelacijska matrica svih konstruiranih institucionalnih indeksa. Korelacije omogućuju razumijevanje međusobnih odnosa između različitih aspekata institucionalnog funkcioniranja.

Korelacijska matrica institucionalnih indeksa
IAI CPI JEI GQI ISI IUI PPI IQC URI PCI
IAI 1.000 0.119 0.686 0.032 0.241 0.372 0.344 0.164 -0.079 -0.328
CPI 0.119 1.000 -0.073 -0.114 -0.509 0.011 -0.003 -0.076 0.112 -0.400
JEI 0.686 -0.073 1.000 -0.282 0.079 -0.032 0.141 0.250 -0.085 0.072
GQI 0.032 -0.114 -0.282 1.000 0.573 0.316 0.246 -0.129 0.264 0.015
ISI 0.241 -0.509 0.079 0.573 1.000 0.400 0.318 0.066 0.147 0.064
IUI 0.372 0.011 -0.032 0.316 0.400 1.000 0.377 -0.287 0.167 -0.524
PPI 0.344 -0.003 0.141 0.246 0.318 0.377 1.000 -0.019 -0.059 -0.006
IQC 0.164 -0.076 0.250 -0.129 0.066 -0.287 -0.019 1.000 -0.153 0.111
URI -0.079 0.112 -0.085 0.264 0.147 0.167 -0.059 -0.153 1.000 -0.198
PCI -0.328 -0.400 0.072 0.015 0.064 -0.524 -0.006 0.111 -0.198 1.000

12 Export

Excel exportiran: C:/Users/lsikic/Luka C/GIMES/GIMES_HR-inflacija/output/semantic_institutions_indices.xlsx 

13 Sažetak

U ovoj analizi je konstruirano deset institucionalnih indeksa temeljenih na semantičkoj analizi medijskog diskursa. Indeksi obuhvaćaju različite aspekte institucionalnog funkcioniranja: ukupnu pozornost (IAI), percepciju korupcije (CPI), pravosuđe (JEI), kvalitetu upravljanja (GQI), sentiment (ISI), neizvjesnost (IUI), polarizaciju (PPI), kompozitnu kvalitetu (IQC), urgentnost (URI) i sintetičku mjeru temeljenu na PCA (PCI).

Sažetak institucionalne analize
Metrika Vrijednost
Broj analiziranih članaka 72,446
Vremenski raspon 01/2021 - 01/2024
Broj semantičkih kategorija 54
Broj makro sektora 12
Broj konstruiranih indeksa 10
Prosječni IAI 62.2
Prosječni institucionalni sentiment ratio -0.447
Prosječni CPI 46.6
Prosječni IUI 48.3

Izvještaj generiran: 2026-01-02 10:25:04.176118

GIMES Research | Semantički indeks institucionalnog okruženja v2.0