Semantički indeks tržišta rada

Mjerenje dinamike tržišta rada kroz analizu medijskog diskursa

Author

GIMES Research

Published

2. siječnja 2026.

1 Uvod

U ovom dokumentu se konstruiraju semantički indeksi tržišta rada temeljeni na analizi medijskog diskursa o zapošljavanju, plaćama, radnim uvjetima i povezanim temama. Metodologija se temelji na brojanju pojmova iz unaprijed definirane semantičke taksonomije, pri čemu se za svaki članak zbrajaju pojavljivanja relevantnih pojmova, a zatim se provodi mjesečna agregacija i normalizacija.

Učitano 26104 članaka
Vremenski raspon: 2021-01-01 do 2024-01-08 

2 Eksploratorni pregled

U ovom poglavlju se prikazuju osnovne deskriptivne statistike dataseta. Analizom se obuhvaćaju broj članaka, vremenski raspon, distribucija izvora i dinamika objavljivanja kroz vrijeme.

Osnovne statistike dataseta
Metrika Vrijednost
Ukupan broj članaka 26,104
Vremenski raspon 01.01.2021 do 08.01.2024
Broj dana 1102
Prosječno članaka dnevno 23.69
Broj izvora 115
Medijan duljine članka 2,944

Top 20 izvora po broju članaka

Mjesečni broj članaka

3 Semantička taksonomija tržišta rada

3.1 Hijerarhijska struktura pojmova

Semantička taksonomija se organizira u hijerarhijsku strukturu s makro kategorijama (npr. zaposlenost, plaće) i meso kategorijama (npr. nezaposlenost, minimalna plaća). Za svaku kategoriju se definira skup regularnih izraza (regex pattern) koji obuhvaćaju relevantne pojmove i njihove morfološke varijante.

Pojmovi se definiraju pomoću korijena riječi (stem) kako bi se osigurala šira morfološka pokrivenost. Na primjer, korijen “zaposlen” će prepoznati “zaposlenost”, “zaposleni”, “zaposlenih”, “zaposlenike” itd.

Princip konstrukcije taksonomije:

  1. Makro kategorije predstavljaju široke tematske domene tržišta rada (npr. zaposlenost, plaće, radni odnosi)
  2. Meso kategorije predstavljaju specifičnije podteme unutar makro kategorija
  3. Regex uzorci se koriste za fleksibilno prepoznavanje morfoloških varijanti

Morfološka pokrivenost:

Za hrvatski jezik koji ima bogatu morfologiju, koriste se:

  • Korijenski oblici s opcionalnim nastavcima: zaposlen[aeiou]+ prepoznaje zaposlenost, zaposleni, zaposlenih
  • Alternativni oblici: (plaća|primanje) prepoznaje oba sinonima
  • Wildcard znakovi: .{0,10} dopušta do 10 bilo kojih znakova između riječi

Formula za brojanje:

\[ \text{count}_{c,d} = \sum_{p \in P_c} \text{matches}(p, d) \]

gdje je \(P_c\) skup regex uzoraka za kategoriju \(c\), a \(d\) je tekst dokumenta.

Kliknite za prikaz kompletne tablice semantičke taksonomije
Struktura semantičke taksonomije tržišta rada
Makro_kategorija Meso_kategorija Broj_pojmova
zaposlenost zaposlenost_opce 6
zaposlenost nezaposlenost 7
zaposlenost hzz 4
zaposlenost anketna 4
place place_opce 6
place prosjecna_placa 3
place minimalna_placa 4
place neto_bruto 4
place rast_place 6
place realna_placa 4
dinamika_rada zaposljavanje 5
dinamika_rada otpustanje 6
dinamika_rada oglasi_posao 5
dinamika_rada fluktuacija 4
radni_odnosi ugovor_rad 4
radni_odnosi sindikati 5
radni_odnosi strajk 4
radni_odnosi socijalni_dijalog 5
uvjeti_rada radno_vrijeme 6
uvjeti_rada rad_od_kuce 6
uvjeti_rada sigurnost_rad 4
uvjeti_rada bolovanje 3
demografija radna_snaga 4
demografija migracije 5
demografija strani_radnici 5
demografija starenje 4
obrazovanje kvalifikacije 4
obrazovanje vjestine 5
obrazovanje prekvalifikacija 4
obrazovanje neuskladenost 5
sektori javni_sektor 4
sektori privatni_sektor 3
sektori deficitarna_zanimanja 5
sektori turisticki_sektor 4
socijalna_zastita mirovine 6
socijalna_zastita naknade 4
socijalna_zastita doprinosi 4
produktivnost produktivnost_rada 4
produktivnost konkurentnost 3
produktivnost automatizacija 5
ranjive_skupine mladi 6
ranjive_skupine zene 5
ranjive_skupine osobe_invaliditetom 4
ranjive_skupine dugotrajno_nezaposleni 2
institucije ministarstvo 3
institucije zakonodavstvo 4
institucije aktivna_politika 5
institucije eu_fondovi 3

3.2 Leksikoni sentimenta i neizvjesnosti

Za mjerenje sentimenta i neizvjesnosti na tržištu rada koriste se specijalizirani leksikoni. Leksikon sentimenta se dijeli na pozitivne i negativne pojmove specifične za tržište rada, dok leksikon neizvjesnosti obuhvaća pojmove koji signaliziraju nesigurnost zaposlenja i ekonomsku neizvjesnost. Svi pojmovi se definiraju pomoću korijena riječi (stem) kako bi se osigurala šira morfološka pokrivenost.

Pozitivan sentiment na tržištu rada se mjeri brojenjem pojmova koji signaliziraju poboljšanje uvjeta, rast zapošljavanja i povećanje plaća. Koriste se korijenski oblici riječi poput rast.{0,10}zaposlen, nova.{0,10}radn.{0,10}mjest, povi[sš]ic, napredovanj.

Negativan sentiment se mjeri brojenjem pojmova koji signaliziraju pogoršanje uvjeta, gubitak posla i ekonomske poteškoće. Koriste se korijenski oblici poput otpu[sš]tanj, otkaz, gubitak.{0,10}posl, ste[cč]aj, emigracij.

Formula za neto sentiment:

\[ \text{Sentiment}_{net} = \text{Pozitivno} - \text{Negativno} \]

Formula za omjer sentimenta:

\[ \text{Sentiment}_{ratio} = \frac{\text{Pozitivno} - \text{Negativno}}{\text{Pozitivno} + \text{Negativno}} \]

Vrijednosti omjera se kreću od -1 (potpuno negativan sentiment) do +1 (potpuno pozitivan sentiment).

Neizvjesnost na tržištu rada se mjeri brojenjem pojmova koji signaliziraju nesigurnost zaposlenja, mogućnost otkaza i ekonomsku nestabilnost.

Definirano 26 pozitivnih i 28 negativnih labor sentiment pojmova
Definirano 26 labor neizvjesnost pojmova
Definirano 19 labor forward looking pojmova

3.3 Brojanje pojmova

Za svaki članak se zbrajaju pojavljivanja pojmova iz svake kategorije. Brojanje se provodi korištenjem regularnih izraza (regex) koji prepoznaju morfološke varijante pojmova. Rezultati se agregiraju na razini makro kategorija zbrajanjem svih pripadajućih meso kategorija.

Izračunato 48 semantičkih varijabli

4 Konstrukcija indeksa

4.1 Mjesečna agregacija

Podaci se agregiraju na mjesečnoj razini kako bi se omogućila analiza vremenskih trendova. Za svaki mjesec se izračunavaju zbroji i prosjeci svih varijabli tržišta rada, te se dodaju pomoćne mjere poput broja članaka i prosječne duljine teksta.

Agregirano 37 mjeseci podataka

4.2 Definicija labor indeksa

U ovom poglavlju se definira dvanaest indeksa tržišta rada. Svaki indeks se konstruira na temelju specifične kombinacije varijabli i normalizira se na skalu 0-100. Normalizacija se provodi korištenjem min-max skaliranja kako bi se omogućila usporedivost indeksa kroz vrijeme.

4.2.1 Pregled indeksa

PCA: PC1 objašnjava 38.7 % varijance
Konstruirano 12 indeksa

4.2.2 Detaljni opis indeksa

U nastavku se pruža detaljan opis svakog od dvanaest konstruiranih indeksa. Za svaki indeks se navodi formula, interpretacija vrijednosti i praktična primjena.

Pregled konstruiranih labor indeksa
Indeks Naziv Opis
LVI Labor Volume Index Ukupan volumen medijske pokrivenosti tržišta rada
EDI Employment Dynamics Index Dinamika zapošljavanja i otpuštanja
WPI Wage Pressure Index Intenzitet rasprave o plaćama i primanjima
LMTI Labor Market Tightness Index Napetost na tržištu rada (nedostatak radnika, deficitarna zanimanja)
LSI Labor Sentiment Index Sentiment medijskog diskursa o tržištu rada
LUI Labor Uncertainty Index Neizvjesnost na tržištu rada
LFLI Labor Forward Looking Index Forward looking orijentacija (planovi, prognoze)
SPI Social Protection Index Pokrivenost tema socijalne zaštite i mirovina
LRI Labor Relations Index Intenzitet rasprave o radnim odnosima i sindikatima
VGI Vulnerable Groups Index Pokrivenost tema ranjivih skupina (mladi, žene, invalidi)
PCI Principal Component Index Prva glavna komponenta svih dimenzija
CLI Composite Labor Index Kompozitni indeks ključnih dimenzija

4.2.2.1 Labor Volume Index (LVI)

LVI mjeri ukupnu razinu medijske pozornosti usmjerene na teme tržišta rada. Indeks se izračunava kao zbroj svih pojmova tržišta rada normaliziran po broju članaka u danom mjesecu. Viša vrijednost ukazuje na intenzivnije pokrivanje tema tržišta rada u medijima.

\[ \text{LVI}_t = \text{normalize}_{0-100}\left(\frac{\sum_{c \in C} \text{count}_{c,t}}{N_t}\right) \]

gdje je \(C\) skup svih kategorija tržišta rada, \(\text{count}_{c,t}\) zbroj pojmova kategorije \(c\) u mjesecu \(t\), a \(N_t\) broj članaka u mjesecu \(t\).

Normalizacija: Koristi se min-max skaliranje na raspon 0-100:

\[ \text{normalize}(x) = \frac{x - \min(x)}{\max(x) - \min(x)} \times 100 \]

Interpretacija vrijednosti:

  • 0-25: Niska medijska pozornost na tržište rada
  • 25-50: Umjerena medijska pozornost
  • 50-75: Povišena medijska pozornost
  • 75-100: Visoka medijska pozornost (razdoblja reformi, kriza ili značajnih promjena)

Prednosti i ograničenja:

  • Obuhvaća sve teme tržišta rada jednako
  • Normalizacija po broju članaka kontrolira za varijacije u volumenu vijesti
  • Ne razlikuje pozitivno od negativnog izvještavanja

4.2.2.2 Employment Dynamics Index (EDI)

EDI mjeri dinamiku zapošljavanja i otpuštanja na tržištu rada. Indeks kombinira kategorije zaposlenost i dinamika_rada, obuhvaćajući pojmove vezane uz stopu zaposlenosti, nezaposlenost, nova zapošljavanja i otpuštanja.

\[ \text{EDI}_t = \text{normalize}_{0-100}\left(\frac{\text{Zaposlenost}_t + \text{Dinamika}_t}{2 \cdot N_t}\right) \]

Komponente:

  • Zaposlenost: stope zaposlenosti/nezaposlenosti, HZZ podaci
  • Dinamika rada: zapošljavanje, otpuštanje, oglasi za posao, fluktuacija

Interpretacija:

  • Visoki EDI: intenzivna rasprava o dinamici zapošljavanja
  • Rastući EDI: povećana aktivnost na tržištu rada (bilo pozitivna ili negativna)
  • EDI treba interpretirati zajedno s LSI za razumijevanje smjera promjena

4.2.2.3 Wage Pressure Index (WPI)

WPI mjeri intenzitet medijske rasprave o plaćama i primanjima. Indeks se fokusira na makro kategoriju plaće koja obuhvaća prosječne plaće, minimalne plaće, neto/bruto razlike, rast plaća i realne plaće.

\[ \text{WPI}_t = \text{normalize}_{0-100}\left(\frac{\text{Plaće}_t}{N_t}\right) \]

Komponente makro kategorije plaće:

  • Opći pojmovi: plaća, primanja, zarada, dohodak
  • Prosječna plaća: prosjek, medijan
  • Minimalna plaća: minimalac, najniža plaća
  • Neto/bruto: razlike u izračunu
  • Rast plaća: povišica, revalorizacija
  • Realne plaće: kupovna moć, inflacija

Primjena:

WPI je koristan za praćenje pritiska na rast plaća, pregovora o minimalnoj plaći i rasprava o životnom standardu.

4.2.2.4 Labor Market Tightness Index (LMTI)

LMTI mjeri napetost na tržištu rada, odnosno koliko je teško pronaći radnike. Indeks kombinira pojmove vezane uz strane radnike, deficitarna zanimanja i neusklađenost vještina. Viša vrijednost ukazuje na veći pritisak potražnje za radnicima.

\[ \text{LMTI}_t = \text{normalize}_{0-100}\left(\frac{\text{Strani radnici}_t + \text{Deficitarna}_t + \text{Neusklađenost}_t}{N_t}\right) \]

Komponente:

  • Strani radnici: uvoz radne snage, radne dozvole, kvote
  • Deficitarna zanimanja: tražena zanimanja, nedostatak kadrova, IT stručnjaci
  • Neusklađenost: skill gap, skill mismatch

Interpretacija:

  • Visoki LMTI: tržište rada je napeto, poslodavci imaju poteškoća s pronalaskom radnika
  • Rastući LMTI: povećanje potražnje za radnicima ili odljev radne snage
  • LMTI može biti vodeći indikator pritiska na rast plaća

Povezanost s ekonomskim ciklusom:

LMTI tipično raste u ekspanzijskoj fazi ekonomskog ciklusa i pada tijekom recesije.

4.2.2.5 Labor Sentiment Index (LSI)

LSI mjeri sentiment medijskog diskursa o tržištu rada. Indeks kombinira ukupni volumen s omjerom pozitivnih i negativnih pojmova, pružajući mjeru ne samo količine već i tona izvještavanja.

\[ \text{LSI}_t = \text{normalize}_{0-100}\left(\frac{\text{Volumen}_t}{N_t} \times (1 + \text{Sentiment}_{ratio,t})\right) \]

Sentiment prilagodba:

Multiplikator \((1 + \text{Sentiment}_{ratio})\) povećava ili smanjuje indeks ovisno o tonu izvještavanja:

  • Pozitivan sentiment (ratio > 0): povećava LSI
  • Negativan sentiment (ratio < 0): smanjuje LSI
  • Neutralan sentiment (ratio ≈ 0): bez promjene

Referentna vrijednost:

  • LSI = 50: neutralan diskurs
  • LSI > 50: dominira pozitivan sentiment o tržištu rada
  • LSI < 50: dominira negativan sentiment

Primjena:

LSI je posebno koristan za praćenje promjena u percepciji stanja na tržištu rada tijekom ekonomskih ciklusa.

4.2.2.6 Labor Uncertainty Index (LUI)

LUI mjeri razinu neizvjesnosti na tržištu rada. Indeks se temelji na frekvenciji pojmova koji signaliziraju nesigurnost zaposlenja, mogućnost otkaza, restrukturiranja i ekonomsku nestabilnost.

\[ \text{LUI}_t = \text{normalize}_{0-100}\left(\frac{\text{Neizvjesnost}_t}{N_t}\right) \]

Kategorije neizvjesnosti:

  1. Nesigurnost zaposlenja: mogući otkazi, potencijalno otpuštanje
  2. Strukturne promjene: restrukturiranje, reorganizacija, spajanja
  3. Tehnološke prijetnje: automatizacija, robotizacija
  4. Ekonomska neizvjesnost: kriza, recesija, usporavanje
  5. Ugovorna nesigurnost: privremeni ugovori, sezonalnost

Interpretacija:

  • Visoki LUI: povećana neizvjesnost na tržištu rada
  • LUI raste prije ekonomskih kriza
  • LUI može služiti kao vodeći indikator pogoršanja uvjeta na tržištu rada

4.2.2.7 Labor Forward Looking Index (LFLI)

LFLI mjeri orijentaciju medijskog diskursa prema budućim očekivanjima na tržištu rada. Indeks obuhvaća pojmove koji signaliziraju planove zapošljavanja, prognoze i buduće trendove.

\[ \text{LFLI}_t = \text{normalize}_{0-100}\left(\frac{\text{Forward}_t}{N_t}\right) \]

Kategorije forward looking pojmova:

  1. Planovi zapošljavanja: planira zaposliti, otvorit će radna mjesta
  2. Prognoze: očekuje se rast, projekcije zaposlenosti
  3. Strategije: strategija zapošljavanja, investicijski planovi
  4. Reforme: reforma tržišta rada, promjene u regulativi

Primjena:

LFLI je koristan za procjenu koliko je medijski diskurs orijentiran prema anticipaciji budućih promjena nasuprot izvještavanju o trenutnom stanju.

4.2.2.8 Social Protection Index (SPI)

SPI mjeri intenzitet medijske pokrivenosti tema socijalne zaštite. Indeks se fokusira na mirovine, naknade za nezaposlene i doprinose.

\[ \text{SPI}_t = \text{normalize}_{0-100}\left(\frac{\text{Socijalna zaštita}_t}{N_t}\right) \]

Komponente:

  • Mirovine: mirovinski sustav, HZMO, mirovinski stupovi
  • Naknade: naknada za nezaposlene, socijalna pomoć
  • Doprinosi: porezi na dohodak, porezni klin

Interpretacija:

SPI raste tijekom rasprava o mirovinskim reformama, promjenama naknada ili poreznog sustava.

4.2.2.9 Labor Relations Index (LRI)

LRI mjeri intenzitet rasprave o radnim odnosima, sindikatima i industrijskim akcijama. Viša vrijednost ukazuje na pojačanu aktivnost socijalnog dijaloga ili industrijskih sukoba.

\[ \text{LRI}_t = \text{normalize}_{0-100}\left(\frac{\text{Radni odnosi}_t}{N_t}\right) \]

Komponente:

  • Ugovori o radu: neodređeno/određeno vrijeme
  • Sindikati: sindikalna aktivnost, kolektivni ugovori
  • Štrajkovi: obustave rada, industrijske akcije
  • Socijalni dijalog: GSV, tripartitni pregovori

Primjena:

LRI je koristan za praćenje ciklusa kolektivnih pregovora i industrijskih akcija.

4.2.2.10 Vulnerable Groups Index (VGI)

VGI mjeri pokrivenost tema vezanih uz ranjive skupine na tržištu rada: mlade, žene, osobe s invaliditetom i dugotrajno nezaposlene.

\[ \text{VGI}_t = \text{normalize}_{0-100}\left(\frac{\text{Ranjive skupine}_t}{N_t}\right) \]

Komponente:

  • Mladi: nezaposlenost mladih, pripravništvo, NEET
  • Žene: rodni jaz, gender gap, zapošljavanje majki
  • Osobe s invaliditetom: kvote zapošljavanja, prilagodbe
  • Dugotrajno nezaposleni: programi aktivacije

Primjena:

VGI je koristan za praćenje fokusa javne politike na socijalno uključivanje na tržištu rada.

4.2.2.11 Principal Component Index (PCI)

PCI se konstruira korištenjem analize glavnih komponenata (PCA) na svim makro kategorijama. Prva glavna komponenta se koristi kao sintetički indeks koji maksimalno objašnjava varijabilitet svih tema tržišta rada.

\[ \text{PCI}_t = \text{normalize}_{0-100}\left(\sum_{i=1}^{k} w_i \cdot z_{i,t}\right) \]

gdje su \(w_i\) težine iz prve glavne komponente, a \(z_{i,t}\) standardizirane vrijednosti makro kategorija.

Postupak konstrukcije:

  1. Standardizacija svih makro kategorija (z-score)
  2. Izračun kovarijacijske/korelacijske matrice
  3. Dekompozicija na svojstvene vrijednosti i vektore
  4. Odabir prve glavne komponente
  5. Projekcija podataka na prvu komponentu
  6. Normalizacija na skalu 0-100

Prednosti:

  • Objektivno ponderiranje tema prema njihovom doprinosu varijabilnosti
  • Reducira dimenzionalnost na jednu sintetičku mjeru
  • Koristi informaciju iz svih tema

4.2.2.12 Composite Labor Index (CLI)

CLI je kompozitni indeks koji kombinira četiri ključne dimenzije tržišta rada: volumen (LVI), dinamiku zapošljavanja (EDI), plaće (WPI) i sentiment (LSI). Indeks pruža sveobuhvatnu mjeru stanja na tržištu rada.

\[ \text{CLI}_t = \frac{\text{LVI}_t + \text{EDI}_t + \text{WPI}_t + \text{LSI}_t}{4} \]

Komponente:

  • LVI: ukupna medijska pozornost
  • EDI: dinamika zapošljavanja
  • WPI: pritisak na plaće
  • LSI: sentiment

Prednosti kompozitnog pristupa:

  • Uravnoteženo obuhvaća različite aspekte tržišta rada
  • Robusniji od pojedinih indeksa
  • Jednostavna interpretacija kao prosječna vrijednost

5 Vizualizacija indeksa

5.1 Glavni labor indeksi

Na sljedećim grafikonima se prikazuje dinamika glavnih indeksa tržišta rada kroz vrijeme. LVI i CLI prikazuju ukupnu aktivnost, EDI i WPI prikazuju dinamiku zapošljavanja i plaće, LSI prikazuje sentiment, a LUI prikazuje neizvjesnost.

Glavni semantički indeksi tržišta rada

5.2 Labor Market Tightness

LMTI prikazuje napetost na tržištu rada, odnosno intenzitet rasprave o nedostatku radnika i deficitarnim zanimanjima.

Labor Market Tightness Index

5.3 Socijalne dimenzije

Na sljedećim grafikonima se prikazuju indeksi socijalnih dimenzija: socijalna zaštita (SPI), radni odnosi (LRI) i ranjive skupine (VGI).

Socijalne dimenzije tržišta rada

6 Sektorska analiza

6.1 Konstrukcija sektorskih indeksa

Sektorski indeksi se konstruiraju za svaku od 12 makro kategorija semantičke taksonomije. Za svaki sektor se izračunava mjesečni zbroj pojmova, koji se zatim normalizira na skalu 0-100 korištenjem min-max skaliranja unutar svakog sektora.

Sektorski indeksi omogućuju praćenje dinamike specifičnih tema tržišta rada neovisno o ostalim temama. Na primjer, sektor “plaće” može rasti dok sektor “nezaposlenost” pada, što bi signaliziralo pomak fokusa s problema nezaposlenosti na rasprave o plaćama.

Formula za sektorski indeks:

\[ \text{Sektor}_{s,t} = \text{normalize}_{0-100}\left(\text{macro}_{s,t}\right) \]

gdje je \(\text{macro}_{s,t}\) zbroj svih pojmova iz makro kategorije \(s\) u mjesecu \(t\).

Napomena o normalizaciji:

Sektorski indeksi se normaliziraju unutar svakog sektora, što znači da vrijednosti različitih sektora nisu izravno usporedive.

Primjena LOESS izglađivanja:

Na grafikonima se koristi LOESS (Locally Estimated Scatterplot Smoothing) za prikaz trenda.

6.2 Dinamika sektorskih indeksa

Na sljedećim grafikonima se prikazuje dinamika 12 dimenzija tržišta rada kroz vrijeme.

Dinamika dimenzija tržišta rada kroz vrijeme

6.3 Heatmapa sektorske aktivnosti

Heatmapa pruža vizualni pregled intenziteta svih sektorskih indeksa kroz vrijeme na jednom grafikonu. Svaki redak predstavlja jednu dimenziju, svaki stupac predstavlja jedan mjesec, a boja ćelije predstavlja normalizirani intenzitet aktivnosti.

Konstrukcija heatmape:

  1. Za svaki sektor se uzimaju mjesečne normalizirane vrijednosti (0-100)
  2. Podaci se organiziraju u matricu (sektori × mjeseci)
  3. Vrijednosti se mapiraju na kontinuiranu skalu boja (plasma paleta)

Interpretacija:

  • Horizontalni uzorci: promjene aktivnosti jedne dimenzije kroz vrijeme
  • Vertikalni uzorci: usporedba aktivnosti različitih dimenzija u istom mjesecu
  • Dijagonalni uzorci: prijenos fokusa s jedne dimenzije na drugu

Heatmapa dimenzija tržišta rada

6.4 Korelacijska struktura

Korelacijska matrica prikazuje međusobne odnose između svih konstruiranih indeksa i sektorskih kategorija. Pozitivna korelacija (crvena) ukazuje na to da dva indeksa/sektora tendiraju rasti i padati zajedno, dok negativna korelacija (plava) ukazuje na obrnuti odnos.

Korelacijska matrica dimenzija i indeksa

7 Sentiment analiza

7.1 Konstrukcija sentiment indeksa

Sentiment analiza na tržištu rada se fokusira na razlikovanje pozitivnog i negativnog izvještavanja. Za svaki članak se broje pojmovi iz pozitivnog leksikona (rast zaposlenosti, nova radna mjesta, povišice) i negativnog leksikona (otpuštanja, otkazi, štrajkovi, emigracija).

Na temelju ovih brojeva se izračunavaju tri mjere:

  1. Neto sentiment: razlika između pozitivnih i negativnih pojmova
  2. Omjer sentimenta: normalizirana razlika na skalu -1 do +1
  3. LSI (Labor Sentiment Index): volumen prilagođen za sentiment na skalu 0-100

Formule:

\[ \text{Neto sentiment}_t = \sum_{p \in P} \text{count}_{p,t} - \sum_{n \in N} \text{count}_{n,t} \]

gdje je \(P\) skup pozitivnih pojmova, a \(N\) skup negativnih pojmova.

\[ \text{Omjer sentimenta}_t = \frac{\text{Pozitivno}_t - \text{Negativno}_t}{\text{Pozitivno}_t + \text{Negativno}_t} \]

Intenzitet jezika:

Dodatno se mjeri intenzitet jezika korištenjem leksikona intenziteta:

  • Visoki intenzitet: “značajan rast”, “masovna otpuštanja”, “rekordan”
  • Niski intenzitet: “minimalan”, “zanemariv”, “neznatan”

Labor sentiment komponente kroz vrijeme

8 Volatilnost i momentum

8.1 Konstrukcija mjera volatilnosti i momenta

Volatilnost i momentum se koriste za procjenu stabilnosti i smjera kretanja indeksa tržišta rada. Volatilnost mjeri koliko indeks varira u kratkom roku, dok momentum mjeri smjer i intenzitet promjene.

Volatilnost se izračunava kao standardna devijacija indeksa u kliznom prozoru od 3 mjeseca. Viša volatilnost ukazuje na nestabilnije uvjete na tržištu rada.

Momentum se izračunava kao razlika između trenutne vrijednosti i vrijednosti u prethodnom razdoblju.

Formula za volatilnost (3M rolling SD):

\[ \text{Vol}_{t} = \sqrt{\frac{1}{2}\sum_{i=t-2}^{t}(x_i - \bar{x}_{t-2:t})^2} \]

Formula za mjesečni momentum:

\[ \text{Mom}_{1M,t} = x_t - x_{t-1} \]

Formula za tromjesečni momentum:

\[ \text{Mom}_{3M,t} = x_t - x_{t-3} \]

Interpretacija:

  • Visoka volatilnost + pozitivan momentum: brzi rast s nestabilnošću
  • Visoka volatilnost + negativan momentum: brzi pad s nestabilnošću
  • Niska volatilnost + pozitivan momentum: stabilan rast
  • Niska volatilnost + negativan momentum: stabilan pad

Volatilnost i momentum labor indeksa

9 Koncentracija tema

9.1 Konstrukcija mjera koncentracije

Koncentracija tema mjeri koliko je medijski diskurs fokusiran na mali broj tema nasuprot disperziji na mnogo tema. Za mjerenje koncentracije koristi se Herfindahl-Hirschman indeks (HHI).

Visoki HHI (bliže 1) ukazuje na fokus medija na jednu ili nekoliko dominantnih tema, što je tipično za razdoblja kriza kada jedna tema dominira (npr. masovna otpuštanja).

Niski HHI (bliže 0) ukazuje na disperziju pažnje na mnogo tema, što je tipično za stabilnija razdoblja.

Herfindahl-Hirschman Index (HHI):

\[ \text{HHI}_t = \sum_{s=1}^{S} \left(\frac{x_{s,t}}{\sum_{s=1}^{S} x_{s,t}}\right)^2 \]

gdje je \(x_{s,t}\) vrijednost sektora \(s\) u mjesecu \(t\), a \(S\) broj sektora.

Interpretacija HHI:

  • HHI = 1: potpuna koncentracija (samo jedna tema)
  • HHI = 1/S: potpuna disperzija (sve teme jednako zastupljene)

Primjena:

  • Rastući HHI: fokusiranje pažnje na dominantnu temu
  • Padajući HHI: disperzija pažnje ili pojava novih tema

Koncentracija tema tržišta rada

10 Korelacije između indeksa

U sljedećoj tablici se prikazuje korelacijska matrica svih konstruiranih indeksa tržišta rada. Korelacije omogućuju razumijevanje međusobnih odnosa između različitih aspekata tržišta rada.

Korelacijska matrica labor indeksa
LVI EDI WPI LMTI LSI LUI LFLI SPI LRI VGI PCI CLI
LVI 1.000 -0.324 0.795 0.374 0.846 0.008 -0.087 0.481 0.346 -0.108 -0.255 0.888
EDI -0.324 1.000 -0.651 -0.342 -0.264 -0.318 -0.176 -0.252 -0.569 0.321 0.517 0.026
WPI 0.795 -0.651 1.000 0.443 0.762 0.018 -0.081 0.494 0.218 -0.257 -0.163 0.682
LMTI 0.374 -0.342 0.443 1.000 0.487 -0.220 0.036 0.335 -0.018 -0.187 -0.189 0.340
LSI 0.846 -0.264 0.762 0.487 1.000 -0.081 -0.062 0.588 -0.012 0.018 -0.025 0.900
LUI 0.008 -0.318 0.018 -0.220 -0.081 1.000 0.305 0.033 0.307 -0.182 -0.207 -0.187
LFLI -0.087 -0.176 -0.081 0.036 -0.062 0.305 1.000 -0.071 0.124 0.014 -0.301 -0.185
SPI 0.481 -0.252 0.494 0.335 0.588 0.033 -0.071 1.000 -0.257 -0.018 0.001 0.490
LRI 0.346 -0.569 0.218 -0.018 -0.012 0.307 0.124 -0.257 1.000 -0.291 -0.718 -0.071
VGI -0.108 0.321 -0.257 -0.187 0.018 -0.182 0.014 -0.018 -0.291 1.000 0.049 0.026
PCI -0.255 0.517 -0.163 -0.189 -0.025 -0.207 -0.301 0.001 -0.718 0.049 1.000 0.090
CLI 0.888 0.026 0.682 0.340 0.900 -0.187 -0.185 0.490 -0.071 0.026 0.090 1.000

11 Export

Excel exportiran: C:/Users/lsikic/Luka C/GIMES/GIMES_HR-inflacija/output/semantic_labor_indices.xlsx 

12 Sažetak

U ovoj analizi je konstruirano dvanaest indeksa tržišta rada temeljenih na semantičkoj analizi medijskog diskursa. Indeksi obuhvaćaju različite aspekte tržišta rada: ukupnu pokrivenost (LVI), dinamiku zapošljavanja (EDI), pritisak na plaće (WPI), napetost tržišta (LMTI), sentiment (LSI), neizvjesnost (LUI), prognostičku orijentaciju (LFLI), socijalnu zaštitu (SPI), radne odnose (LRI), ranjive skupine (VGI), sintetičku mjeru temeljenu na PCA (PCI) i kompozitni indeks (CLI).

Sažetak analize tržišta rada
Metrika Vrijednost
Broj analiziranih članaka 26,104
Vremenski raspon 01/2021 - 01/2024
Broj semantičkih kategorija 48
Broj makro dimenzija 12
Broj konstruiranih indeksa 12
Prosječni LVI 33.5
Prosječni sentiment ratio 0.314
Prosječni LUI 41.2

Izvještaj generiran: 2026-01-02 09:56:26.108516

GIMES Research | Semantički indeks tržišta rada v2.0