Kako u medijima možemo otkriti – skriveno?

Tekstualna analiza temeljena na novinskim člancima sustavan je način kopanja po pisanom sadržaju, izvlačenja obrazaca, tema i uvida korištenjem kombinacije ljudske pameti i, sve više, računalnih alata. Evo kako se to obično radi i na što se istraživači obično usredotočuju:

Proces počinje prikupljanjem hrpe članaka iz novina u određenom vremenskom razdoblju, npr. poput mjesec dana izvještavanja o izborima. Pošto dobijete hrpu teksta analiza se dijeli na dvije glavne vrste: ručnu i automatiziranu.

Ručni pristup: čitali biste članke, kodirajući ih za ideje koje se ponavljaju – poput označavanja svakog spominjanja “ekonomske politike” ili “klimatskih promjena”. To može uključivati ​​okvir poput analize sadržaja, gdje brojite koliko često se određene riječi ili fraze pojavljuju ili analizu diskursa, gdje otkrivate kako jezik oblikuje mišljenja. Spor je, ali izvrstan za hvatanje nijansi – poput sarkazma ili kulturnog podteksta – koje bi strojevi mogli promašiti.

Automatizirani pristup je puno brži, ali podrazumijeva poznavanje programskih jezika i raznih alata, kao što je Pythonov NLTK ili neki drugi softver.

Što se može izračunati?

Učestalost riječi: Brojanje “kriza” ili “nada” da se vidi što dominira u čavrljanju.

Analiza raspoloženja: Mjerenje naginju li članci pozitivno, negativno ili neutralno pomoću leksikona ili strojnog učenja.

Modeliranje tema: algoritmi grupiraju riječi u teme — recimo, “politika”, “kriminal”, “sport” — bez unaprijed definiranih kategorija.

Uočavanje spominjanja ljudi, mjesta ili institucija – primjerice koliko se često pojavljuje “Zagreb” ili “Hrvatska vlada”.

Ipak najviše se istražuje javno mišljenje. Kako članci oblikuju pitanja kao što su imigracija ili zdravstvena skrb — potiču li strah ili optimizam? Analiza raspoloženja često mjeri tu promjenu tijekom vremena.

Politička pristranost: Usporedba dvaju medija, da se vidi čija agenda blista kroz izbor riječi (npr., “reforma” nasuprot “remont”) ili tko se najviše citira.

Pokrivenost događaja: Kako se velike priče — poput pandemije ili rata u Ukrajini — razvijaju u tonu, fokusu ili detaljima.

Društveni trendovi: Uočavanje kulturoloških promjena – poput sve češćeg spominjanja “održivosti” ili “rada na daljinu” – kako bi se procijenilo što je ljudima na umu.

Evolucija jezika: Lingvisti bi mogli tražiti novi sleng, metafore ili kako izrazi poput “sloboda” mijenjaju značenje kroz desetljeća.

Je li prava istina u novinama?

Međutim, treba biti oprezan:  mediji već unaprijed, prije objavljivanja prave svoj vlastiti izbor, friziraju tekst, filtriraju podatke i često su pojedini novinari pristrani. Tako uzimajući to u obzir, za tekstualnu analitiku potrebna je dodatna vještina i možda neki dodatni algoritmi koji će isprogramirati rezultat s obzirom na izvor teksta. Tako da bi se stanje u društvu trebalo istražiti još dublje, da sve ne ostane samo na percepciji jednog novinskog urednika.

Dakle, prava istina možda je negdje drugdje. No ništa ne treba ostati skriveno i nedorečeno ako se posegne za pravim alatima tekstualne analitike. Samo malo više truda i vremena.

Otkrijmo trendove i – zabavimo se

Dobro došli na ovaj blog, gdje brojevi otkrivaju priče, riječi unose red u kaos, a podatci postaju više od obične hrpe znamenki. Naša misija? Otkrivati trendove, istraživati fenomene, analizirati podatke i tražiti istinu skrivenu u zaboravljenim ili namjerno prešućenim događajima.

U svijetu prepunom lažnih informacija i zbunjujućih podataka ovdje nastojimo dati precizne analize koje razotkrivaju logiku iza naizgled nerazumljivih stvari. I usput se zabaviti aktualnim temama! (Jozo Renić)

Povežimo se…