Tekstualna analiza temeljena na novinskim člancima sustavan je način kopanja po pisanom sadržaju, izvlačenja obrazaca, tema i uvida korištenjem kombinacije ljudske pameti i, sve više, računalnih alata. Evo kako se to obično radi i na što se istraživači obično usredotočuju:
Proces počinje prikupljanjem hrpe članaka iz novina u određenom vremenskom razdoblju, npr. poput mjesec dana izvještavanja o izborima. Pošto dobijete hrpu teksta analiza se dijeli na dvije glavne vrste: ručnu i automatiziranu.
Ručni pristup: čitali biste članke, kodirajući ih za ideje koje se ponavljaju – poput označavanja svakog spominjanja “ekonomske politike” ili “klimatskih promjena”. To može uključivati okvir poput analize sadržaja, gdje brojite koliko često se određene riječi ili fraze pojavljuju ili analizu diskursa, gdje otkrivate kako jezik oblikuje mišljenja. Spor je, ali izvrstan za hvatanje nijansi – poput sarkazma ili kulturnog podteksta – koje bi strojevi mogli promašiti.
Automatizirani pristup je puno brži, ali podrazumijeva poznavanje programskih jezika i raznih alata, kao što je Pythonov NLTK ili neki drugi softver.
Što se može izračunati?
Učestalost riječi: Brojanje “kriza” ili “nada” da se vidi što dominira u čavrljanju.
Analiza raspoloženja: Mjerenje naginju li članci pozitivno, negativno ili neutralno pomoću leksikona ili strojnog učenja.
Modeliranje tema: algoritmi grupiraju riječi u teme — recimo, “politika”, “kriminal”, “sport” — bez unaprijed definiranih kategorija.
Uočavanje spominjanja ljudi, mjesta ili institucija – primjerice koliko se često pojavljuje “Zagreb” ili “Hrvatska vlada”.
Ipak najviše se istražuje javno mišljenje. Kako članci oblikuju pitanja kao što su imigracija ili zdravstvena skrb — potiču li strah ili optimizam? Analiza raspoloženja često mjeri tu promjenu tijekom vremena.
Politička pristranost: Usporedba dvaju medija, da se vidi čija agenda blista kroz izbor riječi (npr., “reforma” nasuprot “remont”) ili tko se najviše citira.
Pokrivenost događaja: Kako se velike priče — poput pandemije ili rata u Ukrajini — razvijaju u tonu, fokusu ili detaljima.
Društveni trendovi: Uočavanje kulturoloških promjena – poput sve češćeg spominjanja “održivosti” ili “rada na daljinu” – kako bi se procijenilo što je ljudima na umu.
Evolucija jezika: Lingvisti bi mogli tražiti novi sleng, metafore ili kako izrazi poput “sloboda” mijenjaju značenje kroz desetljeća.
Je li prava istina u novinama?
Međutim, treba biti oprezan: mediji već unaprijed, prije objavljivanja prave svoj vlastiti izbor, friziraju tekst, filtriraju podatke i često su pojedini novinari pristrani. Tako uzimajući to u obzir, za tekstualnu analitiku potrebna je dodatna vještina i možda neki dodatni algoritmi koji će isprogramirati rezultat s obzirom na izvor teksta. Tako da bi se stanje u društvu trebalo istražiti još dublje, da sve ne ostane samo na percepciji jednog novinskog urednika.
Dakle, prava istina možda je negdje drugdje. No ništa ne treba ostati skriveno i nedorečeno ako se posegne za pravim alatima tekstualne analitike. Samo malo više truda i vremena.







