Referencia útmutató

Módszertan és fogalmak

Útmutató a HírSpektrum narratívaelemzéséhez, az összes általunk használt fogalom, mérőszám és vizuális elem magyarázatával.

A platform működése

A HírSpektrum egy narratíva elemző platform, amely valós időben figyeli a magyar internetes hírforrásokat. Az egyes cikkek követése helyett a rendszer narratívákba csoportosítja a tudósításokat.

A cikke gyűjtése, elemzése és a narratívákba való csoportosítása teljesen automatikusan történik. Jelenleg az általunk követett 9 hírforrástól átlagosan naponta több mint 2000 cikket gyűjtünk össze. A csoportosítást egy egyedi algoritmussal végezzük óránként. Erre egy dinamikus klaszterezési eljárást fejlesztettünk ki, amely képes pontosan nyomon követni a narratívákat, detektálni ha egy narratíva az idő múlásával kettéválik, vagy esetleg több narratíva összeolvad egy központi történetté.

Ezeket az óránként elkészített narratívákat ezután címekkel és rövid leírásokkal látjuk el, hogy megkönnyítsük és felgyorsítsuk az információszerzést. Fontos, hogy az oldal nem tökéletes, és nagy valószínűséggel fogtok hibát találni, ezt a jövőben majd vissza is fogjátok tudni jelezni.

Alapelvünk: Nem azt mondjuk meg, mit mond a hír. Hanem megmutatjuk, hogyan mondja, ki mondja, és hogyan változik ez az idő múlásával.

Narratívák

A narratíva egy csoportosítása az összetartozó híreknek, ami segít mélyebben megérteni az eseményeket, feltárni a elfogultságokat és a hírek között húzódó közös szálakat.

Vagy kicsit bonyolultabban: a narratíva az a folyamatosan formálódó értelmezési keret, amely a hírek között húzódó összefüggésekből épül fel, és a puszta eseménysoron túl szereplőket, szándékokat és jelentést rendel a valósághoz.

Minden általunk megjelenített narratíva tartalmazza a következőket:

  • Cím és összefoglaló: A cikkeket röviden összefoglaló cím és leírás
  • Hangulatelemzés: A cikkek érzelmi töltetének és intenzitásának elemzése
  • Forráselemzés: Az egyes hírforrások hány cikket publikáltak az adott témákban
  • Keretezési és Érzelmi elemzés : A narratíva domináns kerete és érzelmeinek ábrázolása
  • Entitás elemzés: A cikkekben említett entitások listája és forrásonkénti bontása
  • Időbeli Trendek: A narratíva néhány metrikájának időbeli ábrázolása

Narratíva keretek

A keretezéselemzés (framing analysis) azt vizsgálja, hogy a média nem csupán beszámol az eseményekről, hanem értelmezési keretet is kínál hozzájuk, meghatározza, mi a fontos, ki a felelős, és mit kellene tenni. Az elmélet alapjait Erving Goffman szociológus rakta le 1974-ben, aki szerint az emberek „értelmezési sémákon” keresztül rendezik a valóságot. A médiakutatásba Robert Entman emelte be 1993-ban, aki szerint a keret kijelöli a problémát, megnevezi az okot, erkölcsi ítéletet hoz, és megoldást javasol. A keretek, amelyeket ez az elemzés alkalmaz, Semetko és Valkenburg 2000-es, széles körben hivatkozott kutatásából származnak.

Az általunk alkalmazott 9 narratíva keret a következő:

Konfliktus

Szembenálló felek, vita, küzdelem

Emberi érdek

Személyes történet, érzelmi bevonódás

Gazdasági következmény

Anyagi hatások, költség, haszon

Erkölcs

Értékrend, norma, vallási vagy etikai alap

Kiszolgáltatottság

Tehetetlenség, áldozatiság, strukturális csapda

Felelősség

Ki tehet róla, ki oldhatja meg

Biztonsági fenyegetés

Veszély, kockázat, félelem

Fejlődés

Megoldás, előrelépés, remény

Egyéb

A történet keretezése nem illeszthető a szokványos kategóriák egyikébe sem.

Hogyan használjuk a kereteket: Minden narratívának van egy domináns kerete (a leggyakoribb keret az összes cikkét tekintve), de a forrásbontás megmutatja, hogy különböző lapok hogyan keretezik ugyanazt a történetet eltérő cikkekben. Ez a szerkesztői elfogultság egyik legerősebb jelzője.

Ezek a keretek nem véletlenszerűek: empirikusan igazolták, hogy újságírók tudatosan vagy ösztönösen ezekbe a mintákba rendezik a híreket, a befogadók pedig ezeken keresztül alakítják véleményüket. Egy narratíva domináns kerete így nem csupán stílusjegy, hanem politikai és társadalmi hatást gyakorló értelmezési döntés.

Narratíva státuszok

Minden narratívának van egy életciklus státusza. Mivel a narratívák óráról órára nőhetnek, átalakulhatnak, kettéválhatnak vagy összeolvadhatnak más narratívákkal szükséges, hogy nyomon kövessük a státuszukat.

Aktív

A narratíva aktívan nyomon követett, új cikkekkel bővülhet, de akár zsugorodhat is, és az alapértelmezett hírfolyamban jelenik meg. Aktív állapotban 2 hétnél fiatalabb és az elmúlt 3 napban frissített narratívák lehetnek.

Archivált

A narratívát már nem követjük aktívan, de továbbra is olvasható. Azok a témák amik nem frissülnek 3 napig vagy 2 hétnél régebbiek archiválásra kerülnek.

Beolvadt

Beolvadt az a narratíva amelynek cikkeinek legalább a fele egy másik narratívában jelenik meg egy későbbi kimutatásban. Mivel az algoritmus óránként újra klaszterezi a narratívákat, ezért előfordul, hogy két narratíva egybeolvad. A kontinuitás érdekében a beolvadt narratívát megtartjuk és jelöljük, hogy a hírfolyam hol folytatódik.

Alapértelmezés szerint a hírfolyam csak aktív narratívákat mutat. A szűrősávval válthatsz a státuszok között.

Hangulatelemzés

A hangulatelemzés azt méri, hogy egy szöveg érzelmi töltete pozitív, semleges vagy negatív-e. Vagyis nem azt, miről szól egy cikk, hanem hogyan viszonyul a tárgyához. A módszer gyökerei a számítógépes nyelvészetre nyúlnak vissza, de a médiakutatásban Pang és Lee 2008-as munkája („Opinion Mining and Sentiment Analysis”) alapozta meg a széles körű alkalmazását.

A hangulat iránya (+1 / 0 / −1) megmutatja, hogy egy forrás vagy narratíva összességében hogyan ábrázolja az eseményeket. Optimistán, semlegesen vagy negatívan. Az intenzitás ezen túlmutat: ugyanaz az érzelmi irány lehet visszafogott vagy erőteljes, ami jelzi, mennyire „töltött” a szöveg retorikai szempontból. Ezt a kettős mérési logikát Dr. Johan Bollen is alkalmazták nagy léptékű médiaelemzéseikben, kimutatva, hogy a hangulat iránya és erőssége együttesen jobb előrejelzője a társadalmi hatásnak, mint bármelyik önmagában.

Forrás és narratívaszinten aggregálva a hangulat szerkesztői mintázatokat fed fel: megmutatja, hogy egy médium strukturálisan pesszimista vagy optimista képet közvetít-e egy témáról, illetve hogy egy narratíva érzelmileg hogyan pozicionálja a befogadót.

POSITIVE

A tartalom helyeslő, optimista vagy kedvező hangnemet hordoz.

NEUTRAL

A tartalom kiegyensúlyozott, ténybeli, egyik irányba sem dől.

NEGATIVE

A tartalom kritikus, pesszimista vagy elutasító hangnemet hordoz.

Hangulati skála

Az alábbi kis négyzeteket látjátok narratíva kártyák felső részén a keret mellett, ami szintén a narratíva általános hangulatelemzését mutatja.

Pontszám tartományCímkeSzín
+0.50 – +1.00Nagyon pozitív
+0.20 – +0.50Pozitív
-0.20 – +0.20Semleges
-0.50 – -0.20Negatív
-1.00 – -0.50Nagyon negatív

Globális hangulat: egy narratíva összes cikkének átlagos hangulata.

Hangulat intenzitás

Magas

A szöveg erőteljes, határozott nyelvi eszközöket használ. A hangulat domináns és egyértelmű irányú.

Közepes

A szöveg mérsékelt érzelmeket hordoz. A hangulat azonosítható, de nem túlzottan éles.

Alacsony

A szöveg visszafogott, semleges hangvételű. A hangulat gyenge vagy alig érzékelhető.

Érzelemdetektálás

A hangulatelemzés megmutatja, hogy egy szöveg pozitív vagy negatív-e, de nem árulja el, milyen érzést vált ki. Mivel más hatása van egy felháborodott cikknek és egy szomorúnak, még ha mindkettő negatív töltetű is. Az érzelemdetektálás ezt a hiányt tölti be: a puszta irányon túl azonosítja a szöveg domináns érzelmi tónusát.

Az alkalmazott kategóriák Robert Plutchik 1980-as érzelemmodelljére épülnek, amely szerint az emberi érzelmek egy viszonylag kis számú alapérzelemre vezethetők vissza, köztük a harag, félelem, öröm, meglepetés, szomorúság, bizalom és undor, amelyek kombinációiból összetettebb érzelmi állapotok keletkeznek. Plutchik modellje azért vált a számítógépes szövegelemzés egyik legelterjedtebb alapjává, mert kategóriái kulturálisan viszonylag stabilak és jól működtethetők szöveges jelekből.

A médiakutatásban az érzelmek detektálása különösen fontos, mert a kutatások szerint köztük Soroka 2014-es munkája alapján, a negatív és magas intenzitású érzelmeket keltő tartalmak erősebb figyelmet és mélyebb emlékezeti nyomot hagynak, mint a semleges vagy pozitív tudósítások. Az egyes érzelmek megoszlása forrásonként és narratívánként így nemcsak a hangulati képet árnyalja, hanem a médium által alkalmazott retorikai stratégiát is feltárja.

Harag

Valami igazságtalannak vagy elfogadhatatlannak tűnik. A szöveg feszültséget, szembenállást vagy felháborodást sugároz.

Félelem

Valami veszélyes vagy kiszámíthatatlan. A szöveg aggodalmat, bizonytalanságot vagy fenyegetettség-érzetet kelt.

Öröm

Valami jól sikerült vagy reménykeltő. A szöveg ünneplést, elégedettséget vagy lelkesedést közvetít.

Meglepetés

Valami váratlanul történt. A szöveg döbbenetet, hirtelen fordulatot vagy előre nem látott fejleményt jelez.

Szomorúság

Valami elveszett vagy megtört. A szöveg gyászt, tehetetlenséget vagy mély csalódottságot fejez ki.

Bizalom

Valami stabil és megbízható. A szöveg pozitív viszonyt sugall intézményekhez, személyekhez vagy folyamatokhoz.

Undor

Valami mélységesen visszataszító vagy megvetendő. A szöveg határozott elutasítást vagy erkölcsi felháborodást közvetít.

Egyéb

Az érzelmi tónus érzékelhető, de nem illeszthető egyértelműen egyetlen domináns kategóriába sem.

Entitások és szerepek

A médiaelemzésben az entitás minden olyan megnevezett szereplő személy, szervezet vagy helyszín, aki vagy ami körül a hírek szerveződnek. Az entitáselemzés azt vizsgálja, hogy ezek a szereplők milyen szerepben és milyen érzelmi töltettel jelennek meg a médiában, feltárva ezzel a tudósítás mögött húzódó hatalmi és értelmezési mintázatokat.

Az elméleti alapot Van Dijk kritikai diskurzuselemzése adja, amely szerint a médiaszövegek nem semlegesen nevezik meg a szereplőket, hanem szerepeket és felelősséget osztanak ki nekik, eldöntve, ki a cselekvő, ki az elszenvedő, és ki a magyarázó hang. Ezt egészíti ki az Entman-féle keretezéselmélet, amely szerint a szereplők pozicionálása, főszereplőként, felelősként vagy áldozatként való beállítása az egyik legerősebb eszköz, amellyel a média formálja a közvéleményt.

A szerepek (főszereplő, felelős, áldozat, kommentátor, említett) nem csupán leíró kategóriák: megmutatják, hogy egy narratíva kinek ad cselekvőképességet és kinek veszi el azt. Az entitások forrás és narratívaszintű hangulati összehasonlítása pedig feltárja, hogy ugyanaz a szereplő különböző médiumokban milyen eltérő megvilágításba kerül, ami a médiatorzítás egyik legközvetlenebb mérőeszköze.

Személy

Megnevezett személ: politikus, közéleti szereplő, szakértő vagy más, a médiában szereplő egyén.

Szervezet

Megnevezett intézmény: kormányzati szerv, vállalat, civil szervezet, párt vagy egyéb szervezet.

Helyszín

Földrajzi entitás: város, ország, régió vagy más, a narratívában releváns helyszín.

Entitás szerepek

Az entitás domináns szerepe a legtöbbször detektált szerep az összes cikkét tekintve.

Főszereplő

A narratíva főszereplője: az a személy, szervezet vagy helyszín, akire/amelyre a történet elsősorban fókuszál.

Felelős

Felelősnek beállított szereplő: a narratíva szerint ő okozta a problémát, vagy felelős a negatív eseményért.

Áldozat

Áldozat: a narratívában elszenvedőként ábrázolt entitás, akit a körülmények vagy más szereplők hátrányosan érintenek.

Kommentátor

Kommentátor: a narratívában véleményt formáló, szakértőként vagy nyilatkozóként megjelenő entitás.

Említett

Megemlített: a szövegben előfordul, de nem tölt be meghatározó szerepet a narratíva szempontjából.

Minden entitásnak saját adatlapja van, amelyen látható: összesített hangulat (mennyire pozitívan vagy negatívan tudósítanak róla), narratíva érintettség (melyik történetekben szerepel), forrásonkénti hangulat összehasonlítás és megemlítések száma. Az adatlap 7, 14, 30 vagy 90 napos időablakra szűrhető.

Források és forrás intelligencia

A HírSpektrum 9 nagy magyar hírportált figyel: 24.hu, 444.hu, Blikk, HVG, Index, Origo, Portfolio, Ripost és Telex. Minden forrást önállóan követünk nyomon és profilozunk. Nem csupán azt rögzítve, mit írnak, hanem azt is, hogyan.

Forrás intelligencia profil

Minden forrásnak saját intelligencia profilja van, amely feltárja a szerkesztői mintázatait:

  • Hangulateloszlás : milyen arányban közöl a forrás pozitív, semleges és negatív cikkeket.
  • Érzelemoszlás : a publikált cikkekben detektált domináns érzelmek megoszlása.
  • Keretezési preferenciák : melyik narratíva keretet alkalmazza a forrás a leggyakrabban.
  • Narratívastratégia : melyik narratívákat fedi le leginkább, és milyen hangnemben teszi azt.
  • Entitásmegemlítések : az adott forrásban leggyakrabban szereplő személyek, szervezetek és helyszínek, hangulati bontással.

Időablak szűrő

Minden forrás intelligencia profil 7, 14, 30 vagy 90 napos időszakra szűrhető. Zgy nyomon követhető, hogy egy szerkesztőség hangja és fókusza hogyan változik az idő függvényében.

Adatfeldolgozás

A HírSpektrum többlépéses elemzési folyamaton dolgozza fel a cikkeket.

01

Gyűjtés

Webes botok segítségével folyamatosan gyűjtjük az új cikkeket az összes figyelt forrásból.

02

Tisztítás

A tartalmat kinyerjük, és megtisztítjuk a hirdetésektől, navigációs elemektől és sablonszövegektől.

03

NLP elemzés

Minden cikket megvizsgálunk hangulat, érzelem, domináns keret és megnevezett entitások (személyek, szervezetek, helyszínek) szempontjából.

04

Narratíva klaszterezés

A cikkeket szemantikai hasonlóság alapján narratívákba csoportosítjuk. Ha egy cikk nem illeszkedik meglévő klaszterbe, új narratíva jön létre.

05

Aggregálás és pontozás

Narratívánként és forrásonként újraszámítjuk az összesített statisztikákat: globális hangulat, kereteloszlás, entitáshangulat és érzelemoszlás.

06

Drift detektálás

A rendszer folyamatosan figyeli a hangulat, a keretezés és az entitásábrázolás szignifikáns változásait, és narratíva driftként jelöli meg őket a napi összefoglalóban.

A cikkbegyűjtés folyamatosan fut. A narratíva klaszterezés és az aggregálás óránként frissül. A napi összefoglaló 06:00-kor generálódik.

Médiatérkép

A Médiatérkép egy interaktív szóródiagram, mely megmutatja, hogyan kommunikál a magyar sajtó egy-egy szereplőről vagy narratíváról. A vízszintes tengely a keretezés racionalitását méri, a tényalapú, érvelő tudósítástól az érzelmi töltetű, hangulatkeltő irányig. A függőleges tengely pedig a hangulati irányt jelzi: pozitívtól negatívig. Egy entitás vagy narratíva kiválasztása után a diagram felmutatja, hogy az egyes hírforrások hol helyezkednek el e két dimenzió mentén, feltárva a polarizációt, a kereteltéréseket és azt, hogy ki hogyan pozicionálja ugyanazt a szereplőt.

Hamarosan: ez a funkció fejlesztés alatt áll.

Napi összefoglaló

A napi összefoglaló minden reggel 06:00-kor áttekinti az elmúlt 24 óra legjelentősebb médiaeseményeit: mely narratívák driftje volt a legnagyobb, hol mélyült a polarizáció, mely új szereplők léptek be a hírtérbe, és milyen volt az összesített médiaközérzet. Nem csak hírösszefoglaló, hanem a médiáról szóló összefoglaló.

Hamarosan: ez a funkció fejlesztés alatt áll.