Referencia útmutató
Módszertan és fogalmak
Útmutató a HírSpektrum narratívaelemzéséhez, az összes általunk használt fogalom, mérőszám és vizuális elem magyarázatával.
A platform működése
A HírSpektrum egy narratíva elemző platform, amely valós időben figyeli a magyar internetes hírforrásokat. Az egyes cikkek követése helyett a rendszer narratívákba csoportosítja a tudósításokat.
A cikke gyűjtése, elemzése és a narratívákba való csoportosítása teljesen automatikusan történik. Jelenleg az általunk követett 9 hírforrástól átlagosan naponta több mint 2000 cikket gyűjtünk össze. A csoportosítást egy egyedi algoritmussal végezzük óránként. Erre egy dinamikus klaszterezési eljárást fejlesztettünk ki, amely képes pontosan nyomon követni a narratívákat, detektálni ha egy narratíva az idő múlásával kettéválik, vagy esetleg több narratíva összeolvad egy központi történetté.
Ezeket az óránként elkészített narratívákat ezután címekkel és rövid leírásokkal látjuk el, hogy megkönnyítsük és felgyorsítsuk az információszerzést. Fontos, hogy az oldal nem tökéletes, és nagy valószínűséggel fogtok hibát találni, ezt a jövőben majd vissza is fogjátok tudni jelezni.
Alapelvünk: Nem azt mondjuk meg, mit mond a hír. Hanem megmutatjuk, hogyan mondja, ki mondja, és hogyan változik ez az idő múlásával.
Narratívák
A narratíva egy csoportosítása az összetartozó híreknek, ami segít mélyebben megérteni az eseményeket, feltárni a elfogultságokat és a hírek között húzódó közös szálakat.
Vagy kicsit bonyolultabban: a narratíva az a folyamatosan formálódó értelmezési keret, amely a hírek között húzódó összefüggésekből épül fel, és a puszta eseménysoron túl szereplőket, szándékokat és jelentést rendel a valósághoz.
Minden általunk megjelenített narratíva tartalmazza a következőket:
- Cím és összefoglaló: A cikkeket röviden összefoglaló cím és leírás
- Hangulatelemzés: A cikkek érzelmi töltetének és intenzitásának elemzése
- Forráselemzés: Az egyes hírforrások hány cikket publikáltak az adott témákban
- Keretezési és Érzelmi elemzés : A narratíva domináns kerete és érzelmeinek ábrázolása
- Entitás elemzés: A cikkekben említett entitások listája és forrásonkénti bontása
- Időbeli Trendek: A narratíva néhány metrikájának időbeli ábrázolása
Narratíva keretek
A keretezéselemzés (framing analysis) azt vizsgálja, hogy a média nem csupán beszámol az eseményekről, hanem értelmezési keretet is kínál hozzájuk, meghatározza, mi a fontos, ki a felelős, és mit kellene tenni. Az elmélet alapjait Erving Goffman szociológus rakta le 1974-ben, aki szerint az emberek „értelmezési sémákon” keresztül rendezik a valóságot. A médiakutatásba Robert Entman emelte be 1993-ban, aki szerint a keret kijelöli a problémát, megnevezi az okot, erkölcsi ítéletet hoz, és megoldást javasol. A keretek, amelyeket ez az elemzés alkalmaz, Semetko és Valkenburg 2000-es, széles körben hivatkozott kutatásából származnak.
Az általunk alkalmazott 9 narratíva keret a következő:
Szembenálló felek, vita, küzdelem
Személyes történet, érzelmi bevonódás
Anyagi hatások, költség, haszon
Értékrend, norma, vallási vagy etikai alap
Tehetetlenség, áldozatiság, strukturális csapda
Ki tehet róla, ki oldhatja meg
Veszély, kockázat, félelem
Megoldás, előrelépés, remény
A történet keretezése nem illeszthető a szokványos kategóriák egyikébe sem.
Hogyan használjuk a kereteket: Minden narratívának van egy domináns kerete (a leggyakoribb keret az összes cikkét tekintve), de a forrásbontás megmutatja, hogy különböző lapok hogyan keretezik ugyanazt a történetet eltérő cikkekben. Ez a szerkesztői elfogultság egyik legerősebb jelzője.
Ezek a keretek nem véletlenszerűek: empirikusan igazolták, hogy újságírók tudatosan vagy ösztönösen ezekbe a mintákba rendezik a híreket, a befogadók pedig ezeken keresztül alakítják véleményüket. Egy narratíva domináns kerete így nem csupán stílusjegy, hanem politikai és társadalmi hatást gyakorló értelmezési döntés.
Narratíva státuszok
Minden narratívának van egy életciklus státusza. Mivel a narratívák óráról órára nőhetnek, átalakulhatnak, kettéválhatnak vagy összeolvadhatnak más narratívákkal szükséges, hogy nyomon kövessük a státuszukat.
A narratíva aktívan nyomon követett, új cikkekkel bővülhet, de akár zsugorodhat is, és az alapértelmezett hírfolyamban jelenik meg. Aktív állapotban 2 hétnél fiatalabb és az elmúlt 3 napban frissített narratívák lehetnek.
A narratívát már nem követjük aktívan, de továbbra is olvasható. Azok a témák amik nem frissülnek 3 napig vagy 2 hétnél régebbiek archiválásra kerülnek.
Beolvadt az a narratíva amelynek cikkeinek legalább a fele egy másik narratívában jelenik meg egy későbbi kimutatásban. Mivel az algoritmus óránként újra klaszterezi a narratívákat, ezért előfordul, hogy két narratíva egybeolvad. A kontinuitás érdekében a beolvadt narratívát megtartjuk és jelöljük, hogy a hírfolyam hol folytatódik.
Alapértelmezés szerint a hírfolyam csak aktív narratívákat mutat. A szűrősávval válthatsz a státuszok között.
Hangulatelemzés
A hangulatelemzés azt méri, hogy egy szöveg érzelmi töltete pozitív, semleges vagy negatív-e. Vagyis nem azt, miről szól egy cikk, hanem hogyan viszonyul a tárgyához. A módszer gyökerei a számítógépes nyelvészetre nyúlnak vissza, de a médiakutatásban Pang és Lee 2008-as munkája („Opinion Mining and Sentiment Analysis”) alapozta meg a széles körű alkalmazását.
A hangulat iránya (+1 / 0 / −1) megmutatja, hogy egy forrás vagy narratíva összességében hogyan ábrázolja az eseményeket. Optimistán, semlegesen vagy negatívan. Az intenzitás ezen túlmutat: ugyanaz az érzelmi irány lehet visszafogott vagy erőteljes, ami jelzi, mennyire „töltött” a szöveg retorikai szempontból. Ezt a kettős mérési logikát Dr. Johan Bollen is alkalmazták nagy léptékű médiaelemzéseikben, kimutatva, hogy a hangulat iránya és erőssége együttesen jobb előrejelzője a társadalmi hatásnak, mint bármelyik önmagában.
Forrás és narratívaszinten aggregálva a hangulat szerkesztői mintázatokat fed fel: megmutatja, hogy egy médium strukturálisan pesszimista vagy optimista képet közvetít-e egy témáról, illetve hogy egy narratíva érzelmileg hogyan pozicionálja a befogadót.
A tartalom helyeslő, optimista vagy kedvező hangnemet hordoz.
A tartalom kiegyensúlyozott, ténybeli, egyik irányba sem dől.
A tartalom kritikus, pesszimista vagy elutasító hangnemet hordoz.
Hangulati skála
Az alábbi kis négyzeteket látjátok narratíva kártyák felső részén a keret mellett, ami szintén a narratíva általános hangulatelemzését mutatja.
| Pontszám tartomány | Címke | Szín |
|---|---|---|
| +0.50 – +1.00 | Nagyon pozitív | |
| +0.20 – +0.50 | Pozitív | |
| -0.20 – +0.20 | Semleges | |
| -0.50 – -0.20 | Negatív | |
| -1.00 – -0.50 | Nagyon negatív |
Globális hangulat: egy narratíva összes cikkének átlagos hangulata.
Hangulat intenzitás
A szöveg erőteljes, határozott nyelvi eszközöket használ. A hangulat domináns és egyértelmű irányú.
A szöveg mérsékelt érzelmeket hordoz. A hangulat azonosítható, de nem túlzottan éles.
A szöveg visszafogott, semleges hangvételű. A hangulat gyenge vagy alig érzékelhető.
Érzelemdetektálás
A hangulatelemzés megmutatja, hogy egy szöveg pozitív vagy negatív-e, de nem árulja el, milyen érzést vált ki. Mivel más hatása van egy felháborodott cikknek és egy szomorúnak, még ha mindkettő negatív töltetű is. Az érzelemdetektálás ezt a hiányt tölti be: a puszta irányon túl azonosítja a szöveg domináns érzelmi tónusát.
Az alkalmazott kategóriák Robert Plutchik 1980-as érzelemmodelljére épülnek, amely szerint az emberi érzelmek egy viszonylag kis számú alapérzelemre vezethetők vissza, köztük a harag, félelem, öröm, meglepetés, szomorúság, bizalom és undor, amelyek kombinációiból összetettebb érzelmi állapotok keletkeznek. Plutchik modellje azért vált a számítógépes szövegelemzés egyik legelterjedtebb alapjává, mert kategóriái kulturálisan viszonylag stabilak és jól működtethetők szöveges jelekből.
A médiakutatásban az érzelmek detektálása különösen fontos, mert a kutatások szerint köztük Soroka 2014-es munkája alapján, a negatív és magas intenzitású érzelmeket keltő tartalmak erősebb figyelmet és mélyebb emlékezeti nyomot hagynak, mint a semleges vagy pozitív tudósítások. Az egyes érzelmek megoszlása forrásonként és narratívánként így nemcsak a hangulati képet árnyalja, hanem a médium által alkalmazott retorikai stratégiát is feltárja.
Valami igazságtalannak vagy elfogadhatatlannak tűnik. A szöveg feszültséget, szembenállást vagy felháborodást sugároz.
Valami veszélyes vagy kiszámíthatatlan. A szöveg aggodalmat, bizonytalanságot vagy fenyegetettség-érzetet kelt.
Valami jól sikerült vagy reménykeltő. A szöveg ünneplést, elégedettséget vagy lelkesedést közvetít.
Valami váratlanul történt. A szöveg döbbenetet, hirtelen fordulatot vagy előre nem látott fejleményt jelez.
Valami elveszett vagy megtört. A szöveg gyászt, tehetetlenséget vagy mély csalódottságot fejez ki.
Valami stabil és megbízható. A szöveg pozitív viszonyt sugall intézményekhez, személyekhez vagy folyamatokhoz.
Valami mélységesen visszataszító vagy megvetendő. A szöveg határozott elutasítást vagy erkölcsi felháborodást közvetít.
Az érzelmi tónus érzékelhető, de nem illeszthető egyértelműen egyetlen domináns kategóriába sem.
Entitások és szerepek
A médiaelemzésben az entitás minden olyan megnevezett szereplő személy, szervezet vagy helyszín, aki vagy ami körül a hírek szerveződnek. Az entitáselemzés azt vizsgálja, hogy ezek a szereplők milyen szerepben és milyen érzelmi töltettel jelennek meg a médiában, feltárva ezzel a tudósítás mögött húzódó hatalmi és értelmezési mintázatokat.
Az elméleti alapot Van Dijk kritikai diskurzuselemzése adja, amely szerint a médiaszövegek nem semlegesen nevezik meg a szereplőket, hanem szerepeket és felelősséget osztanak ki nekik, eldöntve, ki a cselekvő, ki az elszenvedő, és ki a magyarázó hang. Ezt egészíti ki az Entman-féle keretezéselmélet, amely szerint a szereplők pozicionálása, főszereplőként, felelősként vagy áldozatként való beállítása az egyik legerősebb eszköz, amellyel a média formálja a közvéleményt.
A szerepek (főszereplő, felelős, áldozat, kommentátor, említett) nem csupán leíró kategóriák: megmutatják, hogy egy narratíva kinek ad cselekvőképességet és kinek veszi el azt. Az entitások forrás és narratívaszintű hangulati összehasonlítása pedig feltárja, hogy ugyanaz a szereplő különböző médiumokban milyen eltérő megvilágításba kerül, ami a médiatorzítás egyik legközvetlenebb mérőeszköze.
Megnevezett személ: politikus, közéleti szereplő, szakértő vagy más, a médiában szereplő egyén.
Megnevezett intézmény: kormányzati szerv, vállalat, civil szervezet, párt vagy egyéb szervezet.
Földrajzi entitás: város, ország, régió vagy más, a narratívában releváns helyszín.
Entitás szerepek
Az entitás domináns szerepe a legtöbbször detektált szerep az összes cikkét tekintve.
A narratíva főszereplője: az a személy, szervezet vagy helyszín, akire/amelyre a történet elsősorban fókuszál.
Felelősnek beállított szereplő: a narratíva szerint ő okozta a problémát, vagy felelős a negatív eseményért.
Áldozat: a narratívában elszenvedőként ábrázolt entitás, akit a körülmények vagy más szereplők hátrányosan érintenek.
Kommentátor: a narratívában véleményt formáló, szakértőként vagy nyilatkozóként megjelenő entitás.
Megemlített: a szövegben előfordul, de nem tölt be meghatározó szerepet a narratíva szempontjából.
Minden entitásnak saját adatlapja van, amelyen látható: összesített hangulat (mennyire pozitívan vagy negatívan tudósítanak róla), narratíva érintettség (melyik történetekben szerepel), forrásonkénti hangulat összehasonlítás és megemlítések száma. Az adatlap 7, 14, 30 vagy 90 napos időablakra szűrhető.
Források és forrás intelligencia
A HírSpektrum 9 nagy magyar hírportált figyel: 24.hu, 444.hu, Blikk, HVG, Index, Origo, Portfolio, Ripost és Telex. Minden forrást önállóan követünk nyomon és profilozunk. Nem csupán azt rögzítve, mit írnak, hanem azt is, hogyan.
Forrás intelligencia profil
Minden forrásnak saját intelligencia profilja van, amely feltárja a szerkesztői mintázatait:
- Hangulateloszlás : milyen arányban közöl a forrás pozitív, semleges és negatív cikkeket.
- Érzelemoszlás : a publikált cikkekben detektált domináns érzelmek megoszlása.
- Keretezési preferenciák : melyik narratíva keretet alkalmazza a forrás a leggyakrabban.
- Narratívastratégia : melyik narratívákat fedi le leginkább, és milyen hangnemben teszi azt.
- Entitásmegemlítések : az adott forrásban leggyakrabban szereplő személyek, szervezetek és helyszínek, hangulati bontással.
Időablak szűrő
Minden forrás intelligencia profil 7, 14, 30 vagy 90 napos időszakra szűrhető. Zgy nyomon követhető, hogy egy szerkesztőség hangja és fókusza hogyan változik az idő függvényében.
Adatfeldolgozás
A HírSpektrum többlépéses elemzési folyamaton dolgozza fel a cikkeket.
Gyűjtés
Webes botok segítségével folyamatosan gyűjtjük az új cikkeket az összes figyelt forrásból.
Tisztítás
A tartalmat kinyerjük, és megtisztítjuk a hirdetésektől, navigációs elemektől és sablonszövegektől.
NLP elemzés
Minden cikket megvizsgálunk hangulat, érzelem, domináns keret és megnevezett entitások (személyek, szervezetek, helyszínek) szempontjából.
Narratíva klaszterezés
A cikkeket szemantikai hasonlóság alapján narratívákba csoportosítjuk. Ha egy cikk nem illeszkedik meglévő klaszterbe, új narratíva jön létre.
Aggregálás és pontozás
Narratívánként és forrásonként újraszámítjuk az összesített statisztikákat: globális hangulat, kereteloszlás, entitáshangulat és érzelemoszlás.
Drift detektálás
A rendszer folyamatosan figyeli a hangulat, a keretezés és az entitásábrázolás szignifikáns változásait, és narratíva driftként jelöli meg őket a napi összefoglalóban.
A cikkbegyűjtés folyamatosan fut. A narratíva klaszterezés és az aggregálás óránként frissül. A napi összefoglaló 06:00-kor generálódik.
Médiatérkép
A Médiatérkép egy interaktív szóródiagram, mely megmutatja, hogyan kommunikál a magyar sajtó egy-egy szereplőről vagy narratíváról. A vízszintes tengely a keretezés racionalitását méri, a tényalapú, érvelő tudósítástól az érzelmi töltetű, hangulatkeltő irányig. A függőleges tengely pedig a hangulati irányt jelzi: pozitívtól negatívig. Egy entitás vagy narratíva kiválasztása után a diagram felmutatja, hogy az egyes hírforrások hol helyezkednek el e két dimenzió mentén, feltárva a polarizációt, a kereteltéréseket és azt, hogy ki hogyan pozicionálja ugyanazt a szereplőt.
Hamarosan: ez a funkció fejlesztés alatt áll.
Napi összefoglaló
A napi összefoglaló minden reggel 06:00-kor áttekinti az elmúlt 24 óra legjelentősebb médiaeseményeit: mely narratívák driftje volt a legnagyobb, hol mélyült a polarizáció, mely új szereplők léptek be a hírtérbe, és milyen volt az összesített médiaközérzet. Nem csak hírösszefoglaló, hanem a médiáról szóló összefoglaló.
Hamarosan: ez a funkció fejlesztés alatt áll.