digithist.
ELTE BTK · PHD WORKSHOP · 2026. május 14.

Digitális módszerek a történeti kutatásban

Diskurzus, hatalom, hálózat

Ring Orsolya · ELTE BTK · Történelem Segédtudományai Tanszék · ring.orsolya@btk.elte.hu 
01
BEVEZETÉS

Mi a különbség a két szöveg között?

Sziládi János igazgatói programtervezete · 1979
A magyar Nemzeti Színház keletkezésének ez a magasabb indító oka adta meg léte egész folyamán a köztudatban azt a kiemelkedő helyet, melyet ma is elfoglal. […] A Nemzeti Színház a szocialista magyar színházi kultúra megteremtésének is letéteményese.
Művelődésügyi Minisztérium feljegyzése · 1960
Tekintettel az épület elavultságára, rossz állapotára, a felszabadulás után már az első ötéves tervben helyet kapott az új Nemzeti Színház felépítésének költsége, de ebből nem lett semmi. […] A nézőtéri székek és páholyok igen rossz állapotban vannak, a nézőtér akusztikája rossz, a hatósági előírásoknak nem felelnek meg.

Ugyanaz az intézmény, ugyanaz a forráskorpusz, mégis radikálisan más érveléslogika.

02
A workshop célja

A történtei kutatás során alkalmazható digitális módszertan előnyeinek és hátrányainak  megtapasztalása.

Elsődlegesen

Megérteni, mit nyer és mit veszít egy kutató, ha digitális réteget illeszt a hagyományos szoros olvasásra. 

Másodlagosan

Saját kezűleg léterhozni és használni egy működő, böngészőben futó annotáló eszközt, programozói tudás nélkül.

03
példa

Egyetlen forráskorpusz — két dokumentum.

A workshop során végig egyetlen példát használunk: Két dokumentumot a Nemzeti Színház Kádár-kori (1957–1988) történetéből, amelyek az érveléstípusok két végpontját mutatják.

forrásszimbolikus

Sziládi János

Igazgatói programtervezet a Nemzeti Színház szocialista magyar kultúrában betöltött szerepéről · 1979. augusztus 28.

SZ=38 · P=2 · arány 19,0×

forráspragmatikus

Művelődésügyi Minisztérium

Színházi Osztály feljegyzése a Nemzeti Színház épületének tárgyában · 1960. április 13.

SZ=0 · P=18 · tisztán pragmatikus

04
Történeti kontextus

Mit jelent Nemzeti Színház a Kádár-korban?

Nemzeti örökség

A 19. század reformkori örökségétől, Széchenyi koráig visszanyúló kulturális szimbólum.

Szocialista eszköz

A párt számára kultúrpolitikai zászlóshajó, az ideológiai legitimáció kitüntetett intézménye.

Üzemeltetési feladat

Egy konkrét, romlófélben lévő épület, amelyet finanszírozni, építeni, áthelyezni kell.

A Kádár-kori diskurzus tétje pontosan az: kinek az érvelésében melyik értelmezés érvényesül?

05
Módszertani keret

Mi a diskurzuselemzés?

Három tézis, amely a Kádár-kori szövegek elemzéséhez nélkülözhetetlen.

1 · A nyelv nem semleges

A szöveg nem pusztán tükrözi a valóságot, hanem (rész)konstruálja is. A megnevezés egyben tartalom-adás: amikor a hatalom „a nemzeti kultúra letéteményesének" nevezi a Nemzeti Színházat, ezzel létre is hozza ezt az intézményi szerepet.

2 · A diskurzus szabályozott

Egy adott korban, intézményben, hatalmi szerkezetben nem mindenki mondhat bármit. Vannak tilalmak, kizáró eljárások, beszédpozíciók. A pártállami politikai diskurzus a legszigorúbban strukturált terep.

3 · A levéltári forrás aktus

Egy 1978-as belső feljegyzés nem semleges leírás. Maga is diszkurzív aktus, amely a Nemzeti Színháznak egy meghatározott értelmezését rögzíti és termeli.

06
Néhány analitikai eszköz

A diskurzuselemzés négy hagyománya.

Fairclough — Kritikai diskurzuselemzés (CDA)

A szöveg három rétegen értelmezhető:

  • a szöveg maga (nyelvi szint)
  • a diszkurzív gyakorlat (ki, kinek, miért produkálja)
  • a társadalmi gyakorlat (milyen hatalmi viszonyok között)

Foucault — A diskurzus rendje

„Minden társadalomban ellenőrzik és szabályozzák a diskurzus termelését" — megszabják, ki, mit, milyen pozícióból mondhat. A politika terepe a legerősebben strukturált.

Aki a Nemzeti Színház koncepciójáról szólhatott a Kádár-korban: szigorúan körülhatárolt csoport.

Koselleck — Fogalomtörténet

A jelentés nem a fogalomban van, hanem a fogalom használatában. Egy fogalom körül kitüntetett társadalmi vita zajlik — a tartalmát mindig egy adott diskurzus tölti fel.

A „Nemzeti Színház" mint történeti fogalom: a tartalma több évtizeden át küzdelmes tárgyalás kérdése.

Laclau–Mouffe — Üres jelölő

Bizonyos jelölőket különböző politikai logikák különböző tartalommal tölthetnek fel. Az üres jelölő pontosan azért hatékony, mert sokféle pozíciónak ad keretet.

A „Nemzeti Színház" a vizsgált korban pontosan ilyen üres jelölő: nemzeti örökség, szocialista zászlóshajó és presztízsobjektum egyszerre.

A SZ/P kódolási séma ezeknek az elméleti hagyományoknak az operacionalizálása egy konkrét forráskorpuszon.

07
A kódolási logika

Szimbolikus (SZ) vs. pragmatikus (P) érvelés.

Az elemzés hét alkódot alkalmaz, két fő-kategóriába rendezve. A vizuális elkülönítés: kék = szimbolikus érvelés; vörös = pragmatikus érvelés.

SZ — szimbolikus érvelés

A Nemzeti Színház eszméje: nemzeti hagyomány, ideológiai funkció, presztízs.

SZ1 Nemzeti örökség SZ2 Kultpol. funkció SZ3 Presztízs

P — pragmatikus érvelés

A Nemzeti Színház üzemeltetési valósága: épület, kapacitás, költség, helyszín.

P1 Műszaki állapot P2 Kapacitás P3 Gazdasági P4 Helyszín
08
Gyakorlat


Nyissák meg a workshop edition annotálót. A két dokumentum már be van töltve. Saját kezűleg jelöljenek ki SZ vagy P passzusokat.


Workshop edition annotáló
digithist.com/workshop/
workshop_annotalo.html
09
Annotálási alapelvek

Három szabály a kódolói döntéshozatalhoz.


10
A skálázási probléma

De mi van, ha nem két dokumentum, hanem ötven?

50
Reprezentatív dokumentum a korpuszban
596
AI által generált kódolási javaslat
472
Kutatói felülvizsgálat után jóváhagyott kód

Ezeket a mintázatokat egyetlen kutató nem tudja szisztematikusan, reprodukálhatóan azonosítani.

11
Hogyan néz ki egy annotált dokumentum?

Egy dokumentumon belül egyszerre látszik a NER és a kódolási réteg.

Sziládi János igazgatói programtervezete · 1979
A magyar Nemzeti Színház keletkezésének ez a magasabb indító oka adta meg léte egész folyamán a köztudatban azt a kiemelkedő helyet, melyet ma is elfoglal. SZ1
A Nemzeti Színház a szocialista magyar színházi kultúra megteremtésének is letéteményese. SZ2
Tekintettel az épület elavultságára, rossz állapotára, az új Nemzeti Színház felépítésének költsége az első ötéves tervben helyet kapott, de ebből nem lett semmi. P1
A színház 52 éve játszik Budapest legöregebb színházépületében; a színház irodái, műhelyei, raktárai az Operaházban kaptak helyet. P2

Két réteg: az entitás-annotáció (név-, intézmény-, helyszín-, dátum-jelölés) és a kódolási réteg (a passzus érvelés-típusa). A két réteg kombinációja teszi lehetővé a személy×kód mátrix előállítását.

12
Személy × kód mátrix

A digitális elemzés látványos hozadéka: a profilkülönbségek.

Aczél GyörgyMSZMP KB miniszterhelyettes
SZ 100 · P 0
Pozsgay Imrekulturális miniszter
SZ 100 · P 0
Tóth Dezsőminiszterhelyettes
SZ 100 · P 0
Major TamásNemzeti Színház igazgató
SZ 94 · P 6
Sziládi JánosNemzeti Színház igazgató
SZ 88 · P 12
Nagy PéterNemzeti Színház igazgató
SZ 73 · P 27
Zsámbéki Gáborrendező-igazgató
SZ 63 · P 37

A politikai elit kizárólag az eszméjén keresztül viszonyul a Nemzeti Színházhoz; a pragmatikus valóság az intézményi részvevők szövegeiben jelenik meg.

13
Időbeli trend · négy periódus

A pragmatikus érvelés leginkább akkor jelenik meg, amikor döntés kényszerít rá.

100% 75% 50% 25% 0% 1957–64 1965–77 1978–82 1983–88 épületbontás szimbolikus konszolidáció igazgatóváltások PB-határozat 52% 70% 89% 60% 48% 30% 11% 40% SZ — szimbolikus érvelés P — pragmatikus érvelés

Az 1960-as épülettervezési és az 1983-as pártbizottsági döntés egyaránt kikényszeríti a pragmatikus érvrendszert a szimbolikus keretek magabiztosságából.

14
Névelem-felismerés 

A gép automatikusan kiemeli a szövegben szereplő tulajdonneveket.

Mire jó

  • Személyek, intézmények, helyszínek tömeges felismerése
  • Nagy korpuszon konzisztens, reprodukálható eredmény
  • Hálózati elemzés alapanyagát szolgáltatja

Mire nem

  • Nem érti, amit a szöveg jelent — csak felszíni nyelvi mintázatokat felismer
  • Ragozott alakokat, többes névformákat gyakran kihagy
  • Intézménynevet és személynevet összetéveszthet

A workshop során a HuSpaCy magyar nyelvű modellt használjuk — egy spaCy-alapú, magyar nyelvre tanított eszközt.

15
NÉVELEM-FELISMERÉS FUTTATÁSA

A workshop annotálóban
egy kattintással.

SpaCy NER → Futtatás. Nézzék meg az eredményt: melyik entitás helyes, melyik nem.

16
A NER hibakatalógusa · valódi példák a két demódokumentumból

A gép azt tudja, ami a szövegben névelemnek néz ki, nem mindig azt, ami valóban az.

A Nemzeti Színház 1908 óta játszik a jelenlegi helyén, az 1875-ben Fellner és Helmer~ tervei szerint épült Népszínházban. Annakidején ideiglenes jelleggel költözött ide, az új Nemzeti Színház megépítéséig. Modern színházakban a zenekari árkot süllyeszthetően építik. Mindezek figyelembevételével a Nemzeti Színház átépítése a következő ütemterv szerint folyhatna le.
PER — személy ORG — intézmény LOC — helyszín DATE — dátum helyes ~ határhiba fals pozitív

A NER eredményt minden esetben felül kell vizsgálni. 

17
Közös mini-kódolás

A Sziládi-szöveg I. fejezetének nyitóbekezdése.

Hét osztályos séma: SZ-család (kék) vs. P-család (vörös). Önök döntik el, melyik passzus melyik kategóriába tartozik.

18
Kiértékelés

Hány AI-javaslatot fogadott el a kutató felülvizsgálat?

P2 Kapacitás
93%
SZ3 Presztízs
87%
SZ1 Nemzeti örökség
85%
SZ2 Kultpol. funkció
73%
P3 Gazdasági
67%

Kódonkénti bontás

P2 Kapacitás93%
SZ3 Presztízs87%
SZ1 Hagyomány85%
SZ2 Kultpol.73%
P3 Gazdasági67%

A P3 (gazdasági érvek) gyengébb teljesítménye nem hiba, hanem tanulság: a Kádár-kori bürokratikus szövegekben a finanszírozási szempont retorikai burokba van csomagolva — kontextusértés kell hozzá.

19
Mit jelent a 79%?

A Krippendorff-küszöb.

0,67
Krippendorff α — az emberi kódolók közti egyetértés elfogadható minimuma (Krippendorff 2004)
≈ 79%
ami nagyjából ennek a százalékos egyezésnek felel meg

A 79%-os AI–ember egyetértés összemérhető egy emberi kódolópáros egyetértésével. Az AI nem helyettesíti a kutatót, de statisztikailag konzisztens kiindulópontot ad.

20
Digitális vs. hagyományos forráskiadás

Mit hoz többet, és mit veszít egy digitális forráskiadvány?

SzempontHagyományos kritikai forráskiadásDigitális forráskiadvány
Szelekciós elvKötet előszavában expliciten kifejtveGyakran a kód logikájában rejtve
Kritikai apparátusLábjegyzet-rendszer, részletesAnnotációs réteg, gyakran tömörebb
Hivatkozási hálóKéziratos, lineárisLinkek, kapcsolódó entitások, hálózat
FrissíthetőségKanonikus, nyomdaiFrissíthető, de instabilabb
Aggregálható-eNemIgen, statisztikák, vizualizációk
Kanonikus státuszErősMég alakulóban

A digitális forráskiadvány nem helyettesíti a kritikai kiadást — kiegészíti, és új típusú kérdéseket tesz feltehetővé.

21
A kész forráskiadás
digithist.com/forraskiadasok/
diskurzus-hatalom-halozat.html
A digitális forráskiadás négy rétege

Mit lát az olvasó egy digitális forráskiadványban?

1 · Forrásszöveg + entitásjelölés

A Nemzeti Színház a Blaha Lujza téri épületben 1908 óta játszik. Aczél György miniszterhelyettes 1957-ben kezdte el a politikai felügyeletet.

2 · Kódolási réteg

A Nemzeti Színház a magyar nemzeti hagyomány legmagasabb intézménye, amelyet Széchenyi kora teremtett meg. Az épület rossz állapota miatt az új színház felépítésének költsége a tervben helyet kapott.

3 · Kapcsolatháló

Aczél Pozsgay N. Színház Tóth D. Zsámbéki

4 · Statisztikai panel

SZ-kódok (72,8%) 343 P-kódok (27,2%) 128 AI elfogadási arány 79%

Egy digitális forráskiadvány nem négy különálló dokumentum — egyazon kódolt szöveg-korpusz négy reprezentációja, amelyek között az olvasó dinamikusan mozoghat.


22
A digitális forráskiadás további rétegei

Hivatkozási háló és szabványos névterek.

A forráskiadvány nemcsak önmagát publikálja, hanem be is kapcsolódik a kutatói és intézményi infrastruktúrába: minden entitás más hivatkozási rendszerekhez köthető.

1 · Wiki-link integráció

A kiadványban minden személy- és intézménynévhez wiki-azonosító csatolható, ami egy kattintással vagy hover-rel megjeleníti a hivatkozási források rövid leírását:
Aczél Györgywiki Pozsgay Imrewiki Sziládi Jánoswiki Nemzeti Színházwiki

2 · Névterek — személyek és intézmények egyértelmű azonosítása

A névterek lehetővé teszik, hogy az azonos nevű, de különböző személyek ne keveredjenek; továbbá, hogy a kiadvány adatait más rendszerekkel (Wikidata, ELTE személynév-tár, levéltári katalógusok) egyértelműen összepárosítsuk.
// minden entitás kanonikus URI-t kap
persName ref="q462066" → Aczél György
orgName ref="q1054054" → Nemzeti Színház

3 · TEI XML

A Text Encoding Initiative szabvány a humán tudományok bevett szövegkódolási nyelve. Garantálja, hogy a kiadvány adatait 20 év múlva is olvasni lehessen.
<TEI xmlns="http://www.tei-c.org/ns/1.0">
  <persName ref="q462066">
    Aczél György
  </persName>
</TEI>

4 · RiC ontológia (levéltári rekordleírás)

A Records in Contexts modell a Nemzetközi Levéltári Tanács (ICA) szabványa. Adatszerűen rögzíti az iratkeletkezési viszonyokat: ki, mikor, miért, milyen kontextusban hozta létre a forrást.
ric:Person → Aczél György
ric:CorporateBody → Nemzeti Színház
ric:isAssociatedWithPlace
ric:isOrWasGovernedBy
23
SAJÁT ESZKÖZ KÉSZÍTÉSE PROMPTOLÁSSAL

Ön is építhet ilyen eszközt — egyetlen prompttal.

Mindenki saját kezűleg készít egy egyszerűsített NER-annotálót. A prompt készen van, csak el kell olvasnia, módosítania és bemásolnija a saját Claude-jába.

Nem kell programozónak lennie. A kutatói felelőssége az, hogy mit kér a géptől, a hogyan a modell dolga.

24
A prompt szerkezete

Három réteg

1. Szerep és feladat.
„Készíts egy magyar nyelvű névelem-annotáló eszközt."
2. Funkcionális elvárások.
Elrendezés (három panel), interakció (kijelölés → popup → kategorizálás), mit kell tudnia (mentés JSON, hálózat-vizualizáció, statisztika).
3. Technikai részletek.
Függőségek, színkódok hex-formátumban, kimeneti formátum.


25
A prompt eredménye

Egy működő, böngészőben futó névelem-annotáló — ~850 sor HTML.

NévElem Annotáló — Demo BetöltésMentésℹ Hogyan készült?
DOKUMENTUMOK
Sziládi 1979 12
Min. 1960 8
Minta szöveg 3
SZÖVEG · SZIÁDI 1979
A Nemzeti Színház a magyar nemzeti kultúra letéteményese. Aczél György miniszterhelyettes 1957-ben kezdte meg a kultúrpolitikai felügyeletet. A Művelődésügyi Minisztérium Budapesten tartotta a kulcsfontosságú tárgyalásokat.
személy hely szervezet dátum
személy hely szervezet dátum
Annotálás
Hálózat
Statisztika
ANNOTÁCIÓK · 23 db
személy
10
szervezet
8
hely
3
dátum
2
EGYÜTT-ELŐFORDULÁSOK · 17 él
Aczél Pozsg. N.Sz. Sziládi Bp.

Három panel: dokumentum-lista, szövegszerkesztő kijelölés-popup-pal, és a tabokba szervezett vizualizáció — minden funkció a prompt által generált 850 sorban.

26
A workflow — három lépés

Hogyan néz ki ez a Claude.ai-on?

1
Új beszélgetés indítása, a teljes prompt bemásolása
···
Te
# Prompt: NévElem Annotáló — Demo eszköz Készíts egyetlen, önálló HTML5 fájlt — build tool, szerver, npm nélkül — amely egy minimális, magyar nyelvű névelem-annotáló eszköz…
Üzenet írása…
2
Claude generál ~850 sor HTML-t, letölthető
···
Claude
Itt a működő tool, négy entitástípussal, hálózati vizualizációval, statisztikai panellel.
<!DOCTYPE html> <html lang="hu"> <head> <title>NévElem…
tool.html · 850 sor letöltés
Üzenet írása…
3
Második üzenetben módosítási kérés
···
Te
Adj hozzá egy ESEMÉNY entitástípust, narancssárga (#E07A20) színnel.
Claude
Hozzáadtam az új ESEMÉNY típust, frissítve a popup-ot és a statisztikát is.
event: { color: "#E07A20" },
tool_v2.html · 870 sor letöltés
Üzenet írása…

Két üzenet, két letöltés. Az iteratív promptolás logikája pontosan ennyi — a kutatói felelősség a mit kérek, nem a hogyan generálódik.

27
feladata

A prompton egyetlen módosítást végezzenek.

1 · Új beszélgetés a Claude.ai-on
claude.ai/new
2 · A prompt szövege
digithist.com/workshop/
ner_tool_prompt.txt


28
Az eszköz, amit a workshop első felében használtak

Ugyanezt a logikát követi.

A teljes 35 000 soros kutatási annotáló — amelyet az első blokkban használtak — szintén egyetlen ember és egy LLM közötti, iteratív párbeszéd eredménye. Csak nagyobb. Sok-sok lépésben.

A tanulmány módszertani hozadéka

A nem-programozó kutató számára is elérhetővé vált az összetett interaktív fejlesztés — ami a digitális bölcsészeti kutatások önállóságának és reprodukálhatóságának új dimenzióját nyitja meg.

29
Letöltések · minden anyag innen elérhető

A workshop összes segédanyaga.

Az alábbi fájlok a digithist.com/modszertan/ oldalról is letölthetők, és a workshop után is bármikor elérhetők lesznek.

Köszönöm a figyelmet!

30