Diskurzus, hatalom, hálózat
Ugyanaz az intézmény, ugyanaz a forráskorpusz, mégis radikálisan más érveléslogika.
Megérteni, mit nyer és mit veszít egy kutató, ha digitális réteget illeszt a hagyományos szoros olvasásra.
Saját kezűleg léterhozni és használni egy működő, böngészőben futó annotáló eszközt, programozói tudás nélkül.
A workshop során végig egyetlen példát használunk: Két dokumentumot a Nemzeti Színház Kádár-kori (1957–1988) történetéből, amelyek az érveléstípusok két végpontját mutatják.
Igazgatói programtervezet a Nemzeti Színház szocialista magyar kultúrában betöltött szerepéről · 1979. augusztus 28.
SZ=38 · P=2 · arány 19,0×
Színházi Osztály feljegyzése a Nemzeti Színház épületének tárgyában · 1960. április 13.
SZ=0 · P=18 · tisztán pragmatikus
A 19. század reformkori örökségétől, Széchenyi koráig visszanyúló kulturális szimbólum.
A párt számára kultúrpolitikai zászlóshajó, az ideológiai legitimáció kitüntetett intézménye.
Egy konkrét, romlófélben lévő épület, amelyet finanszírozni, építeni, áthelyezni kell.
A Kádár-kori diskurzus tétje pontosan az: kinek az érvelésében melyik értelmezés érvényesül?
Három tézis, amely a Kádár-kori szövegek elemzéséhez nélkülözhetetlen.
A szöveg nem pusztán tükrözi a valóságot, hanem (rész)konstruálja is. A megnevezés egyben tartalom-adás: amikor a hatalom „a nemzeti kultúra letéteményesének" nevezi a Nemzeti Színházat, ezzel létre is hozza ezt az intézményi szerepet.
Egy adott korban, intézményben, hatalmi szerkezetben nem mindenki mondhat bármit. Vannak tilalmak, kizáró eljárások, beszédpozíciók. A pártállami politikai diskurzus a legszigorúbban strukturált terep.
Egy 1978-as belső feljegyzés nem semleges leírás. Maga is diszkurzív aktus, amely a Nemzeti Színháznak egy meghatározott értelmezését rögzíti és termeli.
A szöveg három rétegen értelmezhető:
„Minden társadalomban ellenőrzik és szabályozzák a diskurzus termelését" — megszabják, ki, mit, milyen pozícióból mondhat. A politika terepe a legerősebben strukturált.
Aki a Nemzeti Színház koncepciójáról szólhatott a Kádár-korban: szigorúan körülhatárolt csoport.
A jelentés nem a fogalomban van, hanem a fogalom használatában. Egy fogalom körül kitüntetett társadalmi vita zajlik — a tartalmát mindig egy adott diskurzus tölti fel.
A „Nemzeti Színház" mint történeti fogalom: a tartalma több évtizeden át küzdelmes tárgyalás kérdése.
Bizonyos jelölőket különböző politikai logikák különböző tartalommal tölthetnek fel. Az üres jelölő pontosan azért hatékony, mert sokféle pozíciónak ad keretet.
A „Nemzeti Színház" a vizsgált korban pontosan ilyen üres jelölő: nemzeti örökség, szocialista zászlóshajó és presztízsobjektum egyszerre.
A SZ/P kódolási séma ezeknek az elméleti hagyományoknak az operacionalizálása egy konkrét forráskorpuszon.
Az elemzés hét alkódot alkalmaz, két fő-kategóriába rendezve. A vizuális elkülönítés: kék = szimbolikus érvelés; vörös = pragmatikus érvelés.
A Nemzeti Színház eszméje: nemzeti hagyomány, ideológiai funkció, presztízs.
A Nemzeti Színház üzemeltetési valósága: épület, kapacitás, költség, helyszín.
Nyissák meg a workshop edition annotálót. A két dokumentum már be van töltve. Saját kezűleg jelöljenek ki SZ vagy P passzusokat.
Ezeket a mintázatokat egyetlen kutató nem tudja szisztematikusan, reprodukálhatóan azonosítani.
Két réteg: az entitás-annotáció (név-, intézmény-, helyszín-, dátum-jelölés) és a kódolási réteg (a passzus érvelés-típusa). A két réteg kombinációja teszi lehetővé a személy×kód mátrix előállítását.
A politikai elit kizárólag az eszméjén keresztül viszonyul a Nemzeti Színházhoz; a pragmatikus valóság az intézményi részvevők szövegeiben jelenik meg.
Az 1960-as épülettervezési és az 1983-as pártbizottsági döntés egyaránt kikényszeríti a pragmatikus érvrendszert a szimbolikus keretek magabiztosságából.
A workshop során a HuSpaCy magyar nyelvű modellt használjuk — egy spaCy-alapú, magyar nyelvre tanított eszközt.
SpaCy NER → Futtatás. Nézzék meg az eredményt: melyik entitás helyes, melyik nem.
A NER eredményt minden esetben felül kell vizsgálni.
Hét osztályos séma: SZ-család (kék) vs. P-család (vörös). Önök döntik el, melyik passzus melyik kategóriába tartozik.
| P2 Kapacitás | 93% |
| SZ3 Presztízs | 87% |
| SZ1 Hagyomány | 85% |
| SZ2 Kultpol. | 73% |
| P3 Gazdasági | 67% |
A P3 (gazdasági érvek) gyengébb teljesítménye nem hiba, hanem tanulság: a Kádár-kori bürokratikus szövegekben a finanszírozási szempont retorikai burokba van csomagolva — kontextusértés kell hozzá.
A 79%-os AI–ember egyetértés összemérhető egy emberi kódolópáros egyetértésével. Az AI nem helyettesíti a kutatót, de statisztikailag konzisztens kiindulópontot ad.
| Szempont | Hagyományos kritikai forráskiadás | Digitális forráskiadvány |
|---|---|---|
| Szelekciós elv | Kötet előszavában expliciten kifejtve | Gyakran a kód logikájában rejtve |
| Kritikai apparátus | Lábjegyzet-rendszer, részletes | Annotációs réteg, gyakran tömörebb |
| Hivatkozási háló | Kéziratos, lineáris | Linkek, kapcsolódó entitások, hálózat |
| Frissíthetőség | Kanonikus, nyomdai | Frissíthető, de instabilabb |
| Aggregálható-e | Nem | Igen, statisztikák, vizualizációk |
| Kanonikus státusz | Erős | Még alakulóban |
A digitális forráskiadvány nem helyettesíti a kritikai kiadást — kiegészíti, és új típusú kérdéseket tesz feltehetővé.
Egy digitális forráskiadvány nem négy különálló dokumentum — egyazon kódolt szöveg-korpusz négy reprezentációja, amelyek között az olvasó dinamikusan mozoghat.
A forráskiadvány nemcsak önmagát publikálja, hanem be is kapcsolódik a kutatói és intézményi infrastruktúrába: minden entitás más hivatkozási rendszerekhez köthető.
// minden entitás kanonikus URI-t kap persName ref="q462066" → Aczél György orgName ref="q1054054" → Nemzeti Színház
<TEI xmlns="http://www.tei-c.org/ns/1.0"> <persName ref="q462066"> Aczél György </persName> </TEI>
ric:Person → Aczél György ric:CorporateBody → Nemzeti Színház ric:isAssociatedWithPlace ric:isOrWasGovernedBy
Mindenki saját kezűleg készít egy egyszerűsített NER-annotálót. A prompt készen van, csak el kell olvasnia, módosítania és bemásolnija a saját Claude-jába.
Nem kell programozónak lennie. A kutatói felelőssége az, hogy mit kér a géptől, a hogyan a modell dolga.
Három panel: dokumentum-lista, szövegszerkesztő kijelölés-popup-pal, és a tabokba szervezett vizualizáció — minden funkció a prompt által generált 850 sorban.
Két üzenet, két letöltés. Az iteratív promptolás logikája pontosan ennyi — a kutatói felelősség a mit kérek, nem a hogyan generálódik.
A teljes 35 000 soros kutatási annotáló — amelyet az első blokkban használtak — szintén egyetlen ember és egy LLM közötti, iteratív párbeszéd eredménye. Csak nagyobb. Sok-sok lépésben.
A nem-programozó kutató számára is elérhetővé vált az összetett interaktív fejlesztés — ami a digitális bölcsészeti kutatások önállóságának és reprodukálhatóságának új dimenzióját nyitja meg.
Az alábbi fájlok a digithist.com/modszertan/ oldalról is letölthetők, és a workshop után is bármikor elérhetők lesznek.
Köszönöm a figyelmet!