VI. Primarni viri

Označevanje primarnih virov s smernicami Text Encoding Initiative (TEI) omogoča natančno predstavitev in opis dokumentov, kot so rokopisi, knjige, arhivski dokumenti ali druga gradiva. TEI ponuja več elementov za zajem fizičnih lastnosti, vsebine, konteksta in strukture primarnih virov. Mnogo zgodovinskih virov ni bilo namenjenih objavi, ker so bili zasebne narave ali pa še niso bili zaključni dokument v uredniškem procesu. Zaradi tega razloga lahko neobjavljena besedila vsebujejo mnogo značilne sledi nastajanja in urejanja. Pogostokrat v njih najdemo dodatke, prečrtano besedilo, napake in popravke. S smernicami TEI lahko označimo tudi materialne sledi na viru, kot naprimer poškodbe, zaradi katerih besedilo ni berljivo.

Pri označevanju primarnega vira je pomemben <teiHeader>, opisan v tretjem poglavju.

Na tej strani bomo s smernicami TEI znotraj <text> elementa prikazali osnovno označevanje dveh virov:

Maršič, Alojz. Spomini 1929-1945 in Foglarjeva pesmarica
Maršič, Alojz. Spomini 1929-1945 in Foglarjeva pesmarica



Prvi rokopis bi z osnovnim označevanjem lahko označili na naslednji način:
<div>  <head>Zaslišanje</head>  <p>Za Antonom sem bil poklican jaz. Ko je karabiner<lb/> maršalo opazil, da sem jaz na vrsti, mi je prišel<lb/> naproti in me spremil v sobo. Na široko    mi je odprl<lb/> sobna vrata in jih po vstopu tudi zaprl. Predstavil<lb/> me je zasliševalni komisiji takole: <quote>"Ta tukaj je Alojz<lb/> Maršič,      sim Jožeta Maršiča, oba sta se v prejšnji<lb/> jeseni zadruževala v Ribniški dolini. Imela sta vezo<lb/> s partizani v Veliki gori. Vezo z njimi      imata tudi<lb/> sedaj, ko so se partizani premaknili v gozd<lb/> med Kočevsko reko in Kočevjem."</quote> Seveda po takšnem <pb n="6"/>nisem    pričakoval nič dobrega. Tolmač je moral biti<lb/> Slovenec, saj je gladko govoril slovensko. Dolžili so<lb/> me, da sodelujem z OF, da sem imel    vezo<lb/> s partizani v Veliki gori in da imam tudi sedaj vezo<lb/> izmed partizanov, da moram poznati komandirje. </p> </div>

Predstavljanje pojavov v primarnih virih

Osnovni elementi za predstavljanje dodajanja, izbrisa in izpuščanja so

Pri označevanju primarnih virov v TEI je pomembno, da se dokumentirajo spremembe, ki so se zgodile med procesom pisanja ali urejanja besedila. Te oznake nam omogočajo vpogled v razboj besedila skozi čas. Z njimi lahko pokažemo, kako so bile določene spremembe narejene, kdo jih je naredil in kdaj so bile izvedene. S primerjavo slike vira in zgornjega prepisa v xml obliki vidimo, da je nekaj elementov izpuščenih. Vidimo, da je veliko besed rokopisa prečrtanih, izbrisanih in dodanih.
Besedilo, ki ga je avtor ali urednik naknadno dodal v dokument se označuje z elementom <add>. Z njim označujemo dodani del besedila in poudarimo, da ta vsebina ni bila del prvotne različice vira.
<body> <!-- primer <add> --> <!-- ... -->  <p>   <pb n="6"/>   <add>nisem</add> pričakoval nič dobrega. Tolmač je moral biti </p> <!-- ... --> </body>
Besedilo, ki ga je avtor ali urednik odstranil, se označuje z elementom <del>. Pogosto so izbrisi vidni kot prečtano besedilo. Ta element <del> omogoča ohranitev informacij o tem, kaj je bilo odstranjeno.
Dodatki in izbrisi so pomembni, ker nam lahko pomagajo pri analizi procesa pisanja teksta oziroma urednikovega posega, lahko pa vsebujejo tudi alternativne interpretacije besedila.

Za natančnejše označevanje informacij v <del> in <add> lahko uporabimo atribut @rend, na primer, da navedemo, ali je bilo besedilo izbrisano ali prečrtano in kje in kako je bil dodatek napisan. Pri elementu <del> sta primera vrednosti atributa @rend najpogostejša "strikethrough" za prečrtano besedilo ali "overwritten" za prepisano z novim besedilom. Elementu <add> lahko za informacijo o mestu dodanega besedila dodamo atribut @place - primeri vrednosti tega atributa so 'inline', 'above', 'below', 'bottom', 'top'.

Če so v rokopisu deli besedila prečrtani in nato nadomeščeni z novim besedilom (npr. s pisavo nad prejšnjo vrstico), se za prečrtani del uporabi <del> z atributom @rend, novo dodano besedilo pa se označi z <add>.

<gap> element označuje točko, kjer je bilo gradivo izpuščeno v prepisu, bodisi zaradi uredniških razlogov ali ker je gradivo nečitljivo, nevidno ali neslišno. Razlog opišemo s pomočjo atributa @reason, ki ima lahko vrednosti "editorial", "illegible", "deleted", "cancelled", "inaudible", "irrelevant", "sampling".

<note> element se uporablja za označevanje komentarjev oz. opomb, ki niso del osnovnega besedila, vendar nudijo pomembne informacije za interpretacijo dokumenta, razumevanja besedila, avtorjevega pisanja ali zgodovinskega konteksta. Označimo jih ne glede na to, ali so že prisotne v besedilu ali jih posreduje označevalec. Opomba je vsak komentar v besedilu, ki je na nek način označen kot izven glavnega toka besedila. Vse opombe morajo biti označene z isto značko <note>, ne glede na to, ali se pojavljajo kot opombe v glavnem besedilnem polju, na dnu strani, na koncu poglavja ali zvezka, na robu ali na katerem drugem mestu. Element <note> lahko vključuje različne atribute za njihov natančnejši opis. Najpogostejši atributi so

  • @place - za označevanje lokacije opombe
  • @type - za razlikovanje med opombami
  • @resp - za identificiranje odgovornosti za vsebino opombe
  • @n - se lahko uporabi za številčenje ali simbolično označevanje določenega mesta v izvornem besedilu, kjer je opomba "pritrjena"
Izsek iz Maršič, Alojz. Spomini 1929-1945
Izsek iz Maršič, Alojz. Spomini 1929-1945
<body> <!-- Primer <add>, <del>, <gap> in <note> --> <!-- ... -->  <p>   <gap reason="editorial"/>vrata. Ko se jih je vseh pet vrnilo, <del rend="strikethrough">jih spu</del> je stražar spustil<lb/> drugih pet. Po tem    opravilu <add place="above">smo</add> polegli k počitku, na gola tla.<note place="bottom">konec odstavka</note>  </p> <!-- ... --> </body>

Včasih je zaželeno označiti okrajšave v besedilu kopije, bodisi da se zanje sproži posebna obdelava, da se poda celotna oblika skrajšane besede ali besedne zveze ali da se omogočijo različne možne razširitve okrajšave. Okrajšave se lahko prepišejo tako, kot so, ali razširjene; lahko ostanejo neoznačene ali označene.

  • <abbr> - vsebuje kakršno koli kratico. Za ralikovanje vrst okrajšav se uporablja atribut @type
  • <expan> - vsebuje razširitev okrajšave. Uporablja se za informacijo o razširitvi okrajšave s strani označevalca. To je stvar uredniške politike. Element mora vsebovati celotno okrajšavo. Običajno je kombiniran z <abbr> elementom znotraj <choice> elementa, z namenom zapisa okrajšave in njene razširitve.
  • <choice> - element združuje več ver alternativnih kodiranj za isto točko v besedilu.
<body> <!-- primer okrajšave -->  <p> <!-- ... -->sodelujem z <choice>    <abbr>OF</abbr>    <expan>Osvobodilna fronta</expan>   </choice>., da sem imel vezo <!-- ... -->  </p> </body>

Prepis primarnih besedilnih virov je odvisen od stanja izvirnega gradiva. Nekateri deli besedil so lahko nejasni, uničeni ali manjkajoči. Pri označevanju strganega ali poškodovanega besedila v TEI uporabljamo elemente, ki omogočajo predstavitev fizičnih poškodb. Najpomembnejši elementi so

  • <damage> - označuje širše poškodovano območje izvornega besedila
  • <unclear> - označuje besedo, frazo ali odlomek, ki ga ni mogoče z gotovostjo prepisati, ker je v viru nečitljiv
  • <gap> - označuje manjkajoče besedilo

Element <damage> lahko vsebuje atribute, ki opisujejo naravo kakršnih koli fizičnih poškodb, ki vplivajo na interpretacijo vira. Najpogostejši so

  • @hand - določi 'roko', osebo, ki je povzročila škodo, na primer, če je nekdo znan prečrtal besedilo
  • @agent - opisuje vzrok poškodbe, če je znan. Na primer voda, ogenj, človek
  • @extent - opisuje obseg poškodovanega besedila z uporabo projektno specifičnega besednjaka, ki združuje količino in enote v enem samem nizu besed.
  • @unit - opredeli mersko enoto za poškodbo, na primer centimetri, milimitri, znaki
  • @type - opredeli vrsto poškodbe

Kot primer lahko vzamemo naslednje strgano pismo:

Latinske in nemške kronike na Slovenskem, Pisma Franca Franza
Latinske in nemške kronike na Slovenskem, Pisma Franca Franza


<body> <!-- primer strganega lista --> <!-- ... -->  <div xml:id="franz.1836.095type="letter">   <pb n="1836.05.30_a_._100_6870"    break="hr"/>   <opener>    <dateline>     <damage>Laibac<gap reason="tear"/>     </damage>    </dateline>   </opener>   <lb/>   <p>93.</p>   <p>    <damage agent="tear">Samstags war Abendgesellscha<gap reason="tear"/>     <lb/>heim und gestern Sonntags w<gap reason="tear"/>     <lb/>Samstags Abends ist Frau Gräfin<gap reason="tear"/>     <lb/>Comtesse Tochter Lori aus Wien ange<gap reason="tear"/>     <lb/>Auch Bar. Franz v. Lazzarini war Samstag<gap reason="tear"/>    </damage>    <lb/>Frau Gemahlin zur Stadt gekommen.   <lb/>Gestern war etwas Sonnenschein allein dennoch   <lb/>sehr kühl; heute war ein trüber Morgen und   <lb/>um 10 Uhr regnete es.   </p>  </div> <!-- ... --> </body>

Primer uporabe elementa <unclear> za :

<p>Frau Gräfin Weichard von Auersperg ist mit Comtessen Töchtern, und den <unclear reason="illegible">H</unclear> Sohn Reichard – Montags nach Fiume abgereist.</p>

Regularizacija in normalizacija

Kadar izvirno besedilo v veliki meri uporablja variantne oblike ali nestandardno črkovanje/zapise, je morda zaželeno, da se ga uredi. Pri zgodovinskih virih se pogosto pojavlja, da pravopis ni bil standardiziran. S pomočjo ustreznih TEI elementov lahko tako nestandardne oblike označimo in jih povežemo z regulariziranimi oziroma normaliziranimi oblikami.

Elementi za označevanje so:

Element <reg> vsebuje regularizirano ali normalizirano obliko izvornega besedila. Kodirnik lahko preprosto pokaže, da so bile določene besede posodobljene z uporabo elementa <reg> brez določenih atributov

Element <orig> vsebuje izvirno obliko besedila v viru, in jo označi kot nepopravljeno

Element <choice> združi več alternativnih označevanj istega teksta. Jasno loči original od regularizirane oblike in omogoča primerjavo obeh oblik.

Odvisno od namena prepisa se lahko očitne napake prepišejo takoj, popravijo tiho, izrecno označijo ali izrecno popravijo. Označevalec, ki se drži bolj eksplicitne prakse, bi rad vsaj opozoril na napake, uredniške popravke ali oboje. Za to se uporabljata elementa <sic> in <corr>. Element <sic> se uporablja za označevanje reproduciranega besedilo, čeprav očitno napačnega ali netočnega, medtem ko element <corr> vsebuje pravilno obliko zapisa, ki je v besedilu izvoda očitno napačna. Oba elementa sta lahko združena znotraj <choice> elementa.

V spodnjem primeru so v kritičnem prepisu združeni vsi opisani elementi:

Primer iz Foglarjeve pesmarice
Primer iz Foglarjeve pesmarice
<!-- primer <choice>, <orig>, <reg>, <sic>, <corr> --><lg>  <l>Od Boga Očeta čem od Sina začeti</l>  <l>Z veseljom inu s praviga srca peti</l>  <l>On je zapustija</l>  <l>Nebeško <choice>    <orig>     <choice>      <sic>Shpa no vj io</sic>      <corr>Shpanovijo</corr>     </choice>    </orig>    <reg>španovijo</reg>   </choice>  </l>  <lg type="refrain">   <l>Zahvalena &amp;</l>  </lg> </lg>