Označevanje primarnih virov s smernicami Text Encoding Initiative (TEI) omogoča natančno predstavitev in opis dokumentov, kot so rokopisi, knjige, arhivski dokumenti ali druga gradiva. TEI ponuja več elementov za zajem fizičnih lastnosti, vsebine, konteksta in strukture primarnih virov. Mnogo zgodovinskih virov ni bilo namenjenih objavi, ker so bili zasebne narave ali pa še niso bili zaključni dokument v uredniškem procesu. Zaradi tega razloga lahko neobjavljena besedila vsebujejo mnogo značilne sledi nastajanja in urejanja. Pogostokrat v njih najdemo dodatke, prečrtano besedilo, napake in popravke. S smernicami TEI lahko označimo tudi materialne sledi na viru, kot naprimer poškodbe, zaradi katerih besedilo ni berljivo.
Pri označevanju primarnega vira je pomemben <teiHeader>, opisan v tretjem poglavju.
Na tej strani bomo s smernicami TEI znotraj <text> elementa prikazali osnovno označevanje dveh virov:
Osnovni elementi za predstavljanje dodajanja, izbrisa in izpuščanja so
Za natančnejše označevanje informacij v <del> in <add> lahko uporabimo atribut @rend, na primer, da navedemo, ali je bilo besedilo izbrisano ali prečrtano in kje in kako je bil dodatek napisan. Pri elementu <del> sta primera vrednosti atributa @rend najpogostejša "strikethrough" za prečrtano besedilo ali "overwritten" za prepisano z novim besedilom. Elementu <add> lahko za informacijo o mestu dodanega besedila dodamo atribut @place - primeri vrednosti tega atributa so 'inline', 'above', 'below', 'bottom', 'top'.
Če so v rokopisu deli besedila prečrtani in nato nadomeščeni z novim besedilom (npr. s pisavo nad prejšnjo vrstico), se za prečrtani del uporabi <del> z atributom @rend, novo dodano besedilo pa se označi z <add>.
<gap> element označuje točko, kjer je bilo gradivo izpuščeno v prepisu, bodisi zaradi uredniških razlogov ali ker je gradivo nečitljivo, nevidno ali neslišno. Razlog opišemo s pomočjo atributa @reason, ki ima lahko vrednosti "editorial", "illegible", "deleted", "cancelled", "inaudible", "irrelevant", "sampling".
<note> element se uporablja za označevanje komentarjev oz. opomb, ki niso del osnovnega besedila, vendar nudijo pomembne informacije za interpretacijo dokumenta, razumevanja besedila, avtorjevega pisanja ali zgodovinskega konteksta. Označimo jih ne glede na to, ali so že prisotne v besedilu ali jih posreduje označevalec. Opomba je vsak komentar v besedilu, ki je na nek način označen kot izven glavnega toka besedila. Vse opombe morajo biti označene z isto značko <note>, ne glede na to, ali se pojavljajo kot opombe v glavnem besedilnem polju, na dnu strani, na koncu poglavja ali zvezka, na robu ali na katerem drugem mestu. Element <note> lahko vključuje različne atribute za njihov natančnejši opis. Najpogostejši atributi so
Včasih je zaželeno označiti okrajšave v besedilu kopije, bodisi da se zanje sproži posebna obdelava, da se poda celotna oblika skrajšane besede ali besedne zveze ali da se omogočijo različne možne razširitve okrajšave. Okrajšave se lahko prepišejo tako, kot so, ali razširjene; lahko ostanejo neoznačene ali označene.
Prepis primarnih besedilnih virov je odvisen od stanja izvirnega gradiva. Nekateri deli besedil so lahko nejasni, uničeni ali manjkajoči. Pri označevanju strganega ali poškodovanega besedila v TEI uporabljamo elemente, ki omogočajo predstavitev fizičnih poškodb. Najpomembnejši elementi so
Element <damage> lahko vsebuje atribute, ki opisujejo naravo kakršnih koli fizičnih poškodb, ki vplivajo na interpretacijo vira. Najpogostejši so
Kot primer lahko vzamemo naslednje strgano pismo:
Primer uporabe elementa <unclear> za :
Kadar izvirno besedilo v veliki meri uporablja variantne oblike ali nestandardno črkovanje/zapise, je morda zaželeno, da se ga uredi. Pri zgodovinskih virih se pogosto pojavlja, da pravopis ni bil standardiziran. S pomočjo ustreznih TEI elementov lahko tako nestandardne oblike označimo in jih povežemo z regulariziranimi oziroma normaliziranimi oblikami.
Elementi za označevanje so:
Element <reg> vsebuje regularizirano ali normalizirano obliko izvornega besedila. Kodirnik lahko preprosto pokaže, da so bile določene besede posodobljene z uporabo elementa <reg> brez določenih atributov
Element <orig> vsebuje izvirno obliko besedila v viru, in jo označi kot nepopravljeno
Element <choice> združi več alternativnih označevanj istega teksta. Jasno loči original od regularizirane oblike in omogoča primerjavo obeh oblik.
Odvisno od namena prepisa se lahko očitne napake prepišejo takoj, popravijo tiho, izrecno označijo ali izrecno popravijo. Označevalec, ki se drži bolj eksplicitne prakse, bi rad vsaj opozoril na napake, uredniške popravke ali oboje. Za to se uporabljata elementa <sic> in <corr>. Element <sic> se uporablja za označevanje reproduciranega besedilo, čeprav očitno napačnega ali netočnega, medtem ko element <corr> vsebuje pravilno obliko zapisa, ki je v besedilu izvoda očitno napačna. Oba elementa sta lahko združena znotraj <choice> elementa.
V spodnjem primeru so v kritičnem prepisu združeni vsi opisani elementi: