III. TEI Header

TEI Header

teiHeader je strukturirana komponenta xml dokumenta, ki vsebuje metapodatke o besedilu. Je ključen del dokumenta, saj omogoča razumljivost in uporabnost besedil. Je glavni element za vse metapodatke, povezane z dokumentom Je prvi element v TEI dokumentu Vsebuje več podrejenih delov. Najpomembnejši so: Glava TEI oziroma <teiHeader> je obvezna in vsebuje opisne metainformacije o dokumentu.
<TEI xmlns="http://www.tei-c.org/ns/1.0"> <!-- root element -->  <teiHeader> <!-- obvezen element -->   <fileDesc> ... </fileDesc> <!-- obvezen -->   <encodingDesc>...</encodingDesc> <!-- opcijski -->   <profileDesc>...</profileDesc> <!-- opcijski -->   <revisionDesc>...</revisionDesc> <!-- opcijski -->  </teiHeader>  <text>...</text> </TEI>

<fileDesc>

<teiHeader> vsebuje vsaj opis elektronske datoteke znotraj elementa <fileDesc>. Ta vsebuje opis datoteke, vključno z informacijami o naslovu, avtorjih, izdajah itd. Ta element je sestavljen iz treh obveznih komponent: <titleStmt>, <publicationStmt> in <sourceDesc>.
<TEI xmlns="http://www.tei-c.org/ns/1.0"> <!-- ... -->  <teiHeader> <!-- obvezni elementi -->   <fileDesc>    <titleStmt>     <title> <!-- ... -->     </title>    </titleStmt>   </fileDesc> <!-- ... -->  </teiHeader> </TEI>
  1. <titleStmt> - vsebuje naslov in povezanih osebah, ki so odgovorne za njegovo vsebino.
    <titleStmt>  <title>Elementary and middle school textbooks between 1774 and 1918: An annotated bibliography with supporting study</title>  <author>   <forename>Neja</forename>   <surname>Blaj Hribar</surname>  </author>  <respStmt>   <resp>TEI encoding and publication on the Internet</resp>   <name>Mihael Ojsteršek</name>  </respStmt> </titleStmt>
  2. <editionStmt> - vsebuje informacije, ki se nanašajo na posamezno izdajo besedila.
    <editionStmt>  <edition>Editon 1.0</edition> </editionStmt>
  3. <publicationStmt> - je obvezene element znotraj <fileDesc> in vsebuje infromacije, ki se nanašajo na objavo ali distribucijo elektronskega ali drugega besedila. To vključuje podatke o založniku, kraju, datumu objave, načinu distribucije.
    <publicationStmt>  <publisher>   <orgName xml:lang="sl">Inštitut za novejšo zgodovino</orgName>   <orgName xml:lang="en">Institute of Contemporary History</orgName>   <address>    <addrLine>Privoz 11</addrLine>    <addrLine>SI-1000 Ljubljana</addrLine>   </address>  </publisher>  <pubPlace>http://ojs.inz.si/pnz/article/view/4405</pubPlace>  <date>2023</date>  <availability status="free">   <licence>http://creativecommons.org/licenses/by-nc-nd/4.0/</licence>  </availability> </publicationStmt>
  4. <seriesStmt> - vsebuje informacije o seriji, kateri publikacija pripada.
    <seriesStmt>  <title xml:lang="sl">Prispevki za novejšo zgodovino</title>  <title xml:lang="en">Contributions to Contemporary History</title>  <biblScope unit="volume">64</biblScope>  <biblScope unit="issue">3</biblScope>  <idno type="ISSN">2463-7807</idno> </seriesStmt>
  5. <sourceDesc> - opisuje vir, iz katerega je bilo elektronsko besedilo pridobljeno ali ustvarjeno. Pri digitaliziranih besedilih je to običajno bibliografski opis. Pri ustvarjenih besedilih je lahko le informacija "born digital".
    <sourceDesc>  <p>Born digital</p> </sourceDesc>
  6. <extent> - opisuje približno velikost besedila, shranjenega na nekem nosilcu.
    • na primer velikost na nosilcu (MB, GB) število besed v besedilu, znakov, strani, fizične dimenzijce
  7. <notesStmt> - vsebuje vse opombe, ki zagotavljajo dodatne informacije o besedilu, ki niso zajete v drugih delih bibliografske opredelitve.
    • vsebuje element <note> za označitev opombe
Izmed vseh teh so obvezni <titleStmt>, <publicationStmt> in <sourceDesc>

<encodingDesc>

Element <encodingDesc> dokumentira razmerje med elektronskim besedilom in virom ali viri, iz katerih je bilo izpeljano. Določa metode in uredniška načela, ki so vodila označevanje obravnavanega besedila. Omogoča podroben opis, ali (oziroma kako) je bilo besedilo normalizirano med transkripcijo, kako je označevalec razrešil dvoumnosti v izvoru, katere ravni kodiranja ali analize so bile uporabljene itd. Je torej pojasnilo o kodiranju besedila, uporabljeni metodologiji in standardih.

Ta element lahko vsebuje odstavke, označene le z elementom <p>, ali pa bolj namenske elemente kot sta na primer:

  • <projectDesc> - Podrobno opisuje cilj ali namen, zaradi katerega je bila elektronska datoteka kodirana, skupaj z vsemi drugimi pomembnimi informacijami o postopku, s katerim je bila sestavljena ali zbrana.
  • <editorialDecl> - Poda podrobnosti o uredniških načelih in praksah, ki so bile uporabljene med kodiranjem besedila.

Najosnovneši primer <encodingDesc> z elementom <projectDesc>

<encodingDesc>  <projectDesc xml:lang="en">   <p>Contributions to Contemporary History is one of the central Slovenian scientific      historiographic journals, dedicated to publishing articles from the field of      contemporary history (the 19th and 20th century).</p>   <p>The journal is published three times per year in Slovenian and in the following      foreign languages: English, German, Serbian, Croatian, Bosnian, Italian, Slovak      and Czech. The articles are all published with abstracts in English and      Slovenian as well as summaries in English.</p>  </projectDesc>  <projectDesc xml:lang="sl">   <p>Prispevki za novejšo zgodovino je ena osrednjih slovenskih znanstvenih      zgodovinopisnih revij, ki objavlja teme s področja novejše zgodovine (19. in 20.      stoletje).</p>   <p>Revija izide trikrat letno v slovenskem jeziku in v naslednjih tujih jezikih:      angleščina, nemščina, srbščina, hrvaščina, bosanščina, italijanščina, slovaščina      in češčina. Članki izhajajo z izvlečki v angleščini in slovenščini ter povzetki      v angleščini.</p>  </projectDesc> </encodingDesc>

<profileDesc>

Element <profileDesc> je neobvezen element, namen katerega je omogočiti zapis informacij, ki opredeljujejo različne opisne vidike besedila. Zagotavlja podroben opis nebibliografskih vidikov besedila.

Vsebuje naslednje podrejene elemente:

  • <abstract> - vsebuje povzetek, ki ga je k obstoječemu izvirnemu dokumentu dodal označevalec.
  • <creation> - Opisuje, kje, kdaj in kako je bilo besedilo ustvarjeno. Sem lahko vključimo čas in kraj nastanka ter avtorje ali druge ustvarjalce
  • <langUsage> - v tem elementu navedemo jezike, narečja itd., ki se pojavijo v besedilu.
  • <textClass> - omogoča opredelitev teme ali zvrst, glede na standardno klasifikacijsko shemo ipd.
  • <correspDesc> - vsebuje opis dejanj, povezanih z označevanjem korespondence (npr. pisanje, pošiljanje, prejemanje pisem).
  • <calendarDesc> - uporabimo, če se v besedilu pojavijo datacije, zapisane po posebnem koledarskem sistemu (npr. julijski koledar).

Ti elementi omogočajo zajem informacij, ki pomagajo razumeti ozadje, jezikovne značilnosti in namen besedila. Uporaba teh elementov je prilagodljiva, vključimo lahko le tiste, ki jih potrebujemo za specifičen projekt.

V TEI glavi je v zgodovinskih besedilih in njihovih korpusih elementu <profileDesc> pogosto podrejen tudi element <particDesc>. Ta je namenjen opisovanju udeležencev v izvornem besedilu, ki so povezani z njegovim nastankom, uporabo ali vsebino. Pomemeben je za označevanje besedil, kjer je vključenih več posameznikov ali skupin. <particDesc> vsebuje seznam oseb <listPerson>, ki lahko vsebuje elementa <person> in <personGrp> elementov za določjive osebe znotraj vira in seznam organizacij <listOrg>.

Primer uporabe <particDesc> je označevanje parlamentarnih sej DZ:
<particDesc>  <listOrg>   <head>Seznam organizacij</head>   <org xml:id="cl.DEMOSrole="coalition">    <orgName full="yesxml:lang="sl">Demokratična opozicija Slovenije</orgName>    <orgName full="yesxml:lang="en">Democratic Opposition of Slovenia</orgName>    <orgName full="init">DEMOS</orgName>    <event from="1989-11-27to="1991-12-30">     <label xml:lang="en">existence</label>    </event>    <idno type="URIsubtype="wikimedia"     xml:lang="sl">https://sl.wikipedia.org/wiki/DEMOS</idno>    <idno type="URIsubtype="wikimedia"     xml:lang="en">https://en.wikipedia.org/wiki/Democratic_Opposition_of_Slovenia</idno>   </org>  </listOrg>  <listPerson>   <head xml:lang="sl">Seznam govornikov</head>   <person xml:id="BučarFrance">    <persName>     <surname>Bučar</surname>     <forename>France</forename>     <roleName>dr.</roleName>    </persName>    <sex value="M"/>    <birth when="1923-02-02">     <placeName ref="https://www.geonames.org/3203808">Bohinjska Bistrica</placeName>    </birth>    <affiliation role="MPref="#DruzPolZb"     from="1990-05-08to="1992-12-22ana="#SK.11"/>    <idno type="URIsubtype="wikimedia"     xml:lang="sl">https://sl.wikipedia.org/wiki/France_Bu%C4%8Dar</idno>   </person>  </listPerson> </particDesc>

<revisionDesc>

<revisionDesc> je zadnji element v <teiHeader>, ki je namenjen zapisovanju dnevnika sprememb, kjer se beležijo vse spremembe znotraj besedila. Uporaba tega elementa zagotavlja preglednost pri upravljanju večjega števila datotek, ki se sproti posodabljajo, popravljajo ali drugače spreminjajo. Datoteke lahko tudi prehajajo med raziskovalci in označevalci, zato element lahko dokumentacijski vir. Brez tega zapisa lahko pride do zmede med različicami datoteke. Ključni elementi so

  • <revisionDesc> - je opis revizij in zagotavlja pregled zgodovine sprememb določene datoteke.
  • <listChange> - je seznam sprememb, ki združuje več opisov sprememb, ki so povezane ali z ustvarjanjem ali naknadnim spreminjanje izvornega besedila.
  • <change>, oziroma sprememba, beleži posamezno spremembo ali niz sprememb, narejenih med pripravo izvornega dokumenta ali kasnejšo revizijo elektronske različice. Vsebuje tudi datum, avtorja in opis spremembe.

Nekaj primerov <teiHeader>

Primer Foglarjeva pesmarica, Elektronska znanstvenokritična izdaja
Primer Foglarjeva pesmarica, Elektronska znanstvenokritična izdaja
<teiHeader>  <fileDesc>   <titleStmt>    <title>Foglarjeva pesmarica</title>    <title>Editio princeps</title>    <title>Elektronska znanstvenokritična izdaja</title>    <respStmt>     <resp>Diplomatični prepis, kritični aparat, kritični prepis, opombe in komentar</resp>     <name>Nina Ditmajer</name>    </respStmt>    <respStmt>     <resp>Uredila</resp>     <name xml:id="NDI">Nina Ditmajer</name>    </respStmt>    <respStmt>     <resp>Strokovni pregled</resp>     <name>Natalija Ulčnik</name>     <name>Luka Vidmar</name>    </respStmt>    <respStmt>     <resp>Prevod povzetkov</resp>     <name xml:id="MŠO">Mojca Šorli</name>     <name xml:id="AHA">Ana Habjan</name>    </respStmt>    <respStmt>     <resp>Redakcija zapisa TEI</resp>     <name xml:id="TER">Tomaž Erjavec</name>    </respStmt>    <respStmt>     <resp>Pretvorba v XHTML, postavitev na splet</resp>     <name xml:id="APA">Andrej Pančur</name>    </respStmt>    <respStmt>     <resp>Fotografije rokopisa</resp>     <name xml:id="MZA">Marko Zaplatil</name>    </respStmt>    <respStmt>     <resp>Pri urejanju sodeloval</resp>     <name xml:id="MOG">Matija Ogrin</name>    </respStmt>   </titleStmt>   <editionStmt>    <edition>Objava 1.0</edition>   </editionStmt>   <extent>792,5 kB Mb XML; celoten obseg besedila: 277.440 znakov; obseg besedila v študijah      (brez tekstnokritičnega aparata): 154.629 znakov.</extent>   <publicationStmt>    <publisher>Založba ZRC, ZRC SAZU</publisher>    <authority>Inštitut za slovensko literaturo in literarne vede, ZRC SAZU</authority>    <date when="2021-01-28">2021-01-28</date>    <pubPlace>Ljubljana</pubPlace>    <availability>     <p xml:lang="sl">Avtorske pravice za besedilo te izdaje določa licenca Creative Commons          Priznanje avtorstva–Brez predelav–Nekomercialno 4.0: <ref target="https://creativecommons.org/licenses/by-nc-nd/4.0/">CC BY-ND-NC 4.0</ref>     </p>     <p xml:lang="en">Licenced under Creative Commons Attribution-NonCommercial-NoDerivatives          4.0: <ref target="https://creativecommons.org/licenses/by-nd-nc/4.0/">CC BY-ND-NC            4.0</ref>     </p>    </availability>    <idno type="ISBN">978-961-05-0514-3 (html)</idno>   </publicationStmt>   <sourceDesc>    <p>Elektronska izdaja je pripravljena po izvirniku, ki ga hrani Narodna in univerzitetna        knjižnica (NUK R 281102) in je z opisom in digitalnim faksimilom predstavljen v    <hi>Registru slovenskih rokopisov 17. in 18. stoletja</hi> (NRSS, Ms <ref target="http://ezb.ijs.si/fedora/get/nrss:nrss_ms_123/VIEW/">123</ref>).</p>   </sourceDesc>  </fileDesc>  <profileDesc>   <abstract xml:lang="sl">    <p>Foglarjev rokopis je baročna romarska pesmarica, ki je nastala na Spodnjem Štajerskem        med letoma 1757 in 1762. <!-- ... -->    </p>   </abstract>   <abstract xml:lang="en">    <p>Foglar’s manuscript is a Baroque pilgrimage hymnal composed in Lower Styria between 1757 and 1762. <!-- ... -->    </p>   </abstract>   <textClass>    <keywords xml:lang="sl">     <term>pesmarice</term>     <term>rokopisi</term>     <term>barok</term>     <term>slovenska književnost</term>     <term>Lovrenc Foglar</term>    </keywords>    <keywords xml:lang="en">     <term>hymnals</term>     <term>manuscripts</term>     <term>Baroque</term>     <term>Slovenian literature</term>     <term>Lovrenc Foglar</term>    </keywords>   </textClass>   <langUsage>    <language ident="sl">slovenščina</language>    <language ident="la">latinščina</language>   </langUsage>  </profileDesc>  <revisionDesc>   <change when="2021-02-02">    <name>Andrej Pančur</name> dodal divGen za sidih izdajo.</change>   <change when="2021-02-02">    <name>Andrej Pančur</name> dodal @xml:id in @n.</change>  </revisionDesc> </teiHeader>

Primer <teiHeader> članka v serijski publikaciji

Prispevki za novejšo zgodovino, Letn. 59, št. 1 (2019): Digital Humanities and Language Technologies
<teiHeader>  <fileDesc>   <titleStmt>    <title>Sustainability of Digital Editions: Static Websites of the History of        Slovenia – SIstory Portal</title>    <author>     <name>      <forename>Andrej</forename>      <surname>Pančur</surname>      <affiliation>Institute of Contemporary History</affiliation>     </name>    </author>   </titleStmt>   <editionStmt>    <edition>     <date>2019-04-15</date>    </edition>   </editionStmt>   <publicationStmt>    <publisher>     <orgName xml:lang="sl">Inštitut za novejšo zgodovino</orgName>     <orgName xml:lang="en">Institute of Contemporary History</orgName>     <address>      <addrLine>Kongresni trg 1</addrLine>      <addrLine>SI-1000 Ljubljana</addrLine>     </address>    </publisher>    <pubPlace>http://ojs.inz.si/pnz/article/view/348</pubPlace>    <date>2019</date>    <availability status="free">     <licence>http://creativecommons.org/licenses/by-nc-nd/4.0/</licence>    </availability>   </publicationStmt>   <seriesStmt>    <title xml:lang="sl">Prispevki za novejšo zgodovino</title>    <title xml:lang="en">Contributions to Contemporary History</title>    <biblScope unit="volume">59</biblScope>    <biblScope unit="issue">1</biblScope>    <idno type="ISSN">2463-7807</idno>   </seriesStmt>   <sourceDesc>    <p>No source, born digital.</p>   </sourceDesc>  </fileDesc>  <encodingDesc>   <projectDesc xml:lang="en">    <p>Contributions to Contemporary History is one of the central Slovenian scientific        historiographic journals, dedicated to publishing articles from the field of        contemporary history (the 19th and 20th century).</p>    <p>The journal is published three times per year in Slovenian and in the following        foreign languages: English, German, Serbian, Croatian, Bosnian, Italian, Slovak        and Czech. The articles are all published with abstracts in English and        Slovenian as well as summaries in English.</p>   </projectDesc>   <projectDesc xml:lang="sl">    <p>Prispevki za novejšo zgodovino je ena osrednjih slovenskih znanstvenih        zgodovinopisnih revij, ki objavlja teme s področja novejše zgodovine (19. in 20.        stoletje).</p>    <p>Revija izide trikrat letno v slovenskem jeziku in v naslednjih tujih jezikih:        angleščina, nemščina, srbščina, hrvaščina, bosanščina, italijanščina, slovaščina        in češčina. Članki izhajajo z izvlečki v angleščini in slovenščini ter povzetki        v angleščini.</p>   </projectDesc>  </encodingDesc>  <profileDesc>   <langUsage>    <language ident="sl"/>    <language ident="en"/>   </langUsage>   <textClass>    <keywords xml:lang="en">     <term>digital editions</term>     <term>digital curation</term>     <term>TEI</term>     <term>XSLT</term>     <term>static website</term>    </keywords>    <keywords xml:lang="sl">     <term>digitalne izdaje</term>     <term>digitalno kuratorstvo</term>     <term>TEI</term>     <term>XSLT</term>     <term>statične spletne strani</term>    </keywords>   </textClass>  </profileDesc>  <revisionDesc>   <listChange>    <change>     <date>2019-06-07</date>     <name>Mihael Ojsteršek</name>     <desc>Pretvorba iz DOCX v TEI, dodatno kodiranje</desc>    </change>   </listChange>  </revisionDesc> </teiHeader>