V letu 2021 smo v okviru infrastrukturnega programa delo nekoliko prestrukturirali oziroma smo ga sekcionirali v dvanajst centrov.
V centru za digitalizacijo smo skenirali 80.000 strani in posneli 27 avdio-video montaž v dolžini štirinajst ur dogodkov s področja humanistike. Digitalna knjižnica portala Zgodovina Slovenije – SIstory je tako konec leta 2021 štela več kot 45.000 prosto dostopnih digitalnih objektov znanstvene in kulturne dediščine ter rezultatov raziskav slovenskega zgodovinopisja.
Naloge centra za nestrukturirane podatke so zbiranje, urejanje in obdelava besedilnih, slikovnih, avdio in video zbirk nestrukturiranih podatkov. To so lahko manjše (npr. dobrih 100 slik iz projekta Posmrtne maske, ki smo ga izpeljali v sodelovanju z Društvom za domače raziskave) ali večje zbirke slik (na primer 350.000 slik historičnih popisov prebivalstva). Pogoste pa so tudi manjše (npr. Zbirka 42 tiskovin o koroškem plebiscitu) ali večje zbirke besedil (npr. zbirka Poročevalca državnega zbora, 1668 digitalnih objektov, 142.468 strani). Poleg zbiranja gradiv je center za nestrukturirane podatke odgovoren še za:
Ugotavljamo, da so zbirke nestrukturiranih podatkov najbolj pogosti tipi zbirk, ki nastajajo v okviru dejavnosti infrastrukturnega programa. Večinoma so dostopne prek portala Zgodovina Slovenije – SIstory; ta je leta 2021 vseboval 35 zbirk arhivskih in tiskanih virov, literature in dogodkov.
Center za delno strukturirane podatke je bil ustanovljen za zbiranje, urejanje, analizo in kodiranje delno strukturiranih podatkov, predvsem v formatu XML in v skladu s smernicami mednarodnega konzorcija Text Encoding Initiative (TEI). V sodelovanju z raziskovalci s področja digitalne humanistike center izvaja predvsem bolj ali manj kompleksna kodiranja strukture in pomena besedil. V okviru infrastrukturnega programa bomo tudi v prihodnosti nadaljevali s (pogosto polavtomatskim) kodiranjem sledečih zbirk podatkov in znanstvenih publikacij:
Omogočanje (prostega) dostopa do podatkov iz teh znanstvenih zbirk se lahko izvaja prek repozitorijev GitHub in GitLab, Centra za digitalne izdaje in repozitorija CLARIN.SI https://www.clarin.si/repository/xmlui/.
Člani centra za strukturirane podatke so odgovorni za zbiranje, urejanje, analizo in vnašanje strukturiranih podatkov v relacijske baze podatkov. V okviru tega pa so podpirali in aktivno sodelovali pri razvoju naslednjih večjih zbirk:
Podatki iz vseh teh relacijskih baz raziskovalnih podatkov so prosto dostopni prek spletnih aplikacij, ki jih razvijajo v sodelovanju z DARIAH-SI.