W projekt Calimera jest finansowany przez Komisję Europejską


Biblioteki – IFLA wytworzył zbiorczy indeks zasobów metadanych dla bibliotek cyfrowych [29]. Rząd –



Pobieranie 2.67 Mb.
Strona18/27
Data29.04.2016
Rozmiar2.67 Mb.
1   ...   14   15   16   17   18   19   20   21   ...   27

Biblioteki IFLA wytworzył zbiorczy indeks zasobów metadanych dla bibliotek cyfrowych [29].

Rząd – standard GILS (Government Information Locator Service/Global Information Locator) [[30] jest wykorzystywany w rządowych systemach informacyjnych, chociaż ostatnio wiele rządów preferuje standard Dublin Core. Forum (DCMI) (Dublin Core Metadata Initiative) ustanowiło Rządową Grupę Roboczą [31]. Wiele rządów, m.in. Australia, Kanada, Dania, Finlandia, Irlandia, Nowa Zelandia i Wielka Brytania opracowało wytyczne, które mogą być wiążące dla organizacji sektora publicznego, w tym bibliotek (zob. e-gif – Electronic Government Interoperability Framework [32] i e-gms – Electronic Government Metadata Standard [33] stworzone przez Jednostkę e-Rządu (e-Government Unit) w Wielkiej Brytanii [34. Pierwsza wersja e-gms była oparta na prostym formacie Dublin Core, podczas gdy druga i trzecia bazowały już na kwalifikowanym Dublin Core z pewnymi dodatkowymi elementami zarządzania dokumentami.
Instytucje kulturalne powinny być świadome swojego zapotrzebowania na standardy metadanych specyficznych dla danego środowiska/domeny. Zaadoptowane schemat(y) metadanych powinny być całkowicie udokumentowane dla wszystkich projektów. Dokumentacja ta musi obejmować szczegółowe wskazówki na temat katalogowania ze spisem elementów metadanych i opisem, jak te elementy powinny być używane w celu opisania typów zasobu stworzonego i zarządzanego przez projekt. Wskazówki takie są niezbedne nawet wtedy, gdy używany jest standardowy schemat metadanych do wyjaśnienia, jak ten schemat ma być zastosowany w określonym kontekście projektu.
W celu podtrzymania rozwoju zasobów przez szeroki zakres innych aplikacji i usług, instytucje kulturalne powinny gromadzić opis metadanych dla każdej jednostki przy użyciu DCMES (Dublin Core Metadata Element Set) [35] w prostej/niesprecyzowanej formie. DMES definiuje 15 elementów metadanych co umożliwia proste ponaddomenowe wykrywanie zasobów: Tytuł, Twórca, Opis rzeczowy, Opis, Wydawca, Współtwórca, Data, Typ, Format, Identyfikator, Źródło, Język, Relacja, Miejsce i czas, Własność. Jest to minimalny wymóg, w praktyce proste metadane DC prawdopodobnie będą podzbiorem bogatszego zespołu metadanych.
W celu podtrzymania rozwoju w sektorze dziedzictwa kulturowego, w projekcie nalezy równiez rozważyć dostarczenie opisu metadanych dla każdej jednostki zgodnie ze schematem DC.Culture [36].
Opis na poziomie zbioru ZAKRES

W dużych wspólnych projektach może być konieczne rozważenie zastosowania metadanych do opisu poszczególnych poziomów zbioru, żeby opisać całe zasoby organizacji uczestniczących w programie (zakres, poziom, głębokość, język etc.). Przykłady można znaleźć np. na stronie UKOLN Centrum Opisu Zbioru Collection Description Focus [37] – informacje na temat wykorzystania CLD w Wielkiej Brytanii oraz w Minerva: Deliverable D3.1: Inventories, discovery of digitised content & multilingual issues: Report analysing existing content [38].


Opis na poziomie zbioru nie musi być jednak ograniczony do dużych wspólnych projektów. Opis zbiorowych jednostek może być użyteczny w wielu różnych kontekstach. Może się okazać użyteczny nawet w obrębie zasobów pojedynczej instytucji, czy projektu. (patrz: opis zasobów opisany w JISC Information Environment Architecture Functional Model [39].) Zasób cyfrowy jest tworzony jako część zbioru cyfrowego i powinien być rozpatrywany w kontekście zbioru i rozwoju zbioru. Zbiory są rzeczywiście postrzegane jako składniki wokół których może powstać wiele różnych rodzajów usług cyfrowych.
Zbiory należy opisywać w taki sposób, aby użytkownik mógł wykryć ważne zależności zbioru i aby zbiory mogły być połączone w większą całość istniejącego zbioru cyfrowego oraz w operowanie usługami cyfrowymi w tych zbiorach.
Muzea, biblioteki i archiwa powinny pamiętać o inicjatywach podejmowanych w celu zwiększenia udostępniania i dostępności zbiorów, takich jak: programowe, wspólne, sektorowe, wielobranżowe narodowe lub międzynarodowe inwentarze działalności dygitalizacyjnej i cyfrowej zawartości kulturowej i powinny być przygotowane, aby wspierać metadanymi usługi o ile jest to potrzebne.
Przy opisie zbioru zwykle konieczne jest mapowanie do odpowiednich schematów metadanych. Dobrymi przykładami są:

  • Research Support Libraries Programme (RSLP) schemat opisu na poziomie zbioru (Collection Description schema) [40];

  • opis na poziomie zbioru zdefiniowany w projekcie Minerva D3.2 [41];

pojawiajacy się Dublin Core Collection Description Application Profile [42].
Terminologia ZAKRES

Jeśli użytkownicy mają mieć możliwość skutecznego wyszukiwania w rozproszonych zbiorach danych, ich twórcy muszą wprowadzać wartości do elementów metadanych w sposób spójny.


Należy używać powszechnie uznanych wielojęzycznych źródeł terminologicznych nadając znaczenia elementom metadanych tam, gdzie to możliwe. Tylko w przypadkach, gdzie nie ma terminologii ustandaryzowanej, lokalna terminologia powinna być wzięta pod uwagę. Tam, gdzie używana jest terminologia lokalna, należy udostępnić publicznie informacje na temat terminologii, jej terminów składowych i ich znaczenia.
Wykorzystanie terminologii w rekordach metadanych, standardowych lub specyficznych dla projektu, musi zostać jednoznacznie wskazane w rekordach metadanych.
Rekordy metadanych na poziomie zbioru mogą wykorzystywać terminologię rekomendowaną w schemacie opisu na poziomie zbioru zdefiniowaną w projekcie Minerva [41]
Kontrolowane słowniki, tezaurusy i kartoteki wzorcowe

W celu zapewnienia spójności, najlepiej przyjąć i stosować jakiś określony schemat kodowania lub kontrolowany słownik do indeksowania. Dobrym przykładem są Library of Congress Subject Heading [43].


Tezaurus to rodzaj kontrolowanego słownika, w którym terminy są uporządkowane hierarchicznie w sposób pokazujący związki, np. terminy o węższym i szerszym znaczeniu, ekwiwalentne lub częściowo ekwiwalentne. Terminy są tu oznaczone także jako preferowane i niepreferowane (dla kontroli synonimów). Tezaurusy zazwyczaj zawierają uwagi dotyczące zakresu poszczególnych terminów i inne użyteczne informacje.

Istnieją dwie normy ISO dotyczące tezaurusów: ISO 2788, 1986 Guide to establishment and development of monolingual thesauri [ISO 2788, 1986 Wytyczne ustanawiania i opracowywania tezaurusów jednojęzycznych] [44]; i ISO 5964, 1985 Guide to the establishment and development of multi-lingual thesauri [ISO 5964, 1985 Wytyczne ustanawiania i opracowywania tezaurusów wielojęzycznych] [45]. Podjęto prace w celu aktualizacji obu standardów. Planowany jest nowy standard, BS 8723: Structured vocabularies for information retrieval – guide (patrz: Wielojęzyczność).


Strona The Getty Museum zapewnia dostęp do kilku tematów m.in. The Getty Art. And Architecture Thesaurus [46]; i the Getty Thesaurus of Geographic Names [47].

Przykładem rekordu wzorcowego jest ISAAR (CPF)) (International Standard Archival Authority Record for Corporate Bodies, Persons and Families, druga edycja, 2004 r., wydany przez Międzynarodową Radę Archiwalną – International Council on Archives) [21].


Traugott Koch zestawił listę słowników kontrolowanych, tezaurusów i tablic klasyfikacyjnych [48]. TASI (Technical Advisory Service for Images) Controlling your language – links to metadata vocabularies [49] dostarcza linków do ponad 60 źródeł słownikowych.
Ontologie ZAKRES

Ontologię można opisać jako formalny opis obiektów i ich wzajemnych zależności. (zob. Technologie i infrastruktura, gdzie zawarte są również informacje dotyczące sieci semantycznej oraz RDF).


Identyfikacja obiektu ZAKRES

Głównym powodem, dla którego ludzie przypisują zasobom niepowtarzalne identyfikatory jest możliwość jednoznacznego odniesienia się do zasobu. Muszą więc polegać na tym, że identyfikatory są unikatowe (tj. ten sam identyfikator nie jest przypisany innym zasobom) i trwałe (tj. odnoszą się stale do tego samego zasobu – jak długo będzie to trwało może być zależne od kontekstu i natury zasobu). Może być również wymagane wykorzystanie identyfikatora do zdobycia dostępu do zasobu, tj. identyfikator może być rozpoznany w zależności od usługi do bieżącej lokalizacji źródła.


Przykłady niepowtarzalnych identyfikatorów zawierają:


  • DOIs (Digital Object Identifiers) [50];

  • URNs (Universal Resource Names) [51];

  • PURLs (Persistent Uniform Resource Locators) [52];

  • Handles [53];

  • ARKs (Archival Resource Keys) [54].

Paul Miller napisał przystępny artykuł wyjaśniający problem niepowtarzalnych identyfikatorów (Paul Miller: I am a name and a number. Ariadne, issue 24, 21 stycznia 2000 [55]. Międzynarodowa Rada Muzealna (International Council of Museums; ICOM) wydała w 1995 International Guidelines for museum Object Information: the CIDOC Information Categories [56] (patrz także Ochrona danych cyfrowych).


Perspektywy ZAKRES
W przyszłości ludzie będą otoczeni przez inteligentne, odpowiedzialne i solidne maszyny zdolne do kontaktowania się z nimi jak osoby. Zakres technologii opisany w niniejszych wytycznych istnieje juz teraz, ale ich dojrzała interakcja jest wciąż tylko w sferze wyobraźni. W krótkim czasie będzie oddziaływać na każdy aspekt życia: na domy, szkoły, hotele, samochody, samoloty. Efekt jej działania na instytucje kulturalne będzie dalekosiężny.
W związku ze wzrostem siły systemów liczących, można przechowywać większe ilości informacji, tj. metadanych opisujących wiele milionów obiektów. Umożliwi to udostępnienie dużych współpracujących katalogów.
Możliwe będzie również przechowywanie bardziej złożonych opisów, aby pomieścić np. drugą edycję standardu dla Museum Documentation Association Spectrum, który jest spisem liczącym setki plików. Prawdopodobnie metadane sektora kulturowego będą się rozwijać z ustrukturalizowanych statycznych katalogów do złożonych wolnotekstowych opisów zawierających interpretacje lub odpowiedzi adekwatne do obiektów.

BIBLIOGRAFIA ZAKRES


[1] Gill, Tony and Miller, Paul: Re-inventing the Wheel? Standards, Interoperability and Digital Cultural Content . D-Lib Magazine, Volume 8 Number 1, January 2002. http://www.dlib.org/dlib/january02/gill/01gill.html
[2] TASI (Technical Advisory Service for Images): Metadata and Digital Images. 2002-2004.

http://www.tasi.ac.uk/advice/delivering/metadata.html
[3] Machine Readable Cataloguing (MARC): MARC 21

http://www.loc.gov/marc/
[4] Dublin Core Metadata Element Set, Version 1.1

http://dublincore.org/documents/dces/
[5] Hillman, Diane: Using Dublin Core. 2003.

http://dublincore.org/documents/usageguide/
[6] Online Archive of California Best Practice Guidelines for Digital Objects (OAC BPG DO), Version 1.0, prepared and maintained by the Online Archive of California Working Group, January 2004.

http://www.cdlib.org/inside/projects/oac/bpgdo/
[7] PREMIS (PREservation Metadata: Implementation Strategies)

http://www.oclc.org/research/projects/pmwg/
[8] RLG zestaw 16 podstawowych elementów do wspomagania zachowania ; http://www.rlg.org/preserv/presmeta.html
[9] Model referencyjny dla Open Archival Information Service (OAIS)

http://ssdoo.gsfc.nasa.gov/nost/isoas/
[10] Lavoie, Brian F.: Implementing Metadata in Digital Preservation Systems: the PREMIS Activity in D-Lib Magazine, April 2004, Volume 10 Number 4. ISSN 1082-9873. http://www.dlib.org/dlib/april04/lavoie/04lavoie.html
[11] Day, Michael: Preservation Metadata. Prepublication draft of chapter published in: G. E. Gorman and Daniel G. Dorner (eds.), Metadata applications and management, International Yearbook of Library and Information Management, 2003-2004, London: Facet Publishing, 2004, pp. 253-273. ISBN 1-85604-474-2 (Facet Publishing); ISBN 0-8108-4980-1 (Scarecrow Press).
http://www.ukoln.ac.uk/metadata/publications/iylim-2003/
[12] NISO Z39.87-2002 AIIM 20-2002 Data Dictionary - Technical Metadata for Digital Still Images

http://www.niso.org/standards/resources/Z39_87_trial_use.pdf
[13] Projekt Indecs http://www.indecs.org/
[14] Metadata Encoding and Transmission Standard (METS)

http://www.loc.gov/standards/mets/
[15] IMS Content Packaging Specification

http://www.imsproject.org/content/packaging/
[16] IEEE Learning Object Metadata standard

http://ltsc.ieee.org/wg12/par1484-12-1.html
[17] IMS Global Learning Consortium http://www.imsproject.org/
[18] CETIS (Centre for Educational Technology Interoperability Standards http://www.cetis.ac.uk/
[19] ISO 19115:2003 Geographic information – Metadata

http://www.iso.ch/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=26020&ICS1=35&ICS2=240&ICS3=70
[20] International Standard for Archival Description (General) (ISAD(G). Second Edition. http://www.ica.org/biblio/isad_g_2e.pdf
[21] ISAAR (CPF) (International Standard Archival Authority Record for Corporate Bodies, Persons and Families), 2nd ed. 2004
http://www.ica.org/biblio.php?pdocid=144
[22] EAD (Encoded Archival Description) http://www.loc.gov/ead/
[23] EAC (Encoded Archival Context) http://www.library.yale.edu/eac/
[24] EAD Help Pages – Metadata

http://www.iath.virginia.edu/ead/metadata.html
[25] International Committee for Documentation of the International Council of Museums (ICOM-CIDOC): Museum documentation : standards and guidelines

http://www.willpowerinfo.myby.co.uk/cidoc/stand3st.htm

CIDOC CRM (CIDOC Conceptual Reference Model)



http://cidoc.ics.forth.gr/index.html
[26] SPECTRUM, the UK Museum Documentation Standard, 2nd Edition

http://www.mda.org.uk/spectrum.htm
[27] Getty Research Institute, Categories for the Description of Works of Art (CDWA) http://www.getty.edu/research/conducting_research/standards/cdwa/
[28] UK mda (Museums Documentation Association) factsheets

http://www.mda.org.uk/facts.htm
[29] IFLA Digital Libraries: Metadata Resources

http://www.ifla.org/II/metadata.htm
[30] GILS (Government Information Locator Service/Global Information Locator) http://www.gils.net/about.html
[31] Dublin Core Metadata Initiative (DCMI): Government Working Group. http://dublincore.org/groups/government/
[32] e-gif (Electronic Government Interoperability Framework)

http://www.govtalk.gov.uk/schemasstandards/egif.asp
[33] e-gms (Electronic Government Metadata Standard)

http://www.govtalk.gov.uk/schemasstandards/metadata.asp
[34] UK e-Government Unit

http://e-government.cabinetoffice.gov.uk/Home/Homepage/fs/en
[35] Dublin Core Metadata Element Set (DCMES)

http://dublincore.org/documents/dces/
[36] DC.Culture http://www.minervaeurope.org/DC.Culture.htm
[37] UKOLN Collection Description Focus http://www.ukoln.ac.uk/cd-focus/
[38] Minerva: Deliverable D3.1: Inventories, discovery of digitised content & multilingual issues: Report analysing existing content

http://www.minervaeurope.org/intranet/reports/D3_1.pdf;
[39] JISC Information Environment Architecture Functional Model

http://www.ukoln.ac.uk/distributed-systems/jisc-ie/arch/functional-model/.
[40] Research Support Libraries Programme (RSLP) Collection Description schema http://www.ukoln.ac.uk/metadata/rslp/
[41] Minerva: Deliverable D3.2: Inventories, discovery of digitised content & multilingual issues: Feasibility survey of the common platform

http://www.minervaeurope.org/intranet/reports/D3_2.pdf
[42] Dublin Core Collection Description Application Profile

http://www.ukoln.ac.uk/metadata/dcmi/collection-application-profile/2004-08-20/
[43] Library of Congress Subject Headings

http://www.loc.gov/catdir/cpso/lcco/lcco.html
[44] ISO 2788, 1986 Guide to establishment and development of monolingual thesauri http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=7776
[45] ISO 5964, 1985 Guide to the establishment and development of multi-lingual thesauri

http://www.iso.ch/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=12159
[46] Getty Art and Architecture Thesaurus

http://www.getty.edu/research/conducting_research/vocabularies/aat/
[47] Getty Thesaurus of Geographic Names

http://www.getty.edu/research/conducting_research/vocabularies/tgn/
[48] Controlled vocabularies, thesauri and classification systems available in the WWW. DC Subject. Compiled by Traugott Koch.

http://www.lub.lu.se/metadata/subject-help.html.
[49] TASI (Technical Advisory Service for Images): Controlling your language - links to metadata vocabularies. http://www.tasi.ac.uk/resources/vocabs.html
[50] DOIs (Digital Object Identifiers) http://www.doi.org/
[51] URNs (Universal Resource Names) http://www.ietf.org/rfc/rfc1737.txt
[52] PURLs (Persistent Uniform Resource Locators) http://purl.oclc.org/
[53] Handles http://www.handle.net/introduction.html
[54] ARKs (Archival Resource Keys) http://www.cdlib.org/inside/diglib/ark/
[55] Miller, Paul: I am a name and a number. In Ariadne, issue 24, 21st June 2000. http://www.ariadne.ac.uk/issue24/metadata/intro.html
[56] International Committee for Documentation of the International Council of Museums (ICOM-CIDOC): International Guidelines for Museum Object Information : the CIDOC Information Categories

http://www.willpowerinfo.myby.co.uk/cidoc/guide/
LINKI ZAKRES
Międzynarodowe
SEPIA (Safeguarding European Photographic Images for Access)

Projekt stworzony przez Unię Europejską opracował otwarty model oraz odpowiednie oprogramowanie (SEPIADES) do opisania i skatalogowania fotografii analogowych i cyfrowych. http://www.knaw.nl/ecpa/sepia/workinggroups/wp5/cataloguing.html


MICHAEL (Multilingual Cultural Inventory of Europe)

Projekt definiuje standardy dla opisu na poziomie zbiorów zasobów dziedzictwa kulturowego. Dostarczy usług do wykrywania zasobów (discovery); będą one dostępne w 2005-2006 roku. http://www.michael-culture.irg/index.html


Czechy
ProMuS (Prohlizec muzejnich sbirek)

ProMuS jest opracowywany dla prezentowania zbiorów i muzealnych oraz innych. Jest oparty na skryptach PHP i bazie danych MySQL. Instytucja może zdefiniować sposób prezentacji danych dla użytkownika do czego potrzebna ogólna mała znajomość programowania html. Dane i tabele są importowane w formacie tekstowym co pozwala na import danych prawie z każdego źródła. Do systemu mogą być dodawane obrazki. http://www.mzm.cz/promus


Norwegia
Detektor

Przeszukiwalny opisany katalog tematyczny zasobów Internetowych, wyselekcjonowany i oceniony przez bibliotekarzy w Bibliotece Publicznej w Oslo. Rozwiązanie techniczne zostało dostarczone przez Linux Communications AS. Korzysta ono z bazy danych MySQL działającej na linuksowym serwerze. Detektor zawiera zasoby norweskie, duńskie, szwedzkie, angielskie oraz w innych językach. Do opisania zasobów zostały użyte elementy Dublin Core z lokalnymi poprawkami. http://detektor.deichman.no/


Samkatalog for privatarkiv

Internetowa baza danych dająca użytkownikom dostęp do informacji na temat nie publicznych danych w instytucjach archiwalnych w całym kraju. Było to możliwe przy wykoryrzystaniu norweskiego standardu opisu archiwalnego zdefiniowanego przez oprogramowanie Asta. http://www.riksarkivet.no/samkat/


URN-generator

Dostarczenie unikalnego norweskiego URNs jest nową usługą z Norweskiej Biblioteki Narodowej. URNs (Uniform Resource Names) umożliwia, identyfikację dokumentów internetowych. URN przypisany do dokumentu jest trwały i unikalny i nie zmieni się tak długo, jak zawartość intelektualna pozostanie taka sama, nigdy również nie zostanie wykorzystany powtórnie ani nie zostanie przekazany innemu dokumentowi. URN może być wykorzystywany pozyskiwaniu informacji internetowej na różne sposoby. Usługa wspomagania przez system odwzorowania adresu (resolution) będzie w stanie zamienić URN w URL lub metadane związane z dokumentem. http://www.nb.no/html/standardnummerering.html


Polska
MONA

725,000 obiektów muzealnych (dzieł sztuki) od antyku do sztuki współczesnej opisano przy użyciu standardu CIMI description standards. Standardowy plik zawiera również rezultaty badań przy użyciu specjalnych (chemicznych, biologicznych i biofizycznych) technik konserwacji na obiektach muzealnych http://www.mnw.art.pl


Rosja
Kolekcje muzeum rosyjskiego

Unikatowość tego projektu polega na kompleksowym podejściu do tworzeniai wielozadaniowego muzealnego systemu informacyjnego. Obecność sieci dostarcza możliwości dla personelu do wymiany informacji i współpracy przy tworzeniu tezaurusa. http://www.collections.spb.ru


Serbia i Czarnogóra
CKP – Centralny Katalog Morski Montenegro

Baza obejmująca jednocześnie materiały bibliotek i archiwów odnoszące się do spraw związanych z morzem ogólnie, a w szczególności spraw dotyczących zatoki Boka Kotorskaod, od najstarszych zachowanych dokumentów do najbardziej współczesnych materiałów i publikacji znajdujących się we wszystkich typach blibliotek i archiwów w Czarnogórze (państwowych, kościelnych i prywatnych).



http://www.dacg.cg.yu; http://www.matf.bg.ac.yu/iak
Spain
Spis Archiwów i Zespołów Archiwalnych Andaluzji : CENSARA i CENFOCOA

Informacje na temat lokalnych archiwów i zbiorów związanych z dziedzictwem kulturowym są przesyłane przez archiwistów przy użyciu formatów, są dostępne w Internecie. Nowym sposobem użycia technologii jest to, że jest pierwszy projekt w regionie, który zaadoptował międzynarodowy standard ISAD(G).


http://www.juntadeandalucia.es/cultura/aga
Fichero de Autoridades de Aragón

Celem tego projektu jest stworzenie kartotek wzorcowych obejmujących osoby, rodziny, instytucje i miejscowości. Partnerzy mogą kopiować i aktualizować rekordy haseł wzorcowych za pomocą powiązanych baz danych.


http://www.anabad.org/gtaa/
Ukraina
Kirovohrad Regional Universal Research Library named after D.Chizhevsky: Dublin Core Metadata Project

Darmowa aplikcja online umożliwiająca konwersję metadanych w HTML do standardu Dublin Core. Następnie dane są konwertowane przy użyciu Editor-Convertor do wymienionego formatu opisu bibliograficznego UNIMARC. Dane można zapisać na dysku lokalnym w postaci pliku w standardzie ISO-2709 i eksportować do różnch bibliograficznych baz danych.



http://www.library.kr.ua/dc/dcproje.html; http://www.library.kr.ua/dc/dceditunie.html
Mental Tree: Ukrainian Information Resources for Education and Science

Uniwersalna hierarchiczna baza danych opracowana przez Instytut Studiów Ochrony Pamięci Kulturowej w Ministerstwie Kultury i Sztuki Ukrainy. Program wspomaga wizualna reprezentację danych z których RTF, bitmapy, grafika wektorowa, pliki dźwiękowe i wideo mogą być przechowywane/ Projekt zabezpiecza dane w różnych formatach multimedialnych (tekst, grafikę, wideo, audio, materiały wizualne) online. Największą zaletą bazy danych jest to, że użytkownik może manipulować wizualnie zbiorami danych. http://www.myslenedrevo.com.ua


Wielka Brytania
Access to Archives

Baza danych A2A zawiera katalogi opisujące kolekcje archiwalne, przechowywane w Anglii przez 352 archiwa (record offices) i inne repozytoria archiwalne.



http://www.a2a.org.uk/default.asp
SEAX

SEAX został opracowany w Essex Record Office (ERO). Został podzielony na dwie zgodne części Explorer oraz Public Access Module (PAM). Używając Explorer'a archiwiści mogą mieć dostęp, mogą katalogować indeksować i zachowywać dokumenty. Explorer daje też możliwość zarządzania rekordami indeksu i tworzeniem powiązań między terminami przy użyciu tezaurusa. Część katalogowa jest kompatybilna z ISAD(G). Explorer daje możliwość zachowania każdego obrazu bądź obrazów dla każdej referencji katalogowej, co może być oglądane przez PAM. SEAX pozwala zarządzać wieloma procesami: dostępem, katalogowaniem, indeksowaniem, tezaurusem, przechowywaniem dokumentów oraz tworzeniem przeszukiwalnych baz danych z ułatwieniami dla dodawania obrazów do dokumentów które będą przeglądane. http://seax.essexcc.gov.uk/


Powrót do spisu treści


Calimera – Poradnik

Wykrywanie i pobieranie zasobów



ZAKRES


Rozdział ten obejmuje następujące zagadnienia:

Współdziałanie

Wyszukiwarki

Listy rekomendowanych stron

Bramy, węzły i portale

Przeszukiwanie

Grupy” (Clumps)

Pobieranie obrazów

Harvesting

Sieć semantyczna

ZAGADNIENIA STRATEGICZNE ZAKRES
Biblioteki działają w sieciowym środowisku informacyjnym i, w coraz większym stopniu, również muzea i archiwa. Pojawienie się Internetu oznacza, że nawet najmniejsze muzeum, filie biblioteki lub archiwów mogą mieć teraz dostęp do ciągle rosnących zasobów informacji cyfrowych dostępnych w sieci. Idea społeczeństwa opartego na wiedzy, kształceniu ustawicznym, a także rosnąca tendencja do kontaktowania się z władzami za pomocą środków elektronicznych, sprawiają, że łatwy dostęp do informacji staje się coraz ważniejszy dla wszystkich obywateli.
Wiele instytucji samodzielnie tworzy zasoby cyfrowe – czy to będą ich własne strony internetowe, czy nowe zasoby multimedialne, czasami finansowane przez konkretne programy dygitalizacji (zob. Dygitalizacja i Modele biznesowe). Instytucje muszą wiedzieć, jak te nowe zasoby powinny być opisane, tak aby były łatwe do odnalezienia przez użytkownika i zdolne do współdziałania z innymi zasobami cyfrowymi. W dużym stopniu jest to zależne od sposobu opisu zawartości tak więc te wytyczne powinny być czytane jednocześnie z wytycznymi do Opisu zasobów.

Dane naukowe jak również dane nie potwierdzone naukowo wykazują, że większość ludzi używa wyszukiwarek typu Google do odnalezienia informacji, gubiąc znaczne ilości informacji znanej jako „Deep Web”, zawierającej bazy danych bibliotek, archiwów i muzeów. Problem ten zaczyna teraz narastać, w związku z czym muzea, biblioteki i archiwa muszą go rozwiązać.


Technologie i standardy w tej dziedzinie ciągle są w fazie rozwoju i nieustannie będą podlegać zmianom i dalszemu rozwojowi. Instytucje muszą na bieżąco śledzić postęp w omawianym zakresie, aby uniknąć użycia niewłaściwych lub przestarzałych technologii czy też standardów.
Wiedza ta pomoże im w planowaniu i określaniu priorytetów działalności, szczególnie zaś wówczas gdy będą nabywać nowe systemy lub gdy będą zlecać prace rozwojowe zewnętrznym konsultantom/wykonawcom. W celu przejrzenia informacji na temat pobierania informacji, patrz: Challenges in information retrieval and language modelling, autorstwa Jamesa Allena [1]

WYTYCZNE DOBREJ PRAKTYKI ZAKRES
Wykrywanie i wyszukiwanie informacji zależy od tego jak jest ona opisana. Wytyczne te powinny być więc czytane w odniesieniu do Opisu zasobów, gdzie omówione są takie kwestie jak metadane, terminologia (słowniki kontrolowane i tezaurusy), oraz identyfikatory. Wiele technik wykorzystanych w wykrywaniu i pobieraniu zasobów jest opisanych w rozdziale: Technologie i infrastruktura.
Współdziałanie ZAKRES

W odniesieniu do zawartości cyfrowej współdziałanie oznacza, że powinna ona być możliwa do ponownego użycia, powinna istnieć możliwość jej przenoszenia, np. między różnymi sieciami, systemami i organizacjami. Kluczem do osiągnięcia tego są standardy – skodyfikowane reguły i wytyczne tworzenia opisu i zarządzania zasobami cyfrowymi (więcej informacji można znaleźć w Reinventing the Wheel? Standards, Interoperability and Digital Content, Tony Gill i Paul Miller [2] [Powtórne wynalezienie koła? Standardy, współdziałania i zawartość cyfrowa]. Możliwość łatwiejszego wykrywania i pobierania informacji z różnych źródeł – katalogów, domen (bibliotek, muzeów i archiwów) i różnych rodzajów zasobów (książki i obiekty muzealne) zależna jest od współdziałania. Jest to obszar dający możliwości pracy z innymi organizacjami, jak np.: szkołami wyższymi, uniwersytetami etc., co zapewnia lepszy dostęp do zasobów (zob. Współpraca i partnerstwo). Partnerzy mogą udzielić zgody na udostępnienie swoich usług dla użytkowników, zapewnić wspólny dostęp do swoich katalogów, utworzyć centralne katalogi, etc. (słowo katalog używane jest tutaj w swoim najszerszym znaczeniu, obejmującym opisy zawartości muzeów i archiwów).


Zasadniczo są dwa podejścia do kwestii wyszukiwania: indeksowanie zawartości zasobu oraz indeksowanie metadanych opisujących zasób (metadane mogą być stworzone przez człowieka lub automatycznie wygenerowane, mogą też być połączeniem obu). Wymagania dla współdziałanie, a skutkiem tego wytyczne dobrej praktyki mogą być różne w zależności od tego, którego mechanizmu poszukuje do wykorzystania dostawca zawartości.
Wyszukiwarki ZAKRES

Kluczem do zasobów każdej biblioteki i archiwum jak również muzeum, jest katalog. Katalogi muzeów mogą nie być udostępniane użytkownikom w taki sam sposób, jak w przypadku bibliotek i archiwów. Jednakże wiele bibliotek i niektóre archiwa oferuje obecnie dostęp do Internetu dla swoich użytkowników, a wiele muzeów zaznacza swoją obecność w Internecie. Biblioteki, muzea i archiwa muszą znaleźć sposób, by pomagać otworzyć te zasoby sieciowe dla swoich użytkowników. Najłatwiejszym sposobem na wykonanie tego jest wskazanie użytkownikom jednej z dostępnych wyszukiwarek. Dostępne są następujące typy przeglądarek:



  • wyszukiwarki tekstowe wyszukujące według słów kluczowych, np. Altavista [3], Google [4];

  • wyszukiwarki oparte na indeksach/katalogach, w których użytkownik porusza się przez serie menu, zawężając kryteria wyszukiwania, np. Yahoo [5];

  • meta/multi wyszukiwarki przeszukują zasoby w więcej niż jednej wyszukiwarce, np. ixquick [6];

  • wyszukiwarki używające naturalnego języka, w których wyszukiwanie rozpoczęte zostaje przez wpisanie zwykłego pytania, np. Ask Jeeves [7].

Są też wyszukiwarki specyficzne tematycznie oraz spersonalizowane.
Google (i inne wyszukiwarki tekstowe) obsługiwane są przez „robota”, który podąża za hyperlinkami znajdującymi się na stronach internetowych, pobierając ich pełen tekst. Następnie tworzone są indeksy tego tekstu, i dostarczane są usługi wyszukiwania oparte na indeksach. Główną zaletą takich usług jest możliwość zaszeregowania algorytmów wykorzystywanych do porządkowania pozycji wśród zestawów wyników wyszukiwania. Najlepszy algorytm Google Page Rank, jest systemem segregowania wyników na stronach wynikowych. Aby upewnić się, że ich zasoby są wykrywane przez Google, dostawca zawartości (content provider) musi rozważyć następujące czynniki (lista niepełna):

  • robot wymaga „punktu startu” z którego może podążać za linkami;

  • robot musi mieć dostęp do stron, które mają być indeksowane – albo sam zasób, albo dokument opisujący zasób – przez HTTP (Hypertext Transfer Protocol) [8],, a więc strony przeznaczone do indeksowania nie powinny skrywać się za kwestiami legalizacji etc. Ponadto, pewne roboty nie podążają za adresami URL zawierającymi parametry etc. Tak więc powinna zostać zbudowana wyszukiwarka „przyjazna” dla URL;

  • adresy URL indeksowanych stron muszą być wiarygodnie i trwale powiązane tak aby, przeglądający podążający za linkami w wynikach wyszukiwania, otrzymywał tą samą stronę która była indeksowana;

  • Strony powinny zawierać rodzaj prosto wbudowanych metadanych wykorzystywanych przez wyszukiwarkę w wyświetlonych wynikach wyszukiwania (tytuł, opis, słowa kluczowe (czasami), etc);

  • Nawet jeśli strona może być indeksowana, jej zaszeregowanie w wynikach wyszukiwania jest poddane algorytmom takim jak Google’s Page Rank [9] – i jeśli istnieje niewiele linków do strony, nie będzie zaszeregowana wysoko.

Z drugiej strony, wykrywanie oparte na metadanych, jest zdane na dostawcę zawartości wyświetlającego rekordy metadanych dla harwestingu albo przeszukiwania w czasie rzeczywistym przez dostawcę wykrywania zasobu. Dostawca zawartości i usługi muszą się porozumieć co do (lista nie jest wyczerpująca):



  • użycia protokołu transportu dla wymiany informacji;

  • języka wyszukiwawczego;

  • schematu metadanych;

  • kwestii praw autorskich (jak dostawca usługi użyje/zaprezentuje metadane);

  • kwestii uwierzytelniania/ autoryzacji.

Jakość serwisu może również zależeć od jakości i składu matadanych, kiedy pochodzą od różnych dostawców zawartości.
Pewne wyszukiwarki dostarczają również alternatywnych sposobów wyszukiwania, jak „wyszukiwanie proste”, gdzie przeglądający wprowadza słowa kluczowe, oraz „wyszukiwanie zaawansowane”, gdzie użyta może być logika Boole’a, skracanie etc. Lepsze wyniki uzyskuje się w ostatnim przypadku. Innym przykładem narzędzi wyszukiwarki jest Google Directory [4], który umożliwia wyszukiwanie tematyczne, oraz Google Local [4], umożliwiający przeszukiwanie informacji lokalnych (obecnie działający jedynie w USA i Kanadzie, ale są plany rozszerzenia tej usługi).
Pełną listę wyszukiwarek różnych typów i więcej informacji na ten temat można znaleźć na stronach Phila Bradley’a [10] oraz Search Engine Watch [11]. Podają one informacje o sposobach przeszukiwania sieci, analizują gałąź technologii informacyjnej zajmującą się wyszukiwaniem informacji i zamieszczają pomoc dla właścicieli stron internetowych na temat tego, jak skutecznie zostać znalezionym w sieci.


Listy rekomendowanych stron ZAKRES

Instytucje mogą udzielać użytkownikom dalszej pomocy poprzez tworzenie list przydatnych stron. Zazwyczaj zostają one wcześniej ocenione zgodnie z pewnymi kryteriami jakości (użyteczną metodę oceny i jakości opracowano w projekcie Desire w Information Gateways Handbook [12]) i często stosują klasyfikację stron według tematu. Dobrym przykładem tego jest Sieć Wykrywania Zasobów (Resource Discovery Network; RDN[13]). Prowadzenie i uaktualnianie takiej listy może pochłaniać dużo czasu. Instytucje mogą rozważyć celowość współdziałania przy układaniu i zarządzaniu podobnymi listami. Wspólny Serwis Katalogowy Zasobów Online (Integrated Cataloging Service, Connexion) opracowany przez OCLC[14],, jest dobrym przykładem inicjatywy współpracy przy tworzeniu opisów stron WWW (zob. też portale ).

Bramy, węzły i portale ZAKRES

Rozróżnienie między bramą, węzłem a portalem jest raczej nieostre, ale zazwyczaj brama czy węzeł składa się z zestawów zaopatrzonych w linki do innych stron, które zostały już sprawdzone przez twórców bramy. Użytkownicy otrzymują zestawy menu, które prowadzą ich od terminów najbardziej ogólnych do bardziej szczegółowych. Witryny takie są niezwykle użyteczne dla naukowca poszukującego materiałów, ponieważ oszczędzają mu oglądania strony po stronie na dany temat w poszukiwaniu jednej lub dwóch, które byłyby przyzwoitej jakości. Portale zaś łączą w jednym miejscu aktualną zawartość z rozproszonych źródeł przy użyciu np. harvestu, przeszukiwania czy metaprzeszukiwania i przedstawiają ją użytkownikowi w formie połączonej. Mogą też oferować możliwość dokonywania różnych transakcji, zakupów online.


Ponieważ nie ma możliwości przedstawienia pełnej listy bram, poniżej podano kilka przykładów:



  • Ogólne Yahoo [15], zestawy menu obejmujących całą sieć WWW;

  • rządowe: Directgov [16] – lista witryn rządu brytyjskiego i samorządów lokalnych ułożona alfabetycznie i tematycznie; Premier Ministre [17] – brama do agend rządu francuskiego;

  • akademickie: – Sieć Wykrywania Zasobów (RDN) [13] ustanowiona w celu wsparcia sektora szkolnictwa wyższego w Wielkiej Brytanii. RDN jest w istocie siecią pojedynczych bram lub węzłów, z których każdy obejmuje jeden temat. Jest ona nadal rozwijana przez Subject Portals Project (SPP) [18]; ARL Scholars Portal Project [19], dąży do dostarczenia społeczności akademickiej oprogramowania narzędziowego w celu stworzenia pojedynczego punktu dostępu w sieci. Umożliwi to odszukiwanie zasobów informacji o wysokiej jakości oraz w znacznej mierze, dostarczenie informacji i pokrewnych usług bezpośrednio na pulpit użytkownika; Infomine: Scholary Internet Collections [20];

  • muzea: 24 Hour Museum [21]; Portal Holenderskich Muzeów (Dutch Museums Portal [22]; Portal Muzeum Łotewskiego ( Latvian Museum Portal [23])




  • biblioteki: Portal Bibliotek UNESCO [24]; Bibliotekarski Indeks do Internetu (Librarian’s Index to the Internet) [25];

  • archiwa: UNESCO archives portal [26]; Portal Brytyjskich Archiwów Państwowych [27]; A2A (Access to Archives) [28], angielski element sieci archiwów brytyjskich;

  • Culture [29]: europejski portal kulturalny Komisji Europejskiej;

inne: Infobel [30] – zestaw linków do spisów telefonów online.
Dostępne jest wyspecjalizowane oprogramowanie wspomagające opracowanie i prowadzenie bram tematycznych, np. organizacja i wykrywanie zasobów w serwisach tematycznych (Resource Organisation And Discovery in subject-based services); ROADS [31]. Przedsiębiorstwa komercyjne także oferują oprogramowanie bram i portali np. Vignette [32], SAP Portal [33], Plumtree [34], ZPORTAL [35] etc. Niektóre instytucje dziedzictwa kulturowego zaczynają organizować swoje własne bramy i portale – np. do wspomagania „grup” (clumps), lokalnych serwisów informacyjnych i do celów edukacyjnych.
Przeszukiwanie ZAKRES

Przeszukiwanie umożliwia wyszukiwanie kilku baz danych w tym samym czasie. W przeszukiwaniu międzydomenowym (cross-domain) użytkownicy zdobywają dostęp do bogatego wyboru zasobów informacji przez jeden interfejs wyszukiwawczy. Na przykład, w trakcie jednego poszukiwania na interesujący temat, użytkownik może odszukać książki, rekordy archiwalne i informacje na temat towarzystw i obiektów muzealnych. Do sposobów przeszukiwania należą:



  • eksport wszystkich informacji do nowej bazy danych przy użyciu np. oprogamowania SOAP [36], czy harvestu. Sposób ten obejmuje wysyłanie wszystkich istniejących informacji w pewnych określonych formatach tak, aby umożliwić ich załadowanie do jednej centralnej bazy danych. Mogą się pojawić tutaj pewne trudności, np.:

  • otrzymanie zgody od każdego właściciela/menedżera źródła danych;

  • radzenie sobie z wieloma różnymi dostawcami systemów;

  • radzenie sobie z różnicami w strukturze danych, w szczególności w przypadku źródeł pochodzących z różnych domen (zob. Opis zasobów);

  • przeprowadzanie regularnych aktualizacji.

  • przeszukiwanie rozproszone. Bazy danych pozostają w takiej formie, w jakiej istnieją, a do przeszukiwania baz wykorzystywana jest jedna wyszukiwarka, na przykład przy wykorzystaniu protokołu Z39.50. Trudności związane z tym systemem pochodzą głównie z różnej struktury, dziedziny danych etc., w szczególności, gdy dotyczą baz danych informacji lokalnych;

  • łączenie baz danych w celu przeszukiwania przez wspólny portal. Trudności z tym związane ponownie wiążą się ze strukturą danych, bo rzadko wspólnie występuje wiele obszarów poszukiwań.

Przeszukiwanie będzie ułatwione, gdy:



  • wszyscy dostawcy serwera Z39.50 wprowadzą w życie wspólny profil (tj. Bath Profile [37]);

wszystkie domeny będą wykorzystywały Dublin Core do mapowania wspólnej struktury różniących się standardami metadanych (włączając bazy danych informacji lokalnych, gdzie nie istnieje jeszcze standard opisu i przechowywania danych; Marc 21 [38] posiada jeden, ale nie jest szeroko wykorzystywany; projekt CASP (CASP (Community Advice, Seamless Portals) rekomenduje Dublin Core).

Z39.50 jest międzynarodowym protokołem przeszukiwania i pobierania (ISO 23950:1998 [40]), pozwalającym na przeszukiwanie (zwykle zdalne) heterogenicznych baz danych i pobieranie danych, za pomocą jednego interfejsu użytkownika. Z39.50 definiuje standardowy sposób komunikacji i dzielenia się informacją przez dwa komputery. Przeznaczony do wspomagania przeszukiwania i pobierania informacji – dokumentów pełnotekstowych, danych bibliograficznych, obrazów i multimediów – jest oparty na architekturze klient-serwer i jest w pełni funkcjonalny podczas pracy w Internecie. Pozwala użytkownikom na przeszukanie kilku katalogów lub innych baz danych w jednym zintegrowanym procesie przeszukiwania. Uwaga: do czasu dalszej ewolucji języka zapytań XML, Z39.50 może nadal być preferowanym protokołem przeszukiwania i pobierania dla systemów oferujących kompleksowe wyszukiwanie rozproszone.


SRW (Search/Retrieve Web Service) określa usługę internetową przeznaczoną do przeszukiwania baz danych zawierających metadane i obiekty zarówno tekstowe jak i nie tekstowe. Inicjatywa SRW (SRW Inititiative) wykorzystuje Z39.50 razem z technologią stron internetowych [41].
Grupy Clumps ZAKRES

Clumps to grupa baz danych posiadających wspólne cechy tj. grupę dających się przeszukiwać katalogów Z39.50 grupy instytucji, zazwyczaj muzeów, bibliotek i/lub archiwów. Ważnym elementem większości grup jest to, że instalują one bramę lub portal zawierające mechanizm umożliwiający użytkownikom przeszukiwanie baz danych lub katalogów wszystkich uczestniczących instytucji. Dynamiczne grupowanie oznacza automatyczne generowanie różnych mini-grup przeznaczonych do przeszukiwania, innymi słowy mechanizm do pomocy w nawigacji w dużych roproszonych grupach. Na przykład wyszukane mogą być tylko katalogi specyficzne dla danego tematu. Dla osiągnięcia tego celu grupa musi przyjąć wspólny system metadanych, na którym będą mapowane różne profile używane przez członków konsorcjum. Opracowano wiele systemów metadanych specjalnie dla wspomagania takich działań, np. Bath Profile [37] i ONE-2 Profile [42]. Problemem może być licencjonowanie i ochrona praw autorskich różnych zasobów elektronicznych udostępnianych przez grupę.


Bramy, portale i grupy mogą być wykorzystywane w celu wspierania usług nauczania oraz usług informacyjnych, takich jak informacja lokalna.
Pobieranie obrazów ZAKRES

Do niedawna wyszukiwanie obrazów odbywało się za pomocą deskryptorów tekstowych lub kodów klasyfikujących obsługiwanych w niektórych przypadkach przez pakiety do wyszukiwania tekstu zaprojektowane lub przystosowane specjalnie do obsługi obrazów. AAT - Art and Architecture Thesaurus [43]- składa się ze 120 tys. terminów do opisu obiektów, materiałów teksturalnych, obrazów, architektury i obiektów dziedzictwa kulturowego. Obrazy można także klasyfikować za pomocą systemów, takich jak ICONCLASS [44] dla dzieł sztuki i eksponatów muzealnych, oraz Social History and Industrial Classification dla obiektów muzealnych[45].


Bardziej nowoczesne systemy mogą obecnie pobierać obrazy, które nie zostały werbalnie opisane. Systemy CBIR (Content Based Image Retrieval) nie wykorzystują indeksowania za pomocą słów kluczowych. Obraz jest wyszukiwany raczej przy użyciu pierwotnych cech samego obrazu, takich jak barwa, tekstura lub kształt, np. scena na plaży będzie niebieska u góry i żółta na dole. Prowadzona jest dyskusja techniczna nad różnymi rodzajami systemów CBIR (patrz: Eakins John P. I Graham Margaret E.: Content-based Image Retrieval: a report to the JISC Technology Applications Programme [46]). Istnieją systemy komercyjne CBIR-u, np. QBIC (Query by Image Content) produkcji IBM [47], w którym obraz jest opisywany ze względu na obszary barwy i kształtu, a program pobierający wykonuje operację wyszukiwania obrazów pasujących do opisu. Nie jest konieczne precyzowanie, jaki jest temat obrazu. Przykład takiego systemu – Excalibur’s Image Retrieval Ware znajduje się na stronie Ermitażu (patrz: linki). BT Exact opracował prototypowy system nazywany Shopping Garden [48] wykorzystujący interaktywne techniki przeglądania, przedstawiający użytkownikowi wybór obrazów oraz śledzący preferencje wskazane przez użytkownika przy odnajdywaniu wymaganego obrazu.
Porady na temat wyszukiwaniazasobów znajdują się w Searching for and Retrieving Digital Images. TASI (Technical Advisory Service for Images) Advice Paper, 2002 [49].

Harvesting (Zbieranie informacji o strukturze i zawartości stron WWW) ZAKRES

Oprogramowanie Harvest jest sposobem zbierania lub gromadzenia informacji o metadanych z listy wcześniej określonych źródeł internetowych, np. stron internetowych organizacji uczestniczących. W projekcie Seamless (zob. Linki). Harvest tworzy plik indeksowy, który jest przeszukiwany w odpowiedzi na zapytanie zgłoszone przez użytkownika. Wyniki są następnie integrowane z wynikami przeszukiwania za pomocą Z39.50 i przedstawiane użytkownikowi jako jedna „lista trafień”. Kliknięcie na dowolny rezultat powoduje otwarcie albo odpowiedniej strony WWW (dla zebranych informacji), albo rekordu bazy danych (dla rekordów Z39.50).


Harvesting leży u podstaw projektu o nazwie Inicjatywa Archiwum Otwartego (OAI) [50], który jest wspólnym przedsięwzięciem mającym na celu ułatwienie odnajdywania informacji w sieci poprzez opracowanie i zastosowanie standardów współdziałania. OAI opracował prosty protokół (OAI Protocol for Metadata Harvesting, OAI-PMH [51], który wspiera regularne gromadzenie metadanych z jednego serwisu przez drugi. W Wielkiej Brytanii OAI-PMN spotkał się ze znacznym zrozumieniem w sektorze kulturalnym odnosząc sukcesy w efektywnościwykrywania zasobów przez bramy tematyczne oraz przez wykrywanie zasobów sieciowych takich jak RDN (Resource Discovery Network) w Wielkiej Brytanii. Jednym powodem sukcesu jest to, że OIA-PMH jest dostatecznie łatwy we wdrażaniu przez instytucje kulturalne prowadzące usługi internetowe, ponieważ oparty jest na powszechnie znanych standardach bazowych WWW (HTTP, XML i schematy XML). Operacje wspierane przez OIA-PMH pozwalają instytucjom kulturalnym działać na zasadzie dostawcy danych oraz umożliwiają dostawcom usług prosić o kopie wszystkich jego metadanych, albo o tylko niektóre z metadanych, jak np. o rekordy które były zmodyfikowane od określonego czasu. Instytucje kulturalne mogą udostępniać swoje metadane dla harwestu przez organizowanie repozytoriów metadanych podległych OAI. Obowiązkowym minimalnym wymogiem dla OIA-PMH jest Dublin Core w formie niekwalifikowalnej, ale instytucje kulturalne powinny rozważyć wprowadzenie w życie schematu Dublin Core Culture, co wspomoże wykrywanie zasobów. Instytucje, które wprowadzają repozytoria metadanych OIA powinny załączyć oświadczenie, aby zapewnić, że są nadal w posiadaniu praw własności do tych metadanych. Więcej informacji można znaleźć w Open Archives Initiative – Protocol for Metadata Harvesting: practices of cultural heritage actors, wydane przez Foulonneau, Muriel, wrzesień 2003 [52], oraz na stronie internetowej UKOLIN’a FAQ [53].
Inicjatywa Archiwum Otwartego będzie ułatwiać rozwój bibliotek cyfrowych dla sektora dziedzictwa kulturowego, które zgromadzi zawartość kulturalną instytucji pamięci i doda usługi dla nowego audytorium. Prowadzi to do rozwoju społeczności dostawców danych, którzy dzielą standardy, zasoby terminologii, zawartość i usługi.
Sieć semantyczna (zob.Technologie i infrastruktura) ZAKRES


Pobieranie 2.67 Mb.

1   ...   14   15   16   17   18   19   20   21   ...   27




©absta.pl 2020
wyślij wiadomość

    Strona główna