Librerie digitali Metadati
Definizione di Metadati I medadati sono dati relativi ai dati Descrivono in modo strutturato proprietà dei dati Esempi di informazioni fornite dai metadati per un generico dato/oggetto memorizzato in una libreria digitale Chi lo ha creato Chi lo possiede Quando è stato creato, digitalizzato, memorizzato,
modificato Cosa descrive, ...
2
1
Utilità dei metadati I medadati servono per Migliorare le ricerche interrogando non solo i dati ma anche i metadati
I metadati spesso contengono delle informazioni che sono contenuti in forma implica nei dati
Facilitare lo scambio di informazioni tra sistemi diversi
Se si utilizzano gli stessi metadati o metadati “compatibili”
3
Metadati Serve associare ai metadati Una sintassi Grammatica del linguaggio usato per rappresentare i metadati
Una semantica Significato dei metadati
4
2
Sintassi Nella vita comune Le regole che governano il modo in cui le parole possono essere messe insieme per formare una frase
La grammatica di una lingua
Nell’informatica Le regole che governano il modo in cui le istruzioni di un linguaggio di programmazione possono essere utilizzate per scrivere un programma
La grammatica di un linguaggio di programmazione 5
Sintassi Nell’informatica Le regole che governano il modo in cui un insieme di tag e delimitatori possono essere utilizzati per rappresentare in modo strutturato dei dati
La grammatica del linguaggio utilizzato per rappresentare i dati
6
3
Sintassi: esempi Dati delimitati da tag HTML, XML dato Dati delimitati da separatori CSV (comma separated values) or Tab delimited Valore_campo1, Valore_campo2, Valore_campo3 Dati descritti tramite l’uso di parole chiave Identificatore del campo seguito dal valore Colore: blue Nome: oggetto 1
7
Tipi di metadati Descrittivi (intellettuali) Descrivono il contenuto dell’oggetto Strutturali Descrivono legami e collegamenti tra dati Amministrativi Dicono chi possiede, dove si trova, chi può accedere ad un certo dato, da dove proviene, ..
Tecnici Descrivono il formato, come è avvenuta la conversione di un dato, ...
8
4
Esempi di standard relativi ai metadati descrittivi USMARC ora noto come MARC21 Metadata Object Description Schema (MODS) Encoded Archival Description (EAD) Text Encoding Initiative (TEI) Federal Geospatial Data Committee (FGDC) Dublin Core (DC) Learning Objects Metadata (LOM) Data Documentation Initiative (DDI) MPEG-7
9
MARC Z39.02 NISO standard approvato nel 1971 MAchine Readable Cataloging Progettato per lo scambio di dati tra sistemi librari (library system) Descrive la sintassi dei record É diventato il metodo comunemente utilizzato per rappresentare i dati internamente in molti sistemi librari 10
5
MARC basato sulle etichette (formato esterno) Author: Lesk, Michael. Title: Understanding digital libraries / Michael Lesk. Edition 2nd ed. Published: Boston : Elsevier, 2004. Description: xxxi, 424 p. : ill., maps ; 24 cm. Notes: "Practical digital libraries, 2nd edition." Notes: Includes bibliographical references (p. 387-411) and index. ISBN: 1558609245 (alk. paper) Subject: Libraries -- United States -- Special collections -- Computer files. Subject: Digital libraries -- United States. Authors: Lesk, Michael. Practical digital libraries. HOLLIS Number: 009552461
11
MARC formato interno FMT LDR 001 003 005 008 010 020 040 043 050 0 0 082 0 0 100 1 245 1 0 250 260 300 500 504 650 0
BK pam 2200289 a 45 0 009552461-4 OCoLC 20050216162853.0 041007s2004 mauab b 001 0 eng |a 2004060982 |a 1558609245 (alk. paper) a DLC |c DLC |a n-us--|a Z692.C65 |b L47 2004 |a 025/.00285 |2 22 |a Lesk, Michael. |a Understanding digital libraries / |c Michael Lesk. |a 2nd ed. |a Boston : |b Elsevier, |c 2004. |a xxxi, 424 p. : |b ill., maps ; |c 24 cm. |a "Practical digital libraries, 2nd edition." |a Includes bibliographical references (p. 387-411) and index. |a Libraries |z United States |x Special collections |x Computer files.
650 0 700 1 994 PST 0
|a Digital libraries |z United States. |a Lesk, Michael. |t Practical digital libraries. |a Z0 |b HLS |0 Z30 |1 009552571000010 |b WID |c HD |o BOOK |e HD | N |r HVD60-011651235 |n 0 |h Z692.C65 |i L47 2004 |4Widener |5 Harvard Depository
12
6
MARC Directory
13
Metadata Object Description Schema (MODS) Creato dalla Library of Congress Sottoinsieme dello standard MARC21 Basato sull’uso di XML Pensato per essere una via di mezzo tra Dublin Core e MARC21 Più di Dublin Core Meno di MARC21 Schema MODS http://www.loc.gov/standards/mods/v3/mods-3-1.xsd 14
7
Encoded Archival Description (EAD) Basato sull’uso di XML Altamente recursivo Ampio insieme di tag Molti sottolivelli per la gestione dei tag Difficile da implementare Schema EAD http://www.loc.gov/ead/tglib/att_gen.html
15
Text Encoding Initiative (TEI) Basato sull’uso di XML Pensato per la descrizione dei testi Libri, riviste Contiene metadati sia descrittivi che strutturali Caratteristiche Molto flessibile Molto complicato Molto dispendioso “marcare” i dati Grande insieme di tag (obbligatori) 16
8
Text Encoding Initiative (TEI)
17
Dublin Core (DC) Realizzato nel 1996 per “portare ordine nel web” Obiettivi Realizzare un semplice standard contenente i metadati necessari per descrivere una qualunque pagina web o un qualunque oggetto accessibile su web
Il nome deriva dal luogo in cui è avvenuto il meeting Dublin Ohio
18
9
I quindici elementi di base (Core Elements) Creator Title Subject Contributor Date Description Format Coverage
Publisher Type Rights Relation Source Language Identifier 19
Dublin Core Caratteristiche principali Tutti gli elementi (tag) sono opzionali Tutti gli elementi possono ripetersi L’ordine in cui compaiono gli elementi è ininfluente
É estensibile É internazionale
20
10
Simple e Qualified Dublin Core Estensibilita del Dublin Core Simple Dublin Core si limita all’uso dei 15
elementi originali Qualified Dublin Core include:
Nuovi elementi Specializzazione/rifinimento degli elementi ...
21
Dublin Core: esempio <metadata xmlns="http://example.org/myapp/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://example.org/myapp/ http://example.org/myapp/schema.xsd" xmlns:dc="http://purl.org/dc/elements/1.1/"> UKOLN UKOLN is a national focus of expertise in digital information management. It provides policy, research and awareness services to the UK library, information and cultural heritage communities. UKOLN is based at the University of Bath. UKOLN, University of Bath http://www.ukoln.ac.uk/ 22
11
DC: Resource Model
http://dublincore.org/documents/abstract-model/#sect-2
23
DC: Description Model
http://dublincore.org/documents/abstract-model/#sect-2
24
12
Learning Objects Metadata (LOM) LOM è usato nell’ambito dell’ e-learning La presentazione e i dati sono separati É uno standard IEEE http://ltsc.ieee.org/wg12/
25
Metadati strutturali Descrivono le relazioni tra dati Strutture esplicite Link Puntatori Strutture implicite Numeri che caratterizzano una sequenza Esempio: numero del capitolo all’interno di un libro
26
13
Esempi Making of America version2 (MOA2) Deprecato Metadata Encoding and Transmission Standard (METS) Anche descrittivo http://www.loc.gov/standards/mets/METSOverview.v2.html#MHe ad
27
Metadati amministrativi Informazioni di gestione/amministrazione Chi è il proprietario dei dati e degli oggetti Dove risiedono Costo Provenienza Informazioni sui diritti e sui copyright Chi può accedere al dato In base a quali condizioni 28
14
Metadati tecnici Informazioni utili per la gestione, l’archiviazione e la preservazione dei dati Informazioni sul formato dei file usati per rappresentare i dati Tipo Versione Tipo e livello di compressione Provenienza dal punto di vista tecnico Come è stato creato il dato digitale 29
Metadati tecnici: esempi Metadata for Images in XML (MIX) Data Documentation Initiative (DDI) Metadata Encoding and Transmission Standard (METS)
30
15
Passaggio da un insieme di metadati ad un altro Interoperabilità tra librerie digitali Scambio di dati e metadati Indispensabile definire dei meccanismi di mappatura/corrispondenza tra i diversi metadati utilizzati
Problemi Gli schemi devono essere simili La granularità deve essere simile La semantica deve essere comune Esempi di casi reali Passaggio da MARC a Dublin Core
31
Gestione dei metadati Sono necessari strumenti per la gestione dei metadati Template Strumenti di markup Strumenti di estrazione Strumenti di conversione
32
16
Linee guida per la scelta di “buoni” metadati secondo la NISO I “buoni” metadati devono Essere appropriati per la collezione di dati gestiti Sia per la descrizione delle caratteristiche dei dati che per l’uso che si intende fare di tali dati
Facilitare l’interoperabilità Essere basati su vocabolari standard Includere una descrizione chiara delle condizioni sotto le quali i dati possono essere usati
Dovrebbero essere verificabili e “autorevoli” 33
Pericoli e avvertimenti Metadati complicati = dispendiosi Mantenere lo schema il più semplice possibile Mantenere lo schema, se possibile, flessibile Scegliere i metadati giusti al primo colpo Spesso non c’è l’opportunità di catalogare i dati una seconda volta
Troppo dispendioso Alcune informazioni potrebbero non essere più disponibili 34
17
Pericoli e avvertimenti In una libreria digitale la creazione dei metadati è una delle operazioni più Difficili Costose Lunghe
35
Alcuni strumenti Generatori ed estrattori di metadati Metadati Dublin Core http://www.ukoln.ac.uk/metadata/dcdot/ Metadati per immagini http://hul.harvard.edu/jhove/using.html http://www.semanticmetadata.net/features
36
18