Forside til hjemmeopgave / synopsis til opgaver ved Det Humanistiske Fakultet Personlige data
Institut
Lone Maor Guldberg Mikkelsen
❍ ENGEROM
(fx
[email protected])
[email protected]
❍ INSS
Telefonnummer
28100686
Navn KU-mail
❍ IKK
❍ IVA ❍ MEF ❍ SAXO ❍ ToRS
Studieoplysninger Navn på uddannelse
Informationsvidenskab og kulturformidling
Uddannelsesniveau
❍ BA
❍ BA-tilvalg
❍ KA
❍ KA-tilvalg
❍ Åbent Universitet
Oplysninger om eksamen Kursustitel
Digitale Videnssystemer
Eksamensaktivitet
Digitale Videnssystemer
Eksamenskode
HBIB00081E
Studieordning Eksamenstermin
Vinter14
Titel på opgave
Evaluering af Yad Vashems Navnedatabase
Normalsider
10,3
Eksaminator
Antal tegn
25.733
Må opgaven evt. lægges i opgavebiblioteket? (sæt ×)
❍ Ja
❍ Nej
Albrechtsen Hanne
Oplysninger ved gruppeopgave Der er i opgaven gjort rede for, hvem der har skrevet hvilke afsnit (sæt ×)
❍ Ja
❍ Nej
Medforfatter 1
Navn
KU-brugernavn
Medforfatter 2
Navn
KU-brugernavn
Medforfatter 3
Navn
KU-brugernavn
Medforfatter 4
Navn
KU-brugernavn
Tro & love-erklæring
Du kan finde en vejledning om, hvordan du fletter to PDF’er på http://absalon.hum.ku.dk/studerende/eaflevering/
Rev. 23-april-2014
Jeg erklærer herved på tro og love, at jeg egenhændigt og selvstændigt har udformet opgaven. Ved gruppeeksamen er det tydeligt angivet, hvem der har skrevet hvilke afsnit i henhold til bestemmelser omkring gruppeopgaver. Alle citater i teksten er markeret som sådanne. Opgaven eller væsentlige dele af den har ikke tidligere været fremlagt i anden bedømmelsessammenhæng. Ved elektronisk aflevering i Absalon er håndskrevet underskrift ikke påkrævet.
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
Digitale Videnssystemer Navn:
Lone Maor Guldberg Mikkelsen (KMC144)
Dato for aflevering:
6. januar 2015
Lærers navn:
Hanne Albrechtsen
Semester:
3
Hold:
3
Navn på kursus:
Digitale Videnssystemer - IVA BA
Titel på opgave:
Evaluering af Yad Vashems Navnedatabase
Antal ord:
3854
Antal sider á 375 ord:
10,3
Antal tegn:
25.733
Side 1 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
Summary Den systematiske udryddelse af jøderne i perioden før og under WWII, sætter ramme for Holocaust som betyder ”Brændoffer”. Den centrale navnedatabase på Yad Vashem er en hoveddatabase samler og registrerer navne fra hele verden på Holocaust ofre. Databasen kan kategoriseres som en Webbaseret Biographical Dictionary, som et Knowledge Organization System, sammensat af et facetteret klassifikationssystem, et webbaseret navigationssystem og et Webbaseret søgesystem. Databasen indeholder pr. april 2014 tæt på 6,5 millioner personlige indførsler. I databasen registreres data både af forskere, medarbejdere ved Yad Vashem, og af personer verden over med forbindelse til Holocaust. Databasen servicerer brugeren på to plan: Registrering og søgning. Systemet er komplekst, da data er samlet fra meget forskellige kilder, hvilket giver udfordringer i forhold til Consistency (konsistens) i systemet. Databasen giver godt overblik og signalerer god kvalitet som forstærker Organisationens status.
Side 2 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
Indhold Summary .................................................................................................................................... 2 1. Kan resultat af ondskab klassificeres? ................................................................................... 4 2. Problemformulering............................................................................................................... 5 2.1 Problemstillinger: .................................................................................................................... 5 2.2 Afgrænsninger ......................................................................................................................... 5 3. Metode................................................................................................................................... 5 4. Test og beskrivelse af Databasen........................................................................................... 7 4.1 Registrering: ............................................................................................................................ 9 4.2 Søgning .................................................................................................................................. 10 5. Diskussion ............................................................................................................................ 12 6. Konklusion ............................................................................................................................ 17 7. Perspektivering .................................................................................................................... 17 Litteratur .................................................................................................................................. 19 Web .......................................................................................................................................... 19 Bilag .......................................................................................................................................... 20
Side 3 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
1. Kan resultat af ondskab klassificeres? Jødeforfølgelsen, og senere jøde udryddelsen, i perioden fra 1933 hvor Hitler kom til magten i Tyskland og frem til slutningen af anden verdenskrig (WWII) i 1945, sætter ramme for Holocaust som betyder ”Brændoffer”. Man anslår at ca. 6.000.000 jøder blev myrdet i denne periode. Holocaust har medført et behov for at samle informationer og viden om de ofre som omkom i perioden. Der er derfor siden starten af 50-erne, som er en del af “Yad Vashem” museet i Jerusalem, i samarbejde med den israelske stat og forskellige fonde, forsket i Holocaust. Dette har ført til oprettelsen af ” The Central Database of Shoah Victims’ Names ” (Den centrale navnedatabase for Holocaust-ofre). Databasen er oprettet af instituttet “The International Institute for Holocaust Research” Forskningen er stadfæstet i sin egen lov, vedtaget i 1953 af det Israelske parlament The Knesset. Yad Vashems formål er blandt andet:”…to collect, examine and publish testimony of the disaster and the heroism it called forth…”1 Databasen er kompleks, da der bliver registreret data både af forskere, medarbejdere ved Yad Vashem og af personer verden over med forbindelse til Holocaust. Databasen bliver brugt til dels at registrere så mange ofre for holocaust som muligt, men også i stor udstrækning til at finde frem til familiemedlemmer (mulige Holocaust ofre) der forsvandt under WWII samt at skaffe ny viden om Holocaust. Derfor skal Databasen kunne håndtere mange forskellige sprog, (herunder hebraisk) men skal samtidig fungere som en form for tesaurus, som kan håndtere at navne kan skrives forskelligt, læses forskelligt, udtales forskelligt eller være kælenavne inden for de forskellige sprog. Det er uhyre vigtigt, at Holocaust; dette mørke kapitel i menneskehedens historie, bliver husket. For at sikre, at ondskaben ikke slippes løs igen, at scenariet ikke gentager sig, og at vi lærer af historien. Ved at bevare navne og ansigter på de ca. 6 millioner jøder der blev dræbt under Holocaust, kan de genfindes og mindes, - de drukner ikke bare i massernes hav - og glemmes. Når navne læses og billeder tages frem, træder den menneskelige tragedie frem og får verden til at sige ”Aldrig igen”. Men papir og billeder forgår – databaser består. Så hvordan sætter man et så rationelt 1
http://www.yadvashem.org/yv/en/about/archive/about_archive.asp 9/11/14 10,45
Side 4 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
redskab som en database er, sammen på en måde så den opfylder kriterierne for registrering og søgning – og som samtidig pragmatisk kan vise ofrene fra fortidens rædsler frem? 2. Problemformulering Hvordan er ” The Central Database of Shoah Victims’ Names ” (Den centrale navnedatabase for Holocaust-ofre) bygget op og hvordan er brugergrænsefladen optimeret, så den kan leve op til de store krav, der stilles til den? 2.1 Problemstillinger:
Hvordan ser den bagvedliggende Informations Arkitektur (IA) ud i databasen?
Hvilken form for Knowledge Organization System (KOS) (Videnssystem) kan databasen kategoriseres som?
Hvilke kategoriseringsværktøjer bliver brugt?
Hvilke søgeværktøjer er indbygget i databasens brugergrænseflade?
Hvor brugervenlig er søgedelen af databasen?
Hvilke fejl og mangler, hvis nogen, kan identificeres i brugergrænsefladen?
2.2 Afgrænsninger Det er fravalgt i denne opgave, at evaluere den etiske diskurs og formidling, i forhold til emnets sensibilitet, som hjemmesiden repræsenterer. I analysen af brugergrænsefladen på Navnedatabasen, er der kun fokus fra facetten ”Shoa names Database” og nedefter i hierarkiet. Brugergrænsefladen på Yad Vashems Index (forside) hjemmeside, er der ikke taget stilling til. 3. Metode For at opnå forståelse for den heterogene samling brugere af navnedatabasen og dens derfor følgende kompleksiteten, er der læst en del historisk baggrundslitteratur om Holocaust generelt. Af samme årsag, er Yad Vashems egen hjemmeside og andre samlinger end navnedatabasen undersøgt.
Side 5 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
Det er efter nøje overvejelse besluttet, grundet emnets sensibilitet, ikke at udfærdige en fuld Usability test2 af brugergrænsefladen og derved indsamle empiri ved hjælp af eksterne brugertests og kvalitative/kvantitative interviews. Der er i stedet foretaget en pragmatisk, heuristisk analyse af brugergrænsefladen for at teste databasens brugervenlighed. Testen tager udgangspunkt i James Kalbachs (2007) checkliste, designet specifikt for web navigation. Listen består af følgende 4 dele: 1. Navigation 2. Labeling System 3. Visuelt Design 4. Browser Databasens brugergrænseflade er blevet evalueret (Se bilag 4) og skema er udfyldt for hver del af listen ud fra Kalbachs 1-4 rating system:
Ill 5. Kalbachs rating system. Kilde: Kalbach, J. (2007) Designing Web Navigation.
Ved analyse af databasens opbygning og type er der primært taget udgangspunkt i Stock (2013) og Bawden (2012). arbejdet med Kalbachs (2007) checkliste har dog også været brugt i evalueringen. For at forstå Navnedatabasens opbygning er databasens søgefunktioner, skridt for skridt, ved hjælp af ”live Cases”3, blevet testet subjektivt og der er samlet empiri, som er sammenholdt med klassifikationsteorier fra Stock og Bawden samt andre teoretikere. Denne empiri bruges også ved analyse af brugervenlighed som primært tager udgangspunkt i Kalbach (2007) samt Morville & Rosenfeld (2006). 2 3
Usability Test ses som den mest dybdegående og grundige testform til evaluering af navigation (Kalbach, 2007) Navne på ofre der figurerer i databasen.
Side 6 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
Som eksempler på indeksering og søgning, er der søgt primært på navne med forbindelse til Anne Frank4 og Annes familie. Der er dog også søgt på mere almindelige navne som for eksempel David Cohen. Der er søgt på engelsk, men også på hebraisk for at kunne se sproglige sammenhænge. For at holde konsistens mellem tekst og data, er faglige termer holdt på engelsk, med den danske term i parentes, hvor det er fundet nødvendigt. 4. Test og beskrivelse af Databasen Yad Vashems hjemmeside (index) http://www.yadvashem.org/, er opbygget som et facetteret KOS. I en hovedmenu er der adgang til blandt andet online udstillinger, links til databaser med Yad Vashems egne databaser samt links til databaser over hele verden med information om Holocaust. Yad Vashems digitale samlinger består pt. af følgende databaser med Label ”Digital Collections” med en undermenu med følgende labels (facetter): Navnedatabasen, Fotodatabasen, Dokumentdatabasen, De Retfærdiges database, Biblioteksdatabasen, Filmdatabasen og Shoa Relateredes database. Selve Navnedatabasen (se Illustration 1) er en del af Informations Systemet, som kombinerer et klassifikationssystem med et navigationssystem og et søgesystem.
4
Ung jødisk, tysk pige, som med sin familie flygtede til Holland under WWII. Anne døde i Bergen Belsen i 1945 men efterlod sig en udførlig dagbog fra sine sidste leveår.
Side 7 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
Ill. 1: Forsiden af Navnedatabasen. Kilde: http://db.yadvashem.org/names/search.html?language=en
Side 8 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
Flere forskellige indekseringsformer bliver brugt og der er mulighed for flere søgemetoder. Siden har følgende søgefelter i den facetterede del af systemet: Last Name, First Name, Maiden Name, Year of Birth, Year of Death, Place of Birth, Place before the war, Place during the war, Place of Death og flere. Navnedatabasen gik online i 2004 og indeholder pr. april 2014 tæt på 6,5 millioner personlige indførsler5. Der kan forekommer gengangere, hvor samme person står opført flere gange, da kilderne er forskellige, og der indekseres både manuelt og automatisk. Det skønnes derfor at der er ca. 4,3 millioner separate individuelle ofre registrerede i databasen. Databasen servicerer brugeren på to plan: Registrering og søgning. 4.1 Registrering: Der registreres data indsamlet fra mange forskelligartede kilder. De kan inddeles i tre typer datasæt, hvoraf det kun er det første, som den private bruger er involveret i: 1. Pages of Testimony (PoT) (Sider med Vidneudsagn), som er ensidede formularer der er udfyldt og indleveret til Yad Vashem helt tilbage fra starten af 50-erne. (bilag 1,2 &3) De formularer som blev indsamlet inden databasens opstart, er nu scannede og metadata er lagt i databasen. Det er i dag muligt at udfylde en PoT online på Yad Vashems hjemmeside. Formularen indeholder 37 felter som udfyldes med offerets biografiske data. PoT kan også udskrives, udfyldes manuelt og mailes til Yad Vashem. Der er, med PoT som kilde, per april 2014 ca. 2.600.000 navne i databasen i ca. 30 forskellige sprog (klassificeret efter generelle standarder som for eksempel engelsk = en. se ill. 2) skrevet i 4 forskellige alfabeter.
Ill. 2. Kilde6:
Formularens tekst til beskrivelse af felter, både som hard copy og digitalt, fremstår på det sprog der på forhånd er valgt at få præsenteret hjemmesiden på. Alle PoT’s bliver
5
http://www.yadvashem.org/yv/en/about/hall_of_names/about_central_database.asp 28/12/2014 10,15
6viewsource:http://db.yadvashem.org/names/nameResults.html?lastName=frank&lastNameType=THESAURUS&firstName=anne&firstNameType=THE SAURUS&language=en
Side 9 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
manuelt gennemlæst, og hvis muligt holdt op mod anden dokumentation, af personale på Yad Vashem inden de endeligt bliver uploadede til databasen.
2. Historisk dokumentation fra arkiver, som inkluderer korrespondance og lister fra såvel Nazisternes og de allierede landes myndigheder samt dokumentation fra diverse organisationers optegnelser. Denne dokumentation fremstår i forskellige Europæiske sprog. Dokumentationen håndteres, checkes af personale ved Yad Vashem og metadata tastes ind i databasen. 3. Lokale minde projekter, som udføres over hele verden inden for Jødiske grupperinger og menigheder. Disse partneres7 lokale databaser sammenkøres elektronisk med Yad Vashems navnedatabase. 4.2 Søgning Databasen søger ved alle søgninger inden for alle tre ovennævnte datasæt. Alle udfyldte PoTs bliver manuelt indtastet i databasen af Yad Vashems medarbejdere. Ved søgning direkte fra forsiden af Navnedatabasens på Facetten first name: Anne og Facetten last name: Frank (på engelsk) fremkom der 121 resultater. Disse resultater undersøges og der findes 3 forskellige PoT’s for Anne Frank, som viser sig at hedde Anne-Lise Marie Frank. Det er samme person, med PoTs registreret af 3 forskellige indberettere. Der er mulighed for at bruge den Booleske operatør OG i tilfælde af navne med bindestreg i alle navnefelter. Der er lagt vægt på, at der er mange muligheder for søgning inden for hver facet og med indbygget hjælpefunktioner. Der er ”hjælpebobler” ved alle søgefelter, hvor der i brugerens valgte sprog, forklares hvordan feltet kan udnyttes. For at præcisere søgningen på Anne Frank fortsættes til Advanced Search muligheden. Her fremgår det, at der kan søges med forskellig præcisering: for hver facet kan vælges om der skal søges ved hjælp af:
7
”Literel” – den præcise stavning,
http://www.yadvashem.org/yv/en/resources/names/partners.asp 30/12/2014 9,50
Side 10 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
”Fuzzy” – En form for automatisk stemming8, men som også fungerer som en spell checker der tager hensyn til de mest forekommende stavefejl eller inverterede bogstaver. Her vil for eksempel en søgning på Sarah også finde Satah eller Sarha.
”Soundex” et phonetisk søgeværktøj som i databasen genkender navne som lyder ens fordi de har de samme konsonanter – Shlomo vil derfor også finde Shloime og Szlama, som har samme lyd, men ikke Solomon, da det ikke lyder som de andre navne, selvom det er et synonym.
”Synonyms” - der fungerer som en Thesaurus, hvor alle navne som har Anne som synonym (SY), Narrow Term (NT), Anne som Broad Term (BT) og Anne som Related Term (RT) vises. Derudover har Yad Vashem udviklet et specielt specielt system som genkender alle varianter af navnet som databasen har registreret, hvad enten det er originalt skrevet med Hebrew, Latin eller cyrillic (kyrilliske) bogstaver For eksempel Alexander = Aleksander = Alex = Sandor = Sender = Sasha = Shura.
Fra forsiden af databasen kan foretages en simpel søgning direkte på facetterne Last name og First Name. Ved brug af simpel søgning bliver der per default søgt på hvad her kaldes synonymer. For at få lavere recall og højere præcision9 søges der nu på samme homonymer: first name: Anne og last name: frank, men nu vælges der i præcisering ”Literel”. Herved fremkommer KUN de tre resultater som før var sammen iblandt 121 recalls. Det viser effektiviteten af præciseringen. Der er igen mulighed for at præcisere endnu mere i dette vindue, ved at vælge ”Refine Search” hvor recall kan reduceres endnu mere og præcision derfor højnes. Med kun tre resultater i tilfældet med Anne Frank som søgenavn, er dette ikke relevant men for at afprøve søgesystemet foretages nu en søgning på David Cohen, som er et meget brugt jødisk navn. Uden brug af præciseringsværktøjet får vi et meget omfattende resultat: 905 navne. Der søges nu igen på navnet David Cohen med præcisering på ”Fuzzy” og der fremkommer 157 resultater. Ved valg af ”Literel” er resultatet en meget stor præcision; nu nede på 115 navne, hvor der kun er navne der svarer præcis til stavningen tastet ind i søgefeltet. 8
Søgeværktøj, som finder matches med samme rod og derved øger recall.
9
Recall = antal relevante dokumenter fundet/relevante dokumenter i samlingen. Precision = relevante dokumenter fundet / total antal dokumenter i samlingen.
Side 11 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
Resultatsiden præsenterer søgeresultaterne på en meget overskuelig måde, hvor både navn, fødselsdato, adresse før WWII, kilde og skæbne vises. Fra søgningens resultatliste kan der linkes direkte ind på det ønskede navn, som vises både som webside, og med billede af personen samt scannet billede af original PoS. Fra denne webside kan der søges videre på personer på samme registreringsadresse, samme fødselssted, samme dødssted og andre muligheder. Ved felter med stednavne kan disses geografiske placering vises på et interaktivt kort. Der er i øvrigt på disse individuelle resultatsider, også mulighed for at lave korrektioner i databasen, hvis brugeren mener at der er oplysninger der ikke er korrekte. 5. Diskussion Selve navnedelen af databasen kan kategoriseres som en Webbaseret Biographical Dictionary, men da databasen inkluderer adskillige andre facetter end navne, er her tale om et Knowledge Organization System (KOS) som i sin struktur virker som et facetteret Klassifikationssystem. På nogle områder, blandt andet i funktionen ”Synonyms” har databasen flere dimensioner, i lighed med en ontologi og systemet er også bygget op med både smalt og dybt hierarki – se Ill. 3. Ill. 3 Kilde: Kalbach, J. (2007) Designing Web Navigation. s. 148
Bredde og dybde i hierarkiet spiller en stor rolle for både informationsstrukturen og navigationen i søgesystemet. I et bredt hierarki kan få ”klik” nå et resultat, hvorimod et dybt hierarki kræver flere ”klik”. Det brede hierarki fungerer umiddelbart bedre ved at giver hurtigere resultater, da øjet er langt hurtigere end musen, selvom det ved det dybe hierarki er nemmere at holde fokus på de få labels. (Kalbach, 2007) Ved at tilbyde søgning med værktøjerne ”Literel”, ”Soundex”, ”Fuzzy” og ”Synonyms” virker associativ som en tesaurus, der finder ligheder og sammenhænge mellem navne, tider og steder. ”Soundex” værktøjet som fremfinder og tilbyder muligheder, som umiddelbart ikke har andet til Side 12 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
fælles end udtale tangerer en Ontologisk løsning, som har en høj kompleksitetsgrad og som : ”…often has a rich set of relationships, mort than the synomym/hierarchy/associative relations common to retrieval vocabularies…” 10. Det er ikke ualmindeligt at terminologier overlapper hinanden (Bawden, 2012). Kvaliteten af navnedatabasen (KOS) kan ikke sammenlignes med en færdig og mere homogen database. Fordi databasen er meget omfattende, er under stadig udvikling og datakilderne er meget forskellige, vil der kunne peges på adskillige indikatorer som udfordrer databasen på kvalitet. Stock (2013) peger på 4 dimensioner i en database som parametre for KOS’ens kvaliteten: Structure (struktur), Completeness (færdighed) og Consistency (konsistens). I forhold til struktur er navnedatabasen opbygget med en kombination af moduler og netværksstruktur. Registreringsdelen af navnedatabasen arbejder med store udfordringer. Indeksering af proprier (egennavne) skal tage hensyn til forskellige navneformer; et navn kan staves forskelligt (Bruhns, 1996) både inden for samme sprog, men bestemt også på forskellige sprog. Stock (2013) fremfører, at denne form for fejlkilder er én af tre dimensioner på manglende konsistens; Semantic inconsistency (Semantisk inkonsistens), Circularity errors (Cirkulære fejl) og Skipping Hierachical Levels, der forekommer ofte ved sammenkørsel af flere KOS til en Master KOS. Denne udfordring er bare en af årsagerne til, at en person kan være registreret mere end én gang i databasen.
”En ensartet og konsistent indeksering er en forudsætning for at kunne udføre præcise, pålidelige søgninger. I praksis er det imidlertid ikke altid muligt at opnå en høj standard af ensartethed, da indeksering bygger på en fortolkningsproces der i høj grad er afhængig af indeksørens ekspertise og kvalifikationer samt de værktøjer og den tid, der er til rådighed til indeksering. ”11
10
Bawden, David; Robinson, Lyn (2012). Introduction to Information Science. p. 114.
11
Grauballe, Kaae, Lykke & Mai. (1998) Klassifikationsteori s. 9.
Side 13 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
De data der bliver indgivet med udfyldte PoS’er skrevet i hånden tillader mange fejlregistreringer; det kan blandt andet være svært for indeksøren fra Yad Vashem, at tyde håndskrifter på manuelt udfyldte dokumenter. At flere forskellige indberetningspersoner kan indsende en PoS for samme person, men måske under forskellige navne, såsom kælenavne eller forkortelser for eksempel Dudik, Dudinka, Dedde, Dudi, Dave og flere, i stedet for David. Her er søgeværktøjet ”Fuzzy” en stor hjælp, men Yad Vashems bruger også andre programmer og algoritmer til at finde frem til navne der kunne være et match. Men man må løbende have for øje, at hæver man recall i stedet for præcision, risikerer man også at miste brugere, som giver op, da de store recall kan synes uoverskuelige. (Morville & Rosenfeld, 2006)
Den Automatiske indeksering, hvor flere forskellige informationssystemer sammenkøres, må blive hentet ind i en Master KOS, - se Ill. 4, hvorefter indekseringen er baseret på en kombination af Probabilistic og Rule-based indeksering, hvor data sammenlignes med store mængder allerede eksisterende data og derefter indekseres som beskrevet i Stock 2013 s. 725.
Ill. 4.Kilde: Stock, Wolfgang G., Stock, Mechtild (2013). Handbook of Information Science. S. 725
Metadata som indekseres i Master KOS skal, for at være konsistent, være holdt i et af de gængse indekseringssprog som for eksempel XML12 og i henhold til gældende ISO dokumentation; For eksempel ISO 5964 — Guidelines for the establishment and development of multilingual thesauri.
12
Bawden kapitel 6, side 110.
Side 14 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
I forhold til completeness, er databasen under udvikling og vil sandsynligvis være det mange år fremover. Dette bliver der gjort opmærksom på, på alle sider, og er med til, at det på nuværende tidspunkt, i navnedatabasens tilfælde, ikke er et problem. Selvom ikke alle navne på de 6 millioner ofre er registrerede i databasen, er den stor nok til, at mange kan finde de personer de måtte søge.
Ill. 5. Kilde: Morville, P., Rosenfeld, L. (2006) Information Architecture for the World Wide Web s. 150
Søgning ved hjælp af ”synonyms” giver et stort recall og betyder, at man manuelt må gennemgå en lang liste af navne, men der er til gengæld stor chance for at finde det navn man leder efter uanset om man ved hvordan det staves og på hvilket sprog man skriver. Da brugeren som søger i databasen må formodes at have et formaliseret behov for viden (Taylor, 1968), er søgefunktionen i databasen stramt opbygget og er ikke optimeret til browsing. Navnedatabasens hjemmeside er lagt an på Bruger Centreret Design (Morville & Rosenfeld, 2006). Brugergrænsefladens (the Interface) grafiske udtryk ligner andre hjemmesider, med klart definerede labels (Facetter). Hovedmenuen for Yad Vashems hjemmeside går igen på alle undersider, hvilket gør navigering nem, men som også kan forvirre, idet vores bruger af netop denne database som søger efter et navn i databasen, må formodes at have et formaliseret behov (Taylor, 1968) og derfor ikke har behov for at få direkte adgang til resten af hjemmesiden. Hovedmenuen indeholder desuden links til både webshoppen og til donationsmodulet, signalerer ikke umiddelbart etisk troværdighed, som ellers er en meget vigtig faktor at signalere ved opbygningen af hjemmeside
Side 15 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
(Morville & Rosenfeld, 2006). Det grafiske lidt neddæmpede udtryk med grå og mørke nuancer signalerer og understøtter ellers virksomhedens brand meget fint. Hele tekstboksen på Navnedatabasens hjemmeside går også igen på alle undersider; dette betyder, at brugeren hele tiden kan orientere sig nemt og hurtigt, hvilket er et af de vigtigste punkter for at gøre webnavigation effektiv og brugervenlig (Kalbach, 2007) Man har valgt at opdele søgesiden i 3 felter/kolonner, hvoraf det midterste indeholder selve søgefelterne. Det er en klar og tydelig placering midt på skærmen, og i de venstre kolonne/felt vises der skiftende billeder af Holocaust ofre. Oven over billederne vises der skiftende citater fra samlingerne. De skiftende billeder linker ved klik til billederne i fuld størrelse og citaterne linker ved klik til fuld tekst. Da billederne ingen sammenhæng har med den eventuelt aktuelle søgning virker dette forvirrende, ikke mindst ved brug af databasen de første gange. At ikonerne med links til diverse sociale medier som blandt andre Face Book og Twitter figurerer konsekvent på alle sider og dermed også søgesiden virker ulogisk, da der ikke umiddelbart er noget formål med det på søgeresultatsiden. Ud over de få elementer der er kritiseret ovenover, er brugergrænsefladen på søgesiden generelt set meget gennemtænkt og meget brugervenlig. De mange muligheder for at søge i udvidet søgning, med deres omhyggelige beskrivelse af funktion og i brugerens eget sprog, er med til at løfte hele brugergrænsefladen. Alle felter virker som foreskrevet og der er ikke fundet nogen links der ikke virker.
Side 16 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
6. Konklusion Den centrale navnedatabase på Yad Vashem er en hoveddatabase som på flere måder samler og registrerer navne fra hele verden på Holocaust ofre. Databasen kan kategoriseres som en Webbaseret Biographical Dictionary, og da databasen inkluderer adskillige andre facetter end navne, er her tale om et Knowledge Organization System, sammensat af et facetteret klassifikationssystem, et webbaseret navigationssystem og et Webbaseret søgesystem. Navnedatabasen gik online i 2004 og indeholder pr. april 2014 tæt på 6,5 millioner personlige indførsler. I databasen registreres data både af forskere, medarbejdere ved Yad Vashem, og af personer verden over med forbindelse til Holocaust. Databasen servicerer brugeren på to plan: Registrering og søgning. De registrerede data kan inddeles i tre typer datasæt: 1. Pages of Testimony (PoT) (Sider med Vidneudsagn) 2. Historisk dokumentation fra arkiver 3. Lokale mindeprojekter Systemet er komplekst, da data er samlet fra meget forskellige kilder, hvilket giver udfordringer i forhold til Consistency (konsistens) i systemet, men formår at håndtere disse udfordringer blandt andet ved hjælp af specialudviklet software. Databasens forside signalerer at brugergrænsefladen er overskuelig og forståelig. De mange søgeværktøjer som har indbyggede hjælpefunktioner ved alle søgefelter, gør den let at bruge. Det grafiske udtryk af brugergrænsefladen har små skønhedsfejl, men giver alligevel godt overblik og signalerer god kvalitet som forstærker Organisationens status. 7. Perspektivering I fremtiden vil nye digitale muligheder som sammenkørsler med endnu flere databaser eller søgning i store databrønde, måske åbne for mulighed for at finde endnu flere ofres navne frem fra historiske kilder og derved belyse Holocaust.
Side 17 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
En oplagt mulighed vil være at hente yderligere oplysninger på de enkelte personer fra samlingerne på Yad Vashem, måske ved hjælp af med Doi (Digital Object Identifier)13 -lignende systemer, som kan hente også uorganiserede oplysninger om de individuelle ofre frem og derved supplere databasen. Når databasen har fundet den person man har ledt efter, vil der så også kunne linkes til alle kendte, eksisterende oplysninger om denne person. At præsentere en samlet mappe med alle informationer der er tilknyttet et specifikt offer, kræver dog nogle komplekse og omfattende metodiske og tekniske processer og udvikling af systemer, som Yad Vashem dog regner med at kunne udvikle og præsentere i fremtiden14. En anden mulighed kunne være en folksonomi15 hvor ofrenes familier og bekendte kunne tagge dokumenter og informationer, som den strukturerede Database måske kunne linke til. Der eksisterer store mængder dokumentation i Yad Vashems egne samlinger som hele tiden vokser og bidrager med ny viden men der må også ligge enorme mængder dokumentation og dermed viden, ude på World Wide Web og i stadig ukendte databaser og arkiver. Kan vi når data bliver struktureret og organiseret måske se nye mønstre? Få mere, ny og derved bedre forståelse for hvordan og hvorfor ondskaben tog over i et kort øjeblik? Ved hjælp af stigende viden om Holocaust og med store databrønde og Big Data i tankerne, anes der lys forude; - oplysning, som kan være med til at forklare, hvad der skete dengang.
13
Et ISO certificeret Digital Object Identifier System, brugt blandt andet i citationssøgning inden for de Sociale Medier. http://www.doi.org/ 3/1/2014 9,50 14 http://www.yadvashem.org/yv/en/resources/names/faq.asp 2/1/2015 13,45 15 Her ses en Folksonomi som et organiseringssystem baseret på brugernes egne kategoriseringer, og hvor tagging er søgeord i et ikke-hirakisk system. (Rafferty & Hidderley, 2007).
Side 18 af 23
Digitale Videnssystemer
Lone Maor Guldberg Mikkelsen (KMC144)
Litteratur
Bawden, David; Robinson, Lyn (2012). Introduction to Information Science. London: Facet Publishing. Bruhns S. (1996), Bibliografisk verification. 2. udg. Center for Bibliographical Studies, Romdrup 1996 Frank. A. (1945), En ung piges dagbog. Oversat fra hollandsk af Løvland, H. Grafisk forlag, København, 1952 Grauballe, H., Kaae, S. (2001). Konstruktion af klassifikationssystemer. Danmarks Biblioteksskole, Institut for Informationsstudier. Grauballe, H., Kaae, S., Lykke, M., Mai, J.E. (1998). Klassifikationsteori. Danmarks Biblioteksskole, Institut for Informationsstudier. Kalbach, J. (2007) Designing Web Navigation. O’reilly Media Inc. Sebastopol, CA. 95472 Morville, P., Rosenfeld, L. (2006) Information Architecture for the World Wide Web. O’reilly Media Inc. Sebastopol, CA. 95472 Rafferty, Pauline; Hidderley, Rob (2007). Flickr and Democratic Indexing: dialogic approaches to indexing. Aslib Proceedings: New Information Perspectives. Vol. 59 No. 4/5, 2007, pp. 397-410 Stock, Wolfgang G., Stock, Mechtild (2013). Handbook of Information Science. Berlin, de Gruyter
Web http://hgs.oxfordjournals.org/content/26/1/95.full.pdf+html 23/12/2014 10,45
http://arxiv.org/pdf/1405.2407v1.pdf
23/12/2014 9,30
http://www.firstmonday.dk/ojs/index.php/UC/article/view/3323 23/12/2014 9,45
http://www.yadvashem.org/yv/en/resources/names/partners.asp 21/12/2014 9,30
http://makash.org.il/docs/dovwiner_I_article_sv_formatted.pdf 04/01/2015 12,10
http://www.nngroup.com/articles/ten-usability-heuristics/
Side 19 af 23
02/01/2015 9,45
Digitale Videnssystemer
Bilag Bilag 1 - Digital indlevering af PoS
Side 20 af 23
Lone Maor Guldberg Mikkelsen (KMC144)
Digitale Videnssystemer
Bilag 2 – Manuel indlevering af PoS
Side 21 af 23
Lone Maor Guldberg Mikkelsen (KMC144)
Digitale Videnssystemer
Bilag 3 – digital indlevering af PoS
Side 22 af 23
Lone Maor Guldberg Mikkelsen (KMC144)
Digitale Videnssystemer
Bilag 4. Checkliste
Side 23 af 23
Lone Maor Guldberg Mikkelsen (KMC144)