Indhold og Opsætning i Akademisk Tekstbehandling: What You See, and What You Get Sigfred Hyveled Nielsen Digitale Videnssystemer — 3. Semester — IVA / Københavns Universitet
Afleveret 6. januar 2015
Sidetal: Lige knap 11 normalsider Denne tekst er skrevet af Sigfred Nielsen, og stillet til rådighed under Creative Commons Navngivelse-IkkeKommerciel-DelPåSammeVilkår 3.0 Unported licensen.
http://creativecommons.org/licenses/by-nc-sa/3.0/
Resumé Der produceres i dag store mængder dokumenter, især af akademisk natur. De skrives dog i programmer, der lægger mere fokus på tekstens udseende end indhold. Denne opgave undersøger de mest brugte tekstbehandlingssystemer (hovedsageligt Mircosoft Word og Latex), og de aktuelle problematikker i skrivning og deling af dokumenter.
0: Indhold
Sigfred Hyveled Nielsen
Indhold 1 Indledning
4
2 Problemformulering
4
3 Metode 3.1 Brug af begreber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5 5
4 At få hvad du mener, eller hvad du ser 4.1 Status quo for akademisk tekstbehandling 4.2 Opmærkning af tekst . . . . . . . . . . . . 4.3 Da Word Processoren kom til byen. . . . . . 4.4 Letvægtsmarkup – en gylden middelvej? 4.5 Analyse. Systemerne i brug . . . . . . . .
. . . . .
. . . . .
. . . . .
5 At skrive og beskrive 5.1 Papir i en digital verden . . . . . . . . . . . . . 5.2 Velbevarede dokumenter . . . . . . . . . . . . . 5.3 Layout til lejligheden . . . . . . . . . . . . . . . 5.4 Strukturen i fokus . . . . . . . . . . . . . . . . . 5.5 Diskussion. Forhindringer og mulige løsninger
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
6 6 7 7 8 10
. . . . .
14 14 15 15 16 16
6 Konklusion 17 Referencer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3
2: Problemformulering
Sigfred Hyveled Nielsen
1
Indledning
En af de vigtigste funktioner på en computer er tekstbehandling. For folk der skriver store mængder af tekst – det kunne fx være forskere og studerende – er det uvurderligt at kunne redigere, dele og overskue tekst digitalt. I dag virker det helt håbløst, hvis man skulle skrive en Ph.D.-afhandling i hånden. Og dog ligger der en lang række fundamentale problemer i den måde, hvorpå vi i dag skriver på computere. De programmer, de fleste bruger, skjuler dokumentets struktur til fordel for dets udseende trykt på papir. Og alternativerne er for tekniske og besværlige at lære og at bruge. Dokumenter bliver i større og større grad læst på skærme fremfor på papir – men de formater, som de deles i er stadig optimeret til tryk. Hvad der er fint læseligt på papir, kan blive et uoverskueligt roderi på fx en tablet. Derudover kan de være umulige for computere at indeksere og søge i – og der er ingen garanti for at diverse æsoteriske fil-formater også kan åbnes om 50 år. Der er altså mange problemer af en teknisk natur relateret til tekstbehandling på computere. Men en stor del af problemet ligger også ved brugerne. De fleste tænker meget lidt over hvordan de skriver – og de der gør, klynger sig ofte til de systemer, de har lagt en stor del tid og arbejde i at lære. Konsekvensen er, at der ikke er stor nok efterspørgsel efter lette, struktur-orienterede og universelt tilgængelige tekstbehandlingssystemer.
2
Problemformulering • Hvad er de aktuelle teknologiske udfordringer indenfor produktion og formidling af brugbare og tidsvarende videnskabelige dokumenter? – Hvilke fordele og ulemper er der ved hhv. visuel og markup-baseret tekstbehandling? – Hvordan kan anvendelsen af et letvægts-markup-sprog effektivisere skriveprocessen?
Denne opgave vil først, i et teoretisk og historisk perspektiv, analysere de meste brugte tekstbehandlingssystemer. Efterfølgende vil de væsentligste problemer – og mulige løsninger – blive diskuteret. Fokus for denne opgave er indsnævret til akademisk skrivning. Selvom problemstillingen i princippet gælder alle, der skal forfatte længere tekster, lægger opgavens omfang op til et mere afgrænset fokus. Her er det oplagt at se på forskere og universitetsstuderende, da dette er en gruppe, der jævnligt producerer store mængder af tæt
4
4: Metode
Sigfred Hyveled Nielsen
tekst – i mange tilfælde med henblik på publikation. Effektivitet og god praksis er derfor essentielt i denne henseende. Det må formodes at den overvældende størstedel af denne skrivning foregår på computer efterhånden – og der vil i denne opgave kun blive fokuseret på computerbaseret tekstbehandling.
3
Metode
Denne opgave analyserer diskuterer forskellige tekstbehandlingssystemer, teorien bag, samt diverse forhindringer i deres brug, ud fra den tilgængelige litteratur om emnet. For at finde denne, har jeg søgt i Google Scholar, almindelig Google og diverse databaser tilgængelige gennem Proquest. Jeg har brugt en bred vifte af relevante søgeord – men jeg må erkende at der sagtens kan være højrelevante resultater, der er gået mig forbi, da jeg erfarede store forskelle i søgeresultater ved ganske små justeringer i søgetermen. Emnet viste sig generelt mere tricky at researche end jeg havde ventet (håbet. . . ). Mange resultater var forældede eller kun tangentielt relevante. Stadig flere var præget af personlige holdninger og utilstrækkelige kildehenvisninger. For hver af denne opgaves referencer, er der altså et isbjerg af forgæves læst vrøvl. Jeg er klar over at min problemformulering muligvis slår et brød i den store ende op. Det var dog svært at indskrænke den væsentligt, og stadig nå frem til de områder, jeg gerne ville undersøge. En grund til dette er, at emnet er relativt underbeskrevet (som litteratursøgningen viste) og kræver en del baggrund at formidle. Visse sektioner har jeg derfor været nødt til at reducere til kun et hurtigt overblik. Jeg har dog vurderet dem nødvendige for forståelsen af emnet. Udover litteraturen, analyserer jeg også kort den praktiske brug af forskellige tekstbehandlingssystemer.
3.1
Brug af begreber
Ordene markup og opmærkning betyder det samme, men den danske udgave af begrebet bruges ikke ret meget. For sproglig variation og udformning, optræder begge ligeværdigt i denne opgave. De rettroende indenfor tekstbehandlingssystemerne LATEX og TEX kræver som regel at man anvender den her viste typografiske stilisering. Ad hensyn til både læselighed og ‘skrivelighed’, vil disse dog i denne opgave blive skrevet med ganske almindelige
5
4: At få hvad du mener, eller hvad du ser
Sigfred Hyveled Nielsen
typer. De vil også, hvor intet andet udspecificeres, blive henvist til samlet som Latex.
4 4.1
At få hvad du mener, eller hvad du ser Status quo for akademisk tekstbehandling
Der er groft sagt to lejre indenfor brug af skriveprogrammer på det akademiske niveau[19, s. 1]. Blandt de humanistiske videnskaber og lignende, tager man ofte ikke mere stilling til dette emne, end man er absolut nødt til. De fleste bruger således den samme software, som de har brugt hidtil – det være i gymnasiet, til ‘privat’ brug, etc. – en Word Processor, som i langt de fleste tilfælde hedder Microsoft Word[4]. Men tager man besøg på et andet fakultet, fx hos fysikerne eller matematikerne, vil ens flotte kopi af Word ofte blive mødt med olme blikke. Her foretrækker man generelt det typografiske kodesprog Latex (udtalt la-tek), og nogle vil endda forsvare dette valg til noget meget nær døden. For de fleste vil dette virke ganske absurd, og mange har slet ikke overvejet at der kunne findes andre løsninger end Word. Dette program, og dets konkurrenter som den gratis LibreOffice/OpenOffice.org og Apple’s Pages [16], er store, selvstående skrivemiljøer, der følger designfilosofien WYSIWYG – What You See Is What You Get. Med dette menes, at programmet gør sit bedste for at visningen af teksten på skærmen svarer til hvordan, det vil se ud på tryk. Derfor vises en virtuel A4-side, med de endelige skriftstørrelser, sidehoveder, etc.[19, s. 2] Ved Latex, er filosofien i stedet What You See Is What You MEAN. Her ser man blot en væg af tekst, og al formatering foregår ved at indsætte kommandoer til computeren i sin tekst. For at se det endelige layout, kører man et program, der transformerer koderne til et poleret layout til tryk. Når man vælger dette system, er det ofte for dets evner til at opsætte ligninger og specialtegn. Selve Latex står kun for at lave opsætningen, og det står derfor brugeren frit for, hvilket program selve teksten skrives i – og mange af dem har funktioner, der hjælper med Latex-koden[19, s. 2]. Selvom det endelige resultat fra de to for det utrænede øje vil se nærmest identiske ud, er der altså en fundamental forskel i måden man arbejder på. For virkelig at forstå disse to tilganges styrker og svagheder, er man nødt til at forstå den basale forskel i, hvordan de anskuer tekst.
6
4: At få hvad du mener, eller hvad du ser
Sigfred Hyveled Nielsen
4.2
Opmærkning af tekst
At bruge opmærkninger – eller markup – er en essentiel del af at skrive[6, s. 934-936]. Uden det, ville teksten ikke være andet end en uafbrudt strøm af ord, uden ting så basale som komma og punktum. Udover den basale tegnsætningsopmærkning, er der mange andre slags markup. Af disse, er tre specielt vigtige indenfor tekstbehandling. Den første, præsentationsopmærkning, er dén, det er mindst sandsynligt man overhovedet opdager er der. Den dækker tekstens udseende, de visuelle justeringer, der gøres for læseligheden. Fx, når en linje er rykket ind, eller et ord står med fede typer – men også ting som sideskift og paginering (sidetællingen). Word og lignende programmer gør i høj grad brug af dette. Procedureopmærkning er sådan set det samme – men i stedet for at vise justeringerne, beskrives de. Denne tilgang har sit ophav hos de gamle trykkerier, hvor sætterne lavede bogens layout ud fra anvisninger og koder spredt igennem manuskriptet[34, s. 1]. En god del af de kommandoerne, man bruger i Latex er af denne type. Sidst er der deskriptiv opmærkning, som er en noget anden tilgang. Her markerer man ikke hvordan tekstens elementer skal se ud – men hvad de betyder. Fx kan man angive at et stykke tekst er en persons navn – og at noget andet er et citat. I praktisk forstand kan disse opmærkninger i layout-fasen omdannes til andre typer opmærkning – således at alle citater fx bliver sat med kursiv. Man kan derfor også bruge denne type som erstatning for andre typer markup – inklusiv tegnsætning. Dette kaldes også semantisk eller logisk opmærkning. Præsentations- og procedure-markup er rent visuelt orienteret, og det er derfor op til brugeren at sørge for konsekvent formatering – fx at alle overskrifter sættes med den samme skriftstørrelse. Det bliver dermed hurtigt svært at holde styr på det valgte udseende for et langt dokument, og hvis det skal ændres undervejs, er man nødt til at gå tilbage og rette det hvert eneste sted manuelt[6, s. 943-944].
4.3
Da Word Processoren kom til byen. . .
Computeren har gjort en verden til forskel i måden, vi skriver på. For at udskrive og dele et dokument, behøver man ikke længere sende det til et trykkeri, der sætter det op for én – vi kan gøre det hele selv i dag. Førhen lå arbejdsfordelingen således, at forfatteren skrev teksten som et manuskript, med kun simple formateringsvirkemidler. Dette blev givet videre til en trænet sætter, der – uden syn for tekstens indhold – satte den op på siden, på den mest læselige og harmoniske måde[21, s. 5]. I det 20. århundrede tillod teknologien udviklingen af Word Processoren. Den startede som en dedikeret afdeling af kontoret, og blev så en dedikeret maskine, for til 7
4: At få hvad du mener, eller hvad du ser
Sigfred Hyveled Nielsen
sidst at blive et program på de i 80’erne mere og mere gængse Personlige Computere. Tidlige programmer, som WordStar og WordPerfect, var besværlige og upræcise, men udviklede sig gradvist til at kunne forhåndsvise den trykte side. Microsoft Word blev, efter en sløv start, efterhånden det dominerende program[12, 22]. Sideløbende udvikledes også sætter-programmer, det væsentligste værende Donald Knuth’s Tex, et frit og åbent program, der konverterede procedureopmærkede dokumenter til så smukt som muligt tryk-layout[8]. Snart efter påbegyndte Leslie Lamport udviklingen af Latex, der udvidede Tex med deskriptive og strukturelle kommandoer[21]. Dette gjorde det muligt at angive et stykke tekst som ‘Overskrift’, og lade programmet holde styr på formateringen. Denne funktionalitet – også kaldet Paragraph Styles – blev senere tilføjet til de fleste Word Processorer, hvor dens brug dog er op til brugeren selv. I praksis har denne funktion vist sig meget ofte forkert – eller slet ikke – brugt[31, s. 138-143][34, s. 3]. Alle disse programmer og systemer ledte til et væld af forskellige formater, der besværede delingen af dokumenter. Der blev derfor gjort en indsats for at oprette et deskriptivt Standard Generalized Markup Language (SGML), med fokus på dokumentets indhold og struktur fremfor layoutet[33, s. 10][31, s. 138]. Det blev dog kritiseret for at være for svært at bruge, og ikke understøtte grafik og matematik tilstrækkeligt[6, s. 942]. Selve SGML blev aldrig udbredt, men det var grundlaget for de meget brugte formater HTML (som hjemmesider skrives i) og XML (hvis markup kan tilpasses specifikke formål)[33, s. 11][23]. Det, som flertallet bruger, er altså blevet de visuelt orienterede Word Processorer. Når folk endelig bruger Latex, er det enten fordi det er et krav, eller en hobby. En stor del af grunden til, at Latex ikke er mere udbredt – og ifølge opfinderen selv ikke er den mest brugvenlige løsning[20, s. 2] – er de kryptiske og omfattende kommandoer, som selv den simpleste formatering kræver. Der findes en række programmer, der tilstræber sig at lave WYSIWYG-indpakning til Latex – så man ser sit dokument med præsentations-opmærkning, men det gemmes som en Latex-opmærket fil (fx Lyx). Disse gør det nemmere at producere dokumenter i Latex-format, men forskellen mellem hvad man ser og hvad man skriver kan virke forvirrende[18, s. 59-62]. En mulig løsning på dette problem kan dog findes i internettets tidligste chatsamtaler.
4.4
Letvægtsmarkup – en gylden middelvej?
Letvægts-markup-sprog (LMS) blev født af nød og belejlighed i den tidlige online kommunikation[26]. De første email-systemer og diskussionsfora understøttede kun simpel tekst – tegnene på tastaturet, stort set. For at berige kommunikationen, fandt
8
4: At få hvad du mener, eller hvad du ser
Sigfred Hyveled Nielsen
man derfor på bruge specialtegn til at indikere den formattering, der ellers ville have været visuelt repræsenteret. Hvis fx man ville lægge vægt på et ord, kunne man i stedet for at bruge fed skrift, omkranse det med to asterisker, som så: ‘et **markeret** ord’. Da disse tiltag ikke var organiserede, opstod der ikke ét entydigt syntax – i stedet udvikledes et væld af næsten ens LMS’er; fx Setext fra 1992[9]. Måske af denne grund, nåede de aldrig ud til den bredere, utekniske befolkning. LMS’erne havde dog en fordel, der gjorde at de ikke døde ud: den simple opmærkning gjorde, at teksten var nem både at læse og skrive, men samtidig uden videre kunne konverteres til traditionelle markup-sprog. De passede derfor perfekt til hjemmeside-typen Wiki – et internt linket netværk af tekst-sider, som brugerne kan redigere direkte i (fx det åbne leksikon Wikipedia). LMS’er kendes derfor også som Wiki Markup[17, s. 1][26, s. 43][29, s. 1]. Mange diskussions- og blogging-tjenester (fx Reddit, Wordpress og StackExchange) tillader også brug af letvægts-markup til at formatere indlæg og kommentarer[27, s. 123][1]. Der er dog stadig et væld af markup-sprog med vidt forskellige syntax (Se figur 1). Udenfor wiki’erne, er Markdown (udviklet af John Gruber) det mest udbredte LMS – men selv dette ene fås i et utal undervarianter[26, s. 44][27, s. 122].
Figur 1: Basal markup i div. udbredte markup-sprog.[26, s. 44] Den høje grad af både menneske- og computer-forståelighed i LMS’er, gør dem også egnede til forfatning af generelle tekster – man kan med simpel tegnsætning angive formateringen, og derefter frit konvertere den til Latex- og Word Processorkompatible formater (Den forhåndenværende opgave, for eksempel, er skrevet på denne måde). Der findes en del skriveprogrammer tiltænkt denne tilgang, hvoraf de fleste benytter Markdown[27]. Manglen på et standardiseret LMS er dog problematisk – der er ingen garanti for at den markup, der virker i det ene program eller website, vil virke i det næste. Der er gjort flere forsøg på at skabe et standardiseret sprog[1][17, s. 1-2], men hidtil er det ikke lykkedes at få dem udbredt. 9
4: At få hvad du mener, eller hvad du ser
Sigfred Hyveled Nielsen
Det må også bemærkes at LMS’er i øjeblikket kun kan bruges til den umiddelbare skriveproces – for at producere færdigt layout, er man nødt til at konvertere til Latex og lave den sidste opsætning dér. Selvom det er muligt at indsætte billeder og tabeller, er LMS’ernes funktionalitet stadig meget minimalistisk[17, s. 2-3].
4.5
Analyse. Systemerne i brug
Der er visse fordele og ulemper ved hver tilgang. Ved WYSIWYG-programmer får man øjeblikkelig respons på dokumentets udseende, idet orddeling og sideopsætning beregnes så øjeblikkeligt som muligt – dette kommer dog på bekostning af kvaliteteten. Latex, derimod, tager hele teksten under betragtning, for at opsætte denne så æstetisk som muligt – men det kræver at den køres gennem programmet først[33, s. 5]. Det kan også debateres, om begrebet WYSIWYG er helt sandt, da visningen ikke altid er ens ved forskellige skærme og printere[18, s. 57]. For at undersøge hvordan de forskellige systemer er at arbejde i, har jeg opsat en simpel tekst (se figur 2) i hhv. Microsoft Word, Latex, og Markdown. De forskellige systemers bibliografiske funktioner er et mere omfattende emne, så den viste kildehenvisning er rent kosmetisk.
Figur 2: En kort tekst, der gør brug af overskriftniveauer, indrykkede citater, blandede lister og links (Denne visning er lavet i Latex, med dette dokuments layout)
10
4: At få hvad du mener, eller hvad du ser
Sigfred Hyveled Nielsen
(Se figur 3) Word blev brugt på engelsk i udgaven fra 2010. Brugerfladen er i høj grad visuelt orienteret, og funktioner er derfor primært tilgængelige vha. musen, selvom alting principielt kan tilgås med tastaturet. Overskrifterne blev angivet med Stylefunktionen, der kræver rimelig meget bladren rundt. Jeg forsøgte at markere det indrykkede citat som Stylen ‘Quote’, men denne tillod ikke indrykning eller den følgende kildehenvisning. Listen med blandet nummerering og punktform krævede en vis behændighed med menuer og tasterne Tab og Backspace. For at indsætte linket til Google, var det nødvendigt at lokalisere menupunktet ‘Hyperlink’, og at sætte sig ind i et temmelig forvirrende funktionsvindue. Den basale formatering (fed og kursiv) var nemt tilgængelig.
Figur 3: Færdigt layout lavet i Word. Standard typographic style
(Se figur 4 og 5) I Latex var det nødvendigt at skrive noget mere tekst. Jeg brugte en editor (Texmaker), der hjalp med kommandoer og syntax. At opsætte siden, tillade æøå og links krævede et par linjer kode i starten. For at opsætte det indrykkede citat, kunne kommandoen ‘Quote’ anvendes – men det var nødvendigt selv at sætte det kursivt, samt at inkludere kildehenvisningen indeni ’Quote’en. (Se figur 6, 7 og 5) Markdown blev brugt til at konvertere simpel markup til Latex-kode, med programmet MultiMarkdown. For at producere et dokument, var det nødvendig at tilføje de samme koder i starten, som ved Latex. Den eneste visuelle forskel fra den manuelt skrevne Latex-kode, var en indsat fodnote med linket. I Markdown brugtes hhv. 3 og 4 ‘#’-tegn til at angive overskriftniveau, og tegnet ‘>’ til at angive et indrykket citat. Ved alle tre, kræves der et vist bekendtskab med systemet for hurtigt at opsætte et dokument. Med Word’s menuer er det nemmere at finde funktioner, man sjældent 11
4: At få hvad du mener, eller hvad du ser
Sigfred Hyveled Nielsen
Figur 4: Latex-kode skrevet i hånden
bruger. Men hvis man kan huske metoden, er det hurtigere med Latex – og meget hurtigere med Markdown. Den deskriptive opmærkning (overskrifter og citat) krævede noget mere indsats i Word. For selve tekstopsætningen, krævede Markdown færrest klik og tastetryk, men krævede dog en ekstra konvertering for at få et færdigt dokument. En i skrivende stund meget ny tysk undersøgelse[19] af Latex og Word’s brugbarhed har vist, at ved almindelig tekst er Word langt det mest effektive – selv begyndere i Word var hurtigere til at opsætte tekst end eksperter i Latex. Omvendt var det dog, når dokumentet indeholdt matematik. Et tilhørende spørgeskema viste, var Latexbrugerne mere tilfredse med deres skrivesystem end Word-brugerne, men anså dog også Latex for sværere at lære. Undersøgelsen konkluderer, at Latex kun bør bruges ved matematikholdige dokumenter, og bør frarådes generel brug. Argumentet er at den nedsatte effektivitet svarer til ressourcespild af forskningsmidler, og de kalder Latex-brugernes præference for en art selvbedrag (kognitiv dissonans). Der er dog en del undersøgelsen ikke tager højde for; dens fokus ligger på reproduktion af korte
12
5: At få hvad du mener, eller hvad du ser
Sigfred Hyveled Nielsen
Figur 5: Latex-kode konverteret til færdigt layout
Figur 6: Markdown-kode skrevet i hånden
dokumenter, og siger således ikke noget om brugernes generelle sans for struktur og god praksis. Det fremgår ikke i hvilket omfang Word-brugerne gør brug af Styles – og den på kort sigt vundne effektivitet kan derfor hurtigt gå tabt ved justeringer af formatering og layout. I daglig brug, er der mange faktorer, der spiller ind – og det er
13
5: At skrive og beskrive
Sigfred Hyveled Nielsen
Figur 7: Latex-kode automatisk koverteret fra Markdown-kode
dermed ikke til at erklære det ene system bedre end det andet.
5 5.1
At skrive og beskrive Papir i en digital verden
Med internettets udbredelse, deles dokumenter i stadig større grad digitalt. Dette bringer mange fordele – teksterne kan søges i, indekseres og let distribueres. Derfor bliver færre dokumenter trykt på fysisk papir. De formater og programmer, vi bruger, er dog ikke fulgt med udviklingen, og holder sig stadig til ‘papir-metaforen’: skærmen viser et flot virtuelt ark papir, selv hvis dokumentet aldrig vil blive printet[31, s. 137-145][29, s. 3]. Men dét, der er nemt at læse på papir, er ikke det samme som på en skærm – og det virker fjollet at se på simulerede sideskift i en kontinuerlig tekst på en skærm[20, s. 4]. At WYSIWYG-skriveprogrammerne holder fast i papir-metaforen, gør at brugerne
14
5: At skrive og beskrive
Sigfred Hyveled Nielsen
kun ser dokumentet gennem dets visuelle repræsentation (den statiske funktionalitet), og at kun synlige forskelle anses for vigtige. Ofte ignoreres den dynamiske funktionalitet, som gør dokumentet brugbart for computere – især Paragraph Styles og afsnitsanmærkninger, der ikke kan ses på papiret, og dermed heller ikke på det metaforiske papir[31, s. 138-145]. Et dokument med korrekt deskriptiv markup kan nemt konverteres til et universelt format, såsom SGML. Kun i et format som dette, er man sikker på at dokumentet kan tilgås af alle, uanset programmer og evt. handicap, nu og fremover[6, s. 939][31, s. 137].
5.2
Velbevarede dokumenter
Det er vigtigt at de tekster, vi skriver idag, bevares for – og stadig kan åbnes i – fremtiden. Der er dog ikke ret stort fokus på dette, og tekster udgives og arkiveres ofte i uhensigtsmæssige formater. Ved disse, afhænger man tit af kommercielle programmer og specifikke software-versioner, der ikke nødvendigvis er tilgængelige i fremtiden. Her er det ønskværdigt at dokumenterne så vidt muligt er deskriptiv opmærkede og gemt i et simpelt tekstformat, således at de altid vil kunne åbnes og genopsættes. Ud fra disse kriterier er altså både PDF (der i vid udstrækning bruges til deling, men er en lukket standard ejet af Adobe), Latex (der afhænger af procedure-opmærkning) og diverse Word Processorers interne formater (som Words DOCX), uegnede som oplagringsformat. I stedet vil fx XML være at foretrække[3, 2]. Der er dermed god grund til at bygge program-uafhængighed ind i dokumentformater, så nutidens forskning ikke ender med at sidde fast i dokumenternes svar på Betamax.
5.3
Layout til lejligheden
Selvom man i Latex ikke arbejder direkte med siden, bliver resultatet (som regel en PDF-fil) stadig stærkt print-orienteret. Endvidere flettes teksten sammen med så mange layout-specifikke kommandoer, at det er meget svært at tilpasse det endelige dokument til andre visningsformer, såsom læsning på skærm. Der opstår derved en kløft mellem tekster skrevet til print og traditionel udgivelse, hvor layoutet er ‘frosset’ fast[15, s. 61] – og tekster skrevet til deling på internettet, hvor layoutet opsættes og tilpasses til den enkelte brugers skærmtype[33, s. 12][15, s. 62]. Der er lavet en del forskning i dynamisk og ‘adaptivt’ layout[13, 15], men dokumenter distribueres stadig i ‘frossen’ form.
15
5: At skrive og beskrive
Sigfred Hyveled Nielsen
5.4
Strukturen i fokus
Alle disse problemer har deres rod i, at de bredt anvendte tekstbehandlingssystemer er orienteret mere imod det visuelle, end det logiske. De understøtter kun i begrænset omfang deskriptive opmærkninger, der forklarer tekstelementernes betydning, og lægger i stedet op til at angive hvordan de skal vises. Word Processorer er især skyldige i dette, men problematikken gælder også Latex og, i forlængelse, LMS’er. Forfattere er i dag endt med også at skulle være sættere og designere, selvom disse opgaver kræver helt andre forudsætninger[33, s. 13][6, s. 940]. De trænes til at se teksten gennem dens udseende, fremfor dens struktur, og forventer at arbejde i en visning identisk til det endelige resultat. Modsat de teknisk orienterede forfattere, der anser tekst for et ordnet hieraki af over- og under-elementer (et ‘træ’), bliver tendensen at se teksten som en lineær strøm, og ikke ænse den dybereliggende struktur[14, s. 32][10, s. 11-14][18, s. 58]. Ved brug af deskriptiv markup, er forfatteren nødt til at tage stilling til dokumentets struktur[6, s. 944-946]. Denne tilgang følges tit af mantraet ‘Adskillelse af præsentation og indhold’[5] – dvs., at dokumentets tekst og dets opsætning er uafhængige af hinanden. Dette står parallelt med den såkaldte Model-View-opbygning, som man finder i computerprogrammering. Her sørger man så vidt muligt for at adskille View (programmets brugerflade) fra Model (den interne logik, der får programmet til at virke). Denne tilgang er meget udbredt, og undervises i. De, der skriver tekst fremfor kode, bliver dog sjældent præsenteret for denne idé[29, s. 4].
5.5
Diskussion. Forhindringer og mulige løsninger
Der er altså en del problematikker, der er dybt indgroede i måden, vi bruger computere til at skrive på. De programmer, som flertallet bruger, fokuserer alt for snævert på dokumentets udseende, og i Word Processornes tilfælde, skjuler aktivt dets strukturelle opbygning. Formaterne reflekterer programmerne, og er i mange tilfælde kun egnet til print. I mange tekster argumenteres der derfor for en total overgang til deskriptiv markup[6, 29, 20]. Dette har dog også sine ulemper: store mængder af deskriptiv markup bliver distraherende, og besværer skriveprocessen[6, s. 945]. Samtidig er det svært at sætte klare grænser, når man adskiller indholdet fra præsentationen – hvor hører et billede fx til? – eller en tabel?[23, 28] En del af problemet ligger også i, at struktur-orienterede programmer generelt bliver programmeret fra en ingenørs, snarere end en forfatters, synspunkt. I den sammenhæng bliver det fremsat, at ‘produktet er brugerfladen’, og at hindringen for bredere brug af deskriptiv markup, er manglen på attraktive og brugervenlige program16
6: Konklusion
Sigfred Hyveled Nielsen
mer[10, s. 12-13]. Man bør heller ikke afvise WYSIWYG helt – ved korte og meget visuelle dokumenter, er det ofte en fordelagtig tilgang[14, s. 34][33, s. 5]. Når folk forsvarer det ene eller det andet system, er det generelt mere baseret på holdning og personlig præference, end på nogen objektive vurderinger[19, s. 2]. Argumentet for Latex lyder tit, at det simpelthen producerer smukkere dokumenter – og dets resultater er da også noget mere typografisk detaljerige[32]. Men begynder man at lytte til Latex’ fortalere, ænser man nemt en nærmerst religiøs dedikation. Opfinderen af Tex, Donald Knuth, har et følge en profet værdigt[8], og der cirkulerer flere meget grundige dokumenter, som fordømmer WYSIWYG, Word, og dets filformater, til de hedeste dybder af helvede[11, 7]. Latex-introduktioner på nettet refererer ofte til disse, hvor de burde henvise til saglige undersøgelser[30]. Denne fanatisme kan muligvis også afholde nytilkomne. Konkrete tiltag, der kunne hjælpe til bredere brug af deskriptiv skrivning, kunne være et standardiseret letvægts- og wiki-markup-sprog – samt at undervise i brug af dette og struktur-orienteret skrivning[29, s. 4-6]. Det er altid svært at overtale folk til at skifte væk fra de systemer, de er vant til, så det ville være fordelagtigt at introducere konceptet relativt tidligt. En undersøgelse har vist, at børn i fjerde klasse kunne bruge wiki-markup efter en kort introduktion[29, s. 2]. Med bedre programmer og formater, burde det derfor være muligt at give en ny generation en bedre sans for struktur.
6
Konklusion
Denne opgave har gennemgået de mest gængse tekstbehandlingsystemer, og teorien bag. Der er blevet identificeret en række problemer, navnlig at programmerne ligger mere op til en visuel end struktureret skriveproces. Dette resulterer i dokumenter, der er svære at læse på skærme, indeksere og bevare for fremtiden. Et deskriptivt letvægtsmarkup-sprog kunne potentielt afhjælpe dette, men der findes ikke standardiseret sådant i dag. Et problem ligger også ved brugerne selv, da disse sjældent tænker over hvordan de skriver, og nødigt vil skulle lære at bruge et helt nyt system.
17
6: REFERENCER
Sigfred Hyveled Nielsen
Referencer [1] Jeff Atwood. Standard Markdown is now Common Markdown. 5. sep. 2014. URL: http://blog.codinghorror.com/standard-markdown-is-now-commonmarkdown/ (sidst set 28.12.2014). [2] Ian Barnes. Preservation of TeX/LaTeX Documents. Australian Partnership for Sustainable Repositories, jul. 2006. URL: http://hdl.handle.net/1885/46441 (sidst set 22.12.2014). [3] Ian Barnes. Preservation of word-processing documents. Australian Partnership for Sustainable Repositories, jul. 2006. URL: http://hdl.handle.net/1885/46440 (sidst set 22.12.2014). [4] Francois Brischoux og Pierre Legagneux. “Don’t Format Manuscripts”. I: The Scientist 23.7 (2009), s. 24. [5] Dave Clark. “Content management and the separation of presentation and content”. I: Technical communication quarterly 17.1 (2007), s. 35–60. [6] James H. Coombs, Allen H. Renear og Steven J. DeRose. “Markup systems and the future of scholarly text processing”. I: Communications of the ACM 30.11 (1987), s. 933–947. [7] Allin Cottrell. Word processors: Stupid and inefficient. 1999. URL: http://ricardo.ecn.wfu.edu/~cottrell/wp.html (sidst set 22.12.2014). [8] Steve Ditlea. “Rewriting the Bible in 0’s and 1’s”. I: Technology review 102.5 (1999), s. 66–70. [9] Adam C. Engst. TidBITS in new format. TidBITS. 6. jan. 1992. URL: http://tidbits.com/article/3282 (sidst set 27.12.2014). [10] Peter Flynn. “Why writers don’t use xml”. I: Proceedings of Balisage: The Markup Conference. 2009. [11] Jeff Goldberg. Don’t use MS-Word as a document exchange format. 2005. URL: http://www.goldmark.org/netrants/no-word/ (sidst set 24.12.2014). [12] Thomas Haigh. “Remembering the office of the future: The origins of word processing and office automation”. I: Annals of the History of Computing, IEEE 28.4 (2006), s. 6–31. [13] Steven J. Harrington m.fl. “Aesthetic measures for automated document layout”. I: Proceedings of the 2004 ACM symposium on Document engineering. ACM. 2004, s. 109–111.
18
6: REFERENCER
Sigfred Hyveled Nielsen
[14] Charles Hill. “Markup meets the mainstream: the future of content-based processing”. I: ACM SIGDOC Asterisk Journal of Computer Documentation 21.3 (1997), s. 32–35. [15] Charles Jacobs m.fl. “Adaptive document layout”. I: Communications of the ACM 47.8 (2004), s. 60–66. [16] Cliff Joseph. Alternatives to Pages. 26. maj 2014. URL: http://www.macworld.co.uk/feature/mac-software/alternatives-pages3521569/ (sidst set 03.01.2015). [17] Martin Junghans m.fl. “A grammar for standardized wiki markup”. I: Proceedings of the 4th International Symposium on Wikis. ACM. 2008, s. 21. [18] David Kastrup. “Revisiting WYSIWYG paradigms for authoring LATEX”. I: Proceedings of the 2002 Annual Meeting, TUGboat. Bd. 23. 1. 2002. URL: http://www.tug.org/TUGboat/Articles/tb23-1/kastrup.pdf (sidst set 28.12.2014). [19] Markus Knauff og Jelica Nejasmic. “An Efficiency Comparison of Document Preparation Systems Used in Academic Research and Development”. I: PloS one 9.12 (2014). [20] Leslie Lamport. “Document Production: Visual or Logical?” I: TUGboat 9.1 (1988), s. 8–10. URL: http://www.msr-waypoint.com/enus/um/people/lamport/pubs/document-production.pdf (sidst set 29.12.2014). [21] Leslie Lamport. Latex: A Document Preparation System. Addison-Wesley Longman Publishing Co., Inc., 1986, s. 1–12. [22] Lynn C. Lewis. “Visible and Hidden Transcripts: Word Domination and Paths to Resistance”. I: Computers and Composition Online Journal (spring 2007). URL: http://www2.bgsu.edu/departments/english/cconline/lewis/worddom.html (sidst set 03.01.2015). [23] Chris Lilley. Separation of semantic and presentational markup, to the extent possible, is architecturally sound. 2003. [24] John Lombardi. “War of the Words”. I: InfoWorld 16.6 (1994), s. 66–79. URL: http://books.google.com/books?id=6DoEAAAAMBAJ&pg=PA66 (sidst set 02.01.2015). [25] Comprehensive TeX Archive Network. What are TeX and its friends? 2015. URL: http://www.ctan.org/tex/ (sidst set 02.01.2015). [26] Greg R. Notess. “Diverging Web markup choices”. I: Online 30.6 (2006), s. 43–45. 19
6: REFERENCER
Sigfred Hyveled Nielsen
[27] Steven Ovadia. “Markdown for Librarians and Academics”. I: Behavioral & Social Sciences Librarian 33.2 (2014), s. 120–124. [28] Wendell Piez. “Format and Content: Should they be separated? Can they be?: R 2005. With a counter-example.” I: Proceedings of Extreme Markup Languages . URL : http://conferences.idealliance.org/extreme/html/2005/Piez01/ EML2005Piez01.html (sidst set 28.12.2014). [29] Christoph Sauer. “What you see is wiki–questioning WYSIWYG in the Internet age”. I: Proceedings of Wikimania. Bd. 2006. 2006. [30] James Swenson. Using LaTeX: How and why? 2014. URL: http://people.uwplatt.edu/~swensonj/latex/ (sidst set 28.12.2014). [31] Pål Sørgaard og Tone Irene Sandahl. “Problems with styles in word processing: a weak foundation for electronic publishing with SGML”. I: System Sciences, 1997, Proceedings of the Thirtieth Hawaii International Conference on. Bd. 6. IEEE. 1997, s. 137–146. [32] Dario Taraborelli. The Beauty of Latex. 4. jul. 2011. URL: http://nitens.org/taraborelli/latex (sidst set 03.01.2015). [33] Conrad Taylor. “What has WYSIWYG done to us”. I: The Seybold Report on Publishing Systems 26.2 (1996), s. 1–12. [34] Dennis G. Watson. Brief history of document markup. University of Florida Cooperative Extension Service, Institute of Food og Agriculture Sciences, EDIS, 1992.
20