- agenda (271)
- annotation (24)
- beeldende kunsten (13)
- community created content (16)
- digitale bibliotheek (21)
- diversen (25)
- duurzaamheid (11)
- e-tijdschrift (9)
- editie (134)
- educatief (9)
- handleiding (5)
- humanities computing (15)
- infrastructuur (5)
- institutioneel nieuws (7)
- internet algemeen (12)
- metadata (7)
- naslagwerk (6)
- online boekdiscussie (4)
- open access (1)
- project (8)
- publicatie (26)
- software (48)
- standaard (62)
- tijdschrift (2)
- tijdvak (127)
- 18e eeuw (12)
- 19e eeuw (23)
- 20e eeuw (17)
- middeleeuwen (45)
- niet-westers (1)
- oudheid (9)
- renaissance (36)
- visualisatie (12)
- weblog (3)
Delen via Twitter
Abonneer op RSS feeds
Nieuws
Agenda
Weblog e-tekstualiteit
Achtergrond Deze site is geinitieerd door:
Het Instituut voor Nederlandse Geschiedenis heeft de brieven van Constantijn Huygens digitaal beschikbaar gemaakt. Daarbij is uitgegaan van de bewerking door J.A Worp in de periode 1911-1917, verschenen in de RGP Grote Serie 15, 19, 21, 24, 28 en 32.
Wat wordt beschikbaar gesteld is een verzameling van PDF-bestanden met scans uit de editie-Worp. De brieven zijn per maand verzameld in een enkel bestand. Binnen deze bestanden kan worden gezocht met de faciliteiten van de Acrobat Reader.
Over de bestanden heen kan worden gezocht op tekst, op correspondent, op plaats, en nog een aantal andere mogelijkheden; de zoekopdrachten kunnen worden gecombineerd met selectie op datum. Daarnaast is een scan beschikbaar van het oorspronkelijke persoonsregister, maar dit is een (niet-cumulatief) register per deel, en de verwijzingen zijn niet aanklikbaar (dus bladzijdenummers overschrijven uit de verschillende indices en stuk voor stuk intypen in het zoekinterface…).
De tekst waarin wordt gezocht is het resultaat van optical character recognition. Dat, of een dronken typiste, moet de verklaring zijn van de zeer grote aantallen typefouten in de (zoek-)tekst (tientallen per bladzijde). Het zoeken (en ook het knippen en plakken) is dus niet erg betrouwbaar (dat wil zeggen: het zoeken op de tekst; het zoeken op bijvoorbeeld correspondenten, via de bijbehorende database, is wel betrouwbaar).
Overigens geeft de op de site beschikbare ‘zoekhulp’ netjes aan, dat het zoeken op woorden onbetrouwbaar is. Maar eigenlijk zou het in rode letters boven elke lijst met zoekresultaten moeten staan.
Het behoeft geen betoog dat het fantastisch is, een digitale versie van de brieven van Huygens ter beschikking te hebben. Maar eigenlijk is dit toch niet de manier waarop het zou moeten. De beschikbaarheid van een betrouwbare tekst waar in gezocht kan worden, is m.i. de minimale uitkomst van een dergelijk digitaliseringsproject.
Geplaatst in editie, renaissance, weblog digital humanities
Het zou veel tijd (en geld) hebben gekost om alle teksten integraal te laten overtypen. Maar het grootste argument hiertegen was dat het weinig meerwaarde zou hebben opgeleverd. Immers het betreft een begin 20e eeuwse bronneneditie waarbij veel is weggelaten, veel is geparafraseerd in archaisch taalgebruik en veel verschillende talen door elkaar heen zijn gebruikt. Dat had niet veel extra waarde opgeleverd voor de doorzoekbaarheid op woord.
De financiƫle afweging kan ik natuurlijk niet maken. De redenen die je aanvoert beperken inderdaad de waarde van voltekst zoeken, maar maken het nog niet zinloos. Zeker een zoekmachine die bij de gevonden woorden direct de context toont zou m.i. nog steeds enorme toegevoegde waarde hebben. In iets mindere mate geldt dit ook voor het kunnen knippen en plakken.