- agenda (271)
- annotation (24)
- beeldende kunsten (13)
- community created content (16)
- digitale bibliotheek (21)
- diversen (25)
- duurzaamheid (11)
- e-tijdschrift (9)
- editie (134)
- educatief (9)
- handleiding (5)
- humanities computing (15)
- infrastructuur (5)
- institutioneel nieuws (7)
- internet algemeen (12)
- metadata (7)
- naslagwerk (6)
- online boekdiscussie (4)
- open access (1)
- project (8)
- publicatie (26)
- software (48)
- standaard (62)
- tijdschrift (2)
- tijdvak (127)
- 18e eeuw (12)
- 19e eeuw (23)
- 20e eeuw (17)
- middeleeuwen (45)
- niet-westers (1)
- oudheid (9)
- renaissance (36)
- visualisatie (12)
- weblog (3)
Delen via Twitter
Abonneer op RSS feeds
Nieuws
Agenda
Weblog e-tekstualiteit
Achtergrond Deze site is geinitieerd door:
Wie wil zoeken in documenten in oude taalvarianten (bijvoorbeeld Nederlands uit de Middeleeuwen of de Gouden eeuw), loopt altijd aan tegen de afwijkende en onregelmatige spellingen. In een interessant artikel beschrijven Marijn Koolen e.a. hoe ze herschrijfregels hebben toegepast op zeventiende-eeuws Nederlands en daarmee het resultaat van zoekacties substantieel konden verbeteren. Die herschrijfregels zelf konden ze automatisch afleiden uit twee corpora van historisch en modern materiaal. De benadering zou dus toegepast kunnen worden zonder diepgaande kennis van de betrokken taal, en misschien ook voor andere talen toepasbaar zijn.
Marijn Koolen, Frans Adriaans, Jaap Kamps, and Maarten de Rijke. A cross-language approach to historic document retrieval. In Mounia Lalmas et al., editor, Advances in Information Retrieval: 28th European Conference on Information Retrieval (ECIR 2006), volume 3936 of Lecture Notes in Computer Science, pages 407-419. Springer Verlag, Heidelberg, 2006.
Geplaatst in humanities computing, weblog digital humanities