screenshots


User interface voor het zoeken


Displayed page.


Spreiding Chronologische voorkomens in een database.


Administratie meerdere databases.


Administratie enkele database.


Nieuwe database maken.

       

Last update of this page: july 2008.

Open Boek

Open Boek is een tekst retrieval systeem voor PDF en HTML documenten met archeologische of historische inhoud, of andere documenten waarin het tijdsaspect belangrijk is. Zowel Nederlandstalige als engelstalige documenten kunnen worden gebruikt: andere talen zijn relatief eenvoudig toe te voegen. Belangrijke eigenschap van het OB systeem is semantsiche verrijking door middel van machine learning. In deze versie van Open Boek (2.01) demonstreren we het taggen en indexeren van jaartallen, eeuwen en dergelijke, ongeacht de gebruikte schrijfwijze. We laten ook zien hoe plaatsnamen kunnen woreden ge-disambigueerd, zoeken op afstand van een pepaalde plaats en het linken naar Googlemaps.

In geval van problemen, van welke aard ook, graag contact opnemen met de auteur: Hans Paijmans, Universiteit van Tilburg, paai@uvt.nl.

Demo van version 2.01

Volg deze link voor de huidige versie (version 2.01). Het is de bedoeling dat deze versie altijd on-line is en hopelijk ook bugvrij. Een goede database om te proberen is Dans_stable.

Download van versie 2.01

Belangrijk: Open Boek draait in de LAMP omgeving (Linux, Apache, Mysql en PHP). Download via deze link. De installation en user manual (engelstalig) is bijgevoegd als install.pdf and user.pdf . Unzip de openboek.tgz file ergens in de document root van Apache en volg de instructies in install.pdf.

De manual

De manual voor version 1 kan hier worden ingezien, maar versie 1 wordt niet meer onderhouden. De user interface is echter min of meer gelijk gebleven. We zijn nu bezig met de manual van versie 2, met SQL en andere toeters en bellen; hopelijk is die ergens rond juli 2008 in te zien.

Aangeboden diensten

De teksten van individuele databases of zelfs documenten kunnen met een password worden beschermd, maar OB kan ook indexeringsdiensten leveren voor instellingen die hun data niet on-line willen hebben, of die eigen retrieval applicaties willen bouwen.
Je kunt je eigen PDF-files hier (experimenteel!) opgeven, en Open Boek zal de chronologische gegevens indexeren. De kunt de indexen daarna als ASCII downloaden en voor je eigen toepassingen gebruiken.

Downloading and licensing

Open Boek is zoals alle software die in CATCH projecten is ontwikkeld, gepubliceerd onder de GPL. Op zijn beurt gebruikt het weer andere programmas, die onder andere voorwaarden gepubliceerd kunnen zijn: het is ieders eigen verantwoordelijkheid de gebruiksvoorwaarden voor die software te lezen en zich eraan te houden.
We testen bijna uitsluitend onder Linux en Firefox. Microsofts Internet Explorer geeft zover we weten geen problemen, maar mist allelei prettige eigenschappen van Firefox, zoals tabbed browsing. En Microsoft is natuurlijk inherent onveilig: we kunnen het gebruik ervan niet aanraden.