Leon van Wissen

LvanWissenMember since Feb 28th, 2019
Organizations
362.397.700 statements

Indices from the Stadsarchief Amsterdam, transformed, enriched and published by Golden Agents. The data is transformed into an information-rich graph that includes interpretation and inferred events. For instance, a birth event is inferred from a record from the baptism index and a death event is inferred from a burial record. Where possible, locations have been mapped to resources with geospatial properties and relations between persons are expressed. This should facilitate person disambiguation in multiple graphs, which has not yet been done in this dataset.

The main vocabularies that are used are pnv for names, bio for life events, schema and a temporary Golden Agents vocabulary.

A direct conversion from the original data to RDF can be found in SAA.

Introduction

Van dit handgeschreven kohier (SAA inventarisnummer 5028:662) bestaat een getypte index op achternaam (SAA inventarisnummber 5028:662A). Hierin is de naam van een persoon, de relatie tot een andere persoon of groep (e.g. wed. van, of kinderen van), beroep en de woonwijk opgenomen. Ook is genoteerd op welk foliant de persoon beschreven is.

Wijkindeling

In totaal zijn 60 wijken beschreven in het kohier, aangegeven met cijfers. Daarna volgt een sectie van de 'Magistraten' (M), 'Joodse Natie' (J), 'Paden buijten de Stadt' (P1-P6), 'Officianten' (O), 'Regerende heeren' (R), 'Personen van andere Steden' (AS) en 'Testamenten' (T).

De wijkindeling correspondeert waarschijnlijk met die van een kaart uit 1766, vervaardigd door C. Philips Jacobsz. (1732-1789) en F.W. Greebe en is beschikbaar in de Beeldbank van het Stadsarchief, afbeelding 010001000849.

Digitalisering

Scans van zowel de index, als het kohier zelf zijn beschikbaar in de Beeldbank van het Stadsarchief Amsterdam.

OCR

OCR met Tesseract (500-alpha) op afgeleide tiff's van Scantailor (Advanced 1016). Zie .

Correctie

Semi-automatische verbetering van veelvoorkomende OCR-fouten (e.g. een '&' voor een '4'). Waar regels in het origineel afgebroken waren, zijn die in de tekstbestanden als één regel opgenomen. Elke regel kent drie kolommen, gescheiden door witruimte, met al dan niet een verdere verdeling in persoonsnaam en additionele informatie door een '—' teken.

Persoonsnamen zijn verder uitgesplitst volgens PNV (https://w3id.org/pnv#).

Conversie naar RDF

De data uit de CSV is omgezet naar RDF volgens de ROAR (https://w3id.org/roar#) ontologie, met aanvullingen volgens PROV (http://www.w3org/ns/prov#) OA (http://www.w3org/ns/oa#) en EDM (http://www.europeana.eu/schemas/edm/). Zie: .

Contact

Overgenomen van https://github.com/LvanWissen/kohier-1674/

l.vanwissen@uva.nl

Temporary dataset that contains a quick and dirty mapping of the indices in the Stadsarchief Amsterdam (SAA) to a provisional ontology. No interpretation is given in this dataset. If person names are mentioned, then these are mapped to the pnv vocabulary using a PersonName resource, otherwise a literal is used. Click on one of the example records below to get a grasp of the vocabulary that is used.

The original data (XML) is available in the SAA's Open Data collection.

An enriched version can be found in another dataset in druid: Stadsarchief. In this dataset, persons, locations and (bio) events are inserted, errors are corrected and deduplication is done. The pipeline that is used will, at some point, be publicly available.