Voorbeelddata¶
De repository bevat synthetische voorbeelddata in data/synthetic/data/ — fictieve maar realistische archeologische data waarmee je de volledige Wasstraat-pipeline kunt testen zonder eigen brondata. De echte Delftse opgravingsdata is niet opgenomen in de repository.
Twee voorbeeldprojecten¶
| Project | Beschrijving | Putten | Sporen | Vondsten | Artefacten | Datering |
|---|---|---|---|---|---|---|
| SY001 | Klein project (Marktstraat 10, Voorburg) | 2 | 3 | 4 | 5 (aardewerk, glas) | 1600-1750 |
| SY002 | Groot project (Kerkplein, Leiden) | 4 | 8 | 12 | 20 (8 materiaalsoorten) | 1200-1800 |
SY002 bevat een breed scala aan materiaalsoorten: aardewerk, glas, been, metaal, leer, steen, kleipijp en munten. Beide projecten bevatten ook depot- en fotometadata.
Daarnaast bevat de synthetische data een monsterdatabase met 5 grondmonsters (3× SY001, 2× SY002), 8 botanische determinaties, 4 schelpdeterminaties en bijbehorende referentietabellen (plantensoorten, schelpsoorten, deeltypen, conserveringstoestanden).
Bestandsstructuur¶
De synthetische data volgt exact dezelfde directorystructuur als echte opgravingsdata:
data/synthetic/data/
├── projecten/
│ ├── SY001/
│ │ ├── C Database/opgravingSY001.mdb # Projectdatabase
│ │ └── L Fotos/ # Foto's
│ └── SY002/
│ ├── C Database/opgravingSY002.mdb
│ └── L Fotos/
├── delfit/DELF-IT.mdb # Projectenlijst
├── magazijnlijst/MAGAZIJN.mdb # Depotdata
├── digifotos/Digifotos.mdb # Fotocatalogus
└── monsterdatabase/MONSTERS.mdb # Monsterdata (botanie + schelpen)
Gebruik bij testen¶
De synthetische data wordt automatisch gebruikt bij de standaard integratietests:
make integration # Test pipeline met synthetische data
De docker-compose.test.yml mount de synthetische data als input-volumes voor de Airflow-container.
Eigen data klaarzetten¶
Gemeenten die hun eigen opgravingsdata willen verwerken, kunnen hun bestanden organiseren conform dezelfde structuur als de voorbeelddata. De Wasstraat verwacht:
| Directory | Inhoud | Formaat |
|---|---|---|
projecten/ of digidepot/ |
Per opgraving een subdirectory met de projectdatabase | .mdb / .accdb |
delfit/ of Delf-IT/ |
Centrale administratiedatabase met projectoverzicht | .mdb + .xlsx |
magazijnlijst/ |
Depot- en magazijnadministratie | .mdb |
digifotos/ |
Digitale fotolijst met metadata | .mdb |
monsterdatabase/ |
Monstergegevens met botanische en zoölogische determinaties | .mdb / .accdb |
referentietabellen/ |
ABR-classificatie en standaardtabellen | .xlsx / .mdb |
Plaats de bestanden in data/input/basefiles/projectdatabase/ en configureer de Docker-volumes in je docker-compose override. Zie Aan de slag voor gedetailleerde instructies.
Data opnieuw genereren¶
De synthetische data kan opnieuw gegenereerd worden met het generatorscript in data/synthetic/generatie/:
make synthetic
Vereisten voor regeneratie:
- Java JRE (voor Jackcess MDB-schrijver)
- Python packages uit
data/synthetic/generatie/requirements-synthetic.txt - Jackcess JARs (al aanwezig in
data/synthetic/generatie/jars/)