Innovatieve projecten
DOV is een rijk platform aan data en tools, en stimuleert innovatieve projecten die hiermee aan de slag gaan. DOV ondersteunt projecten die zoeken naar efficiënter gebruik van het brede scala aan DOV-data en -tools, in de verschillende kennisdomeinen waarin de ondergrond een belangrijke rol speelt. Deze projecten worden gestuurd of ondersteund door één of meerdere partners uit het DOV-netwerk. Met dit overzicht willen we werkwijzen, methodes en mogelijke opportuniteiten delen. We richten ons tot data-specialisten, maar ook tot inhoudelijke experten. Geïnteresseerden kunnen elkaar vinden. DOV wenst hiermee te inspireren en een eventuele verdere samenwerking of kennisdeling te stimuleren.
Heb je een interessant project dat in dit lijstje past, contacteer ons of een van de DOV-partners.
Codering van vrije lithologische boorbeschrijvingen met GeoBERTje
VITO: Katrijn Dirix, Hossein Ghorbanfekr, Pieter Jan Kerstens, Lorenz Hambsch
VPO-DOV: Katrien De Nil
VITO heeft een groot aantal Nederlandstalige lithologische boorbeschrijvingen van DOV gebruikt om een large language model te trainen om deze beschrijvingen automatisch te coderen naar hoofd- en nevenlithologie. Het resulterende domeinspecifieke taalmodel heet GeoBERTje en is gebaseerd op BERTje. De prestaties van GeoBERTje werden vergeleken met een script-gebaseerde methode en ChatGPT 4.0. Dit model opent nieuwe mogelijkheden om grote datasets in te zetten in (3D-)modellen en analyses. VITO stelt de code open ter beschikking, zodat alle stappen kunnen doorlopen worden door iedereen: van extractie dataset uit DOV (PyDOV) t.e.m. de codering van de beschrijvingen. Het model kan in de toekomst nog verder ontwikkeld worden. Ook kan het, naast zijn huidige toepassing als coderingstool, gefinetuned worden voor andere specifieke taken.