English Nederlands
Publicatie WP3

Publicatie: FAIR-conforme databaseontwikkeling voor menselijk microbioom

17 september 2024

Authors: Mathieu Dorst, Nathan Zeevenhooven, Rory Wilding, Daniel Mende, Bernd W. Brandt, Egija Zaura, Alfons Hoekstra, Last author: Vivek M. Sheraton

De auteurs hebben tools ontwikkeld voor het creëren van een grote, georganiseerde bibliotheek (database) voor microbioomgegevens (kiemen die in en op ons lichaam leven) die gemakkelijk toegankelijk en bruikbaar zijn voor onderzoekers. Dit zal wetenschappers helpen om informatie te delen en nieuwe manieren te bedenken om gezondheidsproblemen aan te pakken, terwijl ook de privacywetgeving wordt nageleefd en de persoonlijke informatie van mensen wordt beschermd. Ze gebruiken een speciaal platform om de database op te bouwen en een handige set tools te maken die zelfs niet-deskundigen kunnen gebruiken om de gegevens te begrijpen en ermee te werken. Hieronder volgt een technische samenvatting van het werk,

Het artikel stelt de creatie voor van een real-time FAIR (Findable, Accessible, Interoperable, Reusable) database voor de behandeling en opslag van menselijke microbiome en gastheer-geassocieerde gegevens. Deze databaseontwikkelingspijplijn heeft als doel innovatie te vergemakkelijken en kosten in onderzoek te verlagen door gestandaardiseerde, transparante en direct beschikbare (meta)data te maken.

De auteurs bespreken potentiële conflicten die voortkomen uit privacywetgeving en mogelijke sequenties van het menselijk genoom in metagenome shotgun gegevens en stellen alternatieve paden voor om in dergelijke gevallen naleving te bereiken. Ze identificeren gevoelige microbioomgegevens, zoals DNA-sequenties of geolokaliseerde metadata, en overwegen de rol van GDPR-gegevensregelgeving. De database is geïmplementeerd met behulp van een open-source ontwikkelplatform, Supabase, waarmee onderzoekers gegevens over het menselijk microbioom kunnen openen, uploaden, downloaden en er op een FAIR-conforme manier mee kunnen interageren. Daarnaast wordt een groot taalmodel (LLM) ingezet om kennisverspreiding en niet-expert gebruik van de database mogelijk te maken.

Bekijk publicatie (doi)