NL FR EN
www.belgium.be

Prototype van een gedistribueerd FAME informatiesysteem voor een verbeterde identificatie van prokaryoten

Onderzoeksproject C3/012 (Onderzoeksactie C3)

Personen :

Beschrijving :

Context

Snelle en nauwkeurige identificatie van micro-organismen is van groot biologisch, klinisch en economisch belang, en vindt toepassingen binnen een brede waaier aan vakgebieden zoals bioremediëring, klinische diagnostiek, gewasbescherming, voedselveiligheid en waterbeheer, naast tal van andere domeinen. Alhoewel het enorme potentieel van automatische patroonherkenning door een steeds intensievere en meer geraffineerde computerisering reeds wordt uitgebuit in diverse onderzoeksdomeinen, zijn vergelijkbare toepassingen voor het identificeren van bacteriële soorten in een embryonaal stadium blijven hangen. Niettegenstaande grootschalige verkennende projecten wijzen op een potentiële doorbraak, blijven een aantal technische uitdagingen nog steeds overeind. Betreffende het consequent gebruik van ‘machine learning’ technieken voor speciesidentificatie, blijken de grenzen nog dienen bepaald zet te worden. Naast culturele en organisatorische kwesties, is de beschikbaarheid van voldoende financiële middelen ongetwijfeld van groot belang geweest bij de beperkte vooruitgang die tot op heden werd gerealiseerd. Nochtans zou het gezien de waarde van het mogelijke eindproduct – een generiek automatisch identificatiesysteem voor bacteriële species met nieuwe mogelijkheden in het vooruitzicht voor fundamentele en toegepaste activiteiten binnen de microbiologie en gerelateerde domeinen – een gemiste kans zijn om niet te proberen deze beperkingen in de nabije toekomst weg te vlakken.

Projectbeschrijving

Automatische identificatie van een bacteriële stam op basis van de kennis van zijn fenotypische en genomische eigenschappen is onmogelijk zonder een onbeperkte toegang tot de ruwe empirisch onderzoeksresultaten waarop de taxonomy van de prokaryoten gestoeld is. Het genereren van een kritische massa aan waarnemingen die de volledige biodiversiteit omvatten – een noodzakelijke voorwaarde voor geautomatiseerde identificatiesystemen – is een onmogelijke opdracht om te worden gerealiseerd door één enkele onderzoeksinstelling. Vandaar dat het oprichten van grootschalige platformen voor biologische informatie-overdracht best kan worden opgezet met bijdragen vanuit de volledige onderzoeksgemeenschap, waarbij databanken uit verschillende onderzoeksinstellingen met elkaar worden verweven. Een dergelijk platform vormt een wetenschappelijke werkomgeving waar nauwe samenwerkingsverbanden tussen microbiologen, wiskundigen, ingenieurs, en computerwetenschappers kan leiden tot nieuwe benaderingen voor bacteriële identificatie. Tergelijkertijd vormt het ook een solide basis voor de harmonisatie van internationaal beleid en kan het fundamentele inzichten aanreiken voor een beter begrip van het dynamisch gedrag van prokaryote diversificatie. Het oprichten van een platform voor uitwisseling van bacteriële kennis vraagt om nieuwe doorbraken in de aanpak van globale gegevensuitwisseling, een nieuwe cultuur in de omgang met ruwe wetenschappelijke gegevens, en het verkennen van de mogelijkheden van data miningstechnieken met het oog op een beter begrijpen van het bacteriële leven.

Door de vele verbeteringen op het vlak van automatische calibratie en interpretatie van chromatografische profielen kunnen reproduceerbare vetzuurprofielen de dag van vandaag snel worden gegenereerd, op voorwaarde dat stammen onder vastgelegde condities worden opgegroeid. Bijgevolg is identificatie van microorganismen om basis van de analyse van hun cellulaire vetzuursamenstelling routine geworden in vele laboratoria. De snelle doorlooptijd van vetzuuranalyse laat toe om een groter segment van de prokaryote diversiteit the screenen ten opzichte van genomische merkers zoals 16S rRNA gensequenties of polygenomische sequentie-informatie. Als eerste stap bij het oprichten van een complex technologieplatform zal dit project zich dus als vorm van prototype toespitsen op integratie van de vetzuurdatabanken die automatisch worden gegenereerd op basis van het Sherlock Microbial Identification System binnen de BCCM\LMG en DSMZ bacteriëncollecties. Er zal worden aangetoond hoe nieuwe patronen kunnen worden herkend in deze kruispuntdatabank, waardoor er een verhoogde resolutie wordt bekomen van de analyse van de vetzuursamenstelling van de volledige bacteriële cel voor het herkennen van bacteriële soorten. Deze bevindingen bevestigen de toepasbaarheid van kennisextractie uit databanken binnen het domein van de microbiologie. Naast een uitbreiding van de omvang van de kennisbank kunnen nauwkeurigheid en flexibiliteit van automatische soortherkenning verder worden verhoogd door het aanwenden van de allernieuwste ‘machine learning’ technieken. Uit de succesvolle toepassing van deze algoritmen in andere onderzoeksdomeinen kan worden voorspeld dat ze moeten in staat zijn om op een nauwkeurige manier het volledige spectrum van de operationele taxonomische eenheden te modelleren, op voorwaarde dat voldoende leervoorbeelden kunnen worden verzameld. Tenslotte zal het project zich ook richten op de mogelijkheden die integratie van vetzuurdatabanken uit verschillende onderzoeksinstellingen biedt voor kwaliteitscontrole op het biologisch materiaal dat wordt uitgewisseld tussen deze instituten.

Werkpakketten

Om de doelstellingen van het project te verwezenlijken werden de volgende werkpakketen opgesteld:

WERKPAKKET 1. integratie van de BCCM/LMG en DSMZ vetzuurdatabanken
1.1 geïntegreerd beheer van stammendatabank
1.2 insluiten resolutie van taxonomische namen
1.3 linken van vetzuurdatabanken aan geïntegreerde stammendatabank
1.4 standaardisering van het formaat voor annotatie van de experimenten
1.5 analyse van de informatie-inhoud van de geïntegreerde FAME databanken
1.6 evaluatie van de schaalbaarheid van het informatiesysteem voor toekomstige uitbreiding

WERKPAKKET 2. verbeterde automatische identificatie van vetwzuurverbindingen
2.1 data warehousing voor OLAP
2.2 herevaluatie van bestaande bibliotheken voor benoeming van de pieken
2.3 testen van de stabiliteit van nieuwe vetzuur-identificatievensters
2.4 bepalen van de chemische samenstelling van nieuwe vetzuur-identificatievensters
2.5 effect van verbeterde vetzuuridentificatie op soortherkenning

WERKPAKKET 3. ontwerpen van nieuwe soortherkenningsstrategieën
3.1 gesuperviseerde identificatie
3.1.1 beheer van verzamelingen leervoorbeelden
3.1.2 implementatie van gangbare machine learning methodes
3.2 niet-gesuperviseerde identificatie
3.3 vergelijken van alternatieve identificatiestrategieën: nauwkeurigheid en flexibiliteit

WERKPAKKET 4. kwaliteitscontrole op de authenticiteit van biologisch materiaal
4.1. schatting van de fout op de reproduceerbaarheid tussen laboratoria
4.2. bepalen van de lijst van gemeenschappelijke stammen in de BCCM/LMG and DSMZ collecties
4.3. detecteren van inconsistenties in de vetzuurprofielen over de grenzen van de laboratoria

Partners

Partner 1: BCCM\LMG, Universiteit Gent
Promotor: Prof. Dr. Paul De Vos
Laboratorium voor Microbiologie
K.L. Ledeganckstraat 35
B-9000 Gent, België
Tel: 09 264 51 10
Fax: 09 264 50 92
Email: Paul.DeVos@UGent.be
http://lmg.ugent.be; http://bccm.belspo.be

Partner 2 : KERMIT, Universiteit Gent
Promotor: Prof. Dr. Bernard De Baets
Onderzoekseenheid Kennisgebaseerde Systemen
Vakgroep Toegepaste wiskunde, biometrie en procesregeling (LA10)
Coupure links 653
B-9000 Gent, België
Tel: 09 264 59 41
Fax: 09 264 62 20
Email: Bernard.DeBaets@UGent.be
http://users.ugent.be/~bdebaets/

Gebruikerscommissie

Lid 1
Contactpersoon: Prof. Dr. Erko Stackebrandt
Instituut: DSMZ (German collection of microorganisms and cell cultures)
Adres: DSMZ GmbH, Mascheroder Weg 1b, 38124 Braunschweig, Germany
Tel: ++49 531 2616 352
Fax: ++49 531 2616 418
Email: erko@dsmz.de

Lid 2
Contactpersoon: Dr. David Smith
Instituut: CABI Bioscience
Adres: CABI Bioscience, Bakeham Lane, Egham, Surrey, TW20 9TY, UK
Tel: ++44 1491 829046
Fax: ++44 1491 829100
Email: d.smith@cabi.org

Lid 3
Contactpersoon : Dr. Myron Sasser
Instituut: MIDI, Inc.
Adres : MIDI, Inc , 125 Sandy Drive, Newark, DE 19713, USA
Tel: 302-737-4297 or 800-276-8068
Fax: 302-737-7781
Email: myron@midi-inc.com