CBIS
Research facility

CBIS

Clinical Bio-Informatics Services, From data to knowledge

Services

Genomics

DNA mutatie analyse wordt uitgevoerd met Next Generation Sequencing (NGS). Hierbij wordt gekeken naar puntmutaties en kleine inserties/deleties (Indels) tot 50 nucleotiden. Het gaat hierbij om Whole Genome Sequencing (WGS) of Whole Exome Sequencing (WES). Bij WGS worden alle nucleotides van het hele genoom bekeken, terwijl bij WES alleen de nucleotiden in coderende exonen van het genoom worden bekeken.

Transcriptomics

De transcriptomics-methode wordt vaak gebruikt voor het classificeren van cellen bij ziekte en kijkt naar verschillen in RNA expressie. Het verschil in RNA expressiepatronen kan worden onderzocht in specifieke cellen of weefsels. RNA expressie van verschillende groepen kan met elkaar worden vergeleken, bijvoorbeeld: tijdreeksen, behandelde versus niet behandelde patiënt, of patiënt vs controle. Door het filteren van alle genen met behulp van foldchange en p-values worden lijsten verkregen van genen die significant verschillend zijn tussen de groepen. Vervolgens kan functionele analyse gedaan worden aan de hand van deze significante lijst om zo de processen en pathways die hieraan gelinkt zijn beter te begrijpen

Proteomics

  • Annoteren van Swissprot IDs, Refseq Genomics IDs voor geïntegreerde Ingenuity Pathway analyse
  • Meer inzicht krijgen in Mass spectrometry data door het verder analyseren binnen Ingenuity Pathway Analysis
  • Analyse van Somalogic data via statistische testen, visualisatie in heat maps, correlatie en patient stratificatie
  • Kwantificatie: eiwitten, peptides, aminozuren, etc
  • Vergelijking: vergelijking met groepen
  • Ontdekking & voorspelling: supervised, unsupervised
  • Functioneel: Pathway analyse,  annotatie
  • Rapportage: PDF/PPTX

Pathway & Functional Analysis

Het doel van een functionele analyse is om de functie van grotere aantallen genen of eiwitten te begrijpen en de relatie tussen deze genen of eiwitten te begrijpen. Een functionele analyse is een analyse van genen om te kijken of ze betrokken zijn bij een bepaalde ziekte, een moleculaire pathway of moleculair proces. Deze analyse is een belangrijke stap in het begrijpen van het ontstaan en verloop van een ziekte.
Deze functionele analyses kunnen op cel- of orgaan-niveau worden toegepast.

Clincal & Integrated Analysis

Voorspellende model ontwikkeling omvat het creëren, testen en valideren van een model dat het beste de waarschijnlijkheid van een uitkomst kan voorspellen. Hierbij wordt gebruik gemaakt van statistische en ‘machine learning’ model ontwikkelmethodes in het domein van de voorspellende analytics. Om de reproduceerbaarheid van deze voorspellende modellen te verbeteren, hebben we een gestandaardiseerde workflow ontwikkeld als onderdeel van Jupyter Notebook. De basis van translationele onderzoeksprojecten is de integratie van resultaten die vanuit verschillende experimentele modaliteiten komen (transcriptome, proteoom, etc). Het doel van geïntegreerde analyse is om gebruik te maken van alle beschikbare resultaten van een project om zo tot het mechanisme van een ziekte proces te komen of om de uitkomst van een therapeutische interventie te voorspellen. Wij hebben een gegeneraliseerde geïntegreerde analyse workflow geïmplementeerd waarvoor we verschillende tools hebben geïntegreerd om deze problemen op verschillende niveaus van complexiteit te benaderen.

FAIR Data management

De vier FAIR Data Principes:
1. Vindbaar
• Globaal unieke en blijvende identifiers
• Computer leesbare beschrijvingen zodat gestructureerde query's mogelijk zijn

2. Toegankelijk
• Duidelijk gedefinieerde toegang- en veiligheidsprotocollen
• Metadata is altijd toegankelijk, onafhankelijk van de levensduur van de digitale files

3. Interoperabel
• Uitbreidbaar en computer interpreteerbaar formaat voor data en metadata
• Vocabulaires moeten FAIR zijn
• Links naar andere hulpbronnen

4. Herbruikbaar
• Geeft informatie over licenties, data herkomst en gebruik van community-standaard

In recente publicaties wordt gevonden dat ongeveer 50% van de pre-klinische data niet reproduceerbaar is (ref1). Om dit probleem aan te pakken kunnen we er binnen Erasmus MC voor zorgen om een ecosysteem te maken waarin we onderzoekers faciliteren te werken volgens de EU FAIR (vindbaar, toegankelijk, interoperable en herbruikbaar) principes (fig 1). Het op de juiste manier verzamelen, annoteren, archiveren en beheren van de data is essentieel voor onderzoek binnen alle afdelingen van het Erasmus MC. Het op de juiste manier verzorgen van lange termijn opslag van kostbare digitale data betekent dat deze dan ook efficient kan worden hergebruikt voor nieuwe onderzoeken, zowel in gecombineerde als op zichzelf staande studies om zo nieuwe inzichten te genereren.
FAIR data management zal de interne Erasmus MC-samenwerkingen stimuleren en verbeteren, het zal studie duplicaties voorkomen, zal het gebruik van bestaande data promoten en zal onze impact bij externe samenwerkingen en fondsen verbeteren. De EU heeft een plan geïnitieerd voor open research data in H2020 (ref2) waarbij het een vereiste is om voor alle toegekende projecten alle research data voldoet aan de FAIR data principes (fig 1). Nieuwe onderzoeksvoorstellen zijn verplicht om een FAIR data management plan (DMP) te hebben vanaf de start van het onderzoek. Dit plan moet worden bijgehouden gedurende de looptijd van het project (fig 1). Binnen onze Unit Klinische Bioinformatica hebben we FAIR data management als service ontwikkeld (FDMaaS). Deze service geeft de researcher de mogelijkheid om zelf data analyse te doen binnen een FAIR omgeving.

Referenties
1. Freedman LP, Cockburn IM, Simcoe TS. The Economics of Reproducibility in Preclinical Research. PLoS Biol. 2015 Jun 9;13(6):e1002165.
2. https://erc.europa.eu/sites/default/files/document/file/ERC_Open_Access_Guidelines-revised_2014.pdf
Voor meer informatie over FAIR Data Management: https://www.dtls.nl/fair-data/

Methods / applications

Genomics

DNA mutatie analyse wordt uitgevoerd met Next Generation Sequencing (NGS). Hierbij wordt gekeken naar puntmutaties en kleine inserties/deleties (Indels) tot 50 nucleotiden. Het gaat hierbij om Whole Genome Sequencing (WGS) of Whole Exome Sequencing (WES). Bij WGS worden alle nucleotides van het hele genoom bekeken, terwijl bij WES alleen de nucleotiden in coderende exonen van het genoom worden bekeken.

Transcriptomics

De transcriptomics-methode wordt vaak gebruikt voor het classificeren van cellen bij ziekte en kijkt naar verschillen in RNA expressie. Het verschil in RNA expressiepatronen kan worden onderzocht in specifieke cellen of weefsels. RNA expressie van verschillende groepen kan met elkaar worden vergeleken, bijvoorbeeld: tijdreeksen, behandelde versus niet behandelde patiënt, of patiënt vs controle. Door het filteren van alle genen met behulp van foldchange en p-values worden lijsten verkregen van genen die significant verschillend zijn tussen de groepen. Vervolgens kan functionele analyse gedaan worden aan de hand van deze significante lijst om zo de processen en pathways die hieraan gelinkt zijn beter te begrijpen.

Proteomics

  • Annoteren van Swissprot IDs, Refseq Genomics IDs voor geïntegreerde Ingenuity Pathway analyse
  • Meer inzicht krijgen in Mass spectrometry data door het verder analyseren binnen Ingenuity Pathway Analysis
  • Analyse van Somalogic data via statistische testen, visualisatie in heat maps, correlatie en patient stratificatie
  • Kwantificatie: eiwitten, peptides, aminozuren, etc
  • Vergelijking: vergelijking met groepen
  • Ontdekking & voorspelling: supervised, unsupervised
  • Functioneel: Pathway analyse,  annotatie • Rapportage: PDF/PPTX

Pathway & Functionele analyse
Het doel van een functionele analyse is om de functie van grotere aantallen genen of eiwitten te begrijpen en de relatie tussen deze genen of eiwitten te begrijpen. Een functionele analyse is een analyse van genen om te kijken of ze betrokken zijn bij een bepaalde ziekte, een moleculaire pathway of moleculair proces. Deze analyse is een belangrijke stap in het begrijpen van het ontstaan en verloop van een ziekte.
Deze functionele analyses kunnen op cel- of orgaan-niveau worden toegepast.

Klinische & geïntegreerde analyse
Voorspellende model ontwikkeling omvat het creëren, testen en valideren van een model dat het beste de waarschijnlijkheid van een uitkomst kan voorspellen. Hierbij wordt gebruik gemaakt van statistische en ‘machine learning’ model ontwikkelmethodes in het domein van de voorspellende analytics. Om de reproduceerbaarheid van deze voorspellende modellen te verbeteren, hebben we een gestandaardiseerde workflow ontwikkeld als onderdeel van Jupyter Notebook. De basis van translationele onderzoeksprojecten is de integratie van resultaten die vanuit verschillende experimentele modaliteiten komen (transcriptome, proteoom, etc). Het doel van geïntegreerde analyse is om gebruik te maken van alle beschikbare resultaten van een project om zo tot het mechanisme van een ziekte proces te komen of om de uitkomst van een therapeutische interventie te voorspellen. Wij hebben een gegeneraliseerde geïntegreerde analyse workflow geïmplementeerd waarvoor we verschillende tools hebben geïntegreerd om deze problemen op verschillende niveaus van complexiteit te benaderen.

FAIR Data Management

De vier FAIR Data Principes:
1. Vindbaar
• Globaal unieke en blijvende identifiers
• Computer leesbare beschrijvingen zodat gestructureerde query's mogelijk zijn

2. Toegankelijk
• Duidelijk gedefinieerde toegang- en veiligheidsprotocollen
• Metadata is altijd toegankelijk, onafhankelijk van de levensduur van de digitale files

3. Interoperabel
• Uitbreidbaar en computer interpreteerbaar formaat voor data en metadata
• Vocabulaires moeten FAIR zijn
• Links naar andere hulpbronnen

4. Herbruikbaar
• Geeft informatie over licenties, data herkomst en gebruik van community-standaard

In recente publicaties wordt gevonden dat ongeveer 50% van de pre-klinische data niet reproduceerbaar is (ref1). Om dit probleem aan te pakken kunnen we er binnen Erasmus MC voor zorgen om een ecosysteem te maken waarin we onderzoekers faciliteren te werken volgens de EU FAIR (vindbaar, toegankelijk, interoperable en herbruikbaar) principes (fig 1). Het op de juiste manier verzamelen, annoteren, archiveren en beheren van de data is essentieel voor onderzoek binnen alle afdelingen van het Erasmus MC. Het op de juiste manier verzorgen van lange termijn opslag van kostbare digitale data betekent dat deze dan ook efficient kan worden hergebruikt voor nieuwe onderzoeken, zowel in gecombineerde als op zichzelf staande studies om zo nieuwe inzichten te genereren.
FAIR data management zal de interne Erasmus MC-samenwerkingen stimuleren en verbeteren, het zal studie duplicaties voorkomen, zal het gebruik van bestaande data promoten en zal onze impact bij externe samenwerkingen en fondsen verbeteren. De EU heeft een plan geïnitieerd voor open research data in H2020 (ref2) waarbij het een vereiste is om voor alle toegekende projecten alle research data voldoet aan de FAIR data principes (fig 1). Nieuwe onderzoeksvoorstellen zijn verplicht om een FAIR data management plan (DMP) te hebben vanaf de start van het onderzoek. Dit plan moet worden bijgehouden gedurende de looptijd van het project (fig 1). Binnen onze Unit Klinische Bioinformatica hebben we FAIR data management als service ontwikkeld (FDMaaS). Deze service geeft de researcher de mogelijkheid om zelf data analyse te doen binnen een FAIR omgeving.

Referenties
1. Freedman LP, Cockburn IM, Simcoe TS. The Economics of Reproducibility in Preclinical Research. PLoS Biol. 2015 Jun 9;13(6):e1002165.
2. https://erc.europa.eu/sites/default/files/document/file/ERC_Open_Access_Guidelines-revised_2014.pdf
Voor meer informatie over FAIR Data Management: https://www.dtls.nl/fair-data/

Equipment

We are using tools like:

  • Biodiscovery Nexus
  • HeatMapper
  • Ingenuity Pathway Analysis
  • Galaxy
  • HGMD (Qiagen)
  • OmniViz (Instem)
  • Partek Genomics Suite
  • Tibco Spotfire
  • Vista Enhancer Browser

Access & costs

We can provide you an offer, based on the outcome of an intake interviews. Please contact us for prices.

Tools

Biodiscovery Nexus

Nexus Copy Number is een software pakket voor de analyse van copy number data en de visualisatie van CGH, SNP arrray en NGS data.

Gebruik: CNV analysis

Meer informatie over Biodiscovery Nexus vindt u hier: http://www.biodiscovery.com/nexus-copy-number/

Galaxy

Galaxy maakt complexe data analyses toegankelijk, reproduceerbaar en open. Het is een gratis, open-source platform and wordt ondersteund door een grote en zeer actieve gebruikersgemeenschap.

Galaxy biedt een grafische web-interface voor command line (Linux) tools, waardoor complexe analyses uitgevoerd kunnen worden door de onderzoeksanalisten zelf, zonder dat hier een bioinformaticus of eigen kennis van programmeren en de Linux command line voor nodig is. Er zijn over 5000 tools beschikbaar in de Galaxy App Store (“Tool Shed”) voor een breed scala aan onderwerpen, inclusief RNAseq, metagenomics, metabolomics, epigenetics, proteomics, image analysis en veel meer. Al deze tools kunnen makkelijk door eindgebruikers gecombineerd worden tot pipelines in Galaxy’s grafische workflow builder.

Galaxy heeft een trainings infrastructuur (https://training.galaxyproject.org)  opgezet waar zowel gebruikers terecht kunnen die meer willen leren over data analyses in verschillende velden, als instructeurs die graag willen lesgeven in biologische concepten zonder zich druk te hoeven maken om de implementatie details van de achterliggende tools

Wij onderhouden meerdere Galaxy servers in onze afdeling, en er zijn over 80 publieke Galaxy servers wereldwijd om uit te kiezen. Wij zijn betrokken bij verschillende projecten met onderzoeksgroepen en clinici om de Galaxy tools en pipelines te creëren die nodig zijn in het project. Wij voegen ook regelmatig nieuwe tools toe aan de Galaxy tool shed, en zijn onderdeel van de Galaxy Training Network (GTN). Tevens onderhouden wij de training infrastructuur, voegen nieuwe tutorials toe, en geven regelmatig Galaxy training workshops.

Meer informatie over het Galaxy-platform in het algemeen vind u hier: https://galaxyproject.org

HeatMapper

HeatMapper is een eenvoudig te gebruiken programma dat resultaten van unsupervised cluster analyse met behulp van een correlatie plot visueel integreert met sample metadata.
Tevens is het mogelijk de visualisatie van heatmap en klinische data als plaatje op te slaan.

HeatMapper is hier te starten: http://www.planetmathematics.com/heatmapper/

HGMD (Qiagen)

HGMD is de standaard bron van de meest complete set gepubliceerde data over humane genetische ziektes en de daarbij horende mutaties. Je kunt zoeken naar een overview van alle bekende mutaties die geassocieerd zijn met een bepaalde ziekte, naar de interpretatie van de resultaten van een klinische test, naar de meest waarschijnlijk ziekte veroorzakende mutatie binnen een lijst varianten of naar een manier om de mutatie inhoud van HGMD aan je eigen custom NGS analyse pipeline te linken, dit is allemaal mogelijk met HGMD. HGMD is meer dan 5000 keer geciteerd en bevat momenteel meer dan 200.000 mutatie rapporten.

Meer informatie over HGMD vind u hier: https://www.qiagenbioinformatics.com/products/human-gene-mutation-database/

Ingenuity Pathway Analysis

Door het opladen van je gen-set of expressie dataset of mass spec dataset helpt IPA je om de significantie van je ‘omics dataset te interpreteren. IPA helpt je om nieuwe targets of biomarkers te identificeren binnen de biologische context van je vraagstelling. IPA wordt op grote schaal toegepast door life science onderzoeksprofessionals en is geciteerd in duizenden artikelen waar IPA is gebruikt voor analyse, integratie en interpretatie van data afkomstig van ‘omics experiment als RNA-seq, small RNA-seq, microarrays (inclusief miRNA en SNPs), metabolomics, proteomics en small scale experimenten. Binnen Erasmus MC kan iedere medewerker een account krijgen voor IPA waardoor je direct online toegang hebt. Het is zeker aan te raden om een introductie cursus te volgen of expertise van de Clinical Research Service in te huren om je data binnen deze tool op de juiste manier te leren analyseren.

Meer informatie over IPA vind u hier: https://www.qiagenbioinformatics.com/products/ingenuity-pathway-analysis/
Accounts kunt u, indien u Erasmus MC-medewerker bent aanvragen via cbis@erasmusmc.nl
Informatie over eventuele cursussen kunt u vinden via MolMed (www.molmed.nll)

OmniViz (Instem)

OmniViz is een krachtige data mining en analyse oplossing waarmee gebruikers belangrijke informatie kunnen analyseren en verkennen. Dit gebeurd met behulp van de interactieve en intuïtieve visualisatietechnologie. Met behulp van geavanceerde statistische en clusteringalgoritmen verwerkt en toont OmniViz gegevens aan organisaties om verborgen patronen en functies te onthullen, zodat gebruikers nieuwe inzichten kunnen ontdekken en die informatie gemakkelijk kunnen delen met collega's en klanten. OmniViz wordt voornamelijk gebruikt voor het analyseren van Microarray data.

Gebruik:
RNA Expressie analyse:
• Het maken van een OmniViz dataset
• Het maken van een correlatie plot (Hoe correleren samples met elkaar?)
• Selecteer significante genen (SAM)
• Clustering van data, het aanmaken van Treescape plot (Hoe clusteren genen?)
• Selecten top correlating en/of anti-correlating genen voor interessante genen

Maken van een OmniViz dataset van een GEO dataset:
• Selecteren siginificante genen (SAM)
• Maken van Treescape
• Selecteren van top correlerende en/ of anti-correlerende genen die interessant zijn.

Meer informatie vindt u hier: http://www.instem.com

Partek

Partek Discovery Suite is een krachtig en geavanceerde visualisatie en analyse tool voor RNA expressie analyse voor zowel microarray als RNA seq data. De kracht van de tool zijn de algoritmes die het mogelijk maken om de data te normaliseren, via PCA plots te visualiseren en via een uitgebreide set statistische testen data groepen met de juiste statistiek te vergelijken.

Gebruik:
RNA expressie analyse
• Creëren van tabellen die genormaliseerde GEO datasets bevatten voor jouw onderzoeks-vraag
• Normaliseren van data
• PCA visualisatie
• Selecteren van significante genen (ANOVA; T-test; Mann-Whitney etc.)

Meer informatie over Partek Genomics Suite vindt u hier: http://www.partek.com/pgs

Tibco Spotfire

Spotfire is een zeer krachtig data mining en visualisatie pakket. Kort gezegd is TIBCO Spotfire ‘excel op steroïden’. Het programma kan zeer grote datasets snel visualiseren en laat vele filter settings toe. Er zijn veel uiteenlopende visualisatie mogelijkheden binnen deze tool waarbij er ook uitgebreide customizing mogelijkheden zijn.

Meer informatie over TIBCO Spotfire vindt u hier: https://spotfire.tibco.com/overview

Vista Enhancer Browser

Vista Enhancer Browser is een centrale resource voor zowel humane als muis experimenteel gevalideerde (in transgene muis) van niet-coderende DNA fragmenten met gen enhancer activiteit. Een enhancer is een korte DNA regio(50-1500 bp) die gebonden wordt door eiwitten (activatoren) die van invloed zijn op de transcriptie van een bepaald gen en welke niet in directe nabijheid van dit gen hoeft te liggen.

Het doel van de VISTA Enhancer Browser is om vrije toegang te geven aan onderzoekers tot een grote en consistente enhancer dataset. Nieuwe kandidaat niet-coderende regio's worden geidentificeerd gebaseerd op de conservering tussen de humane en andere vertebrate genomen.

Gebruik:
Verkrijgen van posities van enhancers die van belang zijn voor jouw genomische regio(s) van interesse (bijvoorbeeld ‘ledematen’). Je kunt deze regio's filteren of annoteren met variant tabellen van whole genome sequencing experimenten.

Training & education

Training

We offer training-services for each application or workflow developed by us.

• Database and GUI applications  
• Galaxy workflows and services                          
• Docker applications    
• Other pipelines, scripts

Education

We have access to a small educational space for courses and presentations. It is also possible for researchers to make use of one of the many software packages that Clinical Bioinformatics provides, free of charge, in this space. You can request a quote for group bookings.
 
We manage the room by ourselves. This allows us to be flexible to the wishes of the customer. This way we can ensure that specific software is installed for each course, if it is delivered to us.

Features of the room:
• 9 student computers with 2 screens
• 1 teacher computers with 2 screens
• Windows 10, (not SOM!)
• Connection for laptop teacher
• 18 seats
• 2 beamers
• Audio system
• Whiteboard

Reservations can be made by sending an email to cbis@erasmusmc.nl with:
• the desired date
• Timeslot
• Required software / download link of the software with a short installation manual and data for testing

Prior to the course you are invited to come and test if the software works according to expectations.

News, events & publications

About us

Introduction

The CBIS (Clinical Bio-Informatics Services) is part of the Unit Clinical Bioinformatics within the department of Pathology.

We are happy to explain below who we are and what we can do for you.

Under the name CRS we supply bioinformatics-related services. The Clinical Bioinformatics Unit has a range of experience in the field of data analysis and bioinformatics. In the area of (clinical) research, a broad menu of analysis types can be offered. For example: patient stratification, gene expression and mutation detection. We do this with the help of analysis tools such as OmniViz, Ingenuity Pathway Analysis, Nexus Copy Number, Partek, Tibco Spotfire and so on.

Besides doing data analysis, we also provide programming support. For example, we make scripts for converting data, developing a database with web-frontend or developing a data analysis pipeline.

In addition, we have a professional education facility with 10 (9 student PC’s, 1 teacher PC) high-end computers which are very suitable for computationally intensive data analysis. This space can be rented for presentations or small-scale bioinformatics-related courses (maximum 18 people). On this website you can find more information about our services.

For more information, or specific questions you can email us at: cbis@erasmusmc.nl. We will contact you as soon as possible.

Collaboration

Do you have interest in working with us on:
• selecting and executing the best analysis methods?
• developing a custom database?
• setting up a custom analysis pipeline for your analysis?
• etc.

Then please contact us.

We will plan an intake interview with you and one of our data analysts. The intake interview lasts an hour during which you can discuss your wishes and plans of approach with us. We will look at what we can do for you based on your wishes. During this meeting, the following points will be discussed:
• What is the question?
• What kind of data / files will be delivered?
• What sort of analysis is involved?
• Is literature desirable?
• Where will the data and results be stored?
• Level of contact: weekly or bi-weekly?

By default, a progress report is delivered in MS Word or MS PowerPoint.

Based on the outcome of the intake interview, we will prepare an offer for the agreed activities.
For more information you can contact us without obligation by emailing cbis@erasmusmc.nl