Bioinformatica: una scienza recente, nata a ruota del progetto genoma umano (HGP) alla fine degli anni Ottanta del secolo scorso, grazie anche a ricercatori operanti nei nuovi, per l’epoca, centri computazionali di supercomputer.
Una scienza nata come applicazione della tecnologia informatica alla biologia per migliorare la conoscenza dei viventi. Ma, soprattutto, una scienza multidisciplinare in cui si intersecano biologia computazionale, genomica, proteomica, biologia evolutiva, eccetera.
Perciò, come documentato in questo contributo, è una sfida portare nella scuola, seppure all’ultima classe del liceo scientifico, alcuni momenti significativi della bioinformatica, innovativa ricerca didattica per far sperimentare agli studenti alcune strategie di lavoro sul web oggi molto diffuse nel mondo della ricerca.
Vai alla Home-Page della Rivista | Chi Siamo | Vai al Sommario del n° 67 – Dicembre 2017 |
Vai alla Sezione SCIENZ@SCUOLA | Vai agli SPECIALI della Rivista |
Una sfida educativa per docenti liceali e studenti nativi digitali. Nella mia continua ricerca di innovazione nella didattica della biologia, ho cercato di trasferire, nel lavoro con gli studenti delle classi quinte del liceo scientifico, elementi di bioinformatica, la scienza recente (risale agli anni Ottanta del secolo scorso) che applica tecnologie informatiche alla ricerca biologica o, meglio, combina i dati che derivano dalla biologia molecolare alle tecniche di elaborazione informatica.
Questa scelta mi ha guidato nella ricerca didattica a ideare nuovi e più aggiornati approcci operativi, mi ha offerto l’opportunità di costruire interessanti percorsi di apprendimento che coinvolgono in modo attivo gli studenti.
La bioinformatica è caratterizzata da approcci operativi multidisciplinari ed è utilizzata per analizzare dati biologici al fine di formulare ipotesi sui processi caratterizzanti fenomeni propri del vivente.
La bioinformatica aiuta a costruire un linguaggio comune tra biologi e informatici con elevata multidisciplinarietà procedurale, permette infatti di collegare discipline come la matematica, l’informatica, la biologia molecolare, la biochimica, la biomedicina e la genetica. Approcci culturali sempre più diffusi nella ricerca scientifica e che purtroppo la scuola spesso ignora.
Nelle nostre classi sono proposti in prevalenza approcci disciplinari, quindi apprendimenti separati di concetti chiave comuni a differenti discipline, rendendo in genere difficile per gli studenti una visione unitaria dei saperi, la conoscenza dei contesti scientifici di indagine. In Europa e nel mondo si sta da alcuni anni diffondendo la cultura della didattica STEM (Science, Technology, Engineering and Mathematics) che individua nell’apprendimento «integrato» delle differenti discipline occasioni fondamentali per coltivare negli studenti competenze interessanti per cultura personale, ma anche utili nel mondo delle future professioni dove competenze trasversali, e non solo unidisciplinari, saranno sempre più importanti per studiare problemi complessi.
La domanda che mi pongo è se nella scuola di oggi ogni docente possa realmente trovare spazi per attuare un insegnamento/apprendimento che sia aggiornato non tanto dal punto di vista delle informazioni (sempre in aumento vertiginoso), ma dei metodi che la ricerca biologica sta mettendo in atto integrando strumenti nuovi e diversi campi di ricerca.
Oltre le mode del momento e le iniziative sponsorizzate da più parti, servono spazi educativi nell’ambito dei quali si possa sperimentare la complessità del vivente attraverso la conoscenza del lavoro dei ricercatori nel confrontare rapidamente dati, nel comparare i risultati nell’ambito della comunità scientifica, orientando a superare l’idea di singolarità operative e di risultato.
Bioinformatica: una scienza recente per rinnovare la didattica dei sistemi complessi
Uno scopo della bioinformatica è quello di aumentare il livello di conoscenza dei sistemi complessi per eccellenza, i sistemi biologici. Perciò la bioinformatica è per il docente uno strumento utile per educare alla comprensione operativa dei contenuti biologici e al ragionamento autonomo.
Integrare la bioinformatica nella didattica curriculare, anche a «piccole dosi», rende il docente ricercatore attivo di nuovi percorsi e rende i suoi studenti protagonisti creativi che lavorano da ricercatori.
Nella mia pluriennale esperienza nella didattica della bioinformatica ho verificato che non ci sono «prodotti» didattici bioinformatici sempre efficaci per tutti e in tutti i contesti classe, quindi trasferibili così come sono stati strutturati.
Un aspetto molto positivo della bioinformatica è quindi quello di permettere al docente l’ideazione di propri percorsi in modo flessibile, smuovendo alcune passività operative del proprio operare, mettendo in campo idee innovative per guidare a un uso ragionato della tecnologia.
Lo scopo principale di questo scritto è quindi di non dare «ricette bioinformatiche» già presenti in differenti contesti, definite «protocolli» con rigidi schemi operativi, ma di proporre alcune riflessioni e suggerimenti per invitare i docenti a una «creativa e ragionata innovazione operativa», non pura adozione o adesione a iniziative create e promosse per il contesto scuola.
Modalità di lavoro che, dopo alcuni anni di ricerca didattica, collaborando con centri universitari, ho messo in atto sia in attività curriculari di mie classi quinte liceo scientifico, che in parte racconto in questo articolo, sia in progetti pomeridiani di approfondimento teorico e operativo con studenti di altre classi quinte liceali.
Lavorare a due livelli: analizzare e progettare
La bioinformatica permette ai ricercatori due modalità di lavoro: una modalità «statica» per memorizzare ed estrarre dati significativi; una modalità «dinamica» per valutare le relazioni funzionali e temporali dei fenomeni, le interazioni tra diverse parti di un sistema.
È quindi possibile trasmettere l’idea della biologia come scienza della scoperta in cui si individua il sistema da studiare e se ne studiano le caratteristiche, oltre approcci riduzionisti. L’informatica applicata alla biologia incuriosisce gli studenti che, da nativi digitali, sono molto interessati a tutto ciò che riguarda l’utilizzo del computer.
Il docente può quindi avviare gli studenti alla consultazione di banche dati informatiche relative a proteine o sequenze di DNA, genomi appartenenti a organismi differenti, strumenti per ricavare informazioni essenziali che sfociano nel confronto tra specie con differente grado di complessità evolutiva.
Gli aspetti operativi della bioinformatica conducono a ottenere informazioni utili per la comprensione dei fenomeni biologici e per lo sviluppo di nuove strategie biomediche e biotecnologiche.
Oggi, nei laboratori scientifici, i ricercatori possono comunicare in tempo reale nuovi dati confrontando i propri risultati con il lavoro già svolto dalla comunità scientifica. E questi aspetti dinamici della bioinformatica rifluiscono, anche nelle classi liceali, attraverso percorsi di apprendimento che risultano anche di orientamento verso le nuove professioni del mondo del lavoro.
Le banche dati bioinformatiche
Sin dal 1960, e soprattutto dopo le acquisizioni scientifiche dello studio dei genomi di organismi con differente grado di complessità, la comunità scientifica ha cercato di archiviare e analizzare in modo sistematico i dati biologici che si sono accumulati a elevata velocità.
Le «banche dati biologiche» sono i necessari strumenti di raccolta di questi dati, fonti aperte di libera consultazione: ci sono banche dati primarie di raccolta dati e banche dati secondarie che contengono tools, articoli, link per analisi comparative e approfondimenti.
È utile precisare che, per quanto riguarda la qualità dei dati, è importante inserire informazione di elevata affidabilità, riducendo al minimo la possibilità di errore. Ma esistono alcuni aspetti contraddittori in relazione alla conoscenza pubblica di dati biologici e alle difficoltà di classificare una elevata quantità dati per individuarne relazioni e dedurne ipotesi; su questi temi è interessante attivare una discussione nel gruppo classe.
Quali le caratteristiche di una banca dati biologica? Quale l’importanza di queste caratteristiche? E poi, i dati inseriti possono essere sbagliati? Sono necessarie figure professionali che gestiscono e controllano queste informazioni, i curatori della banca dati?
Applicazione didattica per promuovere competenze
Le attività bioinformatiche integrate nel percorso formativo sulle molecole biologiche rappresentano un ottimo strumento per avvicinare i giovani alla professione di biologo, informatico, medico ricercatore e in genere al mondo della ricerca scientifica; non richiedono particolari attrezzature ma solo un’aula di informatica con computer connessi alla rete. Un «intreccio didattico» tra conoscenze di base biochimiche e biologiche molecolari con apertura alla biomedicina.
Quali competenze acquisire? Sicuramente in modo prioritario sapere navigare con metodo è di rigore in una banca dati internazionale.
Nelle banche dati biologiche è possibile anche cercare affinità tra sequenze di DNA o affinità tra sequenze di proteine, perciò occorre ideare percorsi anche in relazione alla specificità del gruppo classe e, eventualmente, procedere con attività differenziate, guidando a lavorare in piccoli gruppi, quasi creando comunità di lavoro virtuose orientate all’aiuto reciproco anche per gli studenti con minori competenze informatiche.
Dati delle banche bioinformatiche
Per bene comprendere la struttura di una banca dati, le sue finalità e potere partecipare ad attività operative, gli studenti devono prima possedere buone conoscenze di biochimica e biologia molecolare. All’aumentare del numero di banche dati disponibili, è importante potere velocemente integrare diverse informazioni provenienti da più fonti grazie a specifici software informatici.
Numerosi i dati presenti nelle banche del DNA: sequenze non codificanti e codificanti, sequenze gnomiche parziali/complete, vettori di clonaggio, genoma virale mitocondriale, polimorfismi, quindi sequenze di DNA con varianti di poche basi che codificano per proteine diverse.
Per la ricerca rapida di similarità di sequenza in banche dati di DNA e proteine si usano, per esempio, il programma FASTA (del 1985) e il programma BLAST (Basic Local Alignment Search Tool, 1990) che usano algoritmi basati sull’indicizzazione di tutte le posizioni in cui compare ogni possibile parola all’interno di una sequenza.
Lavorare in classe da «bioinformatici delle proteine»
La sfida è stata per me trovare la modalità di tradurre questi saperi tecnici e specialistici in attività didattiche per studenti liceali. La bioinformatica permette di studiare proteine che hanno una relazione evolutiva: confrontando sequenze di amminoacidi di specie diverse, e la loro disposizione nello spazio, è possibile stabilire con precisione il livello evolutivo degli organismi che contengono tali molecole biologiche.
Il confronto tra sequenze omologhe serve a identificare le regioni più importanti dal punto di vista strutturale e funzionale. Il confronto delle sequenze tra proteine permette di identificare quali amminoacidi sono responsabili delle caratteristiche comuni e quali delle differenze. Le sequenze di amminoacidi subiscono mutazioni, inserzioni, delezioni e queste variazioni si riflettono sulle proteine codificate. Se una sequenza proteica è conservata durante l’evoluzione ed è presente in molti organismi diversi è molto probabile che in tutti gli organismi svolga la stessa funzione che dipende da una particolare sequenza di amminoacidi.
Le caratteristiche funzionali delle macromolecole biologiche dipendono dalla conformazione tridimensionale che assumono nello spazio. Come sono disposte nello spazio le unità fondamentali delle macromolecole? In particolare è utile riflettere con gli studenti sul fatto che molecole proteiche con sequenza primaria simile tendono ad avere strutture secondarie e terziare simili, se due proteine sono identiche al 50% è molto probabile che la loro struttura tridimensionale sia completamente sovrapponibile.
Perciò ho iniziato il percorso didattico dai contenuti presentati anche dal libro di testo che spiega i quattro livelli di organizzazione delle proteine (struttura primaria, secondaria, terziaria e quaternaria) e dalla domanda se è possibile osservare e analizzare queste strutture. In effetti nel corso degli ultimi trent’anni i ricercatori sono riusciti a individuare la struttura tridimensionale di migliaia di proteine, a partire dalla scoperta di emoglobina e di mioglobina.
I dati strutturali di una proteina corrispondono alle coordinate atomiche determinate attraverso analisi cristallografiche ai raggi X. L’unica banca dati che raccoglie tali informazioni è la PDB (Protein Data Bank) che a dicembre 2002 riportava circa 19400 strutture. Essa è un riferimento unico per tutti gli studi strutturali di interesse biologico.
Protein Data Bank
Ho avviato la consultazione della banca dati Protein Data Bank (PDB) all’indirizzo: www.rcsb.org/pdb/home/home.do.
Nell’aula di informatica gli studenti, lavorando a coppie, si sono collegati alla home page della PDB e hanno via via esplorato le schede richiamate nel menu a sinistra: Welcome, Deposit, Search, Visualize, Download, Learn. In particolare, cliccando su Search si scopre quali sono le principali categorie utilizzabili per una ricerca mirata e quante strutture riferibili a macromolecole umane sono a oggi depositate.
Dopo una breve introduzione, ho chiesto agli studenti di cercare una serie di informazioni per le proteine di seguito indicate: da quanti amminoacidi è composta la proteina, quando è stata depositata la struttura e da chi, con quale metodo è stata ottenuta. È inoltre possibile e interessante visualizzare la sequenza amminoacidica (scheda sequence) e scaricare il file .pdb (text) dal menu download.
Ogni coppia di studenti ha dovuto scegliere tre strutture da cercare e scaricare tra le seguenti: emoglobina (PDB ID 2N2), collagene (PDB ID 1CAG), pompa Na-K (PDB ID 3KDB), insulina (PDB ID 4INS), recettore per l’adrenalina (PSB ID 2RH1), immunoglobulina (PDB ID 1IGT).
La visualizzazione e l’analisi delle strutture è stata effettuata con il software per proteine RasMol scaricabile al link: http://rasmol.org/ o con Deep View – Swiss-Pdb Viewer scaricabile al link: http://spdbv.vital-it.ch/.
Grazie a questi software gli studenti hanno osservato la conformazione delle proteine scelte descrivendone la struttura secondaria, terziaria e quaternaria. Al termine del lavoro gli studenti presentano i risultati ottenuti a tutta la classe e, successivamente, predispongono un elaborato scritto sul lavoro svolto.
Studiare in classe l’evoluzione dell’emoglobina e dei suoi geni
Per consolidare la consapevolezza del legame tra sequenza, struttura e funzione ho svolto, con alcuni studenti particolarmente interessati, un approfondimento sull’emoglobina partendo da alcune sezioni del libro di Marta Paterlini Piccole visioni: la grande storia di una molecola, una pubblicazione molto rigorosa che presenta lo sviluppo storico-sperimentale che ha condotto alla scoperta dell’emoglobina con approccio culturale interdisciplinare. In particolare, il libro presenta la storia di Max Perutz e di tutti gli scienziati (fisici, matematici, biologi, chimici) che hanno collaborato alla scoperta della struttura dell’emoglobina e aiuta gli studenti a comprendere un approccio multidisciplinare alla scienza.
Analisi di parti del testo possono coinvolgere anche docenti di differenti discipline, una costruttiva collaborazione per la formazione scientifica in ambito scolastico.
Negli anni ho utilizzato e selezionato, spesso privilegiando in relazione alla specificità della preparazione di base degli studenti, alcune parti del testo. Spesso ho scelto capitoli di più facile comprensione e più inerenti al percorso operativo realizzato in aula di informatica.
Interessante, dal punto di vista storico e metodologico, anche l’intervista a Max Perutz, Agli albori della biologia molecolare, pubblicata sul n. 11 – Aprile 2001 di questa rivista.
Davanti al computer il gruppetto di studenti selezionati procede nella ricerca sul sito NCBI (National Center of Biotechnology Information) dei geni umani dell’emoglobina (HBB e HBA1, HBA2), della miglobina (MB) e di altre proteine della stessa famiglia.
Gli studenti hanno poi scaricato la sequenza dei geni e delle proteine identificate in formato FASTA (programma per la ricerca di similarità tra sequenze). Gli studenti vengono guidati a compilare una tabella con la lunghezza di ogni gene, il numero e la lunghezza di introni e esoni e la lunghezza della proteina codificata.
È possibile lavorare successivamente a un livello superiore di complessità: allineare le sequenze sia dei geni che delle proteine usando Clustul/W (programma per gli allineamenti multipli) e guidare gli studenti a costruire un albero filogenetico. Quali residui sono rimasti conservati? Quali sono cambiati di più?
L’utilizzo di Cn3D, software creato apposta per la visione tridimensionale di molecole contenute nel database di NCBI, permette poi di confrontare la struttura tridimensionale e le sequenze della famiglia dell’emoglobina.
Ho posto la domanda: quali regioni delle proteine sono maggiormente conservate?
È stato anche possibile individuare nella struttura tridimensionale delle proteine la posizione degli amminoacidi di HBA1, HBA2, HBB che sono mutati nei diversi tipi di talassemia. Successivamente sono stati relazionati alla classe i risultati ottenuti.
Una semplice attività di bioinformatica
La banca dati di Ensembl, creata dalla collaborazione tra EMBL-EBI (European bioinformatic Laboratory) e il Sanger Centre di Cambridge presenta una strutturazione che bene si presta a un utilizzo didattico adeguato alla propria progettazione e al contesto classe nel quale si lavora.
In particolare, tra le differenti attività che ho realizzato negli anni con i miei studenti, presento di seguito una breve sintesi del lavoro di comparazione tra cromosomi di uomo e di topo: Storia di un cromosoma.
In primo luogo abbiamo realizzato il motivo per cui Mus musculus è considerato un organismo modello. Il suo genoma presenta molte sintenie con il genoma umano, infatti il nostro genoma è sovrapponibile all’80% a quello dei topi; in particolare, l’intero cromosoma 1 del topo è costituito da geni presenti in differenti cromosomi umani.
Occorre notare che, nel confronto tra cromosomi di specie diverse il termine sintenia non indica l’associazione di due geni su uno stesso cromosoma, ma la sequenza dei geni sui cromosomi a confronto.
[A destra: Confronto fra il cromosoma X del topo con i cromosomi del genoma umano]
Un’altra osservazione importante che abbiamo riscontrato navigando nella banca dati è che i cromosomi X dei due organismi presentano molte analogie, mentre non vi è alcuna sintenia fra il cromosoma Y del topo e il genoma umano (vedi immagine che segue a sinistra).
Le topoline usate come cavie in laboratorio permettono di verificare gli effetti del silenziamento genico, comprendere le funzioni di ormoni e sono modelli per lo studio di malattie metaboliche.
[A sinistra: Confronto fra il cromosoma Y del topo e i cromosomi dell’uomo]
Nell’ultima parte di questa esperienza ho guidato gli studenti a studiare le sintenie fra il cromosoma 2A e 2B dello scimpanzé e il cromosoma 2 dell’uomo.
Lo scimpanzé ha un cromosoma in più rispetto all’uomo, ma, nel corso dell’evoluzione, la fusione tra cromosoma 2A e 2B dello scimpanzé ha generato il cromosoma 2 dell’uomo. In particolare, il cromosoma 2A dello scimpanzé costituisce la parte superiore del cromosoma 2 dell’uomo, mentre il cromosoma 2B presenta gli stessi geni della parte inferiore del cromosoma umano.
La biologia come scienza della scoperta: il concetto di sistema biologico nella didattica
La bioinformatica mette a disposizione del ricercatore modalità di lavoro predittive sul funzionamento biologico del vivente e modalità prescrittive che possono imporre un determinato comportamento al sistema biologico aprendo a un nuovo approccio integrato di indagine definito «Biologia dei sistemi», un modello dinamico nello studio del comportamento dei sistemi biologici che valuta le interazioni biochimiche, fisiologiche, genetiche tra le differenti parti del sistema.
Un approccio di questo tipo permette di superare uno studio frammentario delle differenti parti a favore di un approccio interdisciplinare. Testimone di questo approccio culturale è il biologo statunitense Leroy Hood che, in un’intervista riportata dalla rivista Science in School (www.scienceinschool.org/it/2009/issue12/leroyhood) presenta riflessioni anche sulle possibili ricadute didattiche di questa modalità in termini di innovatività metodologica.
Una presentazione di questi temi si trova anche nell’articolo di Paolo Tortora, La modellizzazione dei sistemi biologici, pubblicato sul n. 43 – dicembre 2011 di questa rivista.
È risultato quindi molto interessante nelle mie attività didattiche approfondire insieme agli studenti alcuni elementi di questa modalità di indagine sulla biologia dei sistemi, informando che in Italia è adottata dal Centro di ricerca scientifica COSBI (Computational and Systems Biology) di Rovereto, nato dal raccordo operativo tra Microsoft e Università di Trento.
Questo centro mette a disposizione cataloghi di geni e proteine per studiare le integrazioni funzionali tra DNA, proteine e altri componenti biologici utilizzabili anche per ricerche didattiche.
Gli studi transdisciplinari e multidisciplinari sugli organismi in quanto sistemi che cambiano nel tempo sono molto affascinanti e suggeriscono che proprio da differenti dinamiche si originano strutture organizzate a diverso grado di complessità: conoscenze dunque utili per educare a comprendere la complessità del vivente.
Come ho raccontato in questo contributo, introdurre nella didattica liceale elementi di discipline caratterizzate da modalità di indagine multidisciplinari e, in particolare, riuscire a far sperimentare le tecniche di indagine usate dai bioinformatici, ha come esito la consapevolezza che la conoscenza dei sistemi complessi è possibile solo stabilendo relazioni tra diversi saperi scientifici. E, come docente, mi sento stimolata a ricercare altre strategie perché la «prospettiva sistemica» diventi esperienza nel cammino di apprendimento liceale e atteggiamento positivo nel mondo reale.
Questo raccordo formativo è stato presentato molto bene, in tempi molto antecedenti a questo moderno sviluppo scientifico, dal filosofo Evandro Agazzi (in Cultura scientifica e Interdisciplinarità, La Scuola, 1994):
«L’impostazione che, oggi, si mostra più adeguata a rispecchiare una presa di coscienza della complessità è la prospettiva sistemica. In essa infatti un sistema è concepito come un insieme di “sottosistemi”, immerso a sua volta in un ambiente.
La sua costituzione risulta non semplicemente dalla giustapposizione dei sottosistemi, ma dalla reciproca interrelazione tra questi, ciascuno dei quali svolge una funzione rispetto al tutto e può a sua volta sopravvivere e funzionare perché sta in relazione funzionale con il tutto.
È il particolare modo di stare insieme delle parti che caratterizza un sistema e che gli conferisce proprietà che nessuna delle parti, presa isolatamente, possiede.»
Vai al PDF di questo articolo |
Vai alla Home-Page della Rivista | Chi Siamo | Vai al Sommario del n° 67 – Dicembre 2017 |
Vai alla Sezione SCIENZ@SCUOLA | Vai agli SPECIALI della Rivista |
Marina Minoli (Biologa dell’Ordine Nazionale, esperta di didattica delle scienze e comunicazione della scienza a livello europeo, titolare della cattedra di Biologia e Chimica presso il Liceo Scientifico “Marconi” di Chiavari, eletta nel 2017 Membro della
Royal Society Biology di Londra)
Indicazioni bibliografichee sitografiche
- David Form, Fran Lewitter, Ten simple Rules for teaching Bioinformatics at the High School Levels – PLOS Computational Biology, 2011.
- Marina Minoli, Tutto il lavoro dello scienziato, Linx Pearson, Linx Magazine, 4/2009.
- Ross C. Hardison, Evolution of Hemoglobin and its genes, Cold Spring Harbor Perspectives in Medicine, Dicembre 2012
- Marina Minoli, Didattica della bioinformatica, Guida Campbell Docenti di Biologia, Pearson Editore, 1° edizione 2009 e 2° edizione 2011.
- Corrado Priami, Informatica e biologia dei sistemi, Mondo Digitale n. 1, marzo 2004.
- Marina Minoli, Michele Mazzanti, La didattica delle neuroscienze per educare alla complessità della cultura scientifica, Ottobre 2017, La Nuova Secondaria, Studium Editore, Roma.
- Marta Paterlini, Piccole visioni, Codice Edizioni, Torino 2005.
- Marina Minoli, Elements of didactic innovation for neuroscience in high school, Scientix blog Brussels, second part, 3 marzo 2017.
- Maria Cristina Speciani, Agli albori della biologia molecolare. Intervista a Max Perutz, in Emmeciquadro n. 11 – aprile 2001.
- Paolo Tortora, La modellizzazione nei sistemi biologici, in Emmeciquadro n. 43 – dicembre 2011.
© Pubblicato sul
n° 67 di Emmeciquadro