L’effetto della selezione naturale, per cui gli individui di una specie dotati di un corredo genetico (genotipo) corrispondente a un fenotipo (caratteri biologici) favorito in termini di sopravvivenza e soprattutto di prolificità cresceranno di numero rispetto agli altri provocando alla lunga un cambiamento delle frequenze geniche della popolazione, è ormai ben dimostrato.



È quella che chiamiamo micro-evoluzione, il cambiamento relativamente minore (un cavallo rimane un cavallo, un lievito rimane un lievito ma anche un ricettore fotosensibile non diventerà mai un occhio) che, attraverso piccoli e puntuali ‘aggiustamenti’ dovuti alla selezione di particolari varianti geniche corrispondenti a proteine mutate, fa sì che ad esempio si selezionino batteri resistenti agli antibiotici o si riescano a stabilire gli areali geografici di certi organismi marini sulla base di varianti dell’emoglobina particolarmente ‘adatte’ alla specifica temperatura dell’acqua.



Queste piccole modifiche non rendono ragione, se non in minima parte, della straordinaria diversità dei viventi. L’insorgere di nuove specie, il formarsi di funzioni complesse coinvolgenti l’interazione di numerose specie proteiche, l’instaurarsi movimenti coordinati di cellule e tessuti (immaginiamo ad esempio il diffondersi coerente dell’onda di eccitazione attraverso milioni di cellule del miocardio che più o meno ogni secondo per decine di anni devono dar vita allo stesso fenomeno) ci porta nel campo della macro-evoluzione; e qui iniziano i problemi. Qui la sostituzione di un singolo aminoacido in una catena proteica che per avventura dà vita a una variante con caratteristiche fenotipiche vantaggiose non sono neanche pensabili: sarebbe come pretendere di creare una versione più efficiente di un sistema operativo per computer inserendo a caso una linea di programma; anzi, è un’ipotesi molto più peregrina di questa.



Già Darwin si era accorto di questa difficoltà e infatti saggiamente non aveva formulato nessuna ipotesi sulle basi fisiche del suo modello; aveva però sottolineato la necessità di una continuità nel cambiamento, continuità che venne ripresa dai suoi esegeti che diedero vita alla cosiddetta ‘sintesi moderna’, il modello neo-darwinista che continua da circa 80 anni a dominare il pensiero evoluzionista e che ora si trova ad essere in rotta di collisione con le nuove acquisizioni della biologia molecolare. Nell’articolo uscito su Nature il 25 ottobre scorso dal bellissimo titolo “Genetics: the inner life of proteins”, il biochimico di Yale Gunther Wagner definitivamente demolisce il miraggio di migliaia di geni ognuno che ‘lavora in proprio’ e quindi singolarmente ottimizzabile indipendentemente dagli altri; visione funzionale a un’impostazione continuista che insisteva a vedere nella macro-evoluzione semplicemente una micro-evoluzione protratta per tempi molto lunghi e in condizioni di isolamento geografico per cui una popolazione poteva prendere una strada ‘indipendente’ che l’avrebbe portata prima o poi, lungo una miriade di passettini, alla ‘scoperta’ di una nuova funzione.

Era ora, diremmo, visto che i biochimici avevano già calcolato il numero astronomico di combinazioni tra proteine (attorno a 10 elevato alla 72000000 secondo la stima conservativa apparsa sulla rivista Protein Science nel 2011) di cui una sola è quella ‘prescelta’ per avere una cellula funzionante; facendo intuire una complessità così enorme da poter tranquillamente escludere ogni processo evolutivo che non si iscrivesse in una ‘canalizzazione’ generata da leggi fisiche pre-esistenti e comunque rispondenti a fortissimi vincoli legati alla struttura invariante della rete di relazioni ( e facendoci comprendere che bufala colossale sia la pretesa della creazione di una cellula artificiale).

Ciononostante l’evoluzione è avvenuta (nessun dinosauro infesta i nostri boschi) ma di sicuro non è avvenuta avendo la pura casualità come ‘motore dominante’ ma delle leggi (vincoli ?) fisiche ancora a noi ignote. Quali che siano queste leggi però, dovremmo trovarne traccia nel genotipo, in termini di variazioni in particolari loci lungo la molecola del DNA: questo ci siamo chiesti il mio amico israeliano Eli Reuveni e io nello scrivere l’articolo recentemente apparso nella rivista Evolutionary Bioinformatics. E, proprio perché si tratta di un vecchio e (troppo ?) dibattuto tema che solleva fosche reazioni ideologiche/idolatriche, abbiamo dovuto, dopo aver ricevuto qualche rifiuto di tipo dogmatico, mascherare il tutto da articolo metodologico, così le cose sono andate bene. Ma, visto che ogni maschera gioco forza confonde, credo possa essere utile un chiarimento.

Facendo agio sui dati di deep sequencing (mutazioni sul genoma individuate a livello del singolo nucleotide per tutto il patrimonio genetico)  di topo provenienti dal Sanger Institute, Eli ed io abbiamo calcolato le distanze genetiche tra 16 ceppi di una specie di topo (mus musculus) e un’altra specie (sempre topo è ma l’incrocio con musculus non dà prole fertile, quindi si tratta biologicamente di un’altra specie ) chiamata mus spretus e che ci serve da riferimento. Le distanze genetiche non sono altro che il numero di volte che in zone corrispondenti del genoma (loci corrispondenti) troviamo un nucleotide differente.

È un vecchio sistema che deriviamo dai geometri dell’Antica Grecia: per studiare le distanze (relativamente piccole) tra oggetti (i ceppi di musculus) ne calcoliamo le distanze da un oggetto molto più lontano (spretus), considerandolo il vertice di un ideale triangolo avente per base la distanza tra i due oggetti vicini; questo procedimento consente di ridurre al massimo gli errori di calcolo di distanze piccole. Il procedimento si chiama triangolazione ed è ancora in uso nella navigazione (anche se non è più eseguito a mano con il sestante ma se ne occupa il sistema satellitare GPS).
Di distanze da m.spretus ne abbiamo calcolate tantissime (8 milioni per ciascun ceppo), ogni distanza corrispondeva alla distanza genetica relativa a un tratto di 200 nucleotidi. Siccome tutto sommato sempre di topi si tratta, queste zone da 200 nucleotidi potevano essere messe in corrispondenza e quindi individuate senza errori in tutti i ceppi.

Alla fine avevamo un file con 8 milioni di unità statistiche (i pezzi lunghi 200) e 16 variabili (i ceppi) riportanti le distanze genetiche di ciascun ceppo dal punto di riferimento calcolate in ogni pezzo (locus) da 200. Con nostra grande sorpresa tutte queste distanze erano tra loro correlatissime: infatti una sola componente principale spiegava il 90% di tutta l’informazione (PC1); ciò indicava che, indipendentemente dalla particolare sequenza (i ceppi non erano tutti uguali), quello che rimaneva invariante era l’ordine di mutabilità di ogni tratto di DNA. Insomma, se il tratto 346 era più mutato (più distante da m.spretus) del tratto 412 e meno del tratto 45673 questo era vero per tutti e 16 i ceppi! Immaginate che di tratti ce ne sono 8 milioni e che quest’ordine si ripete praticamente identico per i 16 ceppi e avrete un idea del grado di ordine sotteso a questa struttura.

I loading (coefficienti di correlazione tra variabili, e fattori, quindi tra ceppi e componenti) erano identici per PC1 (tutti i ceppi hanno lo stesso loading) e quindi PC1 corrispondeva esattamente alla macro-evoluzione, la distanza tra specie in cui la distanza intra-specie (distanza tra ceppi, microevoluzione) non entra per nulla. Se ci fosse entrata, se ci fosse stato un rapporto tra micro e Macro evoluzione, i loading su PC1 non sarebbero stati identici, un ceppo sarebbe stato più vicino e un altro più lontano dal riferimento mus spretus. La distanza intraspecie (microevoluzione) era invece ben descritta dalle componenti minori (per costruzione indipendenti dalla componente maggiore) che infatti separano molto bene i differenti ceppi naturali tra di loro, mentre le popolazioni di laboratorio (non esposte a selezione naturale) mostrano solo drift genetico, varianza casuale non guidata dalla selezione.

Se andiamo a vedere non più i loading dei ceppi ma i valori degli scores , di quanto cioè i diversi tratti di DNA contribuiscono alle direzioni di divergenza individuate dalle componenti, ci accorgiamo che, mentre PC1 (macro-evoluzione) è ‘diffusa’ su tutto il genoma (come da attendersi), le componenti minori (microevoluzione) sono ‘gene specifiche’, sono i ‘piccoli aggiustamenti puntuali’ ammessi sul singolo elemento. Il punto è allora che qualsiasi cosa sia questa ‘modifica globale’ di cui PC1 è traccia, non solo è altamente deterministica ma del tutto coerente con la necessità di mantenere immutate le relazioni nell’interattoma (cioè dell’insieme delle interazioni molecolari che avvengono in un organismo); ed è comunque una cosa differente dalle ‘piccole modifiche gene-specifiche’ legate alla classica selezione darwiniana che trovano posto nelle componenti minori e quindi per definizione indipendenti dalla prima.

Ora la strada è aperta a capire di cosa sia fatto questo cambiamento ordinato in termini di eventi che lo promuovono; noi ci siamo limitati a scorgerne l’evidente impronta in termini di mutazioni lungo la molecola del DNA.

Rimane da spiegare il perché dell’opposizione che ci ha costretto a contrabbandare l’articolo come una proposta puramente metodologica. Non vogliamo considerare questioni che con la scienza non hanno nulla a che fare come una (voluta?) artificiosa e culturalmente meschina confusione tra ateismo e darwinismo. Va considerato poi che noi non mettiamo mai in dubbio il fatto dell’evoluzione ma abbiamo solo la necessità di riportarla all’interno del quadro di riferimento delle scienze depurandola da effetti mitologici. L’unica spiegazione allora è che questo nostro risultato possa essere una pietra d’inciampo per tutti coloro che cercano ‘il gene’ della malattia X, del carattere Y; per coloro che inserendo un gene in un organismo pensano di poter ottenere ciò che desiderano senza interagire con il resto; coloro a cui una visione d’insieme del genoma, limitando di fatto la possibilità di una manipolazione totale, può aver dato disturbo. Forse è per questo, chi lo sa…