studi e riflessioni di un autodidatta: La Babele dei linguaggi in codice, non prevista da Watson e Crick

Nell'articolo "Il codice genetico III" del 1966*, Crick afferma: "Il codice genetico non è il messaggio vero e proprio ma il "vocabolario" usato dalla cellula per tradurre il linguaggio a quattro lettere dell'acido nucleico nel linguaggio a venti lettere della proteina. I meccanismi cellulari sanno tradurre in un solo senso: dall'acido nucleico alla proteina e non viceversa".

Il concetto di codice, inizialmente utilizzato come metafora, ha finito col sostituire la realtà: il codice genetico è divenuto in biologia molecolare il reale modo di esprimersi delle cellule. Ma l'illusione dei fondatori della teoria del codice di poter ridurre tutta la faccenda alla semplice traduzione del linguaggio dell'acido nucleico nel linguaggio della proteina è stata smentita dai fatti: come vedremo, i linguaggi in codice sono risultati così numerosi da far apparire i processi macromolecolari delle cellule una torre di Babele.

Il punto di partenza della teoria del codice è il linguaggio a quattro lettere (A,G,T,C) del DNA, il quale però non può "comunicare" direttamente col linguaggio a venti lettere delle proteine. La "comunicazione" può essere stabilita soltanto mediante un terzo linguaggio a quattro lettere (U,C,A,G), quello dell'RNA, che prende il nome di messaggero perché "trasmette" alle proteine il messaggio trascritto dal DNA.

Si pone la domanda: chi va considerato come codice genetico, il linguaggio del DNA o quello dell'RNA messaggero? Secondo Crick: "Si utilizzano abitualmente nel vocabolario del codice genetico le lettere dell'RNA (U,C,A,G) piuttosto che quelle del DNA (A,G,T,C)"; e ciò perché il vero messaggio per le proteine si trova nell'RNA messaggero.

A questo punto sorge il problema di interpretare questi linguaggi: si tratta cioè di ritradurre nel nostro linguaggio i linguaggi macromolecolari, che appaiono degli enigmi da decifrare. Così tutto si riduce al problema di decifrare il codice genetico. Per Crick: "Il codice genetico potrebbe facilmente venir decifrato se si potessero determinare insieme la sequenza degli aminoacidi di una proteina e la sequenza delle basi di quella parte di acido nucleico che la codifica: allora un semplice raffronto delle due sequenze darebbe la chiave del codice. Sfortunatamente la determinazione della sequenza delle basi di una lunga molecola di acido nucleico è, per molte ragioni, ancora estremamente difficile: si deve ricorrere a metodi più indiretti".

Insomma, il codice genetico potrebbe esser facilmente decifrato se si potessero, per così dire, far combaciare le sequenze dell'acido nucleico con quelle della proteina. E per facilitare il confronto Crick ha già messo le mani avanti: utilizzare la sequenza dell'RNA al posto di quella del DNA. E fin qui niente da eccepire nella sostanza, perché l'RNA, essendo chimicamente complementare al DNA, garantirebbe la certezza del messaggio, sebbene letto, per così dire, al rovescio.

L'unica difficoltà, a questo punto, pare essere quella di determinare la "sequenza delle basi di una lunga molecola di acido nucleico", ossia dell'RNA messaggero. Il metodo indiretto a cui allude Crick, è stato il calcolo combinatorio grazie al quale si è stabilito che, per il linguaggio a venti lettere delle proteine, è necessario che le quattro basi dell'RNA messaggero si combinino nella forma di triplette, nonostante che ciò dia come risultato 64 possibili triplette, ossia 44 in sovrappiù rispetto ai 20 aminoacidi. Questa eccedenza, invece d'essere attribuita a un errore di impostazione dell'uomo, è stata attribuita alla natura: così il codice genetico con il quale, secondo i biologi molecolari, si esprimono le cellule, è stato giudicato dal punto di vista dell'informazione un "codice degenerato".

Il dispendio delle triplette, sul quale torneremo in seguito, non è però l'unica complicazione a cui va incontro la teoria del codice genetico. Una complicazione ancora più seria consiste in ciò che, quando andiamo a considerare la sintesi proteica che avviene nei ribosomi, i linguaggi in codice crescono a dismisura. Scrive Crick: "Questi corpi [i ribosomi] viaggiano lungo la catena dell'RNA messaggero, leggendo le triplette l'una dopo l'altra e sintetizzando le catene polipeptidiche della proteina, partendo dall'estremità aminica (NH2). Gli aminoacidi non diffondono da sé verso i ribosomi: ciascun aminoacido viene unito chimicamente mediante un enzima specifico a una delle molecole che riconoscono i codoni, note sia come RNA "solubile" (sRNA), sia come RNA "transfer" (o di trasferimento, tRNA)". "Ciascuna molecola di tRNA ha la propria tripletta di basi, chiamata anticodone, che riconosce il rispettivo codone messaggero, appaiando le proprie basi con esso".

Quello del tRNA è, quindi, un terzo linguaggio degli acidi nucleici: ai due linguaggi, rispettivamente, del DNA e dell'mRNA, si aggiunge quello del tRNA che si sbriciola in più di venti linguaggi diversi, specifici ognuno per ciascuno dei venti diversi aminoacidi. Ma per la sintesi delle catene polipeptidiche, c'è bisogno anche dell'intervento degli enzimi: le polimerasi. Ci vogliono almeno venti diverse polimerasi per realizzare l'aggancio degli aminoacidi ai tRNA; e ci vogliono polimerasi anche per la duplicazione del DNA e per la trascrizione dell'RNA messaggero, per non parlare degli enzimi di restrizione, ossia di tutti quegli enzimi che intervengono nella riduzione dei precursori degli RNA e nella riduzione dei precursori polipeptidici delle proteine.

In definitiva, il cosiddetto codice genetico, che originariamente era stato concepito come un codice cifrato da decifrare, che doveva permettere il passaggio dell'unico messaggio genetico dal linguaggio del DNA al linguaggio della proteina, si è andato via via frammentando in un numero incredibile di linguaggi in codice, tutti con un identico problema: quello della decifrazione.

Quando Watson e Crick concepirono il loro codice a doppia elica e stabilirono il dogma centrale DNA-RNA-proteine, non potevano certo immaginare che la loro concezione, formulata in termini tanto semplici quanto economici, si sarebbe via via complicata manifestando un groviglio di complessità e un dispendio inauditi. Non potevano certo immaginare che la loro concezione del codice genetico avrebbe avuto bisogno di così tanti e diversi linguaggi degli acidi nucleici. Non potevano neppure immaginare che il principale linguaggio, quello del DNA, si sarebbe mostrato, in termini di informazione, inutile al 99% negli eucarioti, e che i linguaggi dell'RNA avrebbero mostrato spreco sia di parole (triplette) sia di frasi (sequenze). Infine, non potevano immaginare che nel processo di sintesi delle proteine non si compie un solo passo senza l'intervento di qualche enzima, così che quasi infiniti sono gli enzimi che operano nella sintesi delle proteine, ognuno con il proprio linguaggio da decifrare e con un mistero da risolvere: chi li informa sul da farsi?

Non sapendo come uscire da questa Babele di linguaggi in codice, la maggior parte dei biologi molecolari, consapevoli della impossibilità di decifrazione, se la cavano con una generica parola d'ordine convenzionale: il riconoscimento. Essendo incapaci di conoscere come avviene che un dato enzima intervenga in un dato momento e in dato luogo, essi affermano che l'enzima in questione "riconosce" il "sito", oppure che esiste un qualche meccanismo di riconoscimento; insomma, le macromolecole organiche, vien detto, sanno fare ciò che non sanno fare i biologi molecolari: ossia sanno decifrare i messaggi in codice; perciò, a parte inevitabili errori di copiatura, tutto funziona alla perfezione.

Questa è la strana situazione in cui si sono messi i biologi molecolari con la loro teoria del codice: con il concetto di "riconoscimento", essi attribuiscono alle macromolecole organiche un raziocinio e un'intelligenza che sono costretti a negare a se stessi. A confronto con un qualunque enzima, l'intera comunità dei biologi molecolari deve chinare la testa. Ma non sarebbe preferibile rialzarla per vedere la cieca necessità dei processi biologici? Non sarebbe preferibile riconoscere che gli enzimi operano in maniera ciecamente necessaria, piuttosto che ciecamente attribuire agli enzimi una capacità di riconoscimento negata a se stessi?

Prefigurando il rischio di dover riconoscere la cecità dei processi biologici, Crick si è chiesto: "Il codice attuale è semplicemente il risultato di una serie di accidenti evolutivi, così che le correlazioni fra triplette e aminoacidi sono in una certa misura arbitrarie? O vi sono profonde ragioni strutturali perché la fenilanina debba essere codificata da UUU e UUC e non da altre triplette?"

Con questa domanda Crick ha espresso il suo timore che la teoria del codice potesse dissolversi nella constatazione che il caso e l'arbitrio intervengono nei processi della vita. Ma non si tratta di chiedersi se le triplette sono dominate dal caso o sono determinate da "profonde ragioni strutturali". Ci dobbiamo piuttosto chiedere se è scientifico concepire come codice da decifrare questo gigantesco e complesso processo della vita. Dobbiamo chiederci se questo processo è sorto come risultato di un disegno, di un progetto, che ogni volta si riproduce in maniera deterministica, programmata e perciò economica, oppure è sorto in maniera ciecamente necessaria su fondamenta casuali, e ogni volta si riproduce in maniera ciecamente necessaria, e perciò dispendiosa.

I biologi molecolari preferiscono la versione economica, deterministica, nonostante siano costretti a osservare il dispendio e non siano capaci di determinare nulla. Non possono abbandonare il loro codice perché, nonostante le prove contrarie, non riescono a comprendere la dialettica caso-necessità e aborriscono il dispendio almeno quanto Aristotele aborriva il vuoto.

* Tratto da "Molecole e vita", Scientific American (Zanichelli 1968)

---------

Tratto da "Il caso e la necessità - L'enigma svelato - Terzo volume Biologia" (1993-2002) Inedito