La seconda proprietà fondamentale del DNA è quella di contenere l'informazione per la sintesi delle proteine. Per arrivare alla proteina sono necessari diversi passaggi. Il DNA deve essere prima trascritto in una molecola di RNA che successivamente viene tradotta in una proteina. Vediamo schematicamente il processo.
La trascrizione del DNA in RNA messaggero avviene nel nucleo della cellula ed inizia con il legame di alcune proteine, chiamate fattori di trascrizione, ha particolari sequenze del DNA, dette promotori. La doppia elica del DNA si apre e le due catene si separano. Una di queste catene è quella complementare all'informazione genica originale codificante. Utilizzando quindi questa catena come stampo, l'enzima RNA polimerasi inizierà ad inserire i nucleotidi.
Attraverso l'aggiunta di un nucleotide per volta, il filamento di RNA inizia ad allungarsi. La sintesi dell'RNA procede dall'estremità 5'verso quella 3'del gene, producendo una molecola di RNA complementare alla catena stampo del DNA, a parte la sostituzione della timina con l'uracile. La trascrizione termina poiché alla fine di ogni gene ci sono particolari sequenze di basi, dette terminatori, che causano il distacco dell'RNA polimerasi. La molecola di RNA prodotta va quindi incontro a fenomeni di maturazione.
consistenti principalmente nell'aggiunta di una coda di adenine all'estremità 3'e nell'eliminazione delle sequenze introniche tramite il processo di splicing. A questo punto l'RNA messaggero maturo esce dal nucleo e migra nel citoplasma cellulare portando con sé le istruzioni per la sintesi proteica. La traduzione avviene a livello dei ribosomi, che scorrono lungo il filamento di RNA messaggero e ne riconoscono la sequenza delle basi a gruppi di tre.
Ogni gruppo di tre basi costituisce un codone, che viene riconosciuto da un anticodone complementare sito all'estremità di una particolare molecola chiamata RNA transfer, che porta all'altro suo estremo uno specifico aminoacido. A specifico codone corrisponde quindi uno specifico aminoacido che viene collocato nella giusta posizione lungo la nascente catena proteica, dove ogni aminoacido si lega a quello che lo precede mediante legami peptidici. Poiché le lettere dell'alfabeto genetico sono 4, A, G, C e T, le combinazioni possibili in gruppi di tre lettere sono 64, mentre gli aminoacidi sono solo 20. Vi è quindi una certa ridondanza di informazione ed infatti uno stesso aminoacido può essere codificato da triplette diverse. La precisa sequenza degli aminoacidi in una proteina, insieme al suo successivo ripiegamento, ne determina la forma, la funzionalità e la reattività.
Lo studio dei trascritti permette oggi di capire quali geni sono attivi e vengono quindi trascritti in un determinato momento e in un certo tessuto. Confrontando i trascritti prelevati da animali con fenotipo diverso, è possibile analizzarne l'espressione differenziale. e farsi un'idea di quali geni siano responsabili delle differenze fenotipiche.