Was sind die Eigenschaften des genetischen Codes?

Q: Was ist die genetischer Code einfach erklärt?

Als „genetischer Code werden die Regeln bezeichnet, aufgrund derer die DNA-Sequenz (d.h. die Abfolge der Basen in der DNA) in eine Aminosäuresequenz übersetzt wird. Eine bestimmte Abfolge von drei DNA-Basen kodiert für eine bestimmte Aminosäure. Aminosäuren sind die Bausteine der Proteine.

Q: Wie ist der genetische Code aufgebaut?

Genetischer Code und Proteinbiosynthese Die DNA und mRNA enthalten jeweils vier verschiedene Basen: Adenin, Guanin, Cytosin Thymin (DNA) bzw. Uracil (RNA) . Wie du bereits gelernt hast, ist eine Aminosäure mit drei aufeinanderfolgenden Basen verschlüsselt.

Q: Ist der genetische Code Kommafrei?

Der genetische Code ist degeneriert: Unterschiedliche Tripletts können für die gleiche Aminosäure codieren. Zudem ist der genetische Code kommafrei und nicht überlappend. Das bedeutet, dass die Tripletts lückenlos aneinander anschließen und dass eine Base immer nur Bestandteil von einem Triplett ist.

Als DNA-Sequenz wird die Abfolge der Basen in einem DNA-Strang bezeichnet. Die Basen der DNA sind Adenin (A), Thymin (T), Cytosin (C) und Guanin (G). Eine DNA-Sequenz könnte zum Beispiel so aussehen:

Inhaltsverzeichnis Show

... zur Aminosäuresequenz
Genetische Code-Sonne
Was ist die genetischer Code einfach erklärt?
Wie ist der genetische Code aufgebaut?
Ist der genetische Code Kommafrei?

...ATG CGC AAT GCG ATA TAC...

Die DNA besteht aus zwei Strängen (siehe auch Was ist DNA?). Das heisst, diese Sequenz müsste eigentlich so aussehen:

...ATG CGC AAT GCG ATA TAC...
...TAC GCG TTA CGC TAT ATG...

Als Vorlage für die Synthese der mRNA dient aber nur einer der beiden DNA-Stränge. Die Zelle erkennt anhand bestimmter Merkmale, welchen Strang sie als Vorlage benutzen soll. In unserem Fall wird der folgende DNA-Strang abgelesen:

...TAC GCG TTA CGC TAT ATG...

Die dabei produzierte mRNA ist komplementär dazu und hat die Sequenz:

...AUG CGC AAU GCG AUA UAC...

Sie hat also die gleiche Sequenz wie der nicht-abgelesene DNA-Strang, mit einem Unterschied: Das T wird durch ein U ersetzt.

Wie die Transkription der DNA zu mRNA und die Translation der mRNA zu Protein funktionieren, kannst du übrigens im Artikel Von der DNA zum Protein nachlesen.

... zur Aminosäuresequenz

Je drei im DNA- oder RNA-Strang aufeinanderfolgende Basen werden als Codon oder Basentriplett bezeichnet. Im oberen Beispiel wären ATG/AUG, CGC, AAT/AAU, usw. einzelne Codons oder Basentripletts. Wenn man sich die gesamte DNA einer Zelle als ein Buch vorstellt, wären Codons die Wörter im Buch. Ein Gen besteht aus vielen dieser Codons.

Ein Codon kodiert für:

den Beginn eines Gens oder
das Ende eines Gens oder
eine der 20 Standard-Aminosäuren, aus denen die Zelle Proteine bauen kann

Der genetische Code kann wie unten abgebildet dargestellt werden. Um herauszufinden, wofür das Codon "AUG" steht, musst du den drei Buchstaben von innen nach aussen folgen. Man fängt beim innersten Kreis mit A an. Im mittleren Kreis folgt das U, und im äusseren dann das G. Ausserhalb des letzten Kreises steht in diesem Fall „Met“, was die Abkürzung für die Aminosäure „Methionin“ ist und in Klammern „M“, auch für Methionin.

Diese genetische Code-Sonne erlaubt es uns recht einfach eine DNA- oder RNA-Sequenz in eine Aminosäuresequenz zu übersetzen. Die Aminosäuresequenz in unserem Beispiel wäre:

...MRNAIY…

Genetische Code-Sonne. Bild: Mouagip/Wikimedia Commons

Genetische Code-Sonne

Die Abkürzungen stehen für die folgenden Aminosäuren (im Uhrzeigersinn, beginnend bei Met/Start):
Methionin, Threonin, Asparagin, Lysin, Serin, Arginin, Valin, Alanin, Asparaginsäure, Glutaminsäure, Glycin, Phenylalanin, Leucin, Serin, Tyrosin, Cystein, Tryptophan, Leucin, Prolin, Histidin, Glutamin, Arginin und Isoleucin.

Arginin, Leucin und Serin erscheinen in dieser Auflistung je zweimal, da es für sie mehrere verschiedene Codes gibt.

Am Anfang eines Gens steht der Methionin-Code „AUG“ für „Start“. Hier fängt die Translation an.
UAA (ochre), UAG (amber) und UGA stehen für „Stop“, also das Ende eines Gens. Hier stoppt die Translation.

Die chemischen und physikalischen Eigenschaften von Aminosäuren und deren räumliche Verteilung in einem Protein bestimmen die Eigenschaften des Proteins und seine Funktion.

Als genetischer Code wird die Weise bezeichnet, mit der die Nukleotidsequenz eines RNA-Einzelstrangs in die Aminosäurensequenz der Polypeptidkette eines Proteins übersetzt wird. In der Zelle geschieht dies, nachdem zuvor die in der Abfolge von Basenpaaren des DNA-Doppelstrangs niedergelegte Erbinformation in die Sequenz des RNA-Einzelstrangs (Boten- oder Messenger-Ribonukleinsäure, mRNA) umgeschrieben wurde.

Dieser genetische Code ist bei allen bekannten Arten von Lebewesen in den Grundzügen gleich. Er ordnet einem Triplett von drei aufeinanderfolgenden Nukleobasen der Nukleinsäuren – dem sogenannten Codon – jeweils eine bestimmte proteinogene Aminosäure zu. Die Übersetzung, Translation genannt, findet an den Ribosomen im Zytosol einer Zelle statt. Sie bilden nach Vorgabe der Sequenz von Nukleotiden einer mRNA die Sequenz von Aminosäuren eines Peptids, indem jedem Codon über das Anticodon einer Transfer-Ribonukleinsäure (tRNA) eine bestimmte Aminosäure zugewiesen und diese mit der vorherigen verbunden wird. Auf diese Weise wird eine bestimmte vorgegebene Information in die Form einer Peptidkette überführt, die sich dann zur besonderen Form eines Proteins faltet.

Je komplexer Lebewesen jedoch sind, desto höher scheint der Anteil genetischer Information zu sein, der nicht in Proteine übersetzt wird. Ein beträchtlicher Teil an nicht-codierender DNA wird zwar in RNAs transkribiert, aber nicht per Translation in eine Peptidkette übersetzt. Zu diesen nicht für Protein codierenden RNA-Spezies des Transkriptoms gehören neben den für die Translation erforderlichen tRNAs und ribosomalen RNAs (rRNA) eine Reihe weiterer, meist kleiner RNA-Formen. Diese dienen in vielfältiger Weise der Regulation verschiedener zellulärer Prozesse – so der Transkription selbst, wie auch der möglichen Translation, außerdem einer eventuellen DNA-Reparatur, und darüber hinaus besonderen epigenetischen Markierungen von DNA-Abschnitten sowie u. a. verschiedenen Funktionen des Immunsystems.

Die Transfer-Ribonukleinsäuren, tRNAs, enthalten an prominenter Stelle einer Schleife des kleeblattähnlichen Moleküls ein kennzeichnendes Nukleotid-Triplett, das sie voneinander unterscheidet. Es besteht jeweils aus drei Nukleotiden, die den Nukleotiden eines bestimmten Codons entsprechen, indem sie komplementär zu diesen sind und so ein dreigliedriges Anticodon bilden. Codon und Anticodon passen basenpaarend zueinander und ihnen ist die gleiche spezifische Aminosäure zugeordnet. Eine tRNA wird jeweils mit derjenigen Aminosäure beladen, für die das zu ihrem Anticodon passende Codon steht. Auf diese Weise, durch die spezifische Bindung einer Aminosäure an eine tRNA mit einem bestimmten Anticodon, wird also das Zeichen für eine bestimmte Aminosäure, das Codon, in die genetisch codierte Aminosäure übersetzt.

Streng genommen ist der genetische Code also schon in der Struktur der verschiedenen tRNA-Arten enthalten: Denn ein jedes tRNA-Molekül enthält eine derart strukturierte Aminosäure-Bindungsstelle, dass daran nur jene Aminosäure gebunden wird, die seinem Anticodon nach dem genetischen Code entspricht. Nach Bindung an ihre tRNA steht eine Aminosäure für die Biosynthese von Proteinen am Ribosom zur Verfügung, sodass sie als nächstes Glied der Polypeptidkette angefügt werden kann – falls das Anticodon der tRNA zu einem Codon in der vorgegebenen Nukleotidsequenz der mRNA passt.

Darstellung der Transkription genetischer Information aus einem DNA-Abschnitt in ein RNA-Transkript, wo dann U anstelle von T steht.

Als Voraussetzung für diese Proteinsynthese muss der DNA-Abschnitt eines Gens zunächst in eine Ribonukleinsäure (RNA) umgeschrieben werden (Transkription). Dabei können in eukaryoten Zellen bestimmte Teile dieser hnRNA gezielt entfernt (Spleißen) oder danach verändert werden (RNA-Editing); anschließend wird diese vorläufige prä-mRNA weiter prozessiert zur definitiven mRNA, die schließlich aus dem Zellkern exportiert wird. Denn erst an den Ribosomen, die frei im Zytosol vorliegen können oder an das endoplasmatische Reticulum gebunden sind, werden anhand der mRNA-Vorlage dann die Aminosäuren der zu den Codons passenden tRNAs miteinander zu einem Polypeptid verknüpft.

Dieser Vorgang, mit dem die Information eines Gens in der Form eines Proteins ausgedrückt wird (Genexpression), ergibt sich somit aus einer Folge von Schritten. Hierbei werden die Hauptprozesse unterschieden als (1) Transkription – ein Abschnitt der DNA des Genoms wird durch RNA-Polymerase in RNA umgeschrieben – und (2) posttranskriptionale Modifikation – eine RNA des Transkriptoms wird verändert – sowie (3) Translation – eine mRNA wird am Ribosom in ein Polypeptid übersetzt. Daran kann sich (4) noch eine posttranslationale Modifikation anschließen – ein Polypeptid des Proteoms wird verändert. Im Ablauf dieser Prozesse bis hin zur Bereitstellung eines funktionstragenden Proteins ist die Translation also der Schritt, in dem die genetische Information der Basentriplett-Abfolge in eine Aminosäure-Abfolge umgesetzt wird.

Die eigentliche Anwendung des genetischen Codes, nämlich die Übersetzung einer Nukleotidsequenz in eine Aminosäure anhand des Codons beziehungsweise des Anticodons, findet schon bei der Bindung einer Aminosäure an ihre tRNA durch die jeweilige Aminoacyl-tRNA-Synthetase statt, also bei der Vorbereitung der Aminosäuren für ihren möglichen Zusammenbau in einem Protein. Einige wenige Basentripletts codieren nicht für eine Aminosäure. Insofern sie in diesem Sinn keine Bedeutung tragen, werden sie auch Nonsens-Codons genannt; diese führen bei der Translation zu einem Stop, der die Proteinsynthese beendet, und heißen daher auch Stopcodons.

Alle Lebewesen benutzen in Grundzügen denselben genetischen Code. Die wohl am häufigsten gebrauchte Version ist in den folgenden Tabellen angegeben. Sie zeigen für diesen Standard-Code, welche Aminosäuren von einem der 43 = 64 möglichen Codons gemeinhin codiert werden, bzw. welches Codon in eine der 20 kanonischen Aminosäuren übersetzt wird. So steht zum Beispiel das Codon

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

0 für die Aminosäure Asparaginsäure (Asp), und Cystein (Cys) wird von den Codons

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

1 und

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

2 codiert. Die in der Tabelle angegebenen Basen sind Adenin (A), Guanin (G), Cytosin (C) und Uracil (U) der Ribonukleotide der mRNA; in den Nukleotiden der DNA tritt dagegen Thymin (T) anstelle von Uracil auf. Bei der Transkription eines DNA-Abschnitts dient einer RNA-Polymerase der codogene Strang als Matrize für das Transkript: die DNA-Basensequenz wird basenpaarend in die komplementäre RNA-Basensequenz umgeschrieben beim Aufbau eines RNA-Strangs. Damit wird auf die in DNA vererbbar abgelegte genetische Information zugegriffen, die dann in mRNA für die Proteinbiosynthese zur Verfügung steht.

Der erste Vergleich von großen, aus zahlreichen Bausteinen bestehenden Erbmolekülen mit einer Schrift stammt von Friedrich Miescher, dem Entdecker der Nukleinsäuren, wie aus den erst posthum 1897 veröffentlichten Briefen an den Mediziner Wilhelm His, seinen Onkel, hervorgeht. Es sei völlig überflüssig, aus Eizelle und Spermazelle „eine Vorratskammer zahlloser chemischer Stoffe zu machen, deren jeder Träger einer besonderen erblichen Eigenschaft sein soll,“ schrieb er 1892.[1] Weder das Protoplasma noch der Kern der Zelle bestünden aus zahllosen chemischen Stoffen, sondern vielmehr aus „ganz wenigen chemischen Individuen, von allerdings vielleicht sehr kompliziertem chemischen Bau.“[1] Der Schlüssel zu Vererbung und zur Sexualität liegt nach diesen Überlegungen Mieschers in der Stereochemie von Großmolekülen. Die Größe und Kompliziertheit der beteiligten chemischen Bauformen erlaube eine kolossale Menge von Stereoisomerien, sodass „aller Reichtum und alle Mannigfaltigkeit erblicher Übertragungen ebenso gut darin ihren Ausdruck finden können, als die Worte und Begriffe aller Sprachen in den 24–30 Buchstaben des Alphabets.“[1]

Albrecht Kossel, der Mieschers Arbeiten an Nukleinsäuren fortgeführt und bereits 1891 als deren Spaltprodukte die Nukleinbasen entdeckt hatte, vertiefte diesen heuristischen Schriftvergleich der Erbinformation in seiner Harvey Lecture „The chemical composition of the cell“ von 1911.[2] Diesen Vergleich griff Max Planck in seinem Vortrag Positivismus und reale Außenwelt (1930) auf und später Erwin Schrödinger im Dubliner Exil in Vorträgen und der wirkmächtigen Schrift What is Life? (1944) für die Frage, wie genetische Information in Molekülen gespeichert und weitergegeben werden kann. Der Philosoph Hans Blumenberg weist in seinem Werk Die Lesbarkeit der Welt (1986) in der Episode Der genetische Code und seine Leser darauf hin, dass die späten wichtigen Äußerungen des bereits schwer erkrankten Friedrich Miescher in der Biologie kaum rezipiert sind.[3]

All diese Spekulationen erhielten allerdings erst eine feste Basis, als die Molekularbiologie weiter fortschritt. In den 1940er Jahren gelang Oswald Avery der Nachweis, dass die DNA Träger der Erbinformation ist. 1953 klärten James Watson und Francis Crick deren Struktur und wiesen auf einen möglichen Mechanismus der Vervielfältigung hin. George Gamow gab Francis Crick den ersten Anstoß zur Aufklärung des genetischen Codes, als er ihm in einem Brief mitteilte, dass für die Kodierung von 20 Aminosäuren mindestens Dreier-Kombinationen (Tripletts) der vier Basen der DNS nötig sind (da mit Zweierkombinationen nur 42=16{\displaystyle 4^{2}=16}

Aminosäuren kodierbar sind).[4] Gamow veröffentlichte dies auch in einem Brief an Nature 1954[5] und in den Mitteilungen der dänischen Akademie der Wissenschaften.[6]

In der ersten Hälfte der 1960er Jahre herrschte unter Biochemikern eine gewisse Konkurrenz um das Verständnis des genetischen Codes. Die grundlegende Idee, dass die Aminosäuren durch Basentripletts kodiert werden, konnte 1961 eine Gruppe um Francis Crick und Sydney Brenner bestätigen.[7] Den ersten Schritt zur Aufklärung der Triplett-Codewörter für bestimmte Aminosäuren machte Marshall Nirenbergs Labor an den National Institutes of Health in Bethesda. Am 27. Mai 1961 in der Zeit von 3 Uhr bis 8 Uhr morgens[8] gelang dem deutschen Biochemiker Heinrich Matthaei, damals Post-Doktorand, im Rahmen des Poly-U-Experiments von Nirenberg und Matthaei der entscheidende Durchbruch: die Entschlüsselung des Codons

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

3 für die Aminosäure Phenylalanin. Nirenberg trug darüber im August 1961 auf dem Internationalen Biochemie-Kongress in Moskau vor, ohne zunächst viel Aufsehen zu erregen, da er kaum bekannt war. Erst die von Crick angeregte Wiederholung des Vortrags auf dem Kongress elektrisierte das Publikum; das Experiment zählt zu den bedeutendsten in der Genetik des 20. Jahrhunderts. Um die Entschlüsselung der übrigen Codons entbrann danach ein Wettkampf, insbesondere zwischen den Gruppen um Nirenberg und um Severo Ochoa. 1966 waren alle 64 Basentripletts untersucht und für nahezu alle Codons entsprechende Aminosäuren herausgefunden. Dabei erwies sich, dass einige besondere Codons, denen keine Aminosäure zugeordnet werden konnte, zwar in diesem Sinn keine Bedeutung tragen (Nonsense-Codon), aber eine wichtige Funktion erfüllen, indem sie ein Stopsignal darstellen (Stopcodon).

Genetische Information für den Aufbau von Proteinen ist in bestimmten Abschnitten der Basensequenz von Nukleinsäuren enthalten. Von DNA in RNA umgeschrieben (transkribiert), wird sie für die Biosynthese von Proteinen verfügbar. Die im offenen Leserahmen vorliegende Basensequenz wird am Ribosom abgelesen und nach dem genetischen Code übersetzt (translatiert) in die Aminosäurensequenz der synthetisierten Peptidkette, die Primärstruktur eines Proteins. Dabei wird die Basenfolge schrittweise in Dreiergruppen zerlegt gelesen und jedem dieser Tripletts je eine dazu passende tRNA zugeordnet, beladen mit einer bestimmten Aminosäure. Die Aminosäure wird jeweils durch Peptidbindung an die vorherige gebunden. Auf diese Weise codiert der Sequenzabschnitt für Protein.

Als Codon bezeichnet man das Variationsmuster einer Abfolge von drei Nukleobasen der mRNA, eines Basentripletts, das für eine Aminosäure codieren kann. Insgesamt existieren 43 = 64 mögliche Codons, davon codieren 61 für die insgesamt 20 kanonischen der proteinogenen Aminosäuren; die restlichen drei sind sogenannte Stopcodons zur Termination der Translation. Diese können unter bestimmten Umständen genutzt werden, zwei weitere nicht-kanonische Aminosäuren zu codieren. Damit gibt es für fast alle der Aminosäuren mehrere verschiedene Codierungen, jeweils meist recht ähnliche. Die Codierung als Triplett ist jedoch insofern notwendig, als bei einer Duplett-Codierung nur 42 = 16 mögliche Codons entstehen würden, womit schon für die zwanzig kanonischen oder Standard-Aminosäuren nicht genügend Möglichkeiten gegeben wären.

Standard-Codon-Tabelle für alle 64 möglichen Basen-Tripletts2. BaseUCAG1. BaseUCAGFarbgebung der Aminosäuren

hydrophob (unpolar)

hydrophil neutral (polar)

hydrophil und positiv geladen (basisch)

hydrophil und negativ geladen (sauer)

* Das Triplett des Codons

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

4für Methionin dient daneben auch als Startsignal der Translation. Eines der ersten AUG-Tripletts auf der mRNA wird zum ersten Codon, das decodiert wird. Welches AUG als Startcodon für die tRNAiMet verwendet werden soll, erkennt das Ribosom an Signalen der benachbarten mRNA-Sequenz.
Das Triplett des Stopcodons

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

5dient daneben z. B. beim Menschen unter bestimmten Bedingungen auch als Codon für die (21. proteinogene) Aminosäure Selenocystein.

Die angegebenen Codons gelten für die Nukleotidsequenz einer mRNA. Sie wird in 5′→3′ Richtung am Ribosom abgelesen und übersetzt in die Aminosäurensequenz eines Polypeptids.

Umgekehrte Codon-TabelleAzASASCodon1Start>AUG1MetMAUG1TrpWUGG1SecU(UGA)1PylO(UAG)2TyrYUAU UAC2PheFUUU UUC2CysCUGU UGC2AsnNAAU AAC2AspDGAU GAC2GlnQCAA CAG2GluEGAA GAG2HisHCAU CAC2LysKAAA AAG3IleIAUU AUC AUA4GlyGGGU GGC GGA GGG4AlaAGCU GCC GCA GCG4ValVGUU GUC GUA GUG4ThrTACU ACC ACA ACG4ProPCCU CCC CCA CCG6LeuLCUU CUC CUA CUG UUA UUG6SerSUCU UCC UCA UCG AGU AGC6ArgRCGU CGC CGA CGG AGA AGG3Stop<UAA UAG UGA

Die Translation beginnt mit einem Start-Codon. Doch sind daneben bestimmte Initiationssequenzen und -faktoren nötig, um die Bindung der mRNA an ein Ribosom herbeizuführen und den Prozess zu starten. Dazu gehört auch eine spezielle Initiator-tRNA, welche die erste Aminosäure trägt. Das wichtigste Start-Codon ist

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

4, das für Methionin codiert. Auch können

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

7 und

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

8 – sowie

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

9 und

    AS  = FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSS**VVVVAAAADDEEGGGG
 Starts = ----------**--------------------MMMM----------**---M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

0 in prokaryoten Zellen – als Startcodon dienen, allerdings mit geringerer Effizienz. Die erste Aminosäure ist aber zumeist ein – bei Bakterien und in Mitochondrien N-fomyliertes – Methionin.[9]

Die Translation endet mit einem der drei Stop-Codons, auch Terminations-Codons genannt. Anfangs wurden diesen Codons auch Namen gegeben –

    AS  = FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSS**VVVVAAAADDEEGGGG
 Starts = ----------**--------------------MMMM----------**---M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

1 ist amber (bernsteinfarben),

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

5 ist opal (opalfarben), und

    AS  = FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSS**VVVVAAAADDEEGGGG
 Starts = ----------**--------------------MMMM----------**---M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

3 ist ochre (ockerfarben) (ein Wortspiel auf den Nachnamen ihres Entdeckers Harris Bernstein).

Während das Codon

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

5 zumeist als Stop gelesen wird, kann es selten und nur unter bestimmten Bedingungen für eine 21. (proteinogene) Aminosäure stehen: Selenocystein (Sec). Die Biosynthese und der Einbaumechanismus von Selenocystein in Proteine unterscheiden sich stark von dem aller anderen Aminosäuren: seine Insertion erfordert einen neuartigen Translationsschritt, bei dem ein

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

5 im Rahmen einer bestimmten Sequenzumgebung und zusammen mit bestimmten Cofaktoren anders interpretiert wird. Hierfür ist außerdem eine für Selenocystein bestimmte, strukturell einzigartige tRNA (tRNASec) erforderlich, die bei Vertebraten auch mit zwei chemisch verwandten Aminosäuren beladen werden kann: neben Selenocystein auch Serin oder Phosphoserin.

Einige Archaeen und Bakterien können daneben ein kanonisches Stopcodon

    AS  = FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSS**VVVVAAAADDEEGGGG
 Starts = ----------**--------------------MMMM----------**---M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

1 auch in eine weitere (22.) proteinogene Aminosäure übersetzen: Pyrrolysin (Pyl). Sie verfügen über eine spezielle tRNAPyl sowie ein spezifisches Enzym, diese zu beladen (Pyrrolysyl-tRNA-Synthetase).

Manche kurze DNA-Sequenzen kommen im Genom einer Art nur selten oder gar nicht vor (Nullomere). Bei Bakterien erweisen sich manche dieser als toxisch; auch das Codon

    AS  = FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSS**VVVVAAAADDEEGGGG
 Starts = ----------**--------------------MMMM----------**---M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

7, welches die Aminosäure Arginin codiert, wird in Bakterien vermieden (stattdessen wird

    AS  = FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSS**VVVVAAAADDEEGGGG
 Starts = ----------**--------------------MMMM----------**---M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

8 verwendet).[10] Es gibt durchaus artspezifische Unterschiede in der Codonverwendung.[11] Unterschiede im Gebrauch von Codons bedeuten nicht unbedingt Unterschiede in der Häufigkeit verwendeter Aminosäuren. Denn für die meisten der Aminosäuren gibt es mehr als ein einziges Codon, wie die obenstehende Tabelle zeigt.

Soll eine bestimmte Aminosäure codiert werden, kann oft unter mehreren Codons mit gleicher Bedeutung gewählt werden. Der genetische Code ist ein Code, bei dem mehrere Ausdrücke die gleiche Bedeutung haben, dieselbe semantische Einheit also durch unterschiedliche syntaktische Symbole codiert werden kann. Im Vergleich zu einem Codierungssystem, bei dem jeder semantischen Einheit je ein syntaktischer Ausdruck entspricht und umgekehrt, nennt man solch einen Code degeneriert.

Es hat Vorteile, dass für die circa 20 translational einzubauenden Aminosäuren über 60 Codons verfügbar sind. Dargestellt werden sie jeweils als Kombination aus drei Nukleotiden mit je vier möglichen Basen, sodass es 64 Kombinationen gibt. Deren jeweilige Zuordnung zu einer Aminosäure ist so, dass sehr ähnliche Codon-Variationen für eine bestimmte Aminosäure codieren. Durch die Fehlertoleranz des genetischen Codes genügen oft schon zwei Nukleotide, um eine Aminosäure sicher anzugeben.[12]

Die für eine Aminosäure codierenden Basentripletts unterscheiden sich meist in nur einer der drei Basen; sie haben den minimalen Abstand im Coderaum, siehe Hammingdistanz bzw. Levenshtein-Distanz. Meist unterscheiden sich Tripletts in der dritten Base, der „wackelnden“, die bei Translationen am ehesten falsch gelesen wird (siehe „wobble“-Hypothese).[13] Für den Proteinaufbau häufig nötige Aminosäuren werden von mehr Codons repräsentiert als selten gebrauchte. Eine tiefere Analyse des genetischen Codes offenbart weitere Zusammenhänge etwa bezüglich des Molvolumens und des hydrophoben Effekts (siehe Abbildung).

Bemerkenswert ist auch, dass die Base in der Mitte eines Tripletts den Charakter der zugeordneten Aminosäure weitgehend angeben kann: So sind es im Falle von _ U _ hydrophobe, aber hydrophile im Falle von _ A _. Bei _ C _ sind es unpolare oder polare ohne Ladung, solche mit geladenen Seitenketten treten bei _ G _ als auch bei _ A _ auf, mit negativer Ladung nur bei _ A _ (siehe Tabelle oben). Deshalb sind Radikalsubstitutionen – der Tausch gegen Aminosäuren eines anderen Charakters – oft Folge von Mutationen in jener zweiten Position. Mutationen in der dritten Position („wobble“) bewahren dagegen oft als konservative Substitution die jeweilige Aminosäure oder zumindest deren Charakter. Da Transitionen (Umwandlung von Purinen bzw. Pyrimidinen ineinander, beispielsweise C→T) aus mechanistischen Gründen häufiger auftreten als Transversionen (Umwandlung eines Purins in ein Pyrimidin oder umgekehrt; dieser Prozess setzt zumeist eine Depurinierung voraus), ergibt sich eine weitere Erklärung für die konservativen Eigenschaften des Codes.

Entgegen früheren Annahmen ist die erste Codon-Position oft wichtiger als die zweite Position,[14] vermutlich weil allein Änderungen der ersten Position die Ladung umkehren können (von einer positiv geladenen zu einer negativ geladenen Aminosäure oder umgekehrt). Eine Ladungsumkehr aber kann für die Protein-Funktion dramatische Folgen haben. Dies übersah man bei vielen früheren Studien.

Die sogenannte Degeneration der genetischen Codes macht es auch möglich, die genetische Information weniger empfindlich gegenüber äußeren Einwirkungen zu speichern. Dies gilt insbesondere in Bezug auf Punktmutationen, sowohl für synonyme Mutationen (die zur gleichen Aminosäure führen) als auch für nichtsynonyme Mutationen, die zu Aminosäuren mit ähnlichen Eigenschaften führen.[15]

Offenbar war es schon früh in der Evolutionsgeschichte hilfreich, die Anfälligkeit der Codierung gegenüber fehlerhaft gebildeten Codons zu senken. Die Funktion eines Proteins wird durch dessen Struktur bestimmt. Diese hängt von der Primärstruktur ab, der Sequenz der Aminosäuren: wie viele, welche und in welcher Reihenfolge zu einer Peptidkette verknüpft werden. Diese Angaben enthält die Basensequenz als genetische Information. Eine erhöhte Fehlertoleranz der Codierung sichert die richtige Decodierung. Wird bei einer falschen eher eine Aminosäure mit ähnlichem Charakter eingebaut, verändert dies die Protein-Funktion weniger, als wenn es eine ganz anderen Charakters wäre.

Die Verwendung des Wortes „Code“ geht auf Erwin Schrödinger zurück, der die Begriffe „hereditary code-script“, „chromosome code“ und „miniature code“ in einer Vortragsreihe 1943 verwendet hatte, die er 1944 zusammenfasste und als Grundlage für sein Buch „Was ist Leben?“ aus dem Jahr 1944 verwendete.[16] Der genaue Sitz oder Träger dieses Codes war zu diesem Zeitpunkt noch unklar.

Früher glaubte man, der genetische Code sei zufällig entstanden. Noch 1968 bezeichnete Francis Crick ihn als „eingefrorenen Zufall“.[17][18] Er ist jedoch das Resultat einer strengen Optimierung hinsichtlich der Fehlertoleranz.[19][20] Fehler sind besonders gravierend für die räumliche Struktur eines Proteins, wenn sich die Hydrophobie einer fälschlich eingebauten Aminosäure deutlich vom Original unterscheidet. Im Rahmen einer statistischen Analyse erweisen sich in dieser Hinsicht unter einer Million Zufallscodes nur 100 besser als der tatsächliche. Berücksichtigt man bei der Berechnung der Fehlertoleranz zusätzliche Faktoren, die typischen Mustern von Mutationen und Lesefehlern entsprechen, so reduziert sich diese Zahl sogar auf 1 von 1 Million.[21]

Bemerkenswert ist, dass der genetische Code für alle Lebewesen im Prinzip gleich ist, alle Lebewesen sich also der gleichen „genetischen Sprache“ bedienen.[22] Nicht nur, dass genetische Information bei allen in der Sequenz von Nukleinsäuren vorliegt, und für den Aufbau von Proteinen immer in Tripletts abgelesen wird. Bis auf wenige Ausnahmen steht auch ein bestimmtes Codon jeweils für dieselbe Aminosäure; den gemeinhin üblichen Gebrauch gibt der Standard-Code wieder. Daher ist es möglich, in der Gentechnik z. B. das Gen für menschliches Insulin in Bakterien einzuschleusen, damit diese dann das Hormonprotein Insulin produzieren. Dieses von allen Organismen geteilte gemeinsame Grundprinzip der Codierung wird als „Universalität des Codes“ bezeichnet. Es erklärt sich aus der Evolution so, dass der genetische Code schon sehr früh in der Entwicklungsgeschichte des Lebens ausgestaltet und dann von allen sich entwickelnden Arten weitergegeben wurde. Eine solche Generalisierung schließt nicht aus, dass sich die Häufigkeit verschiedener Codewörter zwischen den Organismen unterscheiden kann (siehe Codon Usage).

Daneben gibt es aber auch verschiedene Varianten, die vom Standard-Code abweichen, bei denen also einige wenige Codons in eine andere als die in der #Standard-Codon-Tabelle angegebene Aminosäure übersetzt werden. Manche dieser Abweichungen lassen sich taxonomisch eingrenzen, sodass besondere Codes definiert werden können. Derart werden inzwischen schon über dreißig variante genetische Codes unterschieden.[23]

Bei eukaryoten Zellen zeigen jene Organellen, die über ein eigenständiges genomisches System verfügen und vermutlich von symbiotischen Bakterien abstammen (Endosymbionten-Theorie), eigene Varianten des genetischen Codes. In Mitochondrien sind so für deren eigene DNA (mtDNA, Mitogenom syn. Chondriom) über zehn abgewandelte Formen mitochondrialen Codes bekannt. Diese weichen jeweils ab vom nukleären Code für die Erbsubstanz im Kern, das Kern-Genom (Karyom). Daneben haben die in Pflanzenzellen zusätzlich vorkommenden Plastiden einen eigenen Code für ihre plastidäre DNA (cpDNA, Plastom).

Auch die Wimpertierchen (Ciliophora) zeigen Abweichungen vom Standard-Code:

    AS  = FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSS**VVVVAAAADDEEGGGG
 Starts = ----------**--------------------MMMM----------**---M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

1, nicht selten auch

    AS  = FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSS**VVVVAAAADDEEGGGG
 Starts = ----------**--------------------MMMM----------**---M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

3, codieren für Glutamin; diese Abweichung findet sich auch in einigen Grünalgen.

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

5 steht auch manchmal für Cystein. Eine weitere Variante findet sich in der Hefe Candida, wo

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

8 Serin codiert.

Des Weiteren gibt es einige Varianten von Aminosäuren, die nicht nur von Bakterien (Bacteria) und Archaeen (Archaea) während der Translation durch Recodierung eingebaut werden können; so kann

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

5, wie oben beschrieben, Selenocystein und

    AS  = FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSS**VVVVAAAADDEEGGGG
 Starts = ----------**--------------------MMMM----------**---M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

1 Pyrrolysin codieren, im Standard-Code beidenfalls Stop-Codons.

Darüber hinaus sind noch weitere Abweichungen vom Standard-Code bekannt, die oft die Initiation (Start) oder die Termination (Stop) betreffen; insbesondere in Mitochondrien ist einem Codon (Basentriplett der mRNA) öfters nicht die übliche Aminosäure zugeordnet. In der folgenden Tabelle sind einige Beispiele aufgeführt:

Abweichungen vom Standard-CodeVorkommenCodonStandardAbweichungMitochondrien (bei allen bis jetzt untersuchten Organismen)UGAStopTryptophanMitochondrien von Säugern, Drosophila und S. cerevisiae und ProtozoenAUAIsoleucinMethionin = StartMitochondrien von SäugernAGC, AGUSerinStopMitochondrien von SäugernAG(A, G)ArgininStopMitochondrien von DrosophilaAGAArgininStopMitochondrien z. B. bei Saccharomyces cerevisiaeCU(U, C, A, G)LeucinThreoninMitochondrien Höherer PflanzenCGGArgininTryptophanEinige Arten der Pilzgattung CandidaCUGLeucinSerinEukarya (selten)CUGLeucinStartEukarya (selten)ACGThreoninStartEukarya (selten)GUGValinStartBacteriaGUGValinStartBacteria (selten)UUGLeucinStartBacteria (SR1 Bacteria)UGAStopGlycin[24]

DNA-Sequenzdatenbanken wie GenBank geben auch mRNA-Sequenzen in einem historischen Konventionen entsprechenden Format an, bei dem das DNA-Alphabet verwendet wird, also T anstelle von U steht. Beispiele:[23]

    AS  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG
 Starts = ---M------**--*----M---------------M----------------------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

    AS  = FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSS**VVVVAAAADDEEGGGG
 Starts = ----------**--------------------MMMM----------**---M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

    AS  = FFLLSSSSYY**CCWWTTTTPPPPHHQQRRRRIIMMTTTTNNKKSSRRVVVVAAAADDEEGGGG
 Starts = ----------**----------------------MM----------------------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

    AS  = FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSSSSVVVVAAAADDEEGGGG
 Starts = ---M------**--------------------MMMM---------------M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

    AS  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG
 Starts = ---M------**--*----M------------MMMM---------------M------------
 Base1  = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG
 Base2  = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG
 Base3  = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

Anmerkung: In der jeweils ersten Zeile „AS“ werden die Aminosäuren im Ein-Buchstaben-Code (siehe #Umgekehrte Codon-Tabelle) angegeben, wobei Abweichungen gegenüber dem Standard-Code (id) jeweils gefettet dargestellt sind (bzw. rot). In der zweiten Zeile „Starts“ zeigt

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

5 Initiation,

    id  = FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

6 Termination; manche Varianten unterscheiden sich allein hinsichtlich (alternativer) Startcodons oder Stopcodons. Weitere Codes sind der frei zugänglichen Quelle zu entnehmen.[23]

Allgemein ist das Konzept von der Evolution des genetischen Codes vom ursprünglichen und mehrdeutigen genetischen Urcode zum wohldefinierten ("eingefrorenen") Code mit dem Repertoire von 20 (+2) kanonischen Aminosäuren akzeptiert.[25] Es gibt jedoch verschiedene Meinungen und Ideen, wie diese Änderungen stattfanden. Auf diesen basierend werden sogar Modelle vorgeschlagen, die „Eintrittspunkte“ für die Invasion des genetischen Codes mit synthetischen Aminosäuren voraussagen.[26]

Was ist die genetischer Code einfach erklärt?

Als „genetischer Code“ werden die Regeln bezeichnet, aufgrund derer die DNA-Sequenz (d.h. die Abfolge der Basen in der DNA) in eine Aminosäuresequenz übersetzt wird. Eine bestimmte Abfolge von drei DNA-Basen kodiert für eine bestimmte Aminosäure. Aminosäuren sind die Bausteine der Proteine.

Wie ist der genetische Code aufgebaut?

Genetischer Code und Proteinbiosynthese Die DNA und mRNA enthalten jeweils vier verschiedene Basen: Adenin, Guanin, Cytosin Thymin (DNA) bzw. Uracil (RNA) . Wie du bereits gelernt hast, ist eine Aminosäure mit drei aufeinanderfolgenden Basen verschlüsselt.

Ist der genetische Code Kommafrei?

Der genetische Code ist degeneriert: Unterschiedliche Tripletts können für die gleiche Aminosäure codieren. Zudem ist der genetische Code kommafrei und nicht überlappend. Das bedeutet, dass die Tripletts lückenlos aneinander anschließen und dass eine Base immer nur Bestandteil von einem Triplett ist.