AlsKonsensussequenz wird diejenigeSequenz vonNukleotiden oderAminosäuren bezeichnet, welche in der Summe am wenigsten von einer gegebenen Menge von entsprechenden Mustersequenzen abweicht. Die genaue Beschaffenheit dieser Sequenz kann hierbei je nach Wahl desAbstandsmaßes, wie etwaHamming- oderLevenshtein-Distanz, variieren.
Meist liegt der Erstellung einer Konsensussequenz die Annahme zugrunde, dass die gegebenen Sequenzen einen gemeinsamenevolutionären Ursprung haben oder einSequenzmotiv mit einer bestimmten biologischen Aufgabe repräsentieren, wobei es oft auch sinnvoll sein kann, mehrdeutige Konsensussequenzen zu formulieren.
Bei Nukleinsäuren können hierfür die Basensymbole derNukleinsäure-Nomenklatur verwendet werden, also neben den eindeutigen BasensymbolenA,C,G,T,U auch beispielsweiseR für eine beliebigePurinbase,Y für eine beliebigePyrimidinbase oderN für ein beliebiges Nukleotid schlechthin.
In der Regel werden Konsensussequenzenheuristisch aus einemmultiplen Sequenzalignment (MSA) erstellt. Im einfachsten Fall wird dasjenige Element in die Konsensussequenz aufgenommen, welches in der entsprechenden Spalte des MSA am häufigsten vorkommt.