Movatterモバイル変換


[0]ホーム

URL:


DE10062566A1 - Identifying optimal primers for amplification, useful e.g. in medicine, to generate many overlapping or adjacent fragments - Google Patents

Identifying optimal primers for amplification, useful e.g. in medicine, to generate many overlapping or adjacent fragments

Info

Publication number
DE10062566A1
DE10062566A1DE10062566ADE10062566ADE10062566A1DE 10062566 A1DE10062566 A1DE 10062566A1DE 10062566 ADE10062566 ADE 10062566ADE 10062566 ADE10062566 ADE 10062566ADE 10062566 A1DE10062566 A1DE 10062566A1
Authority
DE
Germany
Prior art keywords
sections
primers
sequence
primer
unsuitable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10062566A
Other languages
German (de)
Inventor
Oliver Hummel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HUMMEL, OLIVER, 13189 BERLIN, DE
Original Assignee
Genprofile AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genprofile AGfiledCriticalGenprofile AG
Priority to DE10062566ApriorityCriticalpatent/DE10062566A1/en
Publication of DE10062566A1publicationCriticalpatent/DE10062566A1/en
Withdrawnlegal-statusCriticalCurrent

Links

Classifications

Landscapes

Abstract

Identifying primer sequences, and pairs, for generating many adjacent or overlapping PCR (polymerase chain reaction) fragments from a given DNA sequence (I), is new. Identifying primer sequences, and pairs, for generating many adjacent or overlapping PCR (polymerase chain reaction) fragments from a given DNA sequence (I), is new. A list is first drawn up of fragments (II) of (I) that, from their length, are potential primers. The values of characteristic parameters (CP) for each (II) are determined, with at least one CP being evaluated continuously. Value ranges for CP are determined and from these parameters (II) are classified as optimal or unsuitable for use as primers. The value ranges are separated by a transition region that can be represented by a transition function, continuous and with a strongly monotonic progression. Each CP value in this region is assigned a rating corresponding to the size of the appropriate transition function. (II) that are unsuitable, on the basis of one or more CP, are discarded and the other (II) are given a combined score (CS) by weighted summation of the sizes evaluated above and those having CS that meet predetermined criteria are selected. The selected sequences are then stored, displayed and/or output as primers and arranged into pairs. Independent claims are also included for the following: (1) computer program for the novel process; and (2) device for performing the novel process.

Description

Translated fromGerman

Die Erfindung betrifft Verfahren zur Ermittlung von Primer-Sequenzen, insbesondere Verfahren zur Primer-Auswahl für eine vorgegebene DNA-Sequenz auf der Grundlage einer kontinuierli­chen Bewertung charakteristischer Primer-Parameter, Vorrich­tungen zur Durchführung der Verfahren und deren Anwendungen.The invention relates to methods for determining primerSequences, in particular methods for the selection of primers for agiven DNA sequence based on a continuousChen evaluation of characteristic primer parameters, Vorrichto carry out the processes and their applications.

Die Sequenzierung, d. h. die Ermittlung der Nukleotidabfolge in Nukleinsäure-Sequenzen, ist das fundamentale Verfahren zur Entschlüsselung des genetischen Codes. Neben der Aufklärung unbekannter Sequenzen dient die Sequenzierung u. a. dazu, in­dividuelle Unterschiede in bekannten Sequenzen zu ermitteln. Zur Sequenzierung von langen DNA-Sequenzen ist es aus techni­schen Gründen erforderlich, die Sequenzen in handhabbare Un­terabschnitte, die PCR-Fragmente, zu unterteilen. Diese Frag­mente werden mittels Polymerase-Kettenreaktion mit hochspezi­fischen Oligonukleotiden, den sogenannten Primern, amplifi­ziert. Die Fragmente werden durch jeweils ein Primer-Paar be­grenzt und bestimmt.Sequencing, i. H. the determination of the nucleotide sequencein nucleic acid sequences, is the fundamental process forDecoding the genetic code. In addition to the enlightenmentunknown sequences are used for sequencing and a. to indetermine individual differences in known sequences.For the sequencing of long DNA sequences it is technireasons necessary, the sequences in manageable UnSub-sections, the PCR fragments. This questionelements are created using a polymerase chain reaction with highly specifish oligonucleotides, the so-called primers, amplifyed. The fragments are each a pair of primersborders and determines.

Für die Eigenschaften eines PCR-Fragments spielt die Auswahl des entsprechenden Primer-Paares eine wesentliche Rolle, ins­besondere der Abstand der beiden Primer auf der zu amplifizie­renden Sequenz, aus dem sich die Fragmentlänge ergibt. Außer­dem müssen multiple Bindungsorte eines oder beider Primer auf der Sequenz berücksichtigt werden, um mögliche Nebenprodukte auszuschließen. Um mögliche Sequenzierungsfehler an den Enden der Fragmente zu eliminieren, können benachbarte Fragmente mit einer Mindestüberlappung von z. B. 100 Basen generiert werden. Primer stellen hochspezifische Reagenzien dar. Ihre Qualität hängt von einer Vielzahl von Parametern ab. Diese Parameter sind teilweise voneinander abhängig: z. B. Länge, Schmelztemperatur, GC-Gehalt, 3'-Pentamerstabilität, Häufigkeit des 3'-Heptamers und Fähigkeit zur Dimer- oder Hairpinbildung.The selection plays a role in the properties of a PCR fragmentof the corresponding primer pair plays an essential role, insin particular the distance between the two primers on which to amplifyend sequence from which the fragment length results. exceptmultiple binding sites of one or both primers must indicate thisthe sequence should be taken into account for possible by-productsexcluded. For possible sequencing errors at the endsTo eliminate the fragments, neighboring fragments can be useda minimum overlap of e.g. B. 100 bases are generated.Primers are highly specific reagents. Their qualitydepends on a variety of parameters. These parametersare partly interdependent: z. B. length, melting temperature, GC content, 3'-pentamer stability, frequency of 3'-Heptamer and ability to form dimers or hairpins.

Es sind zahlreiche Computerprogramme bekannt, mit denen Primer in guter Qualität für einzelne PCR-Fragmente ausgewählt werden können: z. B. "Primer3" (S. Rozen et al. in "Methods Mol. Biol.", 2000, 132, 365-86) oder prime+ (GCG - Genetics Computer Group, (1998), Program Manual for the GCG Package, Version 10, 1998, 575 Science Drive, Madison, Wisconsin, USA 53711). Diese Programme sind allerdings nicht für die effiziente Generierung überlappender PCR-Fragmente zur Sequenzierung sehr langer Ge­nomabschnitte ausgelegt.Numerous computer programs are known with which primersselected in good quality for individual PCR fragmentscan: e.g. B. "Primer3" (S. Rozen et al. In "Methods Mol.Biol. ", 2000, 132, 365-86) or prime + (GCG - Genetics ComputerGroup, (1998), Program Manual for the GCG Package, Version 10,1998, 575 Science Drive, Madison, Wisconsin, USA 53711). ThisHowever, programs are not for efficient generationoverlapping PCR fragments for sequencing very long Genom sections.

Bei dem von "Primer3" umgesetzten Verfahren wird eine Vielzahl von Teilabschnitten einer vorgegebenen Sequenz in Bezug auf eine Gruppe vorgegebener charakteristischer Primer-Parameter untersucht. Für jeden Parameter wird ein Wertebereich oder/und ein Optimalwert definiert, innerhalb dessen Teilabschnitte der DNA-Sequenz als Primer geeignet sind. Werte außerhalb des Be­reichs/Optimalwerts werden mit einem Punktabzug bestraft. Die Auswahl einer größeren Anzahl von PCR-Primern ist wegen der diskontinuierlichen Bewertung, die einen zu strengen Filter darstellt, uneffektiv.The method implemented by "Primer3" uses a large numberof sections of a given sequence with respect toa group of predetermined characteristic primer parametersexamined. For each parameter there is a range of values or / anddefines an optimal value within which theDNA sequence are suitable as primers. Values outside the BeReichs / Optimalwert are punished with a point deduction. TheChoosing a larger number of PCR primers is because of thatdiscontinuous evaluation, which is too strict a filterrepresents ineffective.

Die Aufgabe der Erfindung ist es, ein neues Verfahren zur Er­mittlung von Primer-Sequenzen anzugeben, mit dem die oben er­läuterten Nachteile der herkömmlichen Verfahren überwunden werden und das eine automatisierte Auswahl von PCR-Primern er­möglicht. Die Aufgabe der Erfindung ist es auch, Vorrichtungen zur Umsetzung der Verfahren und Anwendungen der Verfahren be­reitzustellen.The object of the invention is to develop a new methodaveraging primer sequences with which the above heovercome the disadvantages of the conventional methodsan automated selection of PCR primersmade possible. The object of the invention is also devicesto implement the procedures and applications of the proceduresSemi note.

Diese Aufgaben werden mit Verfahren, Computerprogrammprodukten oder Vorrichtungen mit den Merkmalen gemäß den Patentansprüchen 1, 11 und 12 gelöst. Vorteilhafte Ausführungsformen der Erfindung ergeben sich aus den abhängigen Ansprüchen.These tasks are performed using procedures, computer program productsor devices with the features according to the claims 1, 11 and 12 solved. Advantageous embodiments of theInvention result from the dependent claims.

Die Grundidee der Erfindung ist es, die DNA-Sequenz auf der Grundlage einer kontinuierlichen Bewertung sowie einer gewich­teten Gesamtbewertung der Primer-Parameter mit besten Primer-Paaren abzudecken. Als Parameter können neben den gebräuchli­chen (s. o.) auch jeder weitere Parameter einbezogen werden. Das erfindungsgemäße Verfahren optimiert die Primerqualität für die automatisierte Sequenzierung durch kontinuierliche Be­wertung und Wichtung aller betrachteten Parameter.The basic idea of the invention is to show the DNA sequence on theBasis of a continuous evaluation as well as a weightedOverall evaluation of the primer parameters with the best primerTo cover couples. In addition to the usualChen (see above), each additional parameter can also be included.The method according to the invention optimizes the quality of the primerfor automated sequencing through continuous loadingevaluation and weighting of all considered parameters.

Die Erfindung besitzt den Vorteil, dass die Eignung eines Teilabschnitts als Primer objektiver bzw. realistischer bewer­tet wird als bei den herkömmlichen Techniken und dass die Ana­lyse von langen DNA-Sequenzen in Form überlappender Sequenzab­schnitte als Analyseeinheiten in rationeller Weise ermöglicht wird. Damit wird ein hoher Analysedurchsatz bei einer geringen Ausfallquote erzielt, woraus sich eine Einsparung an Material, Arbeit und Zeit ergibt.The invention has the advantage that the suitability of aSection as a primer objective or realistic valuethan with the conventional techniques and that the Analysis of long DNA sequences in the form of overlapping sequencescuts as analysis units in a rational waybecomes. This results in a high analysis throughput with a low oneFailure rate achieved, which results in a saving in material,Work and time results.

Gegenstand der Erfindung ist ferner ein Computerprogramm zur Umsetzung des genannten Verfahrens.The invention also relates to a computer program forImplementation of the above procedure.

Gegenstand der Erfindung ist auch eine Vorrichtung zur Ermitt­lung von Primer-Sequenzen mit einer Einrichtung zur Erfassung einer Vielzahl von Teilabschnitten einer gegebenen Sequenz und zur Bewertung der charakteristischen Primer-Parameter, einer ersten Auswahleinrichtung, die dazu ausgelegt ist, als Primer-Sequenzen ungeeignete Teilabschnitte der Sequenz zu verwerfen, einer zweiten Auswahleinrichtung, die dazu ausgelegt ist, die Summe der gewichteten Einzelbewertungen der übrigen Teilab­schnitte mit einem vorbestimmten Auswahlkriterium, z. B. einem Absolutschwellwert und/oder einer Maximalwertbildung, zu ver­gleichen, und einer dritten Auswahleinrichtung, die dazu ausgelegt ist, die besten Primer-Paare zu ermitteln. Die erfin­dungsgemäße Vorrichtung umfasst auch Einrichtungen zur Spei­cherung, Ausgabe und/oder Anzeige der ermittelten Primer-Sequenzen und Primer-Paare.The invention also relates to a device for determiningDevelopment of primer sequences with a device for detectiona plurality of sections of a given sequence andto evaluate the characteristic primer parameters, onefirst selection device, which is designed as a primerDiscard unsuitable sections of the sequence,a second selection device, which is designed toSum of the weighted individual evaluations of the remaining partscuts with a predetermined selection criterion, e.g. B. oneAbsolute threshold and / or maximum value formation, versame, and a third selection device designed for this is to find the best primer pairs. The inventdevice according to the invention also includes devices for storagesave, output and / or display the determined primerSequences and primer pairs.

Das erfindungsgemäße Verfahren besitzt vorteilhafterweise zahlreiche Anwendungen in der Biologie, Biotechnologie, Human- und Veterinärmedizin, Agrarwirtschaft, Ökologie sowie alle an­deren Gebieten, in denen die Sequenzierung von Nukleinsäuren eine Rolle spielt.The method according to the invention advantageously hasnumerous applications in biology, biotechnology, humanand veterinary medicine, agriculture, ecology and alltheir areas where the sequencing of nucleic acidsmatters.

Weitere Vorteile und Einzelheiten der Erfindung werden aus der folgenden Beschreibung des Verfahrensablaufes, der Erläuterung eines Beispiels und der beigefügten Zeichnung ersichtlich.Fig. 1 zeigt ein Beispiel für eine erfindungsgemäß verwendete kontinuierliche Übergangsfunktion zur Bewertung eines Primer-Parameters (x-Achse: Parameterwerte, y-Achse: Bewertung der Parameterwerte).Further advantages and details of the invention will become apparent from the following description of the process sequence, the explanation of an example and the accompanying drawing.Fig. 1 shows an example used in the invention continuous transition function for evaluating a primer parameter (x-axis: parameter values, y-axis: Evaluation of the parameter values).

Einzelheiten des erfindungsgemäßen VerfahrensDetails of the method according to the invention

Erfindungsgemäß ist insbesondere vorgesehen, dass auf Basis einer beliebig langen, bekannten Sequenz (der Sequenz, die z. B. aus der EMBL (European Molecular Biology Laboratories)-Datenbank stammt) und anhand festgelegter Parameter PCR-Primer automatisch mit einer kontinuierlichen Bewertung der Parameter ausgewählt werden. Dazu wird die Sequenz zunächst über ihre gesamte Länge oder ein entsprechendes Teilstück für alle mög­lichen Teilabschnitte auf dieser Länge in Bezug auf die inte­ressierenden Primer-Parameter charakterisiert. Die charakte­ristischen Parameter umfassen bestimmte Eigenschaften des Pri­mers (z. B. Primerlänge, GC-Gehalt, Primer-Schmelztemperatur usw.) und Parameter, die festgelegte Kriterien charakterisie­ren (z. B. 3'-Pentamerstabilität, Häufigkeit des 3'-Heptamers oder das Vorkommen von repetitiven Sequenzen ("repeats")).According to the invention, it is in particular provided thatan arbitrarily long known sequence (the sequence thatz. B. from EMBL (European Molecular Biology Laboratories) -Database comes from) and based on defined parameters PCR primerautomatically with a continuous evaluation of the parametersto be selected. To do this, the sequence is first of allentire length or a corresponding section for everyone possiblesections on this length in relation to the intecharacterizing primer parameters. The characterRistic parameters include certain characteristics of the primers (e.g. primer length, GC content, primer melting temperatureetc.) and parameters that characterize the defined criteriaren (e.g. 3'-pentamer stability, frequency of the 3'-heptameror the occurrence of repetitive sequences ("repeats")). 

In Abhängigkeit von anderen Faktoren, z. B. der Sequenzier­methode, den verwendeten Reagenzien und der Länge des zu se­quenzierenden DNA-Abschnitts werden die Fragmentlängen und der Mindestüberlappungsbereich der einzelnen Fragmente vorgegeben. Außerdem können Bereiche der zu sequenzierenden DNA "maskiert" werden, wenn aus diesen keine PCR-Primer ausgewählt werden sollen. Dies können Sequenzbereiche sein, die im Genom häufig vorkommen (sogenannte "repeats") oder bekannte Polymorphismen sowie andere für die Primer-Auswahl ungeeignete Orte (z. B. innerhalb eines Exons). Auf der Grundlage aller festgelegten Vorgaben werden die optimalen Primer ermittelt.Depending on other factors, e.g. B. the sequencermethod, the reagents used and the length of the sequencing DNA section are the fragment lengths and theMinimum overlap area of the individual fragments specified.In addition, areas of the DNA to be sequenced can be "masked"if no PCR primers are selected from themshould. These can be sequence regions that are common in the genomeoccur (so-called "repeats") or known polymorphismsas well as other unsuitable locations for the primer selection (e.g.within an exon). Based on all setThe optimal primers are determined.

1. Charakterisierung der gesamten Sequenz1. Characterization of the entire sequence

In einem ersten Schritt wird die komplette Sequenz hinsicht­lich der einbezogenen Parameter für alle potentiellen Primer­positionen und -längen untersucht. Es werden u. a. repeat-Regionen, bekannte Polymorphismen sowie weitere für die Pri­mer-Auswahl ungeeignete Sequenzbereiche maskiert. Für alle vorgegebenen Primerlängen werden in einem zweiten Schritt die Werte der einbezogenen Parameter bestimmt (z. B. GC-Gehalt, Schmelztemperatur, 3'-Pentamerstabilität u. a.). Anschließend wird jedem Parameter auf der Grundlage einer parameterspezifi­schen kontinuierlichen oder diskontinuierlichen Übergangsfunk­tion eine Bewertung zwischen 0 und 1 zugeordnet.In a first step, the complete sequence is consideredLich the parameters involved for all potential primerspositions and lengths examined. There will be a. including repeatRegions, known polymorphisms and others for the Priunsuitable sequence areas are masked. For allIn a second step, the specified primer lengths are theDetermines the values of the parameters involved (e.g. GC content,Melting temperature, 3'-pentamer stability u. a.). Subsequentlyeach parameter is based on a parameter specificcontinuous or discontinuous transitional radiotion assigned a rating between 0 and 1.

Die Übergangsfunktionen können erfindungsgemäß einen zwischen 0 und 1 kontinuierlichen Werteverlauf besitzen. "1" und "0" können auch als "beste Eignung" bzw. "keine Eignung" als Pri­mer hinsichtlich der konkreten Eigenschaft beschrieben werden. Ein Beispiel hierfür ist inFig. 1 für den Primer-GC-Gehalt (Guanosin-Cytosin-Gehalt) illustriert. Für Werte oberhalb und unterhalb vorbestimmter oberer und unterer Grenzwerte A bzw. D erfolgt die Bewertung mit 0. Primer mit einem mit 0 bewerteten Parameter dürfen nicht ausgewählt werden. Innerhalb des durch die Grenzwerte A und D aufgespannten Intervalls sind zwei wei­tere Grenzwerte (B, C) vorgesehen. Im abgeschlossenen Inter­vall von B bis C erfolgt die Bewertung mit 1, d. h. der Para­meter ist im Wertebereich von B bis C optimal geeignet. Das Optimum für einen jeden Parameter darf einen relativ großen Wertebereich umfassen. Das Optimum wird von Bereichen flan­kiert (Bereich zwischen A und B sowie zwischen C und D), in denen die Qualität des möglichen Primers für den betrachteten Parameter abfällt. In diesen Bereichen wird eine kontinuierli­che Bewertung durch mindestens eine Übergangsfunktion gebil­det. Dieser Abfall kann durch unterschiedlichste Funktionen, auch verschieden für unterschiedliche Parameter, charakteri­siert werden.According to the invention, the transition functions can have a continuous value curve between 0 and 1. "1" and "0" can also be described as "best suitability" and "no suitability" as primers with regard to the specific property. An example of this is illustrated inFIG. 1 for the primer GC content (guanosine cytosine content). For values above and below predetermined upper and lower limit values A and D, the evaluation is made with 0. Primers with a parameter evaluated with 0 must not be selected. Two further limit values (B, C) are provided within the interval spanned by limit values A and D. In the closed interval from B to C, the rating is 1, ie the parameter in the value range from B to C is optimally suitable. The optimum for each parameter can encompass a relatively large range of values. The optimum is flanked by areas (area between A and B and between C and D) in which the quality of the possible primer for the parameter under consideration drops. In these areas, a continuous assessment is formed by at least one transition function. This drop can be characterized by different functions, also different for different parameters.

Zur mathematischen Beschreibung der Bewertung eines Parameters in diesen beiden Bereichen eignen sich u. a. lineare Funktio­nen und Winkelfunktionen, wie inFig. 1 dargestellt. Dadurch ist eine kontinuierliche Bewertung aller bzw. ausgewählter Pa­rameter, die einen Primer charakterisieren, möglich. Im Gegen­satz zu den bereits verfügbaren Verfahren zum Primer-Design erfolgt die Bewertung der Parameter nicht sprunghaft.Linear functions and angular functions, as shown inFIG. 1, are suitable for the mathematical description of the evaluation of a parameter in these two areas. This enables a continuous evaluation of all or selected parameters that characterize a primer. In contrast to the methods for primer design already available, the parameters are not evaluated in leaps and bounds.

2. Gesamtbewertung2. Overall assessment

Anhand der so gewonnenen Einzelbewertungen aller Parameter ei­nes Primers wird eine Gesamtbewertung durchgeführt. Ist ein einbezogener Parameter eines Primers mit 0 bewertet worden, so wird dieser Primer von der Auswahl ausgeschlossen. Für alle übrigen möglichen Primer erfolgt die Gesamtbewertung durch Summation der Bewertungen aller einbezogenen Parameter, wobei auch eine Wichtung jedes einzelnen Parameters frei gewählt werden kann. Zur Bestimmung der am besten geeigneten Primer-Paare wird neben der Gesamtbewertung der beiden einzelnen Pri­mer zusätzlich eine gewichtete kontinuierliche Bewertung der Fragmentlänge (die aus den Positionen von Vorwärts- und Rück­wärtsprimer auf der Sequenz resultiert) und der beiden Primer-Schmelztemperaturen vorgenommen. Dazu erfolgt eine kontinuier­liche Bewertung der Schmelztemperatur-Differenz zwischen Vor­wärts- und Rückwärtsprimer.Based on the individual evaluations of all parameters obtained in this wayAn overall evaluation is carried out for the primer. Is aincluded parameters of a primer were rated 0, see abovethis primer is excluded from the selection. For allother possible primers, the overall evaluation is carried out bySummation of the evaluations of all parameters involved, wherebyweighting of each individual parameter can also be freely selectedcan be. To determine the most suitable primerIn addition to the overall rating of the two individual pria weighted continuous evaluation of the Fragment length (from the positions of forward and backwarddownward primer results on the sequence) and the two primersMelting temperatures made. This is done continuouslyevaluation of the melting temperature difference between preforward and reverse primer.

Das Primer-Paar mit der höchsten Summe der gewichteten Bewer­tungen wird ausgewählt. Ausgangspunkte zur Auswahl von Primer-Paaren können neben dem 5'-Ende der Sequenz auch kritische, z. B. maskierte Bereiche sein.The pair of primers with the highest sum of weighted judgesis selected. Starting points for the selection of primerIn addition to the 5 'end of the sequence, pairs can also be critical, e.g. B.masked areas.

Beispielexample1. Auswahl der charakteristischen Parameter und deren Über­gangsfunktionen1. Selection of the characteristic parameters and their overoutput functions

Es sind Primer für die Sequenz mit der Accession Number "D26607" aus der EMBL-Datenbank ("http:/ / www.ebi.ac.uk/cgi-bin/emblfetch?D26607") zu ermit­teln. Die Sequenz hat eine Länge von 23142 bp (Basenpaaren). Es sollen Primer für den Bereich zwischen dem Basenpaar 1 und 4000 exemplarisch ausgewählt werden. Die PCR-Fragmente sollen eine Länge von 1050 bp haben. Die Überlappung der Fragmente soll mindestens 100 bp betragen. Die Primer sollen eine Länge von 18 bis 27 Nukleotiden haben. Wenn keine Fragmente gene­riert werden können, deren Länge höchstens um 120 bp von der vorgegebenen Fragmentlänge abweicht, soll die vorgegebene Fragmentlänge um 350 bp erhöht bzw. verringert werden. Als charakteristische Parameter der Primer werden die folgenden einbezogen:
Primers for the sequence with the accession number "D26607" from the EMBL database ("http: / / www.ebi.ac.uk/cgi-bin/emblfetch?D26607") must be determined. The sequence is 23142 bp in length (base pairs). Primers for the range between base pair 1 and 4000 should be selected as examples. The PCR fragments are said to have a length of 1050 bp. The overlap of the fragments should be at least 100 bp. The primers should have a length of 18 to 27 nucleotides. If no fragments can be generated, the length of which deviates by a maximum of 120 bp from the predetermined fragment length, the predetermined fragment length should be increased or decreased by 350 bp. The following are included as characteristic parameters of the primers:

  • - Länge,- Length,
  • - GC-Gehalt,- GC content,
  • - Schmelztemperatur,- melting temperature,
  • - Anzahl des 3'-Heptamers in der Gesamtsequenz,Number of 3'-heptamer in the total sequence,
  • - Freie Energie des 3'-Pentamers,- free energy of the 3'-pentamer, 
  • - Maskierung,- masking,
  • - Zugehörigkeit zu einem Exon,- belonging to an exon,
  • - Vorkommen des 3'-Heptamers innerhalb eines Bereiches von 10 kbp.- Occurrence of the 3'-heptamer within a range of 10 kbp.

Die letzten drei Parameter können nur die Werte 0 oder 1 an­nehmen. Alle übrigen Parameter werden kontinuierlich bewertet. Primer, für die wenigstens ein Parameter mit 0 bewertet wurde, werden von den weiteren Berechnungen ausgeschlossen.The last three parameters can only have the values 0 or 1to take. All other parameters are evaluated continuously.Primers for which at least one parameter was rated 0,are excluded from further calculations.

Für die Bewertung der Parameterwerte zwischen den Punkten A und B sowie C und D werden zwei Funktionen ausgewählt (sieheFig. 1):
Two functions are selected for evaluating the parameter values between points A and B as well as C and D (seeFIG. 1):

  • - für den Bereich [A, B[:
    Fkt. 1:
    Fkt. 2:
    - for the area [A, B [:
    Fct. 1:
    Fct. 2:
  • - für den Bereich ]C, D]:
    Fkt. 3:
    - for the area] C, D]:
    Fct. 3:

Claims (13)

Translated fromGerman
1. Verfahren zur Ermittlung von Primer-Sequenzen und Primer-Paaren zur Erzeugung einer Vielzahl benachbarter oder überlappender PCR-Fragmente für eine gegebene DNA-Sequenz, mit den Schritten:
  • - Erstellung einer Liste mit einer Vielzahl von Teilab­schnitten der gegebenen Sequenz, die aufgrund ihrer Länge als Primer ausgewählt werden können,
  • - Ermittlung der Werte von charakteristischen Parametern für jeden Teilabschnitt, wobei mindestens ein Parameter kontinuierlich bewertet wird, indem für den Parameter charakteristische Parameterwertebereiche erfasst werden, für die der jeweilige Parameter entweder als optimal oder als ungeeignet zur Erzeugung von PCR-Fragmenten gilt, und diese Parameterwertebereiche durch Übergangsbereiche getrennt werden, die durch Übergangsfunktionen repräsen­tiert werden, die stetig sind und einen streng monotonen Verlauf besitzen, wobei dem jeweiligen Parameterwert in den Übergangsbereichen eine Bewertung entsprechend der Größe der zugehörigen Übergangsfunktion zugeordnet wird,
  • - Ausschluss von Teilabschnitten, die in Bezug auf mindes­tens einen Parameter als ungeeignet zur Erzeugung von PCR-Fragmenten bewertet werden,
  • - Gesamtbewertung der übrigen Teilabschnitte durch gewich­tete Summenbildung der den Parameterwerten bei der kontinu­ierlichen Bewertung zugeordneten Größen,
  • - Auswahl der Teilabschnitte als Primer, die nach der Gesamtbewertung vorbestimmten Auswahlkriterien entsprechen, und
  • - Speicherung, Anzeige und/oder Ausgabe der ausgewählten Teilabschnitte als Primer-Sequenzen und Anordnung zu Primer-Paaren.
1. A method for determining primer sequences and primer pairs for generating a plurality of adjacent or overlapping PCR fragments for a given DNA sequence, comprising the steps:
  • Preparation of a list with a large number of sections of the given sequence, which can be selected as primers based on their length,
  • - Determination of the values of characteristic parameters for each subsection, wherein at least one parameter is continuously evaluated by recording characteristic parameter value ranges for the parameter, for which the respective parameter is either considered to be optimal or unsuitable for generating PCR fragments, and these parameter value ranges are separated by transition areas, which are represented by transition functions, which are continuous and have a strictly monotonous course, the respective parameter value in the transition areas being assigned an evaluation according to the size of the associated transition function,
  • - Exclusion of sections that are assessed as unsuitable for generating PCR fragments with regard to at least one parameter,
  • - overall evaluation of the remaining sections by weighted summation of the quantities assigned to the parameter values in the continuous evaluation,
  • - Selection of the subsections as primers which correspond to predetermined selection criteria based on the overall evaluation, and
  • - Storage, display and / or output of the selected sections as primer sequences and arrangement of primer pairs.
2. Verfahren gemäß Anspruch 1, bei dem als Parameter die Position des Teilabschnittes auf der Sequenz, die Länge des Teilabschnittes, der GC-Gehalt, die Schmelztemperatur, die 3'-Oligomehrstabilität, die 3'-Oligomehrhäufigkeit und/oder die Markierung ungeeigneter Sequenzbereiche für den Teilab­schnitt ermittelt werden.2. The method according to claim 1, in which as the parameterPosition of the section on the sequence, the length of theSubsection, the GC content, the melting temperature, the3'-oligo multi-stability, the 3'-oligo multi-frequency and / orthe marking of unsuitable sequence areas for the partcut can be determined.3. Verfahren gemäß Anspruch 2, bei dem Teilabschnitte mit Längen von weniger als 12 und mehr als 35 Nukleotiden als ungeeignet und mit Längen von 20 bis 24 Nukleotiden als optimal bewertet werden.3. The method according to claim 2, in which sections withLengths less than 12 and more than 35 nucleotides asunsuitable and with lengths of 20 to 24 nucleotidesbe rated optimally.4. Verfahren gemäß Anspruch 2 oder 3, bei dem Teilab­schnitte mit GC-Gehalten von weniger als 15% und mehr als 85% als ungeeignet und von 45% bis 55% als optimal bewertet werden.4. The method according to claim 2 or 3, in which Teilabcuts with GC levels less than 15% and more than85% as unsuitable and from 45% to 55% as optimalbe rated.5. Verfahren gemäß einem der Ansprüche 2 bis 4, bei dem Teilabschnitte mit Schmelztemperaturen von weniger als 30°C und mehr als 90°C als ungeeignet und im Temperaturbereich von 50°C bis 55°C als optimal bewertet werden.5. The method according to any one of claims 2 to 4, in whichSections with melting temperatures of less than 30 ° Cand more than 90 ° C as unsuitable and in the temperature rangefrom 50 ° C to 55 ° C can be rated as optimal.6. Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem die Übergangsfunktionen durch Winkelfunktionen, lineare Funktionen oder Überlagerungen aus diesen gebildet werden.6. The method according to any one of the preceding claims,where the transition functions by angular functions,linear functions or overlays formed from thesebecome.7. Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem die Auswahl von Teilabschnitten als Primer in Bezug auf die Fragmentlänge derart erfolgt, dass bei einer vorbestimmten optimalen Länge von Teilabschnitten für einen zuerst ausgewählten Teilabschnitt auf dem einen Strang der Sequenz die Teilabschnitte auf dem anderen Strang als ungeeignet bewertet werden, wenn sie zu einer Fragmentlänge führen, die geringer als eine vorbestimmte Mindestlänge oder größer als eine vorbestimmte Maximallänge ist.7. The method according to any one of the preceding claims,in which the selection of subsections as a primer in relationto the fragment length in such a way that at apredetermined optimal length of sections for afirst selected section on one strand ofSequence the sections on the other strand thanbe rated inappropriate if they become a fragment lengthlead less than a predetermined minimum lengthor is greater than a predetermined maximum length. 8. Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem die Auswahl von Teilabschnitten als Primer derart erfolgt, dass für einen zuerst ausgewählten Teilabschnitt auf dem einen Strang der Sequenz die Teilabschnitte auf dem anderen Strang als ungeeignet bewertet werden, wenn beide Teilabschnitte eine Schmelztemperaturdifferenz besitzen, die größer als 10°C ist, wobei die Teilabschnitte als optimal bewertet werden, wenn die Schmelztemperaturdiffe­renz kleiner als 0.5°C ist.8. The method according to any one of the preceding claims,in which the selection of subsections as primers suchthat occurs for a first selected sectionon one strand of the sequence the sections on theother strand will be rated as inappropriate if bothSections have a melting temperature difference,which is greater than 10 ° C, the sections ascan be optimally evaluated if the melting temperature differenceslimit is less than 0.5 ° C.9. Verfahren gemäß Anspruch 8, bei dem in einem Sequenz­bereich, für den ein Teilabschnitt als Primer auf dem einen Strang der Sequenz ausgewählt werden soll, die 15 Primer mit den höchsten Gesamtbewertungen der einzelnen Primer vorausgewählt werden und zu diesen entsprechend der vorbe­stimmten optimalen Fragmentlänge jeweils die besten zugehö­rigen Teilabschnitte auf dem gegenüberliegenden Strang ausgewählt werden, wobei aus den so gebildeten Paaren von Teilabschnitten das Paar mit der höchsten Gesamtbewertung, die sich aus der Bewertung der einzelnen Teilabschnitte, der Schmelztemperaturdifferenz der beteiligten Primer und der Fragmentlänge ergibt, ausgewählt wird.9. The method according to claim 8, in which in a sequencearea for which a subsection acts as a primer on oneStrand of the sequence to be selected is the 15 primerswith the highest overall ratings of the individual primersbe preselected and added to these according to thethe optimal fragment length matched the bestother sections on the opposite strandcan be selected, with the pairs ofSections the couple with the highest overall rating,resulting from the assessment of the individual sections,the melting temperature difference of the primers involved andof the fragment length is selected.10. Verfahren gemäß Anspruch 9, bei dem als zusätzlicher Parameter in einem vorgegebenen Bereich der Sequenz die Lage des Primers relativ zu einem benachbarten Fragment zur Bildung einer vorbestimmten Mindestüberlappung erfasst wird.10. The method according to claim 9, in which as an additionalParameters in a given area of the sequencePosition of the primer relative to an adjacent fragmentFormation of a predetermined minimum overlap detectedbecomes.11. Computerprogrammprodukt, das zur Ermittlung von Primer-Sequenzen und Primer-Paaren nach einem Verfahren gemäß einem der vorhergehenden Ansprüche eingerichtet ist.11. Computer program product designed to identifyPrimer sequences and primer pairs by one methodis set up according to one of the preceding claims.12. Vorrichtung zur Ermittlung von Primer-Sequenzen und Primer-Paaren, die zur Durchführung eines Verfahrens mit den Schritten gemäß einem der vorhergehenden Ansprüche eingerichtet ist, mit:12. Device for determining primer sequences andPrimer pairs used to perform a procedure withthe steps according to any one of the preceding claimsis set up with: - einer Einrichtung zur Erfassung einer Vielzahl von Teilabschnitten einer gegebenen DNA-Sequenz und von zugehö­rigen charakteristischen Parametern,
  • - einer Bewertungseinrichtung zur Bewertung der ermittelten Parameter,
  • - einer ersten Auswahleinrichtung, die dazu ausgelegt ist, als Primer ungeeignete Teilabschnitte der Sequenz zu verwerfen,
  • - einer zweiten Auswahleinrichtung, die dazu ausgelegt ist, die übrigen Teilabschnitte zu bewerten, und
  • - Einrichtungen zur Speicherung, Ausgabe und/oder Anzeige der ermittelten Primer-Sequenzen und Primer-Paaren.
a device for detecting a large number of subsections of a given DNA sequence and associated characteristic parameters,
  • an evaluation device for evaluating the determined parameters,
  • a first selection device which is designed to reject unsuitable sections of the sequence as primers,
  • a second selection device, which is designed to evaluate the remaining sections, and
  • - Devices for storing, outputting and / or displaying the determined primer sequences and primer pairs.
DE10062566A2000-12-152000-12-15Identifying optimal primers for amplification, useful e.g. in medicine, to generate many overlapping or adjacent fragmentsWithdrawnDE10062566A1 (en)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
DE10062566ADE10062566A1 (en)2000-12-152000-12-15Identifying optimal primers for amplification, useful e.g. in medicine, to generate many overlapping or adjacent fragments

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
DE10062566ADE10062566A1 (en)2000-12-152000-12-15Identifying optimal primers for amplification, useful e.g. in medicine, to generate many overlapping or adjacent fragments

Publications (1)

Publication NumberPublication Date
DE10062566A1true DE10062566A1 (en)2002-06-20

Family

ID=7667300

Family Applications (1)

Application NumberTitlePriority DateFiling Date
DE10062566AWithdrawnDE10062566A1 (en)2000-12-152000-12-15Identifying optimal primers for amplification, useful e.g. in medicine, to generate many overlapping or adjacent fragments

Country Status (1)

CountryLink
DE (1)DE10062566A1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
WO2003021259A1 (en)*2001-09-052003-03-13Perlegen Sciences, Inc.Selection of primer pairs
US6898531B2 (en)2001-09-052005-05-24Perlegen Sciences, Inc.Algorithms for selection of primer pairs
US6969589B2 (en)2001-03-302005-11-29Perlegen Sciences, Inc.Methods for genomic analysis

Cited By (4)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
US6969589B2 (en)2001-03-302005-11-29Perlegen Sciences, Inc.Methods for genomic analysis
US11031098B2 (en)2001-03-302021-06-08Genetic Technologies LimitedComputer systems and methods for genomic analysis
WO2003021259A1 (en)*2001-09-052003-03-13Perlegen Sciences, Inc.Selection of primer pairs
US6898531B2 (en)2001-09-052005-05-24Perlegen Sciences, Inc.Algorithms for selection of primer pairs

Similar Documents

PublicationPublication DateTitle
DE69233719T2 (en) Primers, sets and restriction fragments and their use in selective restriction fragment amplification
DE69105959T2 (en) METHOD FOR DIFFERENTIATING NUCLEIC ACIDS BASED ON NUCLEOTIDE DIFFERENCES.
DE69225333T2 (en) Methods for the detection of microorganisms using direct and arbitrary DNA amplification.
DE68909514T2 (en) Method for the simultaneous determination of DNA sequence variations from numerous sites and a set therefor.
DE69233657T2 (en) Three microsatellite repeat polymorphic DNA markers with high information density
DE69821540T2 (en) Competitive PCR with an adapter
DE69331786T2 (en) A REPRESENTATIVE TREATMENT OF DNA ANALYSIS
DE68929299T2 (en) Multiple genomic DNA amplification to detect a deletion
DE60026294T2 (en) "SHOT GUN" SEQUENCING AND AMPLIFICATION WITHOUT CLONING
EP0438512B2 (en)Process for analysing length polymorphisms in dna domains
DE69210588T2 (en) Molecular genetic identification using probes that recognize polymorphic sites
DE19633436A1 (en) Method for the detection of nucleic acids by determining the mass
DE186271T1 (en) POLYNUCLEOTIDE PROBE.
DE60014067T2 (en) COMPOSITIONS AND METHODS FOR GENETIC ANALYSIS
EP1294946A2 (en)Multiplex sequencing method
DE3904270A1 (en) METHOD FOR LABELING SPECIFIC CHROMOSOMES USING REPETETIVE RECOMBINATION DNA
DE60123626T2 (en) METHOD OF CONSTRUCTING SELFASSEMPLEING PROBES AND METHOD FOR DETECTING THEM
DE68909445T2 (en) Method for determining genetic sequences and test set therefor.
DE10062566A1 (en)Identifying optimal primers for amplification, useful e.g. in medicine, to generate many overlapping or adjacent fragments
DE3901675A1 (en) CLEANING POLYMORPHER COMPONENTS COMPLEX GENOME
DE60122899T2 (en) METHOD FOR DETECTING HAPLOTYPES BY MEANS OF MASS SPECTROMETRY
EP1960537A1 (en)Process for determining the genotype from a biological sample containing nucleic acids of different individuals
DE3938853A1 (en) METHOD FOR DETECTING DIFFERENT NUCLEOTIDE SEQUENCES, HYBRIDIZING PROBE FOR THIS METHOD, AND KIT CONTAINING SUCH PROBE
DE60026830T2 (en) METHOD FOR SELECTION OF OLIGONUCLEOTIDES WITH LOW CRUSH-HYBRIDIZATION
DE60311263T2 (en) METHOD FOR DETERMINING THE COPIAL NUMBER OF A NUCLEOTIDE SEQUENCE

Legal Events

DateCodeTitleDescription
8127New person/name/address of the applicant

Owner name:HUMMEL, OLIVER, 13189 BERLIN, DE

8139Disposal/non-payment of the annual fee

[8]ページ先頭

©2009-2025 Movatter.jp