Quantitative Messung von Molekülmengen in komplexen GemischenQuantitative measurement of molecular amounts in complex mixtures
Beschreibungdescription
Die Erfindung betrifft ein Verfahren zur quantitativen Messung von Molekülmengen in komplexen Gemischen mittels Microarrays und anderen mikrostrukturierten Trägern. Anwendungsgebiete der Erfindung sind die Molekularbiologie, die Medizin und die pharmazeutische Industrie.The invention relates to a method for the quantitative measurement of molecular amounts in complex mixtures by means of microarrays and other microstructured carriers. Fields of application of the invention are molecular biology, medicine and the pharmaceutical industry.
Microarrays bestehen aus einer Vielzahl polymerischer Moleküle, die mit einer definierten geometrischen Anordnung fest an der Oberfläche eines Trägersubstrates angebunden sind. Microarrays von Polynukleotiden und Polypeptiden sind inzwischen ein wichtiges Werkzeug der Molekularbiologie sowie verwandter Technologien und Industrien. Sie werden in einer Reihe von Anwendungen eingesetzt, zum Beispiel im Screening, in der DNA-Sequenzierung und in der Genexpressionsanalyse. Als Microarrays im Sinne dieser Ausführung werden auch komplexere Trägergeometrien (Biochips, Nanotechnologie) aufgefaßt, an deren Oberflächen kontrollierte chemische Reaktionen durchgeführt werden. Im Folgenden werden die an der Oberfläche fixierten Moleküle als Target (Target-Bibliothek) bezeichnet. Das zu untersuchende Substanzgemisch, das mit dem Array in Kontakt gebracht wird, wird als (komplexe) Probe bezeichnet. Probe und Array werden unter Hybridisierungsbedingungen in Kontakt gebracht, nicht bindende Probenmoleküle werden wieder entfernt. Die Zahl der auf dem Träger verbliebenen Probenmoleküle bildet ein Hybridisierungsprofil und erlaubt die Be- Stimmung der molekulare Zusammensetzung der Probe [1,2] .Microarrays consist of a large number of polymeric molecules that are firmly attached to the surface of a carrier substrate with a defined geometric arrangement. Microarrays of polynucleotides and polypeptides have become an important tool in molecular biology as well as related technologies and industries. They are used in a number of applications, for example in screening, in DNA sequencing and in gene expression analysis. More complex carrier geometries (biochips, nanotechnology) are also regarded as microarrays in the sense of this embodiment, and controlled chemical reactions are carried out on their surfaces. In the following, the molecules attached to the surface are referred to as the target (target library). The mixture of substances to be examined, which is brought into contact with the array, is referred to as a (complex) sample. The sample and array are brought into contact under hybridization conditions, and non-binding sample molecules are removed again. The number of sample molecules remaining on the support forms a hybridization profile and allows the molecular composition of the sample to be determined [1,2].
In der Praxis werden die auf dem Array verbliebenen Moleküle durch geeignete Markierung (z.B.: fluoreszentes oder radioaktives Labeling) kenntlich gemacht und mit entsprechenden De- tektionsverfahren (zum Beispiel Fluoreszenz- oder Laserscanner) gemessen. Unabhängig von den Details der Arrays und der Detektionstechnik sind die derzeitigen Verfahren ungenau und es ist wenig über den Hybridisierungs- und Meßprozeß und die dabei auftretenden Fehler bekannt . Daher ist insbesondere der quantitative Zusammenhang der Konzentration der Probenmoleküle und des detektierten Signals unsicher. Besonders problema- tisch ist der Vergleich verschiedener Arrays, da er eine quantitative Messung der Konzentration der Probenmoleküle erfordert .In practice, the molecules remaining on the array are identified by suitable labeling (for example: fluorescent or radioactive labeling) and measured using appropriate detection methods (for example fluorescence or laser scanners). Regardless of the details of the arrays and the detection technology, the current methods are imprecise and little is known about the hybridization and measurement process and the errors that occur. The quantitative relationship between the concentration of the sample molecules and the detected signal is therefore particularly uncertain. The comparison of different arrays is particularly problematic because it requires a quantitative measurement of the concentration of the sample molecules.
Bisher wurden folgende Methoden zur quantitative Messung an- gewendet:The following quantitative measurement methods have been used so far:
1. Vergleich mit probeneigenen Genen wenig veränderlicher Expressionsstärke (house keeping genes) [7] .1. Comparison with genes with little change in expression level (house keeping genes) [7].
2. Zugabe zweier artfremder Gene zur Probe (Spiking) in einer festen Konzentration [5] .2. Add two foreign genes to the sample (spiking) in a fixed concentration [5].
3. Kombination des letztgenannten Verfahrens mit variablen Targetmengen [4] .3. Combination of the latter method with variable target amounts [4].
4. Verwendung endgelabelter Probenmoleküle [3].4. Use of end-labeled sample molecules [3].
Weitere Verfahren sind aus [9] und [10] bekannt.Other methods are known from [9] and [10].
Alle diese Methoden erfassen nur einen Teil der bei der Hybridisierung und Messung relevanten Parameter und beruhen auf unzureichend gesicherten Annahmen über den Hybridisierungs- prozess.All of these methods capture only a part of the parameters relevant for hybridization and measurement and are based on insufficiently confirmed assumptions about the hybridization process.
Der Erfindung liegt die Aufgabe zugrunde, die Nachteile der bisher bekannten Methoden zu beseitigen und ein Verfahren zu entwickeln, welches die parallele quantitative Messung von Molekülmengen in komplexen Gemischen ermöglicht.The object of the invention is to eliminate the disadvantages of the previously known methods and to develop a method which enables the parallel quantitative measurement of molecular amounts in complex mixtures.
Die Aufgabe der Erfindung wird mit den in den Ansprüchen beschriebenen Mitteln gelöst .The object of the invention is achieved with the means described in the claims.
Der Kernpunkt der erfindungsgemäßen Messung von Molekülmengen (Anzahlen oder Konzentrationen) in komplexen Gemischen mittels Mikroarrays besteht darin, daß eine zu untersuchende Probe (z. B. DNA, RNA oder Polypeptide) mit einem komplexen Gemisch von Referenzmolekülen versetzt und auf einen Array aufgebracht wird, welcher neben den zur Probe passenden Detektormolekülen zusätzlich Targetmoleküle enthält, an welche die Referenzmoleküle in an sich bekannter Weise binden.The essence of the measurement of amounts of molecules (numbers or concentrations) in complex mixtures according to the invention by means of microarrays is that one to be examined A complex mixture of reference molecules is added to the sample (e.g. DNA, RNA or polypeptides) and applied to an array which, in addition to the detector molecules matching the sample, also contains target molecules to which the reference molecules bind in a manner known per se.
Die Referenzmoleküle werden so ausgewählt, daß sie ähnliche Bindungscharakteristika wie die Probenmoleküle haben, aber weder untereinander noch mit den Probemolekülen oder den da- zugehörenden Detektormolekülen wechselwirken. Ein Beispiel dafür ist, daß zur Untersuchung einer komplexen Probe aus Maus-cDNA ein Gemisch von pflanzenspezifischen Arabidopsis- cDNA Klonen zur Normierung beigegeben wird, welche in ihrem GC-Gehalt den Maus Klonen entsprechen, jedoch aufgrund ihrer Sequenz keine Wechselwirkungen mit diesen eingehen.The reference molecules are selected so that they have similar binding characteristics as the sample molecules, but do not interact with each other, with the sample molecules or the associated detector molecules. An example of this is that a mixture of plant-specific Arabidopsis cDNA clones is added for the analysis of a complex sample from mouse cDNA. The GC content of these clones corresponds to that of the mouse clones but does not interact with them due to their sequence.
Die Konzentrationen der Referenzmoleküle im Referenzgemisch werden vorzugsweise so gewählt, daß sie ein Abbild der Probenmoleküle im Probengemisch sind.The concentrations of the reference molecules in the reference mixture are preferably selected so that they are an image of the sample molecules in the sample mixture.
Die Messung erfolgt in der Weise, daß die Referenzmoleküle mehrfach auf dem Array aufgebracht werden und aus dieser Mehrfachmessung der Meßfehler bestimmt wird.The measurement is carried out in such a way that the reference molecules are applied to the array several times and the measurement error is determined from this multiple measurement.
Zur Überwachung der geometrischen Homogenität des Messvorgangs werden die Targetmoleküle für die Referenzprobe geordnet auf dem gesamten Array aufgebracht .To monitor the geometric homogeneity of the measurement process, the target molecules for the reference sample are applied to the entire array in an orderly fashion.
Die erfindungsgemäße Methode kann auch auf anderen mikrostrukturierten Trägern wie z.B. Chips oder Nanotiterplat- ten durchgeführt werden. Zur Detektion der gebundenen Proben und Referenzmoleküle bzw. der an ihnen befestigten Marker werden optische, elektrische oder mechanische Verfahren verwendet .The method according to the invention can also be used on other microstructured supports such as e.g. Chips or nanotiter plates are carried out. Optical, electrical or mechanical methods are used to detect the bound samples and reference molecules or the markers attached to them.
Durch Zugabe unterschiedlicher Mengen verschiedener Referenz- moleküle zur Probe und Aufbringen entsprechender Targets auf dem Array ist eine erhebliche Verbesserung der quantitativen Messung der Konzentration der Probenmoleküle möglich. Damit ist auch die Vergleichbarkeit verschiedener Messungen gewährleistet .By adding different amounts of different reference molecules to the sample and applying appropriate targets The array can significantly improve the quantitative measurement of the concentration of the sample molecules. This also ensures that different measurements can be compared.
Das erfindungsgemäße Verfahren ist für alle Arten von Molekülen anwendbar, die stöchiometrische Wechselwirkungen eingehen (Schlüssel-Schlosspaare bilden) , insbesondere für RNA, PNA, DNA, und Proteine. Es besteht aus den folgenden Schritten:The method according to the invention can be used for all types of molecules which enter into stoichiometric interactions (form key-lock pairs), in particular for RNA, PNA, DNA and proteins. It consists of the following steps:
1. Wahl der Referenzmoleküle1. Choice of reference molecules
2. Wahl der Menge der Referenzmoleküle in der Probe2. Choice of the amount of reference molecules in the sample
3. Wahl der Menge der Referenzmoleküle im Target . Wahl der Anzahl der Referenzmoleküle 5. Bestimmung der Eichkurven und Quantifizierung der Probenmenge3. Choice of the amount of reference molecules in the target. Choice of the number of reference molecules 5. Determination of the calibration curves and quantification of the sample amount
6. Bestimmung der Messgüte6. Determination of the measurement quality
Das Verfahren ist in Verbindung mit allen möglichen Technolo- gien zur MolekulmengenbeStimmung anwendbar. Insbesondere ist es unabhängig von der genauen Technologie, die zur Markierung (Labeling) der Moleküle eingesetzt wird, wie zum Beispiel radioaktive Markierung oder fluoreszente ein- oder Mehrfarbmarkierung .The method can be used in conjunction with all possible technologies for determining the amount of molecules. In particular, it is independent of the exact technology used to label the molecules, such as radioactive labeling or fluorescent single or multi-color labeling.
Wahl der ReferenzmoleküleChoice of reference molecules
Durch geeignete Auswahl muss sichergestellt werden, dass die als Referenz verwendeten Moleküle möglichst geringe Wechsel- Wirkung mit den Molekülen aus der Target-Bibliothek zeigen. Die Referenzmoleküle können sowohl bekannte Klone/Proteine z.B. aus vorhandenen Molekül-Bibliotheken als auch neue geeignet designte Moleküle sein. Die Referenzmσleküle sollen in ihren Bindungseigenschaften die chemischen Charakteristika der Probe reflektieren (z.B. in Längenverteilung oder GC- Gehalt) und gleichzeitig keine Wechselwirkung (etwa Hintergrund-Hybridisierung oder Kreuzhybridisierug) mit den Proben und den Targetmolekülen eingehen. Verfahren zur Auswahl und zum Design geeigneter DNA, RNA und Proteine sind in den folgenden Abschnitten beschrieben.A suitable selection must ensure that the molecules used as reference interact as little as possible with the molecules from the target library. The reference molecules can be both known clones / proteins, for example from existing molecule libraries, and new, suitably designed molecules. In their binding properties, the reference molecules should reflect the chemical characteristics of the sample (eg in length distribution or GC content) and at the same time no interaction (such as background hybridization or cross-hybridization) with the samples and enter into the target molecules. Methods for the selection and design of suitable DNA, RNA and proteins are described in the following sections.
Prinzipiell gibt es zwei Wege, einen Referenzdatensatz zu konstruieren :In principle, there are two ways to construct a reference data record:
Auswahl der Moleküle aus einer fest vorgegebenen Bibliothek (natürlich vorkommend oder synthetisierter Moleküle) oder Neuentwurf synthetischer Moleküle mit bioinformatischen Me- thoden. Auch eine Kombination der beiden Ansätze kann sinnvoll sein: Bildung von synthetischen Hybridmolekülen aus Fragmenten einer Bibliothek bekannter Moleküle.Selection of molecules from a predefined library (naturally occurring or synthesized molecules) or redesign of synthetic molecules using bioinformatic methods. A combination of the two approaches can also be useful: formation of synthetic hybrid molecules from fragments of a library of known molecules.
1.1 DNA1.1 DNA
Zur Auswahl geeignter Kandidaten aus einer Menge bekannter Klone (Bibliothek) sollten nach Möglichkeit die Sequenzen sämtlicher in der Probe zu erwartenden und aller im Target gespotteten DNA-Moleküle bekannt sein. So kann am sichersten eine störende Wechselwirkung mit der Probe oder den Targetmolekülen vermieden werden.To select suitable candidates from a set of known clones (library), the sequences of all expected DNA molecules in the sample and all spotted DNA molecules in the target should be known. This is the safest way to avoid an interfering interaction with the sample or the target molecules.
Beispiel : Für die Durchführung eines Hefe Hybridisierungsex- perimentes sollen Referenzmoleküle ausgesucht werden. Als Suchbibliothek stehen das Genom des Archebakteriums Archeo- globus fulgidus und Methanococcus janascii zur Verfügung. Durch Vorgabe einer Ähnlichkeitsschwelle (z.B. einem e-value bei BLAST) wird ein Satz von Molekülkandidaten mit genügend geringer Ähnlichkeit zum Hefegenom ausgewählt. Aus diesen Kandidaten wird ein Satz von nicht homologen Molekülen ausgewählt (z.B. mit dem in [6] beschriebenen Verfahren). Bei Bedarf kann eine weitere Auslese nach Kriterien der molekularen Zusammensetzung (Länge, GC-Gehalt) erfolgen. 1.2 OligonukleotideExample: Reference molecules should be selected to carry out a yeast hybridization experiment. The genome of the archebacterium Archeoglobus fulgidus and Methanococcus janascii are available as a search library. By specifying a similarity threshold (e.g. an e-value for BLAST), a set of molecular candidates with sufficiently low similarity to the yeast genome is selected. A set of non-homologous molecules is selected from these candidates (for example using the method described in [6]). If necessary, a further selection based on the criteria of the molecular composition (length, GC content) can be carried out. 1.2 oligonucleotides
Bei Oligonukleotiden ist eine de novo Synthese organismenfremder Moleküle naheliegend. Günstige Molekülkandidaten der Länge L (L-Nukleotide) können durch Auswahl schwach bevölkerter Regionen auf dem verallgemeinerten Hyperwürfel [8] der L- Nukleotide gefunden werden. Ein einfaches numerisches Verfahren dazu versieht die M Oligonukleotide und alle im Genom des zu untersuchenden Organismus auftauchenden L-Nukleotide mit abstossenden Ladungen und sucht durch deterministische oder stochastische Iteration eine Konfiguration minimaler Energie im M*L-dimensionalen Konfigurationsraum der M L-Nukleotide.In the case of oligonucleotides, a de novo synthesis of non-organism molecules is obvious. Favorable molecular candidates of length L (L nucleotides) can be found by selecting sparsely populated regions on the generalized hypercube [8] of the L nucleotides. A simple numerical method provides the M oligonucleotides and all L nucleotides that appear in the genome of the organism to be examined with repulsive charges and searches for a configuration of minimal energy in the M * L-dimensional configuration space of the M L nucleotides by deterministic or stochastic iteration.
1.3 Proteine1.3 Proteins
Bei Proteinen und Peptiden ist die Situation komplizierter, da Molekülwechselwirkungen nicht über einfache Paarbindung erfolgen. Ist eine geeignete Funktion zur Beschreibung der molekularen Wechselwirkungen gefunden, so können die obenge- nannten Verfahren sofort geeignet erweitert werden: das Ziel ist es wiederum, einen Satz von paarweise wechselwirkenden Molekülen zu suchen, die keine Bindung mit der Probe eingehen. Steht eine solche Wechselwirkungsfunktion nicht zur Verfügung, so ist jedenfalls bei Oligopeptiden (Länge < 40) eine experimentelle Auswahl von Referenzmolekülen möglich: Ein grosser Satz von potentiellen Referenzmolekülen, etwa eine Zufallsbibliothek, wird in Festphasensynthese auf einem geeigneten Träger fixiert . Die markierte Probe wird mit der Matrix in Kontakt gebracht. Peptide, die keine Wechselwirkung eingegangen sind, kommen als Kandidaten in die engere Auswahl. In Analogie zur oben beschriebenen Auswahl nichthomologer DNA-Moleküle aus der Datenbank werden durch weitere Hybridisierungsstudien nicht miteinander wechselwirkende Peptide ausgewählt . 2. Wahl der Menge der Referenzmoleküle in der ProbeThe situation for proteins and peptides is more complicated because molecular interactions do not take place via simple pair binding. If a suitable function for describing the molecular interactions has been found, the abovementioned methods can be suitably expanded immediately: the goal is again to search for a set of pairs of interacting molecules which do not bind to the sample. If such an interaction function is not available, an experimental selection of reference molecules is possible in any case for oligopeptides (length <40): A large set of potential reference molecules, such as a random library, is fixed on a suitable support in solid phase synthesis. The marked sample is brought into contact with the matrix. Peptides that have not interacted will be shortlisted as candidates. In analogy to the selection of non-homologous DNA molecules from the database described above, non-interacting peptides are selected by further hybridization studies. 2. Choice of the amount of reference molecules in the sample
Die Mengen der verschiedenen Referenzmoleküle in der Probe sind so zu wählen, dass sie den gesamten Bereich der zu untersuchenden Probenmengen abdecken. In der Praxis hat sich eine Abstufung der verschiedenen Mengen in Form einer Verdünnungsreihe bewährt . Eine Untergrenze der Verdünnungsreihe (geringste Molekülkonzentration) ist typischerweise durch die Detektorempfindlichkeit vorgegeben .The amounts of the different reference molecules in the sample are to be selected so that they cover the entire range of the sample amounts to be examined. In practice, a gradation of the different amounts in the form of a dilution series has proven itself. A lower limit of the dilution series (lowest molecular concentration) is typically specified by the detector sensitivity.
3. Wahl der Menge der Referenzmoleküle im Target3. Choice of the amount of reference molecules in the target
Die Menge der Normierungsmoleküle im Target sollte der typischen Menge der auf dem Array aufgebrachten Targetbibliothek- moleküle entsprechen. Ist diese Menge stark variabel, so sollte auch für die Targetmoleküle eine Verdünnungsreihe angelegt werden. Das Verfahren ist im Abschnitt 5, Beispiel 2 genauer erläutert .The amount of normalization molecules in the target should correspond to the typical amount of target library molecules applied to the array. If this amount is highly variable, a dilution series should also be made for the target molecules. The procedure is explained in more detail in section 5, example 2.
4. Wahl der Anzahl der Referenzmoleküle4. Choice of the number of reference molecules
In Abhängigkeit von der Array-Technologie müssen mehrere kritische Parameter durch Kontrollmessungen oder Kontrollreihen beobachtet werden. Generell sind dies die Anzahl der Wechsel- wirkenden Moleküle auf dem Träger (Targetmoleküle) und die Anzahl wechselwirkender Moleküle in der komplexen Probe. Weitere wichtige Parameter für z.B. cDNA Hybridisierungsexperi- ment sind die Basenkomposition (gc-Gehalt) und die Länge der DNA-Moleküle. In der Praxis wird man je nach Verlässlichkeit der Technologie von nur wenigen Molekülen (einfache Verdünnungsreihe) bis zu zwanzig Prozent der Moleküle (mehrdimensionale und wiederholte Verdünnungsreihe) auf dem Träger für die Normierung und Qualitätskontrolle einsetzen. Mit der Anzahl der verwendeten Normierungsmoleküle steigt die erzielba- re Messgenauigkeit, siehe Abschnitt 6. In der Praxis hat sich die Verwendung eines Standardnormierungssatzes von 384 Molekülen bewährt, die beim Experiment als Referenzmenge mit gespottet werden. Dieses Vorgehen minimiert Komplikationen bei der Durchführung des Experimentes und gewährleistet eine grosse Reproduzierbarkeit. In Abhängigkeit vom durchgeführten Experiment kann die Mehrfachauf- bringung gleicher oder die Auswahl möglichst vieler verschiedener Referenzmoleküle oder ein Kompromiss dieser beiden Wege sinnvoll sein. Generell erlaubt das wiederholte Aufbringen von Verdünnungsreihen die Abschätzung des Messfehlers, wie unten in Beispiel 1 beschrieben.Depending on the array technology, several critical parameters must be observed through control measurements or control series. Generally, these are the number of interacting molecules on the carrier (target molecules) and the number of interacting molecules in the complex sample. Other important parameters for eg cDNA hybridization experiments are the base composition (gc content) and the length of the DNA molecules. In practice, depending on the reliability of the technology, only a few molecules (simple dilution series) up to 20 percent of the molecules (multidimensional and repeated dilution series) will be used on the carrier for standardization and quality control. The achievable measurement accuracy increases with the number of standardization molecules used, see Section 6. In practice, the use of a standard set of 384 molecules, which are spotted in the experiment as a reference set, has proven itself. This procedure minimizes complications when carrying out the experiment and ensures great reproducibility. Depending on the experiment carried out, the multiple application of the same reference molecule or the selection of as many different reference molecules as possible or a compromise between these two methods can be useful. In general, the repeated application of dilution series allows the measurement error to be estimated, as described in Example 1 below.
Eine Absicherung des ausgewählten Moleküldatensatzes erfolgt in einer Voruntersuchung, bei der die Referenzmoleküle ein- zeln und gemeinsam, aber ohne Beigabe der komplexen Probe mit dem Array in Kontakt gebracht werden: es sollten keine Wechselwirkungen mit den zur Probenmessung bestimmten Targetklonen auftreten. In einem komplementären Experiment wird die Probe ohne Beigabe von Referenzmolekülen auf den Array aufge- bracht: es sollten keine Wechselwirkungen mit den als Referenz bestimmten Targetklonen auftreten.The selected molecular data set is verified in a preliminary examination in which the reference molecules are brought into contact with the array individually and together, but without adding the complex sample: there should be no interactions with the target clones intended for sample measurement. In a complementary experiment, the sample is placed on the array without the addition of reference molecules: there should be no interactions with the target clones determined as reference.
5. Bestimmung der Eichkurve und Quantifizierung der Probemengen5. Determination of the calibration curve and quantification of the sample quantities
Aus den Signalstärken der Referenzmoleküle kann durch Optimierung geeigneter Modellparameter oder geeignete Interpolationsverfahren eine (im allgemeinen nichtlineare) Eichkurve bestimmt werden. Durch analytische oder numerische Inversion dieser Eichkurve kann die Probenmenge aus der Signalstärke bestimmt werden. Liegen freie Parameter vor, die das Bindungsverhalten der Moleküle beeinflussen, wie z.B. der GC- Gehalt bei DNA-Molekülen, so ist eine ganze Schar von Übertragungsfunktionen zu bestimmen. Im Fall von räumlich inhomo- genen Arrays ist ebenfalls die Bestimmung mehrerer Eichkurven erforderlich . Beispiel 1:A (generally non-linear) calibration curve can be determined from the signal strengths of the reference molecules by optimizing suitable model parameters or suitable interpolation methods. The amount of sample can be determined from the signal strength by analytical or numerical inversion of this calibration curve. If there are free parameters that influence the binding behavior of the molecules, such as the GC content in DNA molecules, a whole host of transfer functions must be determined. In the case of spatially inhomogeneous arrays, the determination of several calibration curves is also necessary. Example 1:
Sind alle Targetmoleküle in gleicher Anzahl auf dem Träger aufgebracht und ist der Einfluss weiterer Parameter gering, so genügt eine einfache Verdünnungsreihe, um eine Quantifi- zierung des Signales vorzunehmen. Die Referenzmoleküle werden dazu auf verschiedene Konzentrationen verdünnt, z.B. so, dass ihre Konzentration c in zehn Stufen, jeweils um einen Faktor zwei abnimmt (c1# ... , Cι0) . Damit kann ein Messbereich von drei Dekaden kontrolliert werden. Die genaue Wahl Verdün- nungstufen hängt vom dynamischen Messbereich und der geforderten experimentellen Genauigkeit ab. Die Normierungsmoleküle werden der komplexen Probe beigegeben (gespiked) und die Komplementmoleküle in einer Anzahl entsprechend der übrigen Targetmoleküle auf dem Träger angebracht . Nach der Durchfüh- rung des Hybridisierungsexperimentes wird zu jeder der Verdünnungsstufen ck ein entsprechendes Signal sk gemessen: ck —>• sk. Diese Signale können jetzt verwendet werden, um die Transmissionsfunktion T(c) (Quantifizierungsfunktion) zu bestimmen. Im einfachsten Fall wird diese Funktion durch linea- re Interpolation der Messpunkte definiert, im allgemeinen wird man eine Modellfunktion an die Messdaten anpassen (siehe Abb. 1). In diesem speziellen Beispiel (Abbildung 1) wurde als Transmissionsfunktion T(x) = α * (1-exp (- (x+ß) /α) ) angenommen. Durch Inversion der Transmissionsfunktion kann die Quantifizierungsfunktion Q(s) = T"1 (s) bestimmt werden. Die Quantifizierungsfunktion erlaubt es, aus jedem gemessenen Signal s* auf die zugrundeliegende Molekülkonzentration in der Probe zurückzuschliessen: c* = Q(s*) (siehe Abb. 2).If all of the target molecules have been applied to the carrier in equal numbers and the influence of other parameters is small, a simple series of dilutions is sufficient to quantify the signal. For this purpose, the reference molecules are diluted to different concentrations, for example in such a way that their concentration c decreases in ten steps, each by a factor of two (c1 # ..., Cι0 ). This means that a measuring range of three decades can be controlled. The exact choice of dilution levels depends on the dynamic measuring range and the required experimental accuracy. The normalization molecules are added to the complex sample (spiked) and the complement molecules are attached to the carrier in a number corresponding to the other target molecules. After the hybridization experiment has been carried out, a corresponding signal sk is measured for each of the dilution stages ck : ck -> • sk . These signals can now be used to determine the transmission function T (c) (quantification function). In the simplest case, this function is defined by linear interpolation of the measurement points; in general, a model function will be adapted to the measurement data (see Fig. 1). In this specific example (Figure 1), the transmission function was assumed to be T (x) = α * (1-exp (- (x + ß) / α)). By inversion of the transmission function, the quantification function Q (s) = T"1 (s) can be determined. The quantification function makes it possible to infer the underlying molecular concentration in the sample from each measured signal s *: c * = Q (s *) ( see Fig. 2).
Beispiel 2:Example 2:
Ist die gemessene Intensität stark von einem oder mehreren weiteren Parametern wie zum Beispiel dem GC-Gehalt der Sequenzen abhängig, so ist eine ganze Schar von Normierungskurven zu bestimmen. Ein Beispiel ist in Abbildung 3 gezeigt.If the measured intensity is heavily dependent on one or more additional parameters such as the GC content of the sequences, a whole host of normalization curves must be determined. An example is shown in Figure 3.
Bei der Umrechnung von der Signalintensität in die Molekül- konzentration ist dann die entsprechende Kurve zu wählen. Will man etwa für ein Molekül mit einem GC-Gehalt von 30 % die Molekülkonzentration aus dem gemessenen Signal bestimmen, so verwendet man die unterste Quantifizierungskurve. Ist der Einfluss des GC-Gehaltes aus allgemeinen Überlegungen be- kannt, so reicht die in Beispiel 1 besprochene eindimensionale Verdünnungsreihe aus. Der GC-Gehalt taucht dann explizit als zusätzlicher Parameter in der Transmissionsfunktion auf. Ist eine analytische Beziehung nicht bekannt, so muss für einen repräsentativen Parameterbereich GCmin..GCmax der Einfluss auf die Transmissionsfunktion untersucht werden.When converting the signal intensity into the molecule concentration, the corresponding curve must then be selected. If, for example, you want to determine the molecule concentration from the measured signal for a molecule with a GC content of 30%, the lowest quantification curve is used. If the influence of the GC content is known from general considerations, the one-dimensional dilution series discussed in Example 1 is sufficient. The GC content then appears explicitly as an additional parameter in the transmission function. Is an analytical relationship is not known, has for a representative parameter range GCm in ..GCmax of influence are examined for the transmission function.
Beispiel 3 :Example 3:
Ist die Anzahl der Targetmoleküle auf dem Träger für verschiedene Moleküle verschieden gross und hat einen deutlichen Einfluss auf die Messung, so ist eine zweidimensionale Verdünnungsreihe erforderlich. Dabei werden in Analogie zu Beispiel 1 Verdünnungsreihen gebildet. Soll die Probenkonzentration cp auf n Stufen und die Targetkonzentration ct auf m Stufen gemessen werden, so ist es sinnvoll m x n verschiedene Normierungsmoleküle zu wählen, um die Unabhängigkeit der Verdünnungsexperimente zu gewährleisten. Jetzt bildet man eine Verdünnungs-Matrix aus n Zeilen und m Spalten: Jeder Matrixeintrag entspricht einem komplementären Paar von Proben und Targetmolekül .If the number of target molecules on the carrier is different for different molecules and has a significant influence on the measurement, a two-dimensional dilution series is required. Analogous to Example 1, dilution series are formed. If the sample concentration cp is to be measured at n levels and the target concentration ct at m levels, it makes sense to choose mxn different standardization molecules in order to ensure the independence of the dilution experiments. Now you create a dilution matrix of n rows and m columns: Each matrix entry corresponds to a complementary pair of samples and target molecule.
1 :1 1 :2 1 :4 1 :8 1 :16 1 :32 1 :64 1 :128 1 :256 1 :5121: 1 1: 2 1: 4 1: 8 1: 16 1: 32 1: 64 1: 128 1: 256 1: 512
1 :1 M1 M2 M3 M4 M5 M6 M7 M8 M9 M101: 1 M1 M2 M3 M4 M5 M6 M7 M8 M9 M10
1 :2 M11 M12 M13 M14 M15 M16 M17 M18 M19 M201: 2 M11 M12 M13 M14 M15 M16 M17 M18 M19 M20
1 :4 M21 M22 M23 M24 M25 M26 M27 M28 M29 M301: 4 M21 M22 M23 M24 M25 M26 M27 M28 M29 M30
1 :8 M31 M32 M33 34 M35 M36 M37 M38 M39 M401: 8 M31 M32 M33 34 M35 M36 M37 M38 M39 M40
1 :16 M41 M42 M43 M44 M45 M46 M47 M48 M49 M501:16 M41 M42 M43 M44 M45 M46 M47 M48 M49 M50
1 :32 M51 M52 M53 M54 M55 M56 M57 M58 M59 M601:32 M51 M52 M53 M54 M55 M56 M57 M58 M59 M60
1 :64 M61 M62 M63 M64 M65 M66 M67 M68 M69 M701:64 M61 M62 M63 M64 M65 M66 M67 M68 M69 M70
1 :128 M71 M72 M73 M74 M75 M76 M77 M78 M79 M801: 128 M71 M72 M73 M74 M75 M76 M77 M78 M79 M80
1 :256 M81 M82 M83 M84 M85 M86 M87 M88 M89 901: 256 M81 M82 M83 M84 M85 M86 M87 M88 M89 90
1 :512 M91 92 M93 M94 M95 M96 M97 M98 M99 M1001: 512 M91 92 M93 M94 M95 M96 M97 M98 M99 M100
Darstellung der Verdünnungsmatrix: Die Konzentration in der komplexen Probe wird von Zeile zu Zeile herabgesetzt, die Konzentration im Target wird von Spalte zu Spalte herabgesetzt. Beispiel: Molekül 69 hat eine Probenkonzentration von 1:64 der Probenausgangskonzentration und das Komplement auf dem Microarray eine Targetkonzentration von 1:256 der Targe- tausgangskonzentration.Representation of the dilution matrix: The concentration in the complex sample is reduced from row to row, the concentration in the target is decreased from column to column. Example: Molecule 69 has a sample concentration of 1:64 of the initial sample concentration and the complement on the microarray has a target concentration of 1: 256 of the initial target concentration.
Die Konzentration der Probenmoleküle cp wird entsprechend der Proben-Verdünnungsreihe von Zeile zu Zeile herabgesetzt. Die Konzentration der Targetmoleküle ct wird entsprechend der Proben-Verdünnungsreihe von Spalte zu Spalte herabgesetzt. Nach Durchführung des Experimentes wird ähnlich wie im Beispiel 1 eine zweidimensionale Transferfunktion T bestimmt, die es erlaubt, jedem Paar (cp, ct) von Proben- und Targetkonzentration eine Signalstärke s = T(cp, ct) zuzuordnen. Wird die Targetkonzentration ct durch direkte Messung (etwa Absorptionsspektroskopie) bestimmt, so kann die Konzentration cp* eines untersuchten Moleküls aus dem gemessenen Signal s* durch Bildung einer parametrisierten Umkehrfunktion analog zu Beispiel 1 ermittelt werden: cp* = T"1ct (s*) . 6. Bestimmung der MessgüteThe concentration of the sample molecules cp is reduced from row to row in accordance with the sample dilution series. The concentration of the target molecules ct is reduced from column to column according to the sample dilution series. After the experiment has been carried out, a two-dimensional transfer function T is determined similarly to that in Example 1, which allows each signal (cp , ct ) of sample and target concentration to be assigned a signal strength s = T (cp , ct ). If the target concentration ct is determined by direct measurement (for example absorption spectroscopy), the concentration cp * of a molecule under investigation can be determined from the measured signal s * by forming a parameterized inverse function analogously to Example 1: cp * = T"1ct (s *). 6. Determination of the measurement quality
Die Messgüte ist durch die Reproduzierbarkeit von Messungen bestimmt. Die Reproduzierbarkeit ist durch den erwarteten Messfehler bei Wiederholungsmessung gegeben (mittleres Schwankungsquadrat) . Der typische Messfehler bei muss in Abhängigkeit von der gegebenen Signalstärke bestimmt werden. Ein Anhaltspunkt für den Messfehler kann bereits aus Wiederholung der Normierungsreihe gewonnen werden. Mit Hilfe des Fehlerfortpflanzungsgesetzes oder durch Anwendung der Umkehrfunktion kann daraus die effektive Messgenauigkeit im gesamten Messbereich abgeleitet werden (siehe Abb. 1 und Abb. 2) . Eine echte Qualitätskontrolle erfordert jedoch die wiederholte Durchführung des gesamten Experimentes. Die Mehrfachmes- sung erlaubt wiederum unter Verwendung der Umkehrfunktion die Bestimmung der effektiven Schwankungsbreite sowohl der individuellen Messung, als auch eines gegebenen Intensitätsbereiches.The measurement quality is determined by the reproducibility of measurements. The reproducibility is given by the expected measurement error in the case of a repeat measurement (mean fluctuation square). The typical measurement error at must be determined depending on the given signal strength. A reference point for the measurement error can already be obtained by repeating the standardization series. With the help of the error propagation law or by using the inverse function, the effective measurement accuracy in the entire measuring range can be derived (see Fig. 1 and Fig. 2). However, real quality control requires the entire experiment to be repeated. The multiple measurement in turn allows the effective fluctuation range to be determined both for the individual measurement and for a given intensity range using the inverse function.
Literaturliterature
[1] Lennon, G.C. and Lehrach, H. : Trends Genet . , 7, 314-317, 1991[1] Lennon, G.C. and Lehrach, H.: Trends Genet. , 7, 314-317, 1991
[2] The chipping forecast. Nature Genetics Supplement 1-60, Vol. 21, 1999[2] The chipping forecast. Nature Genetics Supplement 1-60, Vol. 21, 1999
[3] Quantitative microarray hybridisation arrays. International Patent Classification: C12Q 1/68, C07H[3] Quantitative microarray hybridization arrays. International Patent Classification: C12Q 1/68, C07H
21/044.21
International Publication Number: WO 99/51772International Publication Number: WO 99/51772
International Publication Date: 14 October 1999International Publication Date: October 14, 1999
Incyte Pharmaceuticals, B . Wang [4] J. Schuchhardt, D. Beule, A. Malik, E. Wolsky, H. Eickhoff, H. Lehrach, H. Herzel : Normalization Strategies for cDNA microarrays. Nucleic Acids Research, 2000, Vol. 28, No. 10 E47-e47Incyte Pharmaceuticals, B. Wang [4] J. Schuchhardt, D. Beule, A. Malik, E. Wolsky, H. Eickhoff, H. Lehrach, H. Herzel: Normalization Strategies for cDNA microarrays. Nucleic Acids Research, 2000, Vol. 28, No. 10 E47-e47
[5] B. Eickhoff, B. Korn, M. Schick, A. Poustka, J. van der Bosch: Normalization of array hybridization experiments in differential gene expression analysis, Nucleic Acids Res. 1999 Nov 15 ;27 (22) :e33.[5] B. Eickhoff, B. Korn, M. Schick, A. Poustka, J. van der Bosch: Normalization of array hybridization experiments in differential gene expression analysis, Nucleic Acids Res. 1999 Nov 15; 27 (22): e33 ,
[6] U. Hobohm, M. Scharf, R. Schneider and C. Sander: Protein Sei., 1, 409-417, 1992[6] U. Hobohm, M. Scharf, R. Schneider and C. Sander: Protein Sei., 1, 409-417, 1992
[7] Loftus,K.S., Chen,Y., Gooden,G., Ryan, J. F., Birznieks, G. , Hillard, M. , Baxevanis,D.A. , Bittner,M. , Meltzer,P., Trent,J. and Pavan,W. (1999): Proc . Natl . Acad. Sei. USA, 96, 9277-9280.[7] Loftus, K.S., Chen, Y., Gooden, G., Ryan, J.F., Birznieks, G., Hillard, M., Baxevanis, D.A. , Bittner, M. , Meltzer, P., Trent, J. and Pavan, W. (1999): Proc. Natl. Acad. Be. USA, 96, 9277-9280.
[8] P.Schuster : Landscapes and molecular evolution. Physica D 107, 1997[8] P. Schuster: Landscapes and molecular evolution. Physica D 107, 1997
[9] US 6,040,138[9] US 6,040,138
[10] US 5,620,901[10] US 5,620,901
Legenden zu den Abbildungen:Legends for the pictures:
Abb. 1: Konstruktion der Eichkurve (Transmissionsfunktion T) ausgehend von sechs Wiederholungen einer Verdünnungsreihe .Fig. 1: Construction of the calibration curve (transmission function T) based on six repetitions of a dilution series.
Abb. 2: Rekonstruktion der Molekülkonzentrationen mithilfe der Quantifizierungsfunktion Q. Die sechs Wiederholungen der Verdünnungsreihe dienen zur Schätzung des erwarteten Messfehlers.Fig. 2: Reconstruction of the molecular concentrations using the quantification function Q. The six repetitions of the dilution series serve to estimate the expected measurement error.
Abb. 3: Ist die beobachtete Signalintensität stark von einem Parameter, wie dem GC-Gehalt abhängig, so ist eine Schar von Quantifizierungsfunktionen zu bestimmen.Fig. 3: If the observed signal intensity is strongly dependent on a parameter, such as the GC content, a host of quantification functions must be determined.