




















ПЕРЕКРЕСТНЫЕ ССЫЛКИ НА РОДСТВЕННЫЕ ЗАЯВКИCROSS REFERENCES TO RELATED APPLICATIONS
[0001] В настоящей заявке испрашивается приоритет по предварительной заявке на патент США №62/378,978, поданной 24 августа 2016 г. и предварительной заявке на патент США №62/443,981, поданной 9 января 2017 г., содержание которых включено в настоящий документ посредством ссылки в полном объеме.[0001] This application claims priority over U.S. Provisional Application No. 62/378,978, filed August 24, 2016, and U.S. Provisional Application No. 62/443,981, filed January 9, 2017, the contents of which are incorporated herein by links in full.
ЗАЯВЛЕНИЕ О ПРАВАХ НА ИЗОБРЕТЕНИЯ, СДЕЛАННЫЕ В ХОДЕ ФИНАНСИРУЕМЫХ ИЗ ФЕДЕРАЛЬНОГО БЮДЖЕТА ИССЛЕДОВАНИЙFEDERALLY FUNDED RESEARCH INVENTIONS
[0002] Не применимо.[0002] Not applicable.
ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY
[0003] Настоящее изобретение относится к области конструирования полипептидов и геномной инженерии, и гомологичной рекомбинации.[0003] The present invention relates to the field of polypeptide design and genomic engineering, and homologous recombination.
УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE INVENTION
[0004] Искусственные нуклеазы, такие как сконструированные нуклеазы с цинковыми пальцами (ZFN), подобные активаторам транскрипции эффекторные нуклеазы (TALEN), система CRISPR/Cas со сконструированной cr-РНК/tracr-РНК («одиночной направляющей РНК'»), также называемые РНК-направляемыми нуклеазами; и/или нуклеазы на основе системы Argonaute (например, изT. thermophilus, известная как «TtAgo», (Swartset al (2014)Nature 507(7491): 258-261) содержат ДНК-связывающие домены (нуклеотидные или полипептидные), ассоциированные или функционально связанные с доменами расщепления, и указанные молекулы использовали для направленного изменения геномных последовательностей. Например, нуклеазы применяли для встраивания экзогенных последовательностей, инактивации одного или более эндогенных генов, получения организмов (например, сельскохозяйственных культур) и линий клеток с измененными паттернами генной экспрессии, и т.п. См., например, патенты США №9,255,250; №9,200,266; №9,0457,63; №9,005,973; №8,956,828; №8,945,868; №8,703,489; №8,586,526; №6,534,261; №6,599,692; №6,503,717; №6,689,558; №7,067,317; №7,262,054; №7,888,121; №7,972,854; №7,914,796; №7,951,925; №8,110,379; №8,409,861; патентные публикации США 20030232410; 20050208489; 20050026157; 20050064474; 20060063231; 20080159996; 201000218264; 20120017290; 20110265198; 20130137104; 20130122591; 20130177983 и 20130177960 и 20150056705. Например, для расщепления геномных последовательностей можно применять пару нуклеаз (например, нуклеаз с цинковыми пальцами, TALEN, гибридных dCas-Fok). Каждый член указанной пары обычно включает сконструированный (не встречающийся в природе) ДНК-связывающий белок, соединенный с одним или более доменами (или полудоменами) расщепления нуклеазы. Когда указанные ДНК-связывающие белки связываются со своим целевым сайтом, домены расщепления, которые соединены с указанными ДНК-связывающими белками, располагаются таким образом, что может происходить их димеризация и последующее расщепление генома.[0004] Artificial nucleases such as engineered zinc finger nucleases (ZFN), transcription activator-like effector nucleases (TALEN), engineered cr-RNA/tracr-RNA CRISPR/Cas system ("single guide RNA'"), also referred to as RNA-directed nucleases; and/or nucleases based on the Argonaute system (e.g. fromT. thermophilus , known as "TtAgo", (Swartset al (2014)Nature 507(7491): 258-261) contain DNA-binding domains (nucleotide or polypeptide), associated or operably linked to cleavage domains, and these molecules have been used to target changes in genomic sequences For example, nucleases have been used to insert exogenous sequences, inactivate one or more endogenous genes, produce organisms (e.g. crops) and cell lines with altered gene expression patterns , etc. See, for example, U.S. Patent Nos. 9,255,250; №6,689,558; №7,067,317; №7,262,054; №7,888,121; №7,972,854; №7,914,796; №7,951,925; №8,110,379; №8,409,861; патентные публикации США 20030232410; 20050208489; 20050026157; 20050064474; 20060063231; 20080159996; 20 1000218264; 20120017290; 20110265198; 20130137104; 20130122591; 20130177983 and 20130177960 and 20150056705. For example, a pair of nucleases (eg , zinc finger nucleases, TALEN, dCas-Fok hybrids) can be used to cleave genomic sequences. Each member of said pair typically includes an engineered (non-naturally occurring) DNA-binding protein linked to one or more nuclease cleavage domains (or half-domains). When said DNA binding proteins bind to their target site, the cleavage domains that are linked to said DNA binding proteins are arranged such that they can dimerize and subsequently cleave the genome.
[0005] Как правило, межмолекулярные ионные пары (солевые мостики) имеют существенное значение для многих взаимодействий ДНК с белком. Часто заряженные боковые цепи аминокислот (т.е. -NH3+, =NH2+) взаимодействуют с отрицательно заряженными фосфатными группами остова ДНК с образованием солевого мостика. Указанные ионные пары могут быть достаточно динамичными и переключаться между прямым спариванием двух ионов и спариванием, которое представляет собой «разделенную растворителем ионную пару», где между двумя ионами встроен растворитель (например, молекула воды) (Chenet al (2015)J Phys Chem Lett 6:2733-2737).[0005] In general, intermolecular ion pairs (salt bridges) are essential for many DNA-protein interactions. Often the charged side chains of amino acids (ie -NH3+, =NH2+) interact with the negatively charged phosphate groups of the DNA backbone to form a salt bridge. Said ion pairs can be quite dynamic and switch between direct pairing of two ions and pairing, which is a "solvent-separated ion pair", where a solvent (e.g. , a water molecule) is embedded between the two ions (Chenet al (2015)J Phys Chem Lett 6:2733-2737).
[0006] В случае белков с цинковыми пальцами специфичность ZFP в отношении целевой последовательности ДНК зависит от специфических, определяемых последовательностью контактов между доменами с цинковыми пальцами и определенными основаниями ДНК. Кроме того, домены с цинковыми пальцами также содержат остатки аминокислот, принимающие участие в неспецифических взаимодействиях ионных пар с фосфатами остова ДНК. Elrod-Erickson с соавторами (Elrod-Ericksonet al (1996).Structure 4:1171) продемонстрировали путем совместной кристаллизации белка с цинковыми пальцами и когнатной ДНК-мишени наличие специфических аминокислот, способных взаимодействовать с фосфорными группами в остове ДНК за счет образования водородных связей. Белки с цинковыми пальцами, в которые входит хорошо известный остов Zif268, как правило, содержат аргинин в качестве аминоконцевого остатка второй цепи β-складки, который также расположен во втором положении в направлении карбоксильного конца относительно второго инвариантного цистеина (см. Фиг. 5A). Указанное положение в составе каждого домена с цинковыми пальцами может называться (-5), поскольку представляет собой 5-й предшествующий началу α-спирали остаток (Фиг. 5A). Аргинин в указанном положении может взаимодействовать с фосфатом на остове ДНК за счет образования заряженной водородной связи с гуанидиновой группой боковой цепи. Белки с цинковыми пальцами с остовом Zif268 также часто содержат лизин в положении 4-го по счету остатка в направлении аминоконца от первого инвариантного цистеина. Указанное положение в составе каждого «пальца» может называться (-14), поскольку представляет собой 14-й остаток, предшествующий началу α-спирали для цинковых пальцев с двумя остатками между координирующими цинк остатками цистеина (Фиг. 5A). Лизин может взаимодействовать с фосфатом на остове ДНК за счет образования опосредованной водой заряженной водородной связи с аминогруппой боковой цепи. Поскольку фосфатные группы располагаются по всей длине остова ДНК, указанный тип взаимодействия между цинковыми пальцами и молекулой ДНК обычно считают неспецифическим в отношении последовательности (J. Miller, Massachusetts Institute of Technology Ph.D. Thesis, 2002).[0006] In the case of zinc finger proteins, the specificity of ZFP for the target DNA sequence depends on specific, sequence-defined contacts between zinc finger domains and certain DNA bases. In addition, zinc finger domains also contain amino acid residues involved in nonspecific interactions of ion pairs with DNA backbone phosphates. Elrod-Ericksonet al (1996.Structure 4:1171) demonstrated by co-crystallization of a zinc finger protein and a cognate target DNA the presence of specific amino acids capable of interacting with phosphorus groups in the DNA backbone through the formation of hydrogen bonds . Zinc finger proteins, which include the well-known Zif268 backbone, typically contain arginine as the amino-terminal residue of the second β-sheet chain, which is also located in the second position towards the carboxyl end relative to the second invariant cysteine (see Fig. 5A). This position within each zinc finger domain can be referred to as (-5) because it represents the 5th residue preceding the start of the α-helix (FIG. 5A). Arginine at this position can interact with phosphate on the DNA backbone by forming a charged hydrogen bond with the guanidine side chain group. Zinc finger proteins with a Zif268 backbone also often contain a lysine at
[0007] В ходе недавних исследований было выдвинуто предположение, что неспецифический контакт фосфата с боковыми цепями в некоторых нуклеазах может также объяснять некоторую часть неспецифической расщепляющей активности указанных нуклеаз (Kleinstiveret al, (2016)Nature 529(7587):490-5; Guilingeret al (2014)Nat Meth: 429-435). Исследователи предположили, что указанные нуклеазы могут обладать «избыточной энергией связывания ДНК», что означает, что они могут отличаться большей аффинностью в отношении своей ДНК-мишени, чем по существу необходимо для связывания и расщепления целевого сайта. Соответственно, были предприняты попытки уменьшения катионных зарядов в ДНК-связывающем домене TALE (Guilinger,там же) или ДНК-связывающем домене Cas9 (Kleinstiver,там же) для снижения энергии связывания ДНК указанных нуклеаз, что приводило к увеличению специфичности расщепленияin vitro. Однако дополнительные исследования (Sternberget al (2015)Nature 527(7576):110-113) также указывают на роль в правильной укладке и активации домена нуклеазы Cas9, которую играют некоторые катионные аминокислоты, мутированные при исследовании ДНК-связывающего домена Cas9, проведенном Kleinstiver. Таким образом, точная роль указанных аминокислот в активности Cas9 неизвестна.[0007] Recent studies have suggested that non-specific phosphate contact with side chains in some nucleases may also account for some of the non-specific cleavage activity of these nucleases (Kleinstiveret al , (2016)Nature 529(7587):490-5; Guilingeret al (2014)Nat Meth : 429-435). The researchers hypothesized that these nucleases may have "excessive DNA binding energy", meaning that they may have more affinity for their target DNA than is essentially necessary to bind and cleave the target site. Accordingly, attempts have been made to reduce the cationic charges in the DNA-binding domain of TALE (Guilinger,ibid. ) or the DNA-binding domain of Cas9 (Kleinstiver,ibid. ) to reduce the DNA binding energy of these nucleases, resulting in an increase in the specificity ofin vitro cleavage. However, additional studies (Sternberget al (2015)Nature 527(7576):110-113) also point to a role in proper folding and activation of the Cas9 nuclease domain by some cationic amino acids mutated in the Kleinstiver study of the Cas9 DNA-binding domain. . Thus, the precise role of these amino acids in Cas9 activity is unknown.
[0008] Для оптимальной специфичности расщепления селективной по последовательности (искусственной) нуклеазой желательно создание условий, обеспечивающих не насыщающие целевое связывание и активность. В насыщающих условиях - по определению - используют количество нуклеазы, избыточное относительно необходимого для достижения полной активности в отношении мишени. Указанный избыток не обеспечивает преимуществ в отношении мишени, но может, тем не менее, приводить к увеличению расщепления в нецелевом сайте. В случае мономерных нуклеаз, насыщающих условий можно легко избежать путем проведения простого исследования зависимости «доза-ответ», чтобы идентифицировать и избежать плато насыщения на кривой титрования. Однако в случае димерной нуклеазы, такой как ZFN, TALEN или dCas-Fok, идентифицировать и избежать насыщающих условий может быть сложнее, если аффинность связывания индивидуальных мономеров неодинакова. В таких случаях исследование «доза-ответ» с применением простого отношения нуклеаз 1:1 обнаруживает только точку насыщения для мономера, отличающегося более слабым связыванием. В таком сценарии, если, например, аффинность мономеров отличается на один порядок, в точке насыщения, идентифицированной в титрационном исследовании 1:1, мономер с большей аффинностью будет присутствовать в концентрации, в 10 раз превышающей необходимую. Итоговый избыток мономера с большей аффинностью может, в свою очередь, приводить к увеличению нецелевой активности без обеспечения какого-либо благоприятного увеличения расщепления в предусмотренной мишени, что потенциально может приводить к уменьшению общей специфичности для любой заданной пары нуклеаз.[0008] For optimum cleavage specificity by a sequence-selective (artificial) nuclease, it is desirable to create conditions that provide non-saturating target binding and activity. Under saturating conditions - by definition - an amount of nuclease is used that is in excess of what is needed to achieve full activity on the target. This excess provides no target advantage, but may nevertheless result in increased cleavage at the non-target site. In the case of monomeric nucleases, saturation conditions can be easily avoided by performing a simple dose-response study to identify and avoid a saturation plateau in the titration curve. However, in the case of a dimeric nuclease such as ZFN, TALEN or dCas-Fok, saturation conditions can be more difficult to identify and avoid if the binding affinity of the individual monomers is not the same. In such cases, a dose-response study using a simple 1:1 nuclease ratio reveals only the saturation point for the weaker-binding monomer. In such a scenario, if, for example, the affinity of the monomers differs by one order of magnitude, at the saturation point identified in the 1:1 titration study, the monomer with the higher affinity will be present at a
[0009] Для уменьшения нецелевого расщепления были разработаны сконструированные облигатные гетеродимерные полудомены расщепления.См., например,патенты США №7,914,796; №8,034,598; №8,961,281 и №8,623,618; патентные публикации США №20080131962 и №20120040398. Указанные облигатные гетеродимеры димеризуются и расщепляют мишени только в том случае, если ZFP обеспечивает размещение различающихся сконструированных доменов расщепления в подходящем целевом сайте, таким образом уменьшая и/или элиминируя мономерное нецелевое расщепление.[0009] To reduce off-target cleavage, engineered obligate heterodimeric cleavage half-domains have been developed.See, for example, US Pat. Nos. 7,914,796; No. 8,034,598; #8,961,281 and #8,623,618; U.S. Patent Publications No. 20080131962 and No. 20120040398. These obligate heterodimers dimerize and cleave targets only if ZFP allows the placement of distinct engineered cleavage domains at the appropriate target site, thereby reducing and/or eliminating monomeric off-target cleavage.
[0010] Тем не менее, сохраняется потребность в дополнительных способах и композициях, на основе системы расщепления сконструированными нуклеазами, для уменьшения нецелевой расщепляющей активности.[0010] However, there remains a need for additional methods and compositions based on engineered nuclease cleavage systems to reduce off-target cleaving activity.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯBRIEF DESCRIPTION OF THE INVENTION
[0011] Согласно настоящему изобретению предложены способы и композиции для увеличения специфичности нуклеазы (например,пары нуклеаз) в отношении предусмотренной мишени по отношению к другим, непредусмотренным сайтам расщепления, также известных как нецелевые сайты. Соответственно, в настоящем документе описаны искусственные нуклеазы (например,нуклеазы с цинковыми пальцами (ZFN), TALEN, CRISPR/Cas-нуклеазы) содержащие мутации в одной или более областей ДНК-связывающего домена (например,востове белка с цинковыми пальцами или TALE), и/или одну или более мутаций в домене расщепления или полудомене расщепления нуклеазыFokI. Кроме того, в настоящем документе описаны способы увеличения специфичности расщепляющей активности при применении указанных новых нуклеаз (например,ZFN, TALEN и т.п.) и/или при независимом титрованим сконструированных партнеров - полудоменов расщепления нуклеазного комплекса. При индивидуальном применении или применении в комбинации способы и композиции согласно настоящему изобретению удивительным образом обеспечивают неожиданное увеличение специфичности к мишени за счет снижения нецелевой расщепляющей активности. Согласно настоящему изобретению также предложены способы применения указанных композиций для нацеленного расщепления клеточного хроматина в представляющей интерес области и/или интеграции трансгена путем нацеленной интеграции в заранее заданную представляющую интерес область в клетках.[0011] The present invention provides methods and compositions for increasing the specificity of a nuclease (for example,pairs of nucleases) in relation to the intended target in relation to other, unintended cleavage sites, also known as non-target sites. Accordingly, artificial nucleases (for example,zinc finger nucleases (ZFN), TALEN, CRISPR/Cas nucleases) containing mutations in one or more regions of the DNA-binding domain (for example,inbackbone of a zinc finger protein or TALE), and/or one or more mutations in the cleavage domain or cleavage half-domain of the nucleaseFokI. In addition, this document describes ways to increase the specificity of cleaving activity using these new nucleases (for example,ZFN, TALEN, etc.) and/or independent titration of engineered partners - cleavage half-domains of the nuclease complex. When used alone or in combination, the methods and compositions of the present invention surprisingly provide an unexpected increase in target specificity by reducing off-target cleavage activity. The present invention also provides methods for using said compositions to target cleavage of cellular chromatin at a region of interest and/or integrate a transgene by targeted integration into a predetermined region of interest in cells.
[0012] Соответственно, согласно одному аспекту в настоящем документе предложен сконструированный нуклеазный полудомен расщепления, содержащий одну или более мутаций по сравнению с исходным доменом расщепления (например,доменом дикого типа), из которого получены указанные мутантные формы. Согласно некоторым вариантам реализации указанные одна или более мутаций представляют собой одну или более из мутаций, представленных в любых из прилагаемых к данному документу таблиц и чертежей, в том числе любую комбинацию указанных мутантов друг с другом и с другими мутантами (такими как мутанты домена димеризации и/или каталитического домена, а также никазные мутации). Мутации согласно описанию в настоящем документе включают, не ограничиваясь перечисленными, мутации, изменяющие заряд домена расщепления, например мутации положительно заряженных остатков с заменой на не заряженные положительно остатки (например,мутации остатков K и R (например, мутации с заменой на S); остатков N (например, →D) и остатков Q (например, →E); мутаций остатков, для которых на основании молекулярного моделирования предсказано близкое расположение к остову ДНК и которые демонстрируют вариативность в гомологахFokI (Фиг. 1 и 17); и/или мутации других остатков (например,патент США №8,623,618 и Guoet al, (2010)J. Mol. Biol. 400(1):96-107).[0012] Accordingly, in one aspect, provided herein is an engineered nuclease cleavage half-domain containing one or more mutations relative to the original cleavage domain (eg, wild-type domain) from which said mutant forms are derived. In some embodiments, said one or more mutations are one or more of the mutations provided in any of the accompanying tables and drawings, including any combination of said mutants with each other and with other mutants (such as dimerization domain mutants and /or catalytic domain, as well as nickase mutations). Mutations as described herein include, but are not limited to, mutations that change the charge of the cleavage domain, for example, mutations of positively charged residues with a change to positively uncharged residues (for example, mutations of K and R residues (for example, mutations with a replacement for S); residues N (e.g. → D) and Q residues (e.g. → E), residue mutations that are predicted to be close to the DNA backbone based on molecular modeling and show variability inFok I homologues (FIGS. 1 and 17); and/ or mutations of other residues (eg, US Pat. No. 8,623,618 and Guoet al , (2010)J. Mol. Biol . 400(1):96-107).
[0013] Наиболее многообещающие мутации были обнаружены с применением второго критерия. Изначально многообещающими мутациями были положительно заряженные остатки, для которых было предсказано близкое расположение к остову ДНК при связыванииFokI с ДНК. Описанные в настоящем документе домены расщепления могут включать одну, две, три, четыре, пять или более мутаций, описанных в настоящем документе, и могут дополнительно включать дополнительные известные мутации. Соответственно, мутации согласно настоящему изобретению не включают специфические мутации, раскрытые в патенте США №8,623,618 (например,N527D, S418P, K448M, Q531R и т.п.), при их использовании по отдельности; однако согласно настоящему изобретению предложены новые мутанты, которые можно применять в комбинации с мутантами из патента США №8,623,618. Никазные мутанты, отличающиеся тем, что один из каталитических доменов нуклеазы в димерной паре содержит одну или более мутаций, делающих его каталитически неактивным (см. патенты США №8,703,489; №9,200,266; и №9,631,186) могут также применяться в комбинации с любыми из мутантов, описанных в настоящем документе. Никазы могут представлять собой ZFN-никазы, TALEN-никазы и системы CRISPR/dCas.[0013] The most promising mutations were found using the second criterion. Initially promising mutations were positively charged residues, which were predicted to be close to the DNA backbone whenFok I was bound to DNA. The cleavage domains described herein may include one, two, three, four, five or more of the mutations described herein and may additionally include additional known mutations. Accordingly, the mutations of the present invention do not include the specific mutations disclosed in US Pat. No. 8,623,618 (eg N527D, S418P, K448M, Q531R, etc.) when used alone; however, the present invention provides new mutants that can be used in combination with the mutants of US Pat. No. 8,623,618. Nicase mutants, characterized in that one of the catalytic domains of the nuclease in the dimer pair contains one or more mutations that make it catalytically inactive (see US patents No. 8,703,489; No. 9,200,266; and No. 9,631,186) can also be used in combination with any of the mutants, described in this document. The nicases can be ZFN nicases, TALEN nicases, and CRISPR/dCas systems.
[0014] Согласно некоторым вариантам реализации сконструированные полудомены расщепления получены изFokI или гомологовFokI и содержат мутацию в одном или более из остатков аминокислот 416, 422, 447, 448 и/или 525, при нумерации, соответствующей полноразмерномуFokI дикого типа, как показано в SEQ ID NO: 1 или соответствующим остаткам в гомологахFokI (см. Фиг. 17). Согласно другим вариантам реализации полудомены расщепления, происходящие изFokI, содержат мутацию в одном или более из остатков аминокислот 414-426, 443-450, 467-488, 501-502, и/или 521-531, в том числе одном или более из 387, 393, 394, 398, 400, 416, 418, 422, 427, 434, 439, 441, 442, 444, 446, 448, 472, 473, 476, 478, 479, 480, 481, 487, 495, 497, 506, 516, 523, 525, 527, 529, 534, 559, 569, 570 и/или 571. Мутации могут включать мутации остатков, обнаруживаемых в естественных ферментах рестрикции, гомологичныхFokI, в соответствующих положениях (Фиг. 17). Согласно некоторым вариантам реализации указанные мутации представляют собой замены, например, замену остатка молекулы дикого типа любой другой аминокислотой, например, аланином (A), цистеином (C), аспарагиновой кислотой (D), глутаминовой кислотой (E), гистидином (H), фенилаланином (F), глицином (G), аспарагином (N), серином (S) или треонином (T). Предусмотрена любая комбинация мутантов, в том числе, но не ограничиваясь перечисленными, представленные в прилагаемых таблицах и чертежах. Согласно некоторым вариантам реализации нуклеазный доменFokI содержит мутацию в одном или более из положений 416, 422, 447, 479 и/или 525 (при нумерации, соответствующей молекуле дикого типа, SEQ ID NO: 1). Указанные нуклеазные домены могут также содержать одну или более мутаций в положениях 418, 432, 441, 448, 476, 481, 483, 486, 487, 490, 496, 499, 523, 527, 537, 538 и 559, в том числе, но не ограничиваясь перечисленными, ELD, KKR, ELE, KKS.См., например,патент США №8,623,618. Согласно другим дополнительным вариантам реализации указанный домен расщепления включает мутации одного или более остатков, представленных в таблице 15 (например,419, 420, 425, 446, 447, 470, 471, 472, 475, 478, 480, 492, 500, 502, 521, 523, 526, 530, 536, 540, 545, 573 и/или 574). Согласно некоторым вариантам реализации варианты доменов расщепления, описанных в настоящем документе, включают мутации остатков, вовлеченных в димеризацию нуклеаз (мутации доменов димеризации), и одну или более дополнительных мутаций; например, контактирующих с фосфатом остатков:например, мутанты димеризации (такие как ELD, KKR, ELE, KKS и т.п.) в комбинации с одной, двумя, тремя, четырьмя, пятью, шестью или более мутациями в положениях аминокислот вне домена димеризации, например, в остатках аминокислот, которые могут участвовать в контактах с фосфатными группами. Согласно предпочтительному варианту реализации мутация в положениях 416, 422, 447, 448 и/или 525 включает замену положительно заряженной аминокислоты на незаряженную или отрицательно заряженную аминокислоту. Согласно другим вариантам реализации вводят мутации в положениях 446, 472 и/или 478 (и необязательно дополнительные остатки, например, в доменах димеризации или каталитических доменах).[0014] In some embodiments, the engineered cleavage half-domains are derived fromFok I orFok I homologues and contain a mutation at one or more of
[0015] Согласно другим вариантам реализации сконструированный полудомен расщепления содержит мутации в домене димеризации, например, в остатках аминокислот 490, 537, 538, 499, 496 и 486 помимо мутаций, описанных в настоящем документе. Согласно предпочтительному варианту реализации настоящего изобретения предложены гибридные белки, в которых сконструированный полудомен расщепления содержит полипептид, в котором остаток Gln (Q), присутствующий в положении 486 молекулы дикого типа, заменен на остаток Glu (E), остаток Ile (I), присутствующий в положении 499 молекулы дикого типа, заменен на остаток Leu (L) и остаток Asn (N), присутствующий в положении 496 молекулы дикого типа, заменен на остаток Asp (D) или Glu (E) («ELD» или «ELE»), помимо одной или более мутаций, описанных в настоящем документе. Согласно другому варианту реализации сконструированные полудомены расщепления получены на основе полудомена расщепленияFokI дикого типа или гомологаFokI,и содержат мутации в остатках аминокислот 490, 538 и 537, при нумерации, соответствующейFokI дикого типа (SEQ ID NO: 1), помимо одной или более мутаций остатков аминокислот 416, 422, 447, 448 или 525. Согласно предпочтительному варианту реализации настоящего изобретения предложен гибридный белок, в котором сконструированный полудомен расщепления содержит полипептид, в котором остаток Glu (E), присутствующий в положении 490 молекулы дикого типа, заменен на остаток Lys (K), остаток Ile (I), присутствующий в положении 538 молекулы дикого типа, заменен на остаток Lys (K); и остаток His (H), присутствующий в положении 537 молекулы дикого типа, заменен на остаток Lys (K) или остаток Arg (R) («KKK» или «KKR») (см. патент США №8,962,281, включенный посредством ссылки в настоящий документ), помимо одной или более мутаций, описанных в настоящем документе.[0015] In other embodiments, the engineered cleavage half-domain contains mutations in the dimerization domain, for example, at
[0016] Согласно другому варианту реализации сконструированные полудомены расщепления происходят из полудомена расщепленияFokI дикого типа или его гомологов, и содержат мутации в остатках аминокислот 490 и 538, при нумерации, соответствующейFokI дикого типа помимо одной или более мутаций остатков аминокислот 416, 422, 447, 448 или 525. Согласно предпочтительному варианту реализации настоящего изобретения предложен гибридный белок, в котором сконструированный полудомен расщепления содержит полипептид, в котором остаток Glu (E), присутствующий в положении 490 молекулы дикого типа, заменен на остаток Lys (K), и остаток Ile (I), присутствующий в положении 538 молекулы дикого типа, заменен на остаток Lys (K) («KK»), помимо одной или более мутаций в положениях 416, 422, 447, 448 или 525. Согласно предпочтительному варианту реализации настоящего изобретения предложен гибридный белок, в котором сконструированный полудомен расщепления содержит полипептид, в котором остаток Gln (Q), присутствующий в положении 486 молекулы дикого типа, заменен на остаток Glu (E), а остаток Ile (I), присутствующий в положении 499 молекулы дикого типа, заменен на остаток Leu (L) («EL») (см. патент США №8,034,598, включенный посредством ссылки в настоящий документ), помимо одной или более мутаций в положениях 416, 422, 447, 448 или 525.[0016] In another embodiment, the engineered cleavage half-domains are derived from the wild-typeFok I cleavage half-domain or homologues thereof, and contain mutations at
[0017] Согласно одному аспекту настоящего изобретения предложены гибридные молекулы, в которых сконструированный полудомен расщепления содержит полипептид, в котором остаток аминокислоты молекулы дикого типа в одном или более из положений 387, 393, 394, 398, 400, 402, 416, 422, 427, 434, 439, 441, 446, 447, 448, 469, 472, 478, 487, 495, 497, 506, 516, 525, 529, 534, 559, 569, 570, 571 в каталитическом доменеFokI мутированы. Согласно некоторым вариантам реализации указанные одна или более мутаций изменяют положительно заряженные остаток аминокислоты молекулы дикого типа на нейтральный остаток или отрицательно заряженный остаток. Согласно любому из указанных вариантов реализации описанные мутанты могут также быть внесены в доменFokI, содержащий одну или более дополнительных мутаций. Согласно предпочтительным вариантам реализации указанные дополнительные мутации находятся в домене димеризации, например, в положениях 499, 496, 486, 490, 538 и 537. Мутации включают замены, инсерции и/или делеции одного или более остатков аминокислот.[0017] According to one aspect of the present invention, hybrid molecules are provided wherein the engineered cleavage half-domain comprises a polypeptide wherein the amino acid residue of the wild-type molecule is at one or more of
[0018] Согласно еще одному аспекту любые из сконструированных полудоменов расщепления, описанных выше, могут быть включены в искусственные нуклеазы, например, путем их связывания с ДНК-связывающим доменом, в том числе, но не ограничиваясь указанным, нуклеазы с цинковыми пальцами, TALEN, CRISPR/Cas-нуклеазы и т.п. Белки с цинковыми пальцами нуклеаз с цинковыми пальцами могут содержать неканонические координирующие цинк остатки (например, CCHC, а не каноническая конфигурация C2H2, см. патент США №9,234,187).[0018] In another aspect, any of the engineered cleavage half-domains described above can be incorporated into artificial nucleases, for example, by binding them to a DNA binding domain, including, but not limited to, zinc finger nucleases, TALEN, CRISPR/Cas nucleases, etc. Zinc finger proteins of zinc finger nucleases may contain non-canonical zinc coordinating residues (e.g. CCHC rather than the canonical C2H2 configuration, see US Pat. No. 9,234,187).
[0019] Согласно другому аспекту предложены гибридные молекулы, содержащие ДНК-связывающий домен и сконструированный полудомен расщепления FokI или его гомолог согласно описанию в настоящем документе, которые продуцируют искусственную нуклеазу. Согласно некоторым вариантам реализации указанный ДНК-связывающий домен гибридной молекулы представляет собой связывающий домен с цинковыми пальцами (например,сконструированный связывающий домен с цинковыми пальцами). Согласно другим вариантам реализации указанный ДНК-связывающий домен представляет собой ДНК-связывающий домен TALE. Согласно другим дополнительным вариантам реализации указанный ДНК-связывающий домен содержит ДНК-связывающую молекулу (например, направляющую РНК) и каталитически неактивный белок Cas9 или Cfp1 (dCas9 или dCfp1). Согласно некоторым вариантам реализации сконструированные гибридные молекулы образуют нуклеазный комплекс с каталитически неактивным сконструированным полудоменом расщепления таким образом, что димерная нуклеаза способна к расщеплению только одной цепи двуцепочечный молекулы ДНК, образуя никазу (см. патент США №9,200,266).[0019] In another aspect, hybrid molecules are provided comprising a DNA binding domain and an engineered FokI cleavage half-domain or homologue thereof as described herein that produce an artificial nuclease. In some embodiments, said DNA binding domain of the fusion molecule is a zinc finger binding domain (eg, an engineered zinc finger binding domain). In other embodiments, said DNA binding domain is a TALE DNA binding domain. In other further embodiments, said DNA-binding domain comprises a DNA-binding molecule (eg , a guide RNA) and a catalytically inactive Cas9 or Cfp1 protein (dCas9 or dCfp1). In some embodiments, the engineered fusion molecules form a nuclease complex with a catalytically inactive engineered cleavage half-domain such that the dimeric nuclease is capable of cleaving only one strand of a double-stranded DNA molecule to form a nickase (see U.S. Patent No. 9,200,266).
[0020] Способы и композиции согласно настоящему изобретению также охватывают мутации одной или более аминокислот в составе ДНК-связывающего домена вне остатков, которые распознают нуклеотиды целевой последовательности (например,одной или более мутаций в «остове ZFP» (вне спиральной области распознавания ДНК) или в «остове TALE» (вне RVD)), которые могут неспецифически взаимодействовать с фосфатами на остове ДНК. Соответственно, согласно некоторым вариантам реализации настоящее изобретение охватывает мутации катионных остатков аминокислот в остове ZFP, не являющиеся необходимыми для специфичности в отношении нуклеотидов мишени. Согласно некоторым вариантам реализации указанные мутации в остове ZFP включают мутацию катионного остатка аминокислоты с заменой на нейтральный или анионный остаток аминокислоты. Согласно некоторым вариантам реализации мутации в остове ZFP содержат мутацию полярного остатка аминокислоты с заменой на нейтральный или неполярный остаток аминокислоты. Согласно предпочтительным вариантам реализации мутации вводят в положение (-5), (-9) и/или в положение (-14) относительно ДНК-связывающей спирали. Согласно некоторым вариантам реализации цинковый палец может содержать одну или более мутаций в положении (-5), (-9) и/или (-14). Согласно дополнительным вариантам реализации один или более цинковых пальцев в белке с множеством цинковых пальцев может содержать мутации в положении (-5), (-9) и/или (-14). Согласно некоторым вариантам реализации аминокислоты в положениях (-5), (-9) и/или (-14) (например, аргинин (R) или лизин (K)) мутированы с заменой на аланин (A), лейцин (L), Ser (S), Asp (N), Glu (E), Tyr (Y) и/или глутамин (Q).[0020] The methods and compositions of the present invention also encompass mutations of one or more amino acids within the DNA binding domain outside of residues that recognize nucleotides of the target sequence (e.g., one or more mutations in the "ZFP backbone" (outside the DNA helical recognition region) or in the "TALE backbone" (outside RVD)), which can non-specifically interact with phosphates on the DNA backbone. Accordingly, in some embodiments, the present invention encompasses mutations of cationic amino acid residues in the backbone of ZFP that are not necessary for target nucleotide specificity. In some embodiments, said mutations in the ZFP backbone include mutation of a cationic amino acid residue to a neutral or anionic amino acid residue. In some embodiments, mutations in the ZFP backbone comprise a polar amino acid residue mutated to a neutral or non-polar amino acid residue. In preferred embodiments, mutations are introduced at position (-5), (-9) and/or position (-14) relative to the DNA-binding helix. In some embodiments, the zinc finger may contain one or more mutations at position (-5), (-9) and/or (-14). In additional embodiments, one or more zinc fingers in a zinc finger protein may contain mutations at position (-5), (-9) and/or (-14). In some embodiments, the amino acids at positions (-5), (-9) and/or (-14) (e.g. , arginine (R) or lysine (K)) are mutated to alanine (A), leucine (L), Ser (S), Asp (N), Glu (E), Tyr (Y) and/or glutamine (Q).
[0021] Согласно другому аспекту предложены полинуклеотиды, кодирующие любые из сконструированных полудоменов расщепления или гибридных белков согласно описанию в настоящем документе.[0021] According to another aspect, polynucleotides are provided that encode any of the engineered cleavage half-domains or fusion proteins as described herein.
[0022] Согласно еще одному аспекту также предложены клетки, содержащие любые из нуклеаз, полипептидов (например,гибридные молекулы или гибридные полипептиды) и/или полинуклеотидов согласно описанию в настоящем документе. Согласно одному варианту реализации указанные клетки содержат пару гибридных полипептидов, один из которых содержит, помимо одной или более мутаций в остатках аминокислот 393, 394, 398, 416, 421, 422, 442, 444, 447, 448, 473, 480, 530 и/или 525, полудомен расщепления ELD или ELE; а другой содержит, помимо одной или более мутаций по остаткам 393, 394, 398, 416, 421, 422, 442, 444, 446, 447, 448, 472, 473, 478, 480, 530 и/или 525, полудомен расщепления KKK или KKR (см. патент США №8,962,281).[0022] In yet another aspect, cells are also provided that contain any of the nucleases, polypeptides (eg, fusion molecules or fusion polypeptides), and/or polynucleotides as described herein. In one embodiment, said cells comprise a pair of fusion polypeptides, one of which contains, in addition to one or more mutations at
[0023] В любых из указанных гибридных полипептидов, описанных в настоящем документе, партнеры ZFP могут дополнительно содержать мутации в ДНК-связывающем домене с цинковыми пальцами в положениях (-5), (-9) и/или (-14). Согласно некоторым вариантам реализации Arg (R) в положении -5 заменяют на Tyr (Y), Asp (N), Glu (E), Leu (L), Gln (Q) или Ala (A). Согласно другим вариантам реализации Arg (R) в положении (-9) заменен на Ser (S), Asp (N) или Glu (E). Согласно дополнительным вариантам реализации Arg (R) в положении (-14) заменен на Ser (S) или Gln (Q). Согласно другим вариантам реализации указанные гибридные полипептиды могут содержать мутации в ДНК-связывающем домене с цинковыми пальцами, где аминокислоты в положениях (-5), (-9) и/или (-14) заменяют на любые из вышеперечисленных аминокислот в любой комбинации.[0023] In any of these fusion polypeptides described herein, the ZFP partners may additionally contain mutations in the zinc finger DNA binding domain at positions (-5), (-9) and/or (-14). In some embodiments, the Arg (R) at position -5 is replaced with Tyr (Y), Asp (N), Glu (E), Leu (L), Gln (Q), or Ala (A). In other embodiments, Arg (R) at position (-9) is replaced by Ser (S), Asp (N), or Glu (E). According to additional implementation options, Arg (R) at position (-14) is replaced by Ser (S) or Gln (Q). In other embodiments, said fusion polypeptides may contain mutations in the zinc finger DNA binding domain wherein the amino acids at positions (-5), (-9) and/or (-14) are substituted for any of the above amino acids in any combination.
[0024] Также согласно настоящему изобретению предложены клетки, которые были модифицированы полипептидами и/или полинуклеотидами согласно настоящему изобретению. Согласно некоторым вариантам реализации в указанных клетках происходит опосредованное нуклеазой встраивание трансгена или опосредованный нуклеазой нокаут гена. Указанные модифицированные клетки, и любые клетки, происходящие из указанных модифицированных клеток, не обязательно содержат нуклеазы согласно настоящему изобретению более чем в течении некоторого времени, однако геномные модификации, опосредованные такими нуклеазами, сохраняются.[0024] The present invention also provides cells that have been modified with the polypeptides and/or polynucleotides of the present invention. In some embodiments, nuclease-mediated transgene insertion or nuclease-mediated gene knockout occurs in said cells. Said modified cells, and any cells derived from said modified cells, do not necessarily contain the nucleases of the present invention for more than some time, however, genomic modifications mediated by such nucleases persist.
[0025] Согласно еще одному аспекту предложены способы нацеленного расщепления клеточного хроматина в представляющей интерес области; способы стимуляции гомологичной рекомбинации в клетке; способы лечения инфекции; и/или способы лечения заболевания. Указанные способы могут быть реализованыin vitro, ex vivoили in vivo,илиможет быть реализована комбинация перечисленного. Указанные способы задействуют расщепление клеточного хроматина в заранее определенной представляющей интерес области в клетках путем экспрессии пары гибридных полипептидов согласно описанию в настоящем документе (т.е.пары гибридных полипептидов, в которой один или оба гибридных полипептидов содержит сконструированные полудомены расщепления согласно описанию в настоящем документе). Согласно некоторым вариантам реализации нацеленное расщепление целевого сайта увеличивается по меньшей мере на 50% - 200% (или на любую промежуточную величину) или более, в том числе на 50-60% (или на любую промежуточную величину), 60% - 70% (или на любую промежуточную величину), 70% - 80% (или на любую промежуточную величину), 80% - 90% (или на любую промежуточную величину, 90% - 200% (или на любую промежуточную величину), по сравнению с доменами расщепления без мутаций согласно описанию в настоящем документе. Аналогичным образом, при применении способов и композиций согласно описанию в настоящем документе расщепление нецелевого сайта снижается 1-100-кратно или более, в том числе, но не ограничиваясь перечисленным, 1-50-кратно (или на любую промежуточную величину).[0025] According to another aspect, methods for targeted cleavage of cellular chromatin in a region of interest are provided; methods for stimulating homologous recombination in a cell; ways to treat the infection; and/or methods of treating the disease. These methods can be implementedin vitro, ex vivoorin vivo,ora combination of the above can be implemented. These methods involve cleaving cellular chromatin at a predetermined region of interest in cells by expressing a pair of fusion polypeptides as described herein (those.a pair of hybrid polypeptides, in which one or both of the hybrid polypeptides contains engineered cleavage half-domains as described herein). In some embodiments, targeted cleavage of the target site is increased by at least 50%-200% (or any value in between) or more, including 50-60% (or any value in-between), 60%-70% ( or any value in between), 70% - 80% (or any value in between), 80% - 90% (or any value in between, 90% - 200% (or any value in between), compared to cleavage domains without mutations as described herein.Similarly, when using methods and compositions as described herein, cleavage of the off-target site is reduced by 1-100-fold or more, including, but not limited to, 1-50-fold (or any intermediate value).
[0026] Сконструированные полудомены расщепления, описанные в настоящем документе, можно применять в способах нацеленного расщепления клеточного хроматина в представляющей интерес области и/или гомологичной рекомбинации в заранее заданной представляющей интерес области в клетках. Клетки включают культивируемые клетки, линии клеток, клетки в организме, клетки, извлеченные из организма для лечения/обработки в тех случаях, когда указанные клетки и/или их потомство возвращают в организм после лечения, и клетки, извлеченные из организма, модифицированные с применением гибридных молекул согласно настоящему изобретению, которые затем возвращают в организм согласно способу лечения (клеточной терапии). Представляющая интерес область клеточного хроматина может представлять собой, например, геномную последовательность или ее часть. Композиции включают гибридные молекулы или полинуклеотиды, кодирующие гибридные молекулы, которые содержат ДНК-связывающую молекулу (например,сконструированный связывающий домен с цинковыми пальцами, или связывающий домен TALE, или сконструированную направляющую РНК CRISPR) и полудомен расщепления согласно описанию.[0026] The engineered cleavage half-domains described herein can be used in methods for targeted cleavage of cellular chromatin at a region of interest and/or homologous recombination at a predetermined region of interest in cells. Cells include cultured cells, cell lines, cells in the body, cells removed from the body for treatment/treatment where said cells and/or their progeny are returned to the body after treatment, and cells removed from the body modified using hybrid molecules according to the present invention, which are then returned to the body according to the method of treatment (cell therapy). The region of interest in the cellular chromatin may be, for example, a genomic sequence or a portion thereof. The compositions include fusion molecules or polynucleotides encoding fusion molecules that contain a DNA binding molecule (e.g., an engineered zinc finger binding domain, or a TALE binding domain, or an engineered CRISPR guide RNA) and a cleavage half-domain as described.
[0027] Гибридная молекула может быть экспрессирована в клетке, например, путем доставки указанной гибридной молекулы в указанную клетку в виде полипептида, или путем доставки в клетку полинуклеотида, кодирующего указанную гибридную молекулу, при этом указанный полинуклеотид, если он представляет собой ДНК, транскрибируется и транслируется с получением гибридной молекулы. В свою очередь, если полинуклеотид представляет собой мРНК, кодирующую гибридную молекулу, после доставки указанной мРНК в клетку указанная мРНК транслируется, с получением таким образом гибридной молекулы.[0027] A fusion molecule can be expressed in a cell, for example, by delivering said fusion molecule to said cell as a polypeptide, or by delivering to the cell a polynucleotide encoding said fusion molecule, said polynucleotide, if DNA, being transcribed and translated to produce a hybrid molecule. In turn, if the polynucleotide is an mRNA encoding a fusion molecule, upon delivery of said mRNA to a cell, said mRNA is translated, thereby producing a fusion molecule.
[0028] Согласно другим аспектам настоящего изобретения предложены способы и композиции для увеличения специфичности сконструированных нуклеаз. Согласно одному аспекту предложены способы увеличения общей целевой специфичности расщепления путем уменьшения нецелевой расщепляющей активности. Согласно некоторым вариантам реализации сконструированные партнеры - полудомены расщепления сконструированного нуклеазного комплекса используют для контакта с клеткой, причем каждый партнер указанного комплекса используют в соотношении с другим партнером, отличном от 1:1. Согласно некоторым вариантам реализации используемое соотношение указанных двух партнеров (полудоменов расщепления) соответствует 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10 или 1:20, или любому промежуточному варианту. Согласно другим вариантам реализации соотношение указанных двух партнеров превышает 1:30. Согласно другим вариантам реализации указанные два партнера задействованы в выбранном соотношении, отличающемся от 1:1. Согласно некоторым аспектам каждый партнер доставляют в указанную клетку в виде мРНК, или доставляют в вирусном или невирусном векторе, при этом доставляют разные количества мРНК или вектора, кодирующего каждый из партнеров. Согласно дополнительным вариантам реализации оба партнера в нуклеазном комплексе могут содержаться в одном вирусном или невирусном векторе, однако преднамеренно экспрессируются таким образом, что один партнер экспрессируется на более высоком или более низком уровне, чем другой, что в конечном итоге обеспечивает доставку в клетку полудомены расщепления в соотношении, отличном от 1:1. Согласно некоторым вариантам реализации все полудомены расщепления экспрессируются с применением разных промоторов, обеспечивающих разную эффективность экспрессии. Согласно другим вариантам реализации указанные два домена расщепления доставляют в указанную клетку с применением вирусного или невирусного вектора, оба из которых экспрессируются с одной открытой рамки считывания, однако гены, кодирующие указанные два партнера, разделены последовательностью (например, саморасщепляющейся последовательностью 2A или IRES) что приводит к более низкому уровню экспрессии 3’-партнера, таким образом, что соотношение указанных двух партнеров составляет 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10 или 1:20, или соответствует любому промежуточному варианту. Согласно другим вариантам реализации указанные два партнера задействованы в выбранном соотношении, отличающемся от 1:1.[0028] According to other aspects of the present invention, methods and compositions are provided for increasing the specificity of engineered nucleases. In one aspect, methods are provided for increasing the overall target specificity of a cleavage by reducing off-target cleavage activity. In some embodiments, engineered partners, the cleavage half-domains of the engineered nuclease complex, are used to contact the cell, with each partner of said complex being used in a ratio other than 1:1 with the other partner. In some embodiments, the ratio of the two partners (cleavage half-domains) used is 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10, or 1:20, or any intermediate option. In other embodiments, the ratio of the two partners is greater than 1:30. In other embodiments, the two partners are involved in a selected ratio other than 1:1. In some aspects, each partner is delivered to said cell as mRNA, or delivered in a viral or non-viral vector, wherein different amounts of mRNA or vector encoding each of the partners are delivered. In additional embodiments, both partners in the nuclease complex can be contained in the same viral or non-viral vector, but are intentionally expressed in such a way that one partner is expressed at a higher or lower level than the other, which ultimately allows the delivery of cleavage half-domains to the cell in ratio other than 1:1. In some embodiments, all cleavage half-domains are expressed using different promoters that provide different expression efficiencies. In other embodiments, said two cleavage domains are delivered to said cell using a viral or non-viral vector, both of which are expressed from the same open reading frame, however, the genes encoding said two partners are separated by a sequence (e.g. , 2A self-cleaving sequence or IRES) resulting in to a lower level of expression of the 3'-partner, so that the ratio of these two partners is 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10 or 1:20, or any in between. In other embodiments, the two partners are involved in a selected ratio other than 1:1.
[0029] Также предложены способы уменьшения нецелевой нуклеазной активности при использовании комплексов двух или более нуклеаз. Например, согласно настоящему изобретению предложены способы варьирования соотношения ДНК-связывающих молекул при использовании комплексов двух или более нуклеаз. Согласно некоторым вариантам реализации указанные ДНК-связывающие молекулы представляют собой полипептидные ДНК-связывающие домены (например, ZFN, TALEN, dCas-Fok, мега-TAL, мегануклеазы), тогда как согласно другим вариантам указанные ДНК-связывающие молекулы представляют собой направляющие РНК для применения с РНК-направляемыми нуклеазами. Согласно предпочтительным вариантам реализации соотношение указанных двух или более ДНК-связывающих молекул составляет 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10 или 1:20, или соответствует любому промежуточному варианту. Согласно другим вариантам реализации указанные две ДНК-связывающие молекулы задействованы в выбранном соотношении, отличающемся от 1:1. Согласно некоторым аспектам не равное 1:1 соотношение достигается путем изменения соотношения направляющих РНК, используемых для трансфекции клетки. Согласно другим аспектам указанное соотношение изменяют путем изменения соотношения каждого комплекса белка Cas9/ направляющей РНК, используемого для обработки представляющих интерес клеток. Согласно еще одному дополнительному аспекту измененное соотношение достигается путем применения различных соотношений ДНК, кодирующих направляющие РНК (вирусные или невирусные) для обработки клеток, или путем применения промоторов, обеспечивающих экспрессию разной силы для дифференциальной экспрессии ДНК-связывающих молекул в клетках. Возникновение нецелевых событий может быть снижено в 2-1000 раз (или на любую промежуточную величину) или более, в том числе, но не ограничиваясь перечисленными, по меньшей мере в 10, 50, 60, 70, 80, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000 раз (или на любую промежуточную величину) или более.[0029] Also provided are methods for reducing off-target nuclease activity using complexes of two or more nucleases. For example, the present invention provides methods for varying the ratio of DNA-binding molecules using complexes of two or more nucleases. In some embodiments, said DNA binding molecules are polypeptide DNA binding domains (e.g. , ZFN, TALEN, dCas-Fok, mega-TAL, meganucleases), while in other embodiments, said DNA binding molecules are guide RNAs for use. with RNA-directed nucleases. In preferred embodiments, the ratio of said two or more DNA binding molecules is 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10, or 1:20, or matches any intermediate option. In other embodiments, the two DNA binding molecules are involved in a selected ratio other than 1:1. In some aspects, the non-1:1 ratio is achieved by changing the ratio of guide RNAs used to transfect the cell. In other aspects, this ratio is changed by changing the ratio of each Cas9 protein/guide RNA complex used to treat the cells of interest. In yet another aspect, the altered ratio is achieved by using different ratios of DNA encoding guide RNAs (viral or non-viral) to treat cells, or by using promoters that provide different expression strengths for differential expression of DNA binding molecules in cells. The occurrence of non-target events can be reduced by a factor of 2-1000 (or any amount in between) or more, including, but not limited to, at least 10, 50, 60, 70, 80, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000 times (or any amount in between) or more.
[0030] Соответственно, согласно другому аспекту способ расщепления клеточного хроматина в представляющей интерес области может включать: (a) выбор первой последовательности в представляющей интерес области; (b) конструирование первой ДНК-связывающей молекулы для специфического связывания с первой последовательностью; (c) экспрессию в клетке первой гибридной молекулы, содержащей первую ДНК-связывающую молекулу (например, молекулу с цинковыми пальцами, TALE, онРНК) и домен расщепления (или полудомен); и (d) экспрессию в клетке второго гибридного белка, при этом вторая гибридная молекула содержит второй ДНК-связывающий домен и второй домен расщепления (или полудомен), причем по меньшей мере одна из гибридных молекулы содержит линкер согласно описанию в настоящем документе; также при этом первая гибридная молекула связывается с первой последовательностью, а вторая гибридная молекула связывается с второй последовательностью, расположенной на расстоянии 2-50 нуклеотидов от первой последовательности, таким образом, чтобы могло происходить формирование активного нуклеазного комплекса и расщепление клеточного хроматина в представляющей интерес области. Согласно некоторым вариантам реализации обе гибридные молекулы содержат линкер согласно описанию в настоящем документе между ДНК-связывающим доменом и каталитическим нуклеазным доменом.[0030] Accordingly, according to another aspect, a method for cleavage of cellular chromatin in a region of interest may include: (a) selecting a first sequence in the region of interest; (b) constructing a first DNA binding molecule for specific binding to the first sequence; (c) cell expression of a first fusion molecule containing a first DNA binding molecule (eg , zinc finger molecule, TALE, sRNA) and a cleavage domain (or half-domain); and (d) cellular expression of a second fusion protein, wherein the second fusion molecule comprises a second DNA binding domain and a second cleavage domain (or half-domain), wherein at least one of the fusion molecules comprises a linker as described herein; also, the first fusion molecule binds to the first sequence, and the second fusion molecule binds to a second sequence located 2-50 nucleotides from the first sequence, so that the formation of an active nuclease complex and cleavage of cellular chromatin in the region of interest can occur. In some embodiments, both hybrid molecules contain a linker as described herein between the DNA binding domain and the catalytic nuclease domain.
[0031] Также предложены способы изменения области клеточного хроматина, например, для введения нацеленных мутаций. Согласно некоторым вариантам реализации способы изменения клеточного хроматина включает введение в указанную клетку одной или более нацеленных нуклеаз для обеспечения двуцепочечного разрыва в клеточном хроматине в заранее заданном сайте, и донорного полинуклеотида, гомологичного последовательности нуклеотидов клеточного хроматина в области разрыва. Процессы репарации клеточной ДНК активируются при наличии двуцепочечного разрыва; донорный полинуклеотид применяют в качестве матрицы для репарации разрыва, что приводит к введению всей или части последовательности нуклеотидов донора в клеточный хроматин. Соответственно, последовательность в клеточном хроматине может быть изменена и, согласно некоторым вариантам реализации, может быть конвертирована в последовательность, присутствующую в донорном полинуклеотиде.[0031] Also provided are methods for altering a region of cellular chromatin, for example, to introduce targeted mutations. In some embodiments, methods for altering cellular chromatin include introducing into said cell one or more targeted nucleases to provide a double-strand break in the cellular chromatin at a predetermined site, and a donor polynucleotide homologous to the nucleotide sequence of the cellular chromatin at the region of the break. Cellular DNA repair processes are activated in the presence of a double-strand break; the donor polynucleotide is used as a template for rupture repair, which results in the introduction of all or part of the donor's nucleotide sequence into the cellular chromatin. Accordingly, the sequence in the cellular chromatin can be changed and, in some embodiments, can be converted to the sequence present in the donor polynucleotide.
[0032] Нацеленные изменения включают, не ограничиваясь перечисленными, точечные мутации (т.е.конверсию одной пары оснований в другую пару оснований), замены (т.е.конверсию нескольких пар оснований в другую последовательность идентичной длины), инсерций одной или более пар оснований, делеций одной или более пар оснований; и любую комбинацию вышеупомянутых изменений последовательностей. Изменения могут также включать конверсию пар оснований, входящих в состав кодирующей последовательности, таким образом, что изменяется кодируемая аминокислота.[0032] Targeted changes include, but are not limited to, point mutations (i.e. , the conversion of one base pair to another base pair), substitutions (i.e. , the conversion of multiple base pairs to another sequence of identical length), insertions of one or more pairs bases, deletions of one or more base pairs; and any combination of the aforementioned sequence changes. Changes may also include the conversion of base pairs that are part of the coding sequence, so that the encoded amino acid is changed.
[0033] Донорный полинуклеотид может представлять собой ДНК или РНК, может быть линейным или кольцевым, и может быть одноцепочечным или двуцепочечным. Он может быть доставлен в клетку в виде депротеинизированной нуклеиновой кислоты, в виде комплекса с одним или более агентами для доставки (например, липосомами, наночастицами, полоксамерами) или в основе для вирусной доставки, такой как, например, аденовирус, лентивирус или аденоассоциированный вирус (AAV). Длина донорных последовательностей может варьировать от 10 до 1000 нуклеотидов (или соответствовать любому промежуточному целому числу нуклеотидов) или более. Согласно некоторым вариантам реализации указанная донорная молекула содержит полноразмерный ген, фланкированный областями гомологии с целевым сайтом расщепления. Согласно некоторым вариантам реализации в указанной донорной последовательности отсутствуют гомологичные области и она встроена в целевой локус за счет независимого от гомологии механизма (т.е. NHEJ). Согласно другим вариантам реализации указанная донорная молекула содержит отрезок нуклеиновой кислоты меньшего размера, фланкированной гомологичными областями для применения в клетке(т.е. для генной коррекции). Согласно некоторым вариантам реализации указанная донорная молекула содержит ген, кодирующий функциональный или структурный компонент, такой как мшРНК, РНК-интерференция, микроРНК или т.п. Согласно другим вариантам реализации указанная донорная молекула содержит последовательности, кодирующие регуляторный элемент, который связывается с представляющим интерес геном и/или модулирует его экспрессию. Согласно другим вариантам реализации указанный донор представляет собой представляющий интерес регуляторный белок (например, ТФ ZFP, ТФ TALE или ТФ CRISPR/Cas), который связывается с представляющим интерес геном и/или модулирует его экспрессию.[0033] The donor polynucleotide may be DNA or RNA, may be linear or circular, and may be single or double stranded. It can be delivered to the cell as a deproteinized nucleic acid, complexed with one or more delivery agents (e.g. , liposomes, nanoparticles, poloxamers), or in a viral delivery vehicle such as, for example, adenovirus, lentivirus, or adeno-associated virus ( AAV). The length of the donor sequences can vary from 10 to 1000 nucleotides (or any intermediate integer number of nucleotides) or more. In some embodiments, said donor molecule contains the full length gene flanked by regions of homology to the target cleavage site. In some embodiments, the donor sequence lacks homologous regions and is inserted into the target locus by a homology-independent mechanism (ie , NHEJ). In other embodiments, said donor molecule comprises a smaller stretch of nucleic acid flanked by homologous regions for use in the cell(ie , for gene editing). In some embodiments, said donor molecule contains a gene encoding a functional or structural component, such as shRNA, RNAi, miRNA, or the like. In other embodiments, said donor molecule contains sequences encoding a regulatory element that binds to and/or modulates the expression of a gene of interest. In other embodiments, said donor is a regulatory protein of interest (eg, ZFP TF, TALE TF, or CRISPR/Cas TF) that binds to and/or modulates expression of a gene of interest.
[0034] В любом из вышеупомянутых способов клеточный хроматин может находиться в геноме хромосомы, эписомы или органеллы. Клеточный хроматин может находиться в клетках любого типа, в том числе, но не ограничиваясь перечисленными, прокариотические и эукариотические клетки, клетки грибов, клетки растений, клетки животных, клетки млекопитающих, клетки приматов и клетки человека.[0034] In any of the above methods, cellular chromatin may be located in the genome of a chromosome, episome, or organelle. Cellular chromatin can be found in any type of cell, including, but not limited to, prokaryotic and eukaryotic cells, fungal cells, plant cells, animal cells, mammalian cells, primate cells, and human cells.
[0035] Согласно еще одному аспекту изобретения также предложены клетки, содержащие любые из полипептидов (например,гибридные молекулы) и/или полинуклеотидов согласно описанию в настоящем документе. Согласно одному варианту реализации указанные клетки содержат пару гибридных молекул, каждая из которых содержит домен расщепления согласно описанию в настоящем документе. Клетки включают культивированные клетки, клетки в организме и клетки, которые были извлечены из организма для лечения/обработки, в тех случаях, когда указанные клетки и/или их потомство возвращают в организм после лечения. Представляющая интерес область клеточного хроматина может представлять собой, например, геномную последовательность или ее часть.[0035] According to another aspect of the invention, cells are also provided that contain any of the polypeptides (eg, hybrid molecules) and/or polynucleotides as described herein. In one embodiment, said cells comprise a pair of fusion molecules, each containing a cleavage domain as described herein. Cells include cultured cells, cells in the body, and cells that have been removed from the body for treatment/treatment, in cases where these cells and/or their progeny are returned to the body after treatment. The region of interest in the cellular chromatin may be, for example, a genomic sequence or a portion thereof.
[0036] Согласно другому аспекту, в настоящем документе описан набор, содержащий гибридный белок согласно описанию в настоящем документе, или полинуклеотид, кодирующий один или более белков с цинковыми пальцами, домены расщепления и/или гибридные белки согласно описанию в настоящем документе; вспомогательные реагенты; и, необязательно, инструкции и подходящие контейнеры. Указанный набор может также включать одну или более нуклеаз или полинуклеотиды, кодирующие такие нуклеазы.[0036] In another aspect, provided herein is a kit comprising a fusion protein as described herein, or a polynucleotide encoding one or more zinc finger proteins, cleavage domains, and/or fusion proteins as described herein; auxiliary reagents; and, optionally, instructions and suitable containers. Said set may also include one or more nucleases or polynucleotides encoding such nucleases.
[0037] Указанные и другие аспекты будут хорошо понятны специалисту в свете приведенного описания в целом.[0037] These and other aspects will be well understood by a person skilled in the art in light of the above description as a whole.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS
[0038] На Фиг. 1 приведена последовательность аминокислот (SEQ ID NO: 1) и последовательность нуклеотидов (SEQ ID NO: 2) части нуклеазыFokI дикого типа. Последовательность отражает каталитический нуклеазный домен FokI, и нумерация соответствует белкуFokI дикого типа, используемого для получения кристаллических структур 1FOK.pdb и 2FOK.pdb (Wah,там же) (аминокислота Q нуклеазного домена начинается в положении 384). Заключенные в рамку положения указывают на возможные сайты мутаций.[0038] In FIG. 1 shows the amino acid sequence (SEQ ID NO: 1) and nucleotide sequence (SEQ ID NO: 2) of the wild typeFok I nuclease portion. The sequence reflects theFok I catalytic nuclease domain and the numbering corresponds to the wild-typeFok I protein used to generate the 1FOK.pdb and 2FOK.pdb crystal structures (Wah,ibid. ) (the Q amino acid of the nuclease domain starts at position 384). Boxed positions indicate possible mutation sites.
[0039] На Фиг. 2A-2C представлены схематические изображения моделей взаимодействия доменаFokI с молекулой ДНК. На Фиг. 2A показана локализация аминокислот R422, R416 и K525. На Фиг. 2B показана локализация аминокислот R447, K448 и R422. Фиг. 2C иллюстрирует подгруппу разных типов ZFN, которые могут быть получены путем включения 1, 2 или 3 (1×, 2× или 3×, соответственно) мутаций (либо R → Q, либо R → L) в остов с цинковыми пальцами. Черными стрелками обозначены положения мутаций.[0039] In FIG. 2A-2C are schematic representations of models for the interaction of theFok I domain with the DNA molecule. On FIG. 2A shows the localization of amino acids R422, R416 and K525. On FIG. 2B shows the localization of the amino acids R447, K448 and R422. Fig. 2C illustrates a subset of different types of ZFNs that can be generated by incorporating 1, 2, or 3 (1×, 2×, or 3×, respectively) mutations (either R→Q or R→L) into the zinc finger backbone. Black arrows indicate the positions of mutations.
[0040] На Фиг. 3A и 3B показана активность BCL11A-специфических ZFN, несущих новые мутацииFokI, описанные в настоящем документе. На Фиг. 3A показана нацеленная модификация в клетках CD34+ для BCL11A-специфических ZFN SBS#51857-ELD/SBS#51949-KKR против когнатной мишени BCL11A (обозначенных уникальным идентификатором - «регистрационным знаком» PRJIYLFN, SEQ ID NO: 13) и двух нецелевых сайтов, также обозначенных идентификаторами - «регистрационными знаками» NIFMAEVG (SEQ ID NO: 14) и PEVYOHIU (SEQ ID NO: 20). ZFP описаны в PCT/US 2016/032049. Все эксперименты проводили с 2 мкг мРНК каждой ZFN для доставки нуклеаз; значения отражают процент ридов последовательностей, которые содержат инсерции и делеции (% инделей), соответствующие нуклеазной активности. На Фиг. 3A приведены результаты замены остатком серина в положениях 416, 422, 447, 448 и 525 доменаFokI в одной или обеих ZFN. На Фиг. 3B приведен аналогичный набор данных, за исключением того, что остовы гетеродимерного домена димеризацииFokI поменяны местами,т.е. на Фиг. 3A приведены результаты при использовании мутаций в паре SBS#51857-ELD/SBS#51949-KKR, тогда как на Фиг. 3B приведены результаты при использовании мутаций в паре SBS#51857-KKR/SBS#51949-ELD.[0040] In FIG. 3A and 3B show the activity of BCL11A-specific ZFNs carrying the novelFok I mutations described herein. On FIG. 3A shows targeted modification in CD34+ cells for the BCL11A-specific ZFN SBS#51857-ELD/SBS#51949-KKR against the BCL11A cognate target (identified by the unique identifier 'registration mark' PRJIYLFN, SEQ ID NO: 13) and two non-target sites, also designated by identifiers - "registration marks" NIFMAEVG (SEQ ID NO: 14) and PEVYOHIU (SEQ ID NO: 20). ZFPs are described in PCT/US 2016/032049. All experiments were performed with 2 µg mRNA of each ZFN for nuclease delivery; the values reflect the percentage of sequence reads that contain insertions and deletions (% indels) corresponding to nuclease activity. On FIG. 3A shows the results of a serine substitution at
[0041] На Фиг. 4 представлен график целевой и нецелевой активности для ряда TCRA-специфических (нацеленных на константную область, также известную как TRAC) вариантов ZFNFokI (PCT-публикация WO 2017106528). За исключением двух репликатов исходной пары ZFN, доменFokI в одной из двух ZFN несет мутацию положительно заряженного остатка. Рассчитывали расстояние между альфа-углеродом мутированного остаткаFokI и ближайшим кислородом фосфата в остове ДНК в молекулярной модели ZFN-ДНК (Milleret al (2007)Nat Biotech 25(7):778-785); точки данных обозначены цветом на основании указанного вычисленного расстояния (либо <10: серый цвет; либо >10: черный цвет). Каждая точка данных соответствует целевой активности и объединенной нецелевой активности для разных пар ZFN, несущих мутацииFokI на одной из ZFN в паре. Указаны точки данных, соответствующие исходной паре.[0041] In FIG. 4 is a graph of target and non-target activity for a number of TCRA-specific (targeting the constant region, also known as TRAC) ZFNFok I variants (PCT Publication WO 2017106528). With the exception of two replicates of the original ZFN pair, theFok I domain in one of the two ZFNs carries a positively charged residue mutation. The distance between the alpha carbon of the mutatedFok I residue and the nearest phosphate oxygen in the DNA backbone was calculated in the ZFN-DNA molecular model (Milleret al (2007)Nat Biotech 25(7):778-785); data points are color-coded based on the specified calculated distance (or <10 : grey colour; or >10 : black color). Each data point corresponds to target activity and pooled non-target activity for different pairs of ZFNs carryingFok I mutations on one of the ZFNs in the pair. The data points corresponding to the original pair are indicated.
[0042] На Фиг. 5A и 5B схематически изображена область остова цинкового пальца. На Фиг. 5A (SEQ ID NO: 3) показаны аминокислоты второго пальца белка Zif268 с отмеченными бета-складчатыми и альфа-спиральными структурами. Также показана локализация аминокислот, вовлеченных в распознавание специфических оснований ДНК (-1-6). Положительно заряженные остатки, обладающие потенциалом для взаимодействия с фосфатным остовом ДНК, отмечены рамками. Подчеркнуты инвариантные остатки цистеина, вовлеченные в координацию цинка. На Фиг. 5B представлено увеличенное трехмерное изображение одного пальца (сплошная сфера представляет собой координированный ион цинка), и показаны тенденции взаимодействия с ДНК разных областей каждого цинкового пальца. ДНК представлена на диаграмме, где фосфаты обозначены символом «P», а основания ДНК заключены в рамки со скругленными углами. Серыми стрелками обозначены приблизительные положения остатков, обозначенных рамками, а черными стрелками обозначены взаимодействия между белком с цинковыми пальцами и ДНК.[0042] In FIG. 5A and 5B schematically depict the core region of a zinc finger. On FIG. 5A (SEQ ID NO: 3) shows the second finger amino acids of the Zif268 protein, with beta-fold and alpha-helical structures marked. The localization of amino acids involved in the recognition of specific DNA bases (-1-6) is also shown. Positively charged residues that have the potential to interact with the DNA phosphate backbone are marked with boxes. Invariant cysteine residues involved in zinc coordination are underlined. On FIG. 5B is an enlarged 3D image of a single finger (the solid sphere represents a coordinated zinc ion) and shows trends in interaction with DNA from different regions of each zinc finger. DNA is represented in the diagram, where phosphates are indicated by the symbol "P" and DNA bases are enclosed in rounded boxes. Gray arrows indicate the approximate positions of the boxed residues, and black arrows indicate interactions between the zinc finger protein and DNA.
[0043] На Фиг. 6 (SEQ ID NO: 4-6) показано сохранение аминокислот в каждом положении в составе цинкового пальца. В первых строках представлено выравнивание последовательностей аминокислот в хорошо известных цинковых пальцах из Zif268 и Sp1 (палец 2 из Zif268 (SEQ ID NO: 4), палец 3 из Zif268 (SEQ ID NO: 5) и палец 2 Sp1 (SEQ ID NO: 6)). Координирующие цинк остатки цистеина и гистидина заключены в рамки, как и спирали распознавания. Положительно заряженные остатки аргинина (R) и лизина (K), которые контактируют с фосфатами остова ДНК, также заключены в рамки. Числа под первыми тремя строками представляют собой частоты встречаемости каждой аминокислоты в каждом положении в 4867 разных проанализированных встречающихся в природе цинковых пальцев. Символы слева от диаграммы представляют собой однобуквенные коды, соответствующие остаткам аминокислот, частоты встречаемости которых приведены в таблице. В контактирующем с фосфатом положении было идентифицировано три незаряженные аминокислоты, аланин, лейцин и глутамин (заключены в овалы) с низкой, однако ненулевой частотой встречаемости.[0043] In FIG. 6 (SEQ ID NO: 4-6) shows the retention of amino acids at each position in the zinc finger. The first rows show the amino acid sequence alignment in the well-known Zif268 and Sp1 zinc fingers (Zif268 finger 2 (SEQ ID NO: 4), Zif268 finger 3 (SEQ ID NO: 5) and Sp1 finger 2 (SEQ ID NO: 6). )). The zinc-coordinating cysteine and histidine residues are framed, as are the recognition helices. The positively charged arginine (R) and lysine (K) residues that are in contact with DNA backbone phosphates are also boxed. The numbers below the first three rows are the frequencies of each amino acid at each position in the 4867 different naturally occurring zinc fingers analyzed. The symbols to the left of the diagram are single-letter codes corresponding to amino acid residues, the frequencies of which are given in the table. At the phosphate contact position, three uncharged amino acids, alanine, leucine, and glutamine (enclosed in ovals) were identified with a low but non-zero frequency of occurrence.
[0044] На Фиг. 7A и 7B (SEQ ID NO: 7 и 8) приведены изображения остовов ZFP, в том числе модули белка либо с шестью цинковыми пальцами (Фиг. 7A, SEQ ID NO: 7), либо с пятью цинковыми пальцами (Фиг. 7B, SEQ ID NO: 8). Символы над некоторыми заключенными в рамку положениями указывают на мутации, которые тестировали в указанном положении. Каждый палец идентифицирован метками F1-F6. Каждый из указанных белков собирают из трех разных «модулей», обозначенных «Модуль A», «Модуль B» и «Модуль C». Мутации в положениях -14, -9 и -5 N-концевого пальца в каждом модуле могут быть внесены путем изменения последовательности ПЦР-праймера, используемого в процессе сборки.[0044] In FIG. 7A and 7B (SEQ ID NOs: 7 and 8) are images of ZFP backbones, including protein modules with either six zinc fingers (FIG. 7A, SEQ ID NO: 7) or five zinc fingers (FIG. 7B, SEQ ID NO: 8). The symbols above some of the boxed positions indicate mutations that were tested at the indicated position. Each finger is identified by labels F1-F6. Each of these proteins is assembled from three different "modules" designated "Module A", "Module B", and "Module C". Mutations at positions -14, -9 and -5 of the N-terminal finger in each module can be introduced by changing the sequence of the PCR primer used in the assembly process.
[0045] На Фиг. 8A-8C приведены графики, отражающие целевую и нецелевую расщепляющую активность TCRA (TRAC)-специфической ZFN (PCT-публикация WO 2017106528), содержащей новый остов с мутациями цинковых пальцевсогласно настоящему изобретению. Обе TCRA (TRAC)-специфические ZFN содержат 6 повторов с цинковыми пальцами; для простоты эксперимента мутации в положении -5 вводили только в N-концевой палец каждого модуля (например, F1, F3 или F5 в полноразмерном ZFN). Соответственно, каждая индивидуальная ZFN может содержать 0, 1, 2 или 3 мутации, и пара ZFN целиком может содержать в общей сложности до 6 мутаций (например, 0, 1, 2, 3, 4, 5 или 6 мутаций). Значения на графике отражают средние значения для всех протестированных пар ZFN с заданным числом и типом мутаций в положении -5. Стандартная ошибка среднего обозначена планками погрешностей. Для каждой пары ZFN измеряли активность в отношении трех нецелевых мишеней, указанных в таблице 3; нецелевые значения, усредненные для получения нанесенных на график значений, включают относительную активность исходных TCRA (TRAC) ZFN в отношении каждой из указанных трех нецелевых мишеней для каждой конструкции. На Фиг. 8A приведена относительная активность исходных TCRA (TRAC) ZFN, где наборы данных отражают изменения либо целевой (черные столбцы), либо нецелевой (серые столбцы) активности в результате замены указанных аминокислот в положении -5 в одном или более повторах цинковых пальцев только в одной из двух ZFN в паре. На Фиг. 8B представлен относительный уровень активности при введении указанной замены аргинин-аланин в один или оба партнера ZFN одновременно. Левая половина Фиг. 8B соответствует парам ZFN, где указанное число мутаций происходит только в одной ZFN в паре (и соответствует левой трети Фиг. 8A), а правая половина Фиг. 8B соответствует парам ZFN, где такое же число мутаций вводили в обе ZFN в паре (например, 2 соответствует одной мутации в каждой ZFN в паре, 4 соответствует двум мутациям в каждой ZFN в паре, а 6 соответствует трем мутациям в каждой ZFN в паре. Эксперименты, представленные на Фиг. 8A и 8B, проводили в CD34+ клетках с дозой 6 мкг на эксперимент. На Фиг. 8C приведены данные, аналогичные двум правым третям Фиг. 8A, при этом дозировка РНК составляла 2 мкг на эксперимент.[0045] In FIG. 8A-8C are graphs showing the targeted and non-targeted cleavage activity of TCRA (TRAC)-specific ZFN (PCT Publication WO 2017106528) containing a novel backbone with zinc finger mutations.according to the present invention. Both TCRA (TRAC)-specific ZFNs contain 6 zinc finger repeats; for simplicity of the experiment, mutations at position -5 were introduced only into the N-terminal finger of each module (for example, F1, F3 or F5 in a full size ZFN). Accordingly, each individual ZFN may contain 0, 1, 2, or 3 mutations, and a pair of ZFNs as a whole may contain up to a total of 6 mutations (eg, 0, 1, 2, 3, 4, 5, or 6 mutations). The values in the graph represent the average values for all ZFN pairs tested with a given number and type of mutations at position -5. The standard error of the mean is indicated by error bars. For each ZFN pair, activity was measured against the three non-targets listed in Table 3; non-target values averaged to obtain plotted values include the relative activity of the original TCRA (TRAC) ZFN against each of these three non-target targets for each design. On FIG. 8A shows the relative activity of the parent TCRA (TRAC) ZFN, where the datasets reflect changes in either target (black bars) or non-target (grey bars) activity resulting from substitution of the indicated amino acids at position -5 in one or more zinc finger repeats in only one of the two ZFNs in a pair. On FIG. 8B shows the relative level of activity when said arginine-alanine substitution is administered to one or both ZFN partners simultaneously. Left half of Fig. 8B corresponds to ZFN pairs where the indicated number of mutations occurs in only one ZFN in the pair (and corresponds to the left third of FIG. 8A) and the right half of FIG. 8B corresponds to pairs of ZFNs where the same number of mutations were introduced into both ZFNs in a pair (for example, 2 corresponds to one mutation in each ZFN in a pair, 4 corresponds to two mutations in each ZFN in a pair, and 6 corresponds to three mutations in each ZFN in a pair. The experiments shown in Fig. 8A and 8B were performed in CD34+ cells at a dose of 6 μg per experiment. On FIG. 8C shows data similar to the right two thirds of FIG. 8A, with the RNA dosage being 2 μg per experiment.
[0046] На Фиг. 9 приведен график, отражающий целевая (черные столбцы) и нецелевую (серые столбцы) расщепляющую активность в нецелевом сайте NIFMAEVG BCL11A-специфических ZFN, содержащие новые мутации остова с цинковыми пальцами согласно настоящему изобретению (в указанном случае используют трехбуквенное сокращение и указание на количество остатков аргинина в положении -5, мутированных с заменой на указанный остаток;например, «6 Gln» означает, что в паре ZFN было мутировано 6 аргининов (по 3 на ZFN) с заменой на 6 глутаминов). Стандартная ошибка обозначена планками погрешностей. Эксперименты проводили на клетках CD34+ в дозе 2 мкг мРНК на ZFN на эксперимент.[0046] In FIG. 9 is a graph showing target (black bars) and non-target (grey bars) cleavage activity at the NIFMAEVG non-target site of BCL11A-specific ZFNs containing the novel zinc finger backbone mutations of the present invention (in this case, use the three-letter abbreviation and indicate the number of arginine residues in position -5, mutated with a change to the specified residue;for example , "6 Gln" means that 6 arginines were mutated in the ZFN pair (3 per ZFN) with a replacement for 6 glutamines). The standard error is indicated by error bars. Experiments were performed on CD34+ cells at a dose of 2 μg mRNA for ZFN per experiment.
[0047] На Фиг. 10 приведено изображение вестерн-блота для детекции экспрессии BCL11A-специфической ZFN в клетках CD34+ после трансфекции либо мРНК, кодирующей оба партнера ZFN на одном полинуклеотиде, соединенные последовательностью 2A (51857-2a-51949), либо дозирования мРНК, кодирующими ZFN по отдельности; либо смесью двух мРНК, кодирующих каждый партнер, в указанных дозах. Белки детектировали антителом к Flag, и было продемонстрировано, что количество белка, экспрессируемое после трансфекции мРНК, согласуется с использованным количеством мРНК. Как и ожидалось, конструкция с 2a обеспечивала большее количество 5’ ZFN SBS#51857 по сравнению с 3’ZFN, SBS#51949.[0047] In FIG. 10 shows a Western blot image for detection of BCL11A-specific ZFN expression in CD34+ cells after transfection with either mRNA encoding both ZFN partners on the same polynucleotide linked by the 2A sequence (51857-2a-51949 ) or dosing of mRNA encoding ZFN separately; or a mixture of two mRNAs encoding each partner, at the indicated doses. Proteins were detected with an anti-Flag antibody and the amount of protein expressed after mRNA transfection was shown to be consistent with the amount of mRNA used. As expected, the 2a construct provided more 5'
[0048] На Фиг. 11 показано титрование дозы для двух партнеров BCL11A-специфической ZFN 51949 и 51857 либо при целевой локализации (BCL11A, левая панель), либо при нецелевой локализации NIFMAEVG (правая панель). Результаты демонстрируют, что изменение соотношений партнеров ZFN может обеспечивать сохранение целевой активности наряду с уменьшением нецелевой активности (сравнение активности в отношении целевой мишени BCL11A при обработке 60 мкг каждой мРНК (целевая активность - 85,92% инделей, против целевой активности 86,42% при обработке 60 мкг 51949, 6,6 мкг 51857) с уменьшенной нецелевой активностью (нецелевая активность 27,34% при использовании 60 мкг каждой мРНК; против 4,21% инделей при использовании 60 мкг 51949 и 6,6 мкг 51857)).[0048] In FIG. 11 shows dose titration for the two partners of BCL11A-
[0049] На Фиг. 12 приведена таблица, где представлена целевая и нецелевая расщепляющая активность BCL11A-специфических ZFN при обработке CD34+ клеток либо одной мРНК, кодирующей оба партнера ZFN согласно описанию выше, (51857/51949 2a), либо титрованными дозами партнеров ZFN, где один партнер (51949) содержит мутациюFokI R→S в положении 416. Идентифицирующие «регистрационные знаки» приведены в таблице 1 из примера 2 (SEQ ID NO: 13-53). Данные, соответствующие PRJIYLFN, отражают относительный уровень ридов последовательностей в предусмотренной мишени BCL11A, содержащих индели, согласующиеся с активностью ZFN. Данные, соответствующие всем другим идентифицирующим «регистрационным знакам», приведенным в левом столбце, соответствует подтвержденным или предполагаемым нецелевым локусам для пары ZFN 51857/51949. Соотношения в правом столбце соответствуют активности в образце, обработанном 51857/51949 2a, разделенному на активность в образце, обработанном титрованными 51857/51949 R416S, в указанном локусе.[0049] In FIG. 12 is a table showing the target and non-target cleaving activity of BCL11A-specific ZFNs when treated with CD34+ cells with either a single mRNA encoding both ZFN partners as described above (51857/51949 2a) or titrated doses of ZFN partners where one partner (51949) contains theFok I R→S mutation at
[0050] На Фиг. 13 приведены результаты несмещенного анализа захвата для сравнения двух пар ZFN. На левой панели («исходная пара ZFN») представлены результаты применения пары SBS51857 и SBS51949, а на правой панели («вариант пары ZFN») представлен результат применения SBS63014 и SBS65721), содержащей исходную пару и, дополнительно, мутации остова ZFP согласно описанию в настоящем документе, а также мутациюFokI R416S в конструкции SBS65721. В частности, во варианте пары каждая ZFN указанной пары содержит три мутации R→Q в пальцах, а конструкция SBS65721 дополнительно содержит мутацию FokI R416S. Данные демонстрируют, что указанные мутации уменьшают число уникальных захватов с 21 локализаций для исходной пары до 4 для указанного варианта. Кроме того, если партнеры в парах ZFN вводят в неравных количествах, число захватов также уменьшается. В случае исходной пары число захватов снижается с 21 (равные дозы) до 13 (неравные дозы) локализаций (с 28% до 3,4% нецелевых агрегатов, соответственно), а в случае варианта пары число захватов снижается с 4 до 2 (от 0,26% до 0,08% совокупного нецелевого расщепления, соответственно). Комбинация указанных двух подходов приводит к общему уменьшению с 21 локализации для исходной пары до 2 для варианта при дозировании партнерами в неравных концентрациях, с уменьшением с 28% нецелевых событий в совокупности для исходной пары до 0,08% нецелевых событий в совокупности для варианта.[0050] In FIG. 13 shows the results of an unbiased capture analysis comparing two pairs of ZFNs. The left panel (“original ZFN pair”) shows the results of using the SBS51857 and SBS51949 pair, and the right panel (“variant ZFN pair”) shows the result of applying SBS63014 and SBS65721) containing the original pair and, additionally, ZFP backbone mutations as described in herein, as well as theFok I R416S mutation in the SBS65721 construct. In particular, in a variant of the pair, each ZFN of the pair contains three R→Q mutations in the fingers, and the SBS65721 construct additionally contains theFok I R416S mutation. The data demonstrate that these mutations reduce the number of unique captures from 21 locations for the original pair to 4 for the specified variant. In addition, if partners in ZFN pairs are administered in unequal amounts, the number of captures is also reduced. In the case of the original pair, the number of captures is reduced from 21 (equal doses) to 13 (unequal doses) localizations (from 28% to 3.4% of non-target aggregates, respectively), and in the case of the variant pair, the number of captures is reduced from 4 to 2 (from 0 .26% to 0.08% total untargeted cleavage, respectively). The combination of these two approaches results in an overall reduction from 21 sites for the original couple to 2 for the option when dosed by partners at unequal concentrations, with a decrease from 28% non-target events in the pool for the original pair to 0.08% of non-target events in the pool for the option.
[0051] На Фиг. 14 представлены результаты, демонстрирующие снижение нецелевого расщепления при использовании ZFN согласно описанию в настоящем документе при получении в условиях крупномасштабного производства. Использованная пара ZFN включала SBS63014 и SBS65722.[0051] In FIG. 14 shows results demonstrating the reduction in off-target digestion using ZFN as described herein when produced under large scale production conditions. The ZFN pair used included SBS63014 and SBS65722.
[0052] На Фиг. 15A-15D показаны результаты, демонстрирующие снижение нецелевого расщепления при использовании мутантов ZFN (нацеленных на AAVS1) согласно описанию в настоящем документе. На Фиг. 15A представлены результаты активности исходных ZFN 30035/30054. На Фиг. 15B представлена целевая активность и соотношение целевой/нецелевая расщепляющей активности для трех наборов мутантов FokI: мутантовFokI ELD, содержащих дополнительные одиночные мутации (левый набор данных); мутантовFokI KKR, содержащих дополнительные одиночные мутации (набор данных посередине); и мутантовFokI ELD и KKR, содержащих такие же дополнительные одиночные мутации (правый набор данных). На Фиг. 15C приведена матрица целевой активности, где доменыFokI ELD или KKR содержат две мутации, а на Фиг. 15D приведены соотношения целевой/нецелевой активности для данных, представленных на Фиг. 15C.[0052] In FIG. 15A-15D show results demonstrating a reduction in off-target cleavage using ZFN mutants (targeting AAVS1) as described herein. On FIG. 15A shows the activity results of the parent ZFN 30035/30054. On FIG. 15B shows target activity and target/non-target cleavage activity ratio for three sets ofFok I mutants:Fok I ELD mutants containing additional single mutations (left dataset);Fok I KKR mutants containing additional single mutations (data set in the middle); andFok I ELD and KKR mutants containing the same additional single mutations (right dataset). On FIG. 15C shows a target activity matrix where theFok I ELD or KKR domains contain two mutations, and FIG. 15D shows target/non-target activity ratios for the data shown in FIG. 15C.
[0053] На Фиг. 16A и 16B приведены результаты, демонстрирующие снижение нецелевого расщепления при использовании примеров нацеленных на AAVS1 мутантов ZFN согласно описанию в настоящем документе. На Фиг. 16A представлены мутанты в контексте ELD и KKR, а на Фиг. 16B представлены мутанты в контексте ELD-KKR.[0053] In FIG. 16A and 16B are results demonstrating a reduction in off-target cleavage using examples of AAVS1-targeted ZFN mutants as described herein. On FIG. 16A shows mutants in the context of ELD and KKR, and FIG. 16B shows mutants in the context of ELD-KKR.
[0054] На Фиг. 17 показано выравниваниеFokI и гомологовFokI (SEQ ID NO: 54-64). Штриховкой показана степень сохранения. Нумерация соответствует доменуFokI дикого типа (SEQ ID NO: 1).[0054] In FIG. 17 shows an alignment ofFok I andFok I homologues (SEQ ID NOs: 54-64). Hatching shows the degree of conservation. The numbering corresponds to the wild-typeFok I domain (SEQ ID NO: 1).
[0055] На Фиг. 18 представлены примеры мутаций, положения которых сопоставлены сFokI или гомологамиFokI, представленными на Фиг. 17.[0055] In FIG. 18 shows examples of mutations whose positions are mapped toFok I orFok I homologues shown in FIG. 17.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION
[0056] Согласно настоящему изобретению предложены способы и композиции для увеличения специфичности целевого расщепления сконструированными нуклеазами за счет дифференциального уменьшения нецелевого расщепления. Указанные способы включают уменьшение неспецифических взаимодействий между доменом расщепленияFokI и ДНК, уменьшение неспецифических взаимодействий между остовом с цинковыми пальцами и ДНК, и изменение соотношений каждого партнера - полудомена расщепления относительно соотношения по умолчанию, равного 1:1.[0056] The present invention provides methods and compositions for increasing the specificity of targeted cleavage by engineered nucleases by differentially reducing non-targeted cleavage. These methods include reducing non-specific interactions between theFok I cleavage domain and DNA, reducing non-specific interactions between the zinc finger backbone and DNA, and changing the ratios of each cleavage half-domain partner from the default ratio of 1:1.
Общее описаниеgeneral description
[0057] При практической реализации способов, а также при получении и применении композиций согласно описанию в настоящем документе используют, если не указано иное, стандартные методики молекулярной биологии, биохимии, структуры и анализа хроматина, вычислительной химии, клеточных культур, рекомбинантной ДНК и связанных областей, известные из уровня техники. Указанные методики подробно описаны в опубликованных источниках.См., например, источники: Sambrooket al. MOLECULAR CLONING: A LABORATORY MANUAL, второе издание, Cold Spring Harbor Laboratory Press, 1989; и третье издание, 2001; Ausubelet al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 и периодические обновления; серия: METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, “Chromatin” (P.M. Wassarman and A.P. Wolffe, eds.), Academic Press, San Diego, 1999; METHODS IN MOLECULAR BIOLOGY, Vol. 119, “Chromatin Protocols” (P.B. Becker, ed.) Humana Press, Totowa, 1999.[0057] In the practice of the methods, as well as in the preparation and use of compositions as described herein, unless otherwise indicated, standard techniques of molecular biology, biochemistry, chromatin structure and analysis, computational chemistry, cell cultures, recombinant DNA and related fields are used. known from the prior art. These techniques are described in detail in published sources.See for example Sambrooket al. MOLECULAR CLONING: A LABORATORY MANUAL, second edition, Cold Spring Harbor Laboratory Press, 1989; and third edition, 2001; Ausubelet al. , CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 and updates from time to time; series: METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, “Chromatin” (PM Wassarman and AP Wolffe, eds.), Academic Press, San Diego, 1999; METHODS IN MOLECULAR BIOLOGY, Vol. 119, “Chromatin Protocols” (PB Becker, ed.) Humana Press, Totowa, 1999.
ОпределенияDefinitions
[0058] Термины «нуклеиновая кислота», «полинуклеотид» и «олигонуклеотид» используются взаимозаменяемо и относятся к дезоксирибонуклеотидному или рибонуклеотидному полимеру, в линейной или кольцевой конформации, в одноцепочечной или двуцепочечной форме. Для целей настоящего изобретения указанные термины не являются ограничивающими применительно к длине полимера. Термины могут включать известные аналоги естественных нуклеотидов, а также нуклеотиды, модифицированные по фрагментам оснований, сахаров и/или фосфатов (например, фосфотиоатные остовы). В целом, аналог конкретного нуклеотида обладает такой же специфичностью в отношении спаривания оснований;т.е.аналог A будет спариваться с основанием T.[0058] The terms "nucleic acid", "polynucleotide" and "oligonucleotide" are used interchangeably and refer to a deoxyribonucleotide or ribonucleotide polymer, in linear or circular conformation, in single-stranded or double-stranded form. For the purposes of the present invention, these terms are not limiting in relation to the length of the polymer. The terms may include known analogs of naturally occurring nucleotides, as well as nucleotides modified with base, sugar, and/or phosphate moieties (eg , phosphothioate backbones). In general, an analogue of a particular nucleotide has the same specificity for base pairing;those. the analog of A will pair with the base of T.
[0059] Термины «полипептид», «пептид» и «белок» используются взаимозаменяемо для обозначения полимера из остатков аминокислот. Указанный термин также применим к полимерам аминокислот, в которых одна или более аминокислот представляют собой химические аналоги или модифицированные производные соответствующих встречающихся в природе аминокислот.[0059] The terms "polypeptide", "peptide" and "protein" are used interchangeably to refer to a polymer of amino acid residues. This term also applies to polymers of amino acids in which one or more amino acids are chemical analogues or modified derivatives of the corresponding naturally occurring amino acids.
[0060] «Связывание» относится к специфическому в отношении последовательности нековалентном взаимодействию между макромолекулами (например, между белком и нуклеиновой кислотой). Не все компоненты связывающего взаимодействия обязательно должны быть специфическими в отношении последовательности (например, контакты с остатками фосфата в остове ДНК), при условии, что взаимодействие в целом остается специфическим в отношении последовательности. Такие взаимодействия обычно характеризуются константой диссоциации (Kd), составляющей 10-6 M-1 или менее. «Аффинность» относится к силе связывания: увеличенная аффинность связывания коррелирует с более низкой Kd. «Неспецифическое связывание» относится к нековалентным взаимодействиям, которые происходят между любой представляющей интерес молекулой (например, сконструированной нуклеазой) и макромолекулой (например, ДНК), и не зависят от целевой последовательности.[0060] "Binding" refers to a sequence-specific, non-covalent interaction between macromolecules (eg , between a protein and a nucleic acid). Not all components of a binding interaction need to be sequence-specific (eg , contacts with phosphate residues in the DNA backbone), provided that the interaction as a whole remains sequence-specific. Such interactions are typically characterized by a dissociation constant (Kd ) of 10-6 M-1 or less. "Affinity" refers to the strength of binding: increased binding affinity correlates with lower Kd . "Non-specific binding" refers to non-covalent interactions that occur between any molecule of interest (e.g. an engineered nuclease) and a macromolecule (e.g. DNA), and are independent of the target sequence.
[0061] «Связывающий белок» представляет собой белок, который способен нековалентно связываться с другой молекулой. Связывающий белок может связываться, например, с молекулой ДНК (ДНК-связывающий белок), молекулой РНК (РНК-связывающий белок) и/или белковой молекулой (белок-связывающий белок). В случае белок-связывающего белка последний может связываться сам с собой (с образованием гомодимеров, гомотримеров и т.п.) и/или может связываться с одной или более молекул другого белка или белков. Связывающий белок может обладать более чем одним типом связывающей активности. Например, белки с цинковыми пальцами обладают ДНК-связывающей, РНК-связывающей и белок-связывающей активностью. В случае РНК-направляемой нуклеазной системы, РНК-направляющая гетерологична нуклеазному компоненту (Cas9 или Cfp1); оба могут быть сконструированы.[0061] A "binding protein" is a protein that is capable of non-covalently binding to another molecule. The binding protein may, for example, bind to a DNA molecule (DNA binding protein), an RNA molecule (RNA binding protein) and/or a protein molecule (protein binding protein). In the case of a protein-binding protein, the latter may bind to itself (to form homodimers, homotrimers, etc.) and/or may bind to one or more molecules of another protein or proteins. A binding protein may have more than one type of binding activity. For example, zinc finger proteins have DNA-binding, RNA-binding, and protein-binding activities. In the case of an RNA-targeted nuclease system, the target RNA is heterologous to the nuclease component (Cas9 or Cfp1); both can be constructed.
[0062] «ДНК-связывающая молекула» представляет собой молекулу, которая может связываться с ДНК. Такая ДНК-связывающая молекула может представлять собой полипептид, домен белка, домен в составе белка большего размера или полинуклеотид. Согласно некоторым вариантам реализации указанный полинуклеотид представляет собой ДНК, тогда как согласно другим вариантам реализации указанный полинуклеотид представляет собой РНК. Согласно некоторым вариантам реализации указанная ДНК-связывающая молекула представляет собой белковый домен нуклеазы (например, домен FokI), тогда как согласно другим вариантам реализации указанная ДНК-связывающая молекула представляет собой направляющий РНК-компонент РНК-направляемой нуклеазы (например, Cas9 или Cfp1).[0062] A "DNA binding molecule" is a molecule that can bind to DNA. Such a DNA binding molecule may be a polypeptide, a protein domain, a domain within a larger protein, or a polynucleotide. In some embodiments, said polynucleotide is DNA, while in other embodiments, said polynucleotide is RNA. In some embodiments, said DNA-binding molecule is a nuclease protein domain (e.g. ,Fok I domain), while in other embodiments, said DNA-binding molecule is a guide RNA component of an RNA-directed nuclease (e.g. , Cas9 or Cfp1) .
[0063] «ДНК-связывающий белок» (или связывающий домен) представляет собой белок, или домен в составе белка большего размера, который связывает ДНК специфическим в отношении последовательности образом, например, посредством одного или более цинковых пальцев или за счет взаимодействия с одним или более RVD в белке с цинковыми пальцами или TALE, соответственно. Термин «ДНК-связывающий белок с цинковыми пальцами» часто сокращают до белка с цинковыми пальцами или ZFP.[0063] A “DNA-binding protein” (or binding domain) is a protein, or domain within a larger protein, that binds DNA in a sequence-specific manner, such as through one or more zinc fingers or through interaction with one or more more RVD in zinc finger protein or TALE, respectively. The term Zinc Finger DNA Binding Protein is often abbreviated to Zinc Finger Protein or ZFP.
[0064] «ДНК-связывающий белок с цинковыми пальцами» (или связывающий домен) представляет собой белок или домен в составе белка большего размера, который связывает ДНК специфическим в отношении последовательности образом посредством одного или более цинковых пальцев, которые представляют собой области последовательности аминокислот в составе связывающего домена, структура которого стабилизирована за счет координации иона цинка. Термин «ДНК-связывающий белок с цинковыми пальцами» часто сокращают до белка с цинковыми пальцами или ZFP.[0064] A "zinc finger DNA-binding protein" (or binding domain) is a protein or domain within a larger protein that binds DNA in a sequence-specific manner via one or more zinc fingers, which are amino acid sequence regions in composition of the binding domain, the structure of which is stabilized due to the coordination of the zinc ion. The term Zinc Finger DNA Binding Protein is often abbreviated to Zinc Finger Protein or ZFP.
[0065] «ДНК-связывающий домен TALE», или «TALE» представляет собой полипептид, содержащий один или более доменов/единиц повтора TALE. Домены повтора вовлечены в связывание TALE с когнатной целевой последовательностью ДНК. Длина одной «единицы повтора» (также называемой «повтором») составляет, как правило, 33-35 аминокислот, и она демонстрирует по меньшей мере некоторую гомологию последовательности другим последовательностям повторов TALE в составе встречающегося в природе белка TALE.См., например,патент США №8,586,526, включенный в настоящий документ полностью посредством ссылки.[0065] A "TALE DNA binding domain" or "TALE" is a polypeptide containing one or more TALE repeat domains/units. The repeat domains are involved in the binding of TALE to a cognate target DNA sequence. A single "repeat unit" (also referred to as a "repeat") is typically 33-35 amino acids in length and exhibits at least some sequence homology to other TALE repeat sequences within the naturally occurring TALE protein.See, for example, US Patent No. 8,586,526, incorporated herein in its entirety by reference.
[0066] ДНК-связывающие домены с цинковыми пальцами и TALE могут быть «сконструированы» для связывания с заранее заданной последовательностью нуклеотидов, например, посредством конструирования (изменения одной или более аминокислот) спиральной области распознавания встречающегося в природе белка с цинковыми пальцами или путем конструирования аминокислот, вовлеченных в ДНК-связывание («двойной остаток вариабельного повтора», или область RVD). Соответственно, сконструированные белки с цинковыми пальцами или белки TALE представляют собой белки, не встречающиеся в природе. Неограничивающие примеры способов конструирования белков с цинковыми пальцами и TALE представлены дизайном и выбором. Полученный путем дизайна белок представляет собой белок, не встречающийся в природе, дизайн/состав которого является результатом применения преимущественно рациональных критериев. Рациональные критерии дизайна включают применение правил замены и компьютерных алгоритмов для обработки информации из базы данных, где хранится информация о дизайне существующих ZFP или TALE и данные о связывании. См., например, патенты США № №8,586,526; №6,140,081; №6,453,242; и №6,534,261; см. также WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 и WO 03/016496.[0066] Zinc finger and TALE DNA binding domains can be "engineered" to bind to a predetermined sequence of nucleotides, for example, by constructing (altering one or more amino acids) a helical recognition region of a naturally occurring zinc finger protein or by constructing amino acids involved in DNA binding ("double variable repeat residue", or RVD region). Accordingly, engineered zinc finger proteins or TALE proteins are non-naturally occurring proteins. Non-limiting examples of zinc finger and TALE protein engineering methods are represented by design and choice. A designed protein is a non-naturally occurring protein whose design/composition is the result of predominantly rational criteria. Rational design criteria include the use of substitution rules and computer algorithms to process information from a database that stores existing ZFP or TALE design information and binding data. See, for example, US Pat. Nos. 8,586,526; No. 6,140,081; No. 6,453,242; and #6,534,261; see also WO 98/53058; W098/53059; W098/53060; WO 02/016536 and WO 03/016496.
[0067] «Выбранными» («отобранными») являются белок с цинковыми пальцами, белок TALE или система CRISPR/Cas, не встречающиеся в природе, получаемые в основном в результате применения эмпирического способа, такого как фаговый дисплей, двухгибридная система «interaction trap», рациональный дизайн или гибридная селекция. См.например, US 5,789,538; US 5,925,523; US 6,007,988; US 6,013,453; US 6,200,759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197 и WO 02/099084.[0067] "Selected"("selected") is a zinc finger protein, TALE protein, or CRISPR/Cas system that is not naturally occurring, obtained mainly by applying an empirical method, such as phage display, two-hybrid "interaction trap" system , rational design or hybrid selection. Seefor example US 5,789,538; US 5,925,523; US 6,007,988; US 6,013,453; US 6,200,759; WO 95/19431; W096/06166; W098/53057; W098/54311; WO00/27878; WO 01/60970; WO 01/88197 and WO 02/099084.
[0068] «TtAgo» представляет собой прокариотический белок Argonaute, предположительно вовлеченный в сайленсинг генов. TtAgo происходит из бактерийThermus thermophilus. См., например, Swartset al, там же; G. Shenget al., (2013)Proc. Natl. Acad. Sci. U.S.A. 111, 652). «Система TtAgo» включает все необходимые компоненты, в том числе, например, направляющие ДНК для расщепления ферментом TtAgo.[0068] "TtAgo" is a prokaryotic Argonaute protein thought to be involved in gene silencing. TtAgo originates fromThermus thermophilus bacteria. See, for example, Swartset al, ibid .; G. Shenget al ., (2013)Proc. Natl. Acad. Sci . USA 111, 652). The "TtAgo System" includes all necessary components, including, for example, guide DNA for cleavage by the TtAgo enzyme.
[0069] «Рекомбинация» относится к процессу обмена генетической информацией между двумя полинуклеотидами, в том числе, но не ограничиваясь перечисленными, захвату путем негомологичного соединения концов («non-homologous end joining», NHEJ) и гомологичной рекомбинации. Для целей настоящего изобретения «гомологичная рекомбинация (HR)» относится к специализированной форме такого обмена, происходящей, например, во время репарации двуцепочечных разрывов в клетках за счет направляемых гомологией механизмов репарации. Для указанного процесса необходима гомология последовательностей нуклеотидов, он задействует «донорную» молекулу для репарации «целевой» молекулы (т.е.молекулы, в которой произошел двуцепочечный разрыв) с матрицы; и также известен как «некроссоверная конверсия генов» или «конверсия генов с короткими трактами», поскольку приводит к переносу генетической информации от донора к мишени. Без связи с конкретной теорией, такой перенос может задействовать коррекцию несовпадений гетеродуплексной ДНК, которая образуется между разорванной мишенью и донором, и/или «синтез-зависимое аннелирование цепи», при котором используют донор для ресинтеза генетической информации, которая становится частью мишени, и/или родственные процессы. Такая специализированная HR часто приводит к изменению последовательности целевой молекулы таким образом, чтобы происходило включение части последовательности или всей последовательности донорного полинуклеотида в состав целевого полинуклеотида.[0069] "Recombination" refers to the process of exchanging genetic information between two polynucleotides, including but not limited to non-homologous end joining (NHEJ) and homologous recombination. For the purposes of the present invention, "homologous recombination (HR)" refers to a specialized form of such exchange occurring, for example, during the repair of double-strand breaks in cells by homology-directed repair mechanisms. This process requires nucleotide sequence homology and uses a "donor" molecule to repair the "target" molecule (i.e. , the molecule in which the double-strand break has occurred) from the template; and is also known as "non-crossover gene conversion" or "short-path gene conversion" because it results in the transfer of genetic information from the donor to the target. Without wishing to be bound by a particular theory, such transfer may involve the correction of mismatches in the heteroduplex DNA that forms between the broken target and the donor, and/or "synthesis-dependent strand annulation", which uses the donor to resynthesize the genetic information that becomes part of the target, and/ or related processes. Such specialized HR often results in a change in the sequence of the target molecule such that part or all of the donor polynucleotide sequence is incorporated into the target polynucleotide.
[0070] В определенных способах согласно настоящему описанию одна или более нацеленных нуклеаз согласно описанию в настоящем документе создают двуцепочечный разрыв (ДЦР) в целевой последовательности (например, клеточного хроматина) в заранее заданном сайте (например,представляющем интерес гене или локусе). ДЦР опосредует интеграцию конструкции (например, донорной) согласно описанию в настоящем документе. Указанная конструкция необязательно гомологична последовательности нуклеотидов в области разрыва. Экспрессионная конструкция может быть физически интегрирована; или, как вариант, используют экспрессионную кассету в качестве матрицы для репарации разрыва за счет гомологичной рекомбинации, что приводит к введению всей последовательности нуклеотидов или части последовательности нуклеотидов из экспрессионной кассеты в клеточный хроматин. Соответственно, первая последовательность в клеточном хроматине может быть изменена и, согласно некоторым вариантам реализации, может быть конвертирована в последовательность, присутствующую в экспрессионной кассете. Соответственно, применение терминов «заменять» или «замена» может относиться к замене одной последовательности нуклеотидов на другую (т.е. замене последовательности в информационном смысле), и не обязательно требует физической или химической замены одного полинуклеотида на другой.[0070] In certain methods as described herein, one or more targeted nucleases as described herein create a double strand break (DSB) in a target sequence (e.g., cellular chromatin) at a predetermined site (e.g., a gene or locus of interest). LCB mediates the integration of a construct (e.g. donor) as described in this document. Said construct is not necessarily homologous to the nucleotide sequence at the break. The expression construct may be physically integrated; or, alternatively, the expression cassette is used as a template to repair the gap by homologous recombination, which results in the introduction of all or part of the nucleotide sequence from the expression cassette into the cell chromatin. Accordingly, the first sequence in the cellular chromatin may be altered and, in some embodiments, converted to a sequence present in the expression cassette. Accordingly, the use of the terms "substitute" or "substitution" may refer to the substitution of one nucleotide sequence for another (ie, a sequence substitution in the informational sense), and does not necessarily require a physical or chemical substitution of one polynucleotide for another.
[0071] В любом из способов, описанных в настоящем документе, могут применяться дополнительные сконструированные нуклеазы для дополнительного расщепления двух цепей (двухцепочечного расщепления) в дополнительном целевом сайте внутри клетки.[0071] In any of the methods described herein, additional engineered nucleases can be used to further cleave two strands (double-strand cleavage) at an additional target site within the cell.
[0072] Согласно определенным вариантам реализации способов нацеленной рекомбинации, и/или замены, и/или изменения последовательности в представляющей интерес области в клеточном хроматине хромосомную последовательность изменяют путем гомологичной рекомбинации с экзогенной «донорной» последовательностью нуклеотидов. Такую гомологичную рекомбинацию стимулирует двуцепочечный разрыв в клеточном хроматине в случае присутствия последовательностей, гомологичных области разрыва.[0072] According to certain embodiments of methods for targeted recombination and/or replacement and/or sequence alteration in a region of interest in cellular chromatin, a chromosomal sequence is altered by homologous recombination with an exogenous "donor" nucleotide sequence. Such homologous recombination is stimulated by a double-strand break in the cellular chromatin in the presence of sequences homologous to the break region.
[0073] В любом из способов, описанных в настоящем документе, первая последовательность нуклеотидов («донорная последовательность») может содержать последовательности, гомологичные, однако не идентичные геномным последовательностям в представляющей интерес области, что стимулирует гомологичную рекомбинацию со встраиванием неидентичной последовательности в представляющей интерес области. Соответственно, согласно некоторым вариантам реализации части донорной последовательности, гомологичные последовательностям в представляющей интерес области, демонстрируют приблизительно 80-99% (или соответствующую любому промежуточному целочисленному значению) идентичность последовательностей подлежащей замене геномной последовательности. Согласно другим вариантам реализации гомология между донорной и геномной последовательностями превышает 99%, например, в тех случаях, когда на протяжении 100 непрерывных пар оснований донорные и геномные последовательности различаются только 1 нуклеотидом. В определенных случаях негомологичная часть донорной последовательности может содержать последовательности, не присутствующие в представляющей интерес области, соответственно, в представляющую интерес область вводят новые последовательности. В указанных случаях негомологичная последовательность обычно фланкирована последовательностями, имеющими длину 50-1000 пар оснований (или длину, соответствующую любому промежуточному целочисленному значению) или длину, соответствующую любому числу пар оснований, превышающему 1000, гомологичными или идентичными последовательностям в представляющей интерес области. Согласно другим вариантам реализации донорная последовательность не гомологична первой последовательности и встроена в геном за счет механизмов негомологичной рекомбинации.[0073] In any of the methods described herein, the first nucleotide sequence ("donor sequence") may contain sequences that are homologous, but not identical, to genomic sequences in the region of interest, which stimulates homologous recombination with the insertion of a non-identical sequence in the region of interest . Accordingly, in some embodiments, portions of the donor sequence that are homologous to sequences in the region of interest exhibit approximately 80-99% (or corresponding to any intermediate integer value) sequence identity of the genomic sequence to be replaced. In other embodiments, the homology between the donor and genomic sequences is greater than 99%, such as when the donor and genomic sequences differ by only 1 nucleotide over 100 contiguous base pairs. In certain cases, the non-homologous part of the donor sequence may contain sequences not present in the region of interest, respectively, new sequences are introduced into the region of interest. In these cases, the non-homologous sequence is usually flanked by sequences having a length of 50-1000 base pairs (or a length corresponding to any intermediate integer value) or a length corresponding to any number of base pairs in excess of 1000, homologous or identical to sequences in the region of interest. In other embodiments, the donor sequence is not homologous to the first sequence and is incorporated into the genome through non-homologous recombination mechanisms.
[0074] Любые из способов, описанных в настоящем документе, могут применяться для частичной или полной инактивации одной или более целевых последовательностей в клетке путем нацеленной интеграции донорной последовательности, или посредством расщепления целевой последовательности или последовательностей с последующей допускающей ошибки NHEJ-опосредованной репарацией, разрушающей экспрессию представляющего интерес гена или генов. Также предложены линии клеток с частично или полностью инактивированными генами.[0074] Any of the methods described herein can be used to partially or completely inactivate one or more target sequences in a cell by targeted integration of a donor sequence, or by cleavage of a target sequence or sequences followed by an error-prone NHEJ-mediated repair that destroys expression the gene or genes of interest. Cell lines with partially or completely inactivated genes are also proposed.
[0075] Кроме того, способы нацеленной интеграции согласно описанию в настоящем документе могут также применяться для интеграции одной или более экзогенных последовательностей. Указанная экзогенная последовательность нуклеиновой кислоты может содержать, например, один или более генов, или одну или более молекул кДНК, или любой тип кодирующей или некодирующей последовательности, а также один или более контрольных элементов (например,промоторов). Кроме того, экзогенная последовательность нуклеиновой кислоты может продуцировать одну или более молекул РНК (например, малые шпилечные РНК (мшРНК), ингибиторные РНК (РНКи), микроРНК (миРНК) и т.п.).[0075] In addition, the methods of targeted integration as described herein can also be used to integrate one or more exogenous sequences. Said exogenous nucleic acid sequence may contain, for example, one or more genes, or one or more cDNA molecules, or any type of coding or non-coding sequence, as well as one or more control elements (eg, promoters). In addition, the exogenous nucleic acid sequence can produce one or more RNA molecules (eg , small hairpin RNAs (shRNAs), inhibitory RNAs (RNAi), microRNAs (miRNAs), etc.).
[0076] «Расщепление» относится к разрыву ковалентного остова молекулы ДНК. Расщепление может быть инициировано различными способами, в том числе, но не ограничиваясь перечисленным, ферментативным или химическим гидролизом фосфодиэфирной связи. Возможно расщепление как одной цепи, так и двух цепей, и расщепление двух цепей может происходить в результате двух отдельных расщеплений одной цепи. Расщепление ДНК может приводить к образованию либо «тупых» концов, либо ступенчатых концов. Согласно некоторым вариантам реализации гибридные полипептиды используют для нацеленного расщепления двуцепочечной ДНК.[0076] "Cleavage" refers to a break in the covalent backbone of a DNA molecule. Cleavage can be initiated in a variety of ways, including, but not limited to, enzymatic or chemical hydrolysis of the phosphodiester bond. Both single strand and double strand cleavage is possible, and two strand cleavage may result from two separate single strand cleavages. Cleavage of DNA can lead to the formation of either "blunt" ends or stepped ends. In some embodiments, hybrid polypeptides are used to target double-stranded DNA cleavage.
[0077] «Полудомен расщепления» представляет собой последовательность полипептида, которая в сочетании с вторым полипептидом (идентичным или отличающимся) образует комплекс, обладающий расщепляющей активностью (предпочтительно двуцепочечной (с расщеплением обеих цепей) расщепляющей активностью). Термины «первый и второй полудомены расщепления»; «+ и - полудомены расщепления» и «правый и левый полудомены расщепления» используются взаимозаменяемо для обозначения пар полудоменов расщепления, которые димеризуются. Термин «домен расщепления» применяют взаимозаменяемо с термином «полудомен расщепления». Термин «домен расщепления FokI» включает последовательность FokI, представленную в последовательности SEQ ID NO: 1, а также любые гомологи FokI, в том числе, но не ограничиваясь указанными, последовательности, представленные на Фиг. 17.[0077] A "cleavage half-domain" is a polypeptide sequence which, when combined with a second polypeptide (identical or different), forms a complex having cleaving activity (preferably double-stranded (cleaving both strands) cleaving activity). The terms "first and second splitting half-domains";"+ and - cleavage half-domains" and "right and left cleavage half-domains" are used interchangeably to refer to pairs of cleavage half-domains that dimerize. The term "cleavage domain" is used interchangeably with the term "cleavage half-domain". The term "FokI cleavage domain" includes theFokI sequence shown in SEQ ID NO: 1, as well as anyFokI homologues, including, but not limited to, the sequences shown in FIG. 17.
[0078] «Сконструированный полудомен расщепления» представляет собой полудомен расщепления, модифицированный таким образом, чтобы образовывать облигатные гетеродимеры с другим полудоменом расщепления (например,другим сконструированным полудоменом расщепления).[0078] An "engineered cleavage half-domain" is a cleavage half-domain modified to form obligate heterodimers with another cleavage half-domain (eg, another engineered cleavage half-domain).
[0079] Термин «последовательность» относится к последовательности нуклеотидов любой длины, которая может быть представлена ДНК или РНК; может быть линейной, кольцевой или разветвленной, и может быть либо одноцепочечной, либо двуцепочечной. Термин «трансген» относится к последовательности нуклеотидов, которая встроена в геном. Трансген может иметь любую длину, например, от 2 до 100 000 000 нуклеотидов (или длину, соответствующую любому промежуточному или большему целочисленному значению), предпочтительно от приблизительно 100 до 100 000 нуклеотидов (или длину, соответствующую любому промежуточному целочисленному значению), более предпочтительно - длину от приблизительно 2000 до 20 000 нуклеотидов (или длину, соответствующую любому промежуточному целочисленному значению); еще более предпочтительно - длину от приблизительно 5 до 15 кБ (или длину, соответствующую любому промежуточному целочисленному значению).[0079] The term "sequence" refers to a sequence of nucleotides of any length, which can be represented by DNA or RNA; may be linear, circular or branched, and may be either single or double stranded. The term "transgene" refers to a sequence of nucleotides that is integrated into the genome. The transgene may be of any length, for example, from 2 to 100,000,000 nucleotides (or a length corresponding to any intermediate or greater integer value), preferably from about 100 to 100,000 nucleotides (or a length corresponding to any intermediate integer value), more preferably - a length of about 2,000 to 20,000 nucleotides (or any intermediate integer value); even more preferably, a length of from about 5 to 15 kB (or a length corresponding to any intermediate integer value).
[0080] «Хромосома» представляет собой комплекс хроматина, содержащие полный геном или часть генома клетки. Геном клетки часто характеризуют по кариотипу, который представляет собой совокупность всех хромосом, которые содержатся в геноме клетки. Геном клетки может содержать одну или более хромосом.[0080] "Chromosome" is a complex of chromatin containing the entire genome or part of the genome of the cell. The genome of a cell is often characterized by its karyotype, which is the totality of all the chromosomes that are contained in the cell's genome. The genome of a cell may contain one or more chromosomes.
[0081] «Эписома» представляет собой реплицирующуюся нуклеиновую кислоту, нуклеопротеиновый комплекс или другую структуру, содержащую нуклеиновую кислоту, которая не входит в состав хромосомного кариотипа клетки. Примеры эписом включают плазмиды, миникольца и определенные вирусные геномы. Специфические для печени конструкции, описанные в настоящем документе, могут поддерживаться в эписомной форме или, как вариант, могут быть стабильно встроены в клетку.[0081] "Episome" is a replicating nucleic acid, nucleoprotein complex, or other structure containing a nucleic acid that is not part of the cell's chromosomal karyotype. Examples of episomes include plasmids, minicircles, and certain viral genomes. The liver-specific constructs described herein can be maintained in episomal form, or alternatively can be stably integrated into a cell.
[0082] «Экзогенная» молекула представляет собой молекулу, которая в норме не присутствует в клетке, однако может быть введена в клетку с применением одного или более генетических, биохимических или других способов. «Присутствие в клетке в норме» определяют для указанной клетки применительно к конкретной стадии развития и конкретным условиям окружающей среды. Соответственно, например, молекула, которая присутствует только во время эмбрионального развития мышц, представляет собой экзогенную молекулу применительно к взрослой мышечной клетке. Аналогичным образом, молекула, индуцируемая тепловым шоком, представляет собой экзогенную молекулу применительно к клетке, не подвергавшейся тепловому шоку. Экзогенная молекула может включать, например, функциональный вариант неправильно функционирующей эндогенной молекулы или неправильно функционирующий вариант нормально функционирующей эндогенной молекулы.[0082] An "exogenous" molecule is a molecule that is not normally present in a cell, but can be introduced into a cell using one or more genetic, biochemical, or other means. "Normal presence in a cell" is defined for a specified cell in relation to a particular stage of development and specific environmental conditions. Accordingly, for example, a molecule that is present only during embryonic muscle development is an exogenous molecule when applied to an adult muscle cell. Similarly, a heat shock induced molecule is an exogenous molecule when applied to a cell that has not been subjected to heat shock. The exogenous molecule may include, for example, a functional variant of a misbehaving endogenous molecule or a misbehaving variant of a normally functioning endogenous molecule.
[0083] Экзогенная молекула может представлять собой, в том числе, малую молекулу, например, полученную с применением способа комбинаторной химии, или макромолекулу, такую как белок, нуклеиновая кислота, углевод, липид, гликопротеин, липопротеин, полисахарид, любое модифицированное производное вышеуказанных молекул, или любой комплекс, содержащий одну или более из вышеуказанных молекул. Нуклеиновые кислоты включают ДНК и РНК, могут быть одно- или двуцепочечными; линейными, разветвленными или кольцевыми; и могут иметь любую длину. Нуклеиновые кислоты включают способные к образованию дуплексов, а также образующие триплексы нуклеиновые кислоты. См., например, патенты США №5,176,996 и №5,422,251. Белки включают, не ограничиваясь перечисленными, ДНК-связывающие белки, транскрипционные факторы, факторы ремоделирования хроматина, связывающие метилированную ДНК белки, полимеразы, метилазы, деметилазы, ацетилазы, деацетилазы, киназы, фосфатазы, лигазы, деубиквитиназы, интегразы, рекомбиназы, лигазы, топоизомеразы, гиразы и геликазы.[0083] The exogenous molecule may be, including, a small molecule, for example, obtained using a combinatorial chemistry method, or a macromolecule, such as a protein, nucleic acid, carbohydrate, lipid, glycoprotein, lipoprotein, polysaccharide, any modified derivative of the above molecules , or any complex containing one or more of the above molecules. Nucleic acids include DNA and RNA, may be single or double stranded; linear, branched or ring; and can be of any length. Nucleic acids include duplex-forming as well as triplex-forming nucleic acids. See, for example, US Pat. Nos. 5,176,996 and 5,422,251. Proteins include, but are not limited to, DNA binding proteins, transcription factors, chromatin remodeling factors, methylated DNA binding proteins, polymerases, methylases, demethylases, acetylases, deacetylases, kinases, phosphatases, ligases, deubiquitinases, integrases, recombinases, ligases, topoisomerases, gyrase and helicase.
[0084] Экзогенная молекула может относится к тому же типу молекулы, что и эндогенная молекула, например, экзогенный белок или нуклеиновая кислота. Например, экзогенная нуклеиновая кислота может содержать инфицирующий вирусный геном, плазмиду или эписому, введенную в клетку, или хромосому, которая в норме не присутствует в указанной клетке. Способы введения экзогенных молекул в клетки известны специалистам в данной области техники и включают, не ограничиваясь перечисленными, опосредованный липидами перенос (т.е. липосомы, в том числе с нейтральными и катионными липидами), электропорацию, прямую инъекцию, слияние клеток, бомбардировку частицами, ко-осаждение с фосфатом кальция, опосредованный DEAE-декстраном перенос и опосредованный вирусными векторами перенос. Также экзогенная молекула может относиться к тому же типу молекулы, что и эндогенная молекула, но происходить из вида, отличного от того, к которому относится клетка. Например, последовательность нуклеиновой кислоты человека может быть введена в клетку линии, изначально происходящей из организма мыши или хомяка. Способы введения экзогенных молекул в клетки растений известны специалистам в данной области техники и включают, не ограничиваясь перечисленными, трансформацию протопластов, применение карбида кремния (например, WHISKERS™), опосредованнуюAgrobacterium трансформацию, опосредованный липидами перенос (т.е.липосомы, в том числе с нейтральными и катионными липидами), электропорацию, прямую инъекцию, слияние клеток, бомбардировку частицами (например, с применением «генной пушки»), ко-осаждение с фосфатом кальция, опосредованный DEAE-декстраном перенос и опосредованный вирусными векторами перенос.[0084] An exogenous molecule may refer to the same type of molecule as an endogenous molecule, such as an exogenous protein or nucleic acid. For example, the exogenous nucleic acid may contain an infecting viral genome, a plasmid or episome introduced into a cell, or a chromosome that is not normally present in said cell. Methods for introducing exogenous molecules into cells are known to those skilled in the art and include, but are not limited to, lipid-mediated transfer (i.e., liposomes, including those with neutral and cationic lipids), electroporation, direct injection, cell fusion, particle bombardment, calcium phosphate co-precipitation, DEAE-dextran-mediated transfer, and viral vector-mediated transfer. Also, an exogenous molecule may be of the same type of molecule as an endogenous molecule, but come from a species different from that of the cell. For example, a human nucleic acid sequence can be introduced into a cell line originally derived from a mouse or hamster. Methods for introducing exogenous molecules into plant cells are known to those skilled in the art and include, but are not limited to, protoplast transformation, silicon carbide (e.g. , WHISKERS™),Agrobacterium -mediated transformation, lipid-mediated transfer (i.e. , liposomes, including with neutral and cationic lipids), electroporation, direct injection, cell fusion, particle bombardment (e.g. using a "gene gun"), calcium phosphate co-precipitation, DEAE-dextran-mediated transfer, and viral vector-mediated transfer.
[0085] Напротив, «эндогенная» молекула представляет собой молекулу, в норме присутствующую в конкретной клетке на конкретной стадии развития в конкретных условиях окружающей среды. Например, эндогенная нуклеиновая кислота может включать хромосому, геном митохондрии, хлоропласта или другой органеллы, или встречающуюся в природе эписомную нуклеиновую кислоту. Дополнительные эндогенные молекулы могут включать белки, например, транскрипционные факторы и ферменты.[0085] In contrast, an "endogenous" molecule is a molecule normally present in a particular cell at a particular developmental stage under particular environmental conditions. For example, an endogenous nucleic acid may include a chromosome, mitochondrial, chloroplast, or other organelle genome, or a naturally occurring episomal nucleic acid. Additional endogenous molecules may include proteins, such as transcription factors and enzymes.
[0086] В настоящем документе термин «продукт экзогенной нуклеиновой кислоты» включает как полинуклеотидные, так и полипептидные продукты, например, продукты транскрипции (полинуклеотиды, такие как РНК) и продукты трансляции (полипептиды).[0086] As used herein, the term "exogenous nucleic acid product" includes both polynucleotide and polypeptide products, such as transcription products (polynucleotides such as RNA) and translation products (polypeptides).
[0087] «Гибридная» молекула представляет собой молекулу, в которой две или более субъединичных молекул соединены, предпочтительно, ковалентно соединены. Субъединичные молекулы могут относиться к молекулам одного химического типа, или могут относиться к молекулам разных химических типах. Примеры гибридных молекул включают, не ограничиваясь перечисленными, гибридные белки (например, белковый ДНК-связывающий домен, гибридный с доменом расщепления), гибридный полинуклеотидный ДНК-связывающий домен (например,онРНК), функционально связанный с доменом расщепления, и гибридные нуклеиновые кислоты (например, нуклеиновая кислота, кодирующая гибридный белок).[0087] A "hybrid" molecule is one in which two or more subunit molecules are linked, preferably covalently linked. Subunit molecules may refer to molecules of the same chemical type, or may refer to molecules of different chemical types. Examples of fusion molecules include, but are not limited to, fusion proteins (e.g., a protein DNA binding domain fusion with a cleavage domain), a fusion polynucleotide DNA binding domain (e.g., sRNA) operably linked to a cleavage domain, and fusion nucleic acids (e.g., , the nucleic acid encoding the fusion protein).
[0088] Экспрессия гибридного белка в клетке может быть результатом доставки указанного гибридного белка в указанную клетку, или доставки полинуклеотида, кодирующего указанный гибридный белок, в клетку, где указанный полинуклеотид транскрибируется, и транскрипт транслируется с получением указанного гибридного белка. В экспрессии белка в клетке могут также быть задействованы транс-сплайсинг, расщепление полипептидов и лигирование полипептидов. Способы доставки полинуклеотидов и полипептидов в клетки описаны в различных разделах настоящего документа.[0088] Expression of a fusion protein in a cell can result from delivery of said fusion protein to said cell, or delivery of a polynucleotide encoding said fusion protein into a cell, where said polynucleotide is transcribed and the transcript is translated to produce said fusion protein. Protein expression in a cell may also involve trans-splicing, polypeptide cleavage, and polypeptide ligation. Methods for delivering polynucleotides and polypeptides to cells are described in various sections of this document.
[0089] «Ген» для целей настоящего изобретения включает область ДНК, кодирующую генный продукт (см. ниже), а также все области ДНК, которые регулируют продуцирование указанного генного продукта, при этом такие регуляторные последовательности могут быть как смежными, так и несмежными кодирующим и/или транскрибируемым последовательностям. Соответственно, ген включает, однако не обязательно ограничен перечисленным, промоторные последовательности, терминаторы, последовательности регуляции трансляции, такие как сайты связывания рибосом и участки внутренней посадки рибосомы, энхансеры, сайленсеры, инсуляторы, граничные элементы, точки начала репликации, сайты прикрепления к матриксу и локус-контролирующие элементы.[0089] "Gene" for the purposes of the present invention includes the region of DNA encoding the gene product (see below), as well as all DNA regions that regulate the production of the specified gene product, while such regulatory sequences can be either contiguous or non-contiguous coding and/or transcribed sequences. Accordingly, a gene includes, but is not necessarily limited to, promoter sequences, terminators, translation regulation sequences such as ribosome binding sites and internal ribosome entry sites, enhancers, silencers, insulators, boundary elements, origins of replication, matrix attachment sites, and a locus. - control elements.
[0090] «Генная экспрессия» относится к конверсии информации, содержащейся в гене, в генный продукт. Генный продукт может представлять собой продукт прямой транскрипции гена (например, мРНК, тРНК, рРНК, антисмысловую РНК, рибозим, структурную РНК или любой другой тип РНК) или белок, продуцированный путем трансляции мРНК. Генные продукты также включают РНК, модифицированные в результате таких процессов, как кэпирование, полиаденилирование, метилирование и редактирование, а также белки, модифицированные, например, при метилировании, ацетилировании, фосфорилировании, убиквитинировании, АДФ-рибозилировании, миристоилировании и гликозилировании.[0090] "Gene expression" refers to the conversion of information contained in a gene into a gene product. A gene product may be a direct transcription product of a gene (eg, mRNA, tRNA, rRNA, antisense RNA, ribozyme, structural RNA, or any other type of RNA) or a protein produced by translation of an mRNA. Gene products also include RNAs modified by processes such as capping, polyadenylation, methylation and editing, as well as proteins modified by, for example, methylation, acetylation, phosphorylation, ubiquitination, ADP-ribosylation, myristoylation and glycosylation.
[0091] «Модуляция» генной экспрессии относится к изменению активности гена. Модуляция экспрессии может включать, однако не ограничивается перечисленным, активацию генов и репрессию генов. Для модуляции экспрессии может применяться редактирование генома (например, расщепление, изменение, инактивация, случайная мутация). Инактивация генов относится к любому снижению генной экспрессии по сравнению с экспрессией в клетке, которая содержит ZFP, TALE или систему CRISPR/Cas согласно описанию в настоящем документе. Соответственно, инактивация генов может быть частичной или полной.[0091] "Modulation" of gene expression refers to a change in the activity of a gene. Modulation of expression may include, but is not limited to, gene activation and gene repression. Genome editing (eg, cleavage, alteration, inactivation, random mutation) can be used to modulate expression. Gene inactivation refers to any decrease in gene expression compared to expression in a cell that contains ZFP, TALE, or the CRISPR/Cas system as described herein. Accordingly, gene inactivation can be partial or complete.
[0092] «Представляющая интерес область» представлена любой областью клеточного хроматина, такой как, например, ген или некодирующая последовательность в составе гена или смежная с геном, с которой требуется связать экзогенную молекулу. Связывание может проводиться для нацеленного расщепления ДНК и/или нацеленной рекомбинации. Представляющая интерес область может находиться, например, в хромосоме, в эписоме, в геноме органеллы (например, митохондрии, хлоропласта) или инфицирующем вирусной геноме. Представляющая интерес область может входить в состав кодирующей области гена, в состав транскрибируемых некодирующих областей, таких как, например, лидерные последовательности, трейлерные последовательности или интроны, или в состав нетранскрибируемых областей, в 5'-направлении или в 3'-направлении от кодирующей области. Длина представляющей интерес области может составлять всего одну пару нуклеотидов или до 2000 пар нуклеотидов, или соответствовать любому целому числу пар нуклеотидов.[0092] A "region of interest" is any region of cellular chromatin, such as, for example, a gene or a non-coding sequence within or adjacent to a gene, to which an exogenous molecule is desired to be linked. Linking may be for targeted DNA cleavage and/or targeted recombination. The region of interest may be, for example, in a chromosome, in an episome, in the genome of an organelle (eg, mitochondria, chloroplast) or the infecting viral genome. The region of interest may be within the coding region of a gene, within transcribed non-coding regions such as, for example, leader sequences, trailer sequences, or introns, or within non-transcribed regions, 5' or 3' from the coding region. . The region of interest can be as short as one base pair, or as long as 2000 base pairs, or any integer number of base pairs.
[0093] Локус типа «безопасная гавань» представляет собой локус в составе генома, куда может быть встроен ген без каких-либо пагубных эффектов для клетки-хозяина. Наиболее предпочтителен локус типа «безопасная гавань», экспрессия встроенной генной последовательности в котором не нарушается какой-либо сквозной экспрессией соседних генов. Неограничивающие примеры локусов типа «безопасная гавань» для нацеливания нуклеазы или нуклеаз, включают CCR5, HPRT, AAVS1,Rosa и альбумин.См., например,патенты США №7,951,925; №8,771,985; №8,110,379; №7,951,925; публикации США №20100218264; №20110265198; №20130137104; №20130122591; №20130177983; №20130177960; №20150056705 и №20150159172.[0093] A safe harbor locus is a locus within the genome where a gene can be inserted without any detrimental effects to the host cell. Most preferred is a safe harbor locus in which expression of the inserted gene sequence is not disturbed by any pass-through expression of adjacent genes. Non-limiting examples of safe harbor loci for targeting a nuclease or nucleases include CCR5, HPRT, AAVS1,Rosa , and albumin.See, for example, US Pat. Nos. 7,951,925; No. 8,771,985; #8,110,379; No. 7,951,925; U.S. Publication No. 20100218264; No. 20110265198; No. 20130137104; No. 20130122591; No. 20130177983; No. 20130177960; No. 20150056705 and No. 20150159172.
[0094] «Репортерный ген» или «репортерная последовательность» относится к любой последовательности, которая продуцирует белковый продукт, который легко измерить, предпочтительно, хотя не обязательно, с применением рутинного анализа. Подходящие репортерные гены включают, не ограничиваясь перечисленными, последовательности, кодирующий белки, опосредующие устойчивость к антибиотикам (например, устойчивость к ампициллину, устойчивость к неомицину, устойчивость к G418, устойчивость к пуромицину), последовательности, кодирующие окрашенные, или флуоресцентные, или люминесцентный белки (например, зеленый флуоресцентный белок, усиленный зеленый флуоресцентный белок, красный флуоресцентный белок, люциферазу), и белки, опосредующие усиленный рост клеток и/или амплификацию генов (например, дигидрофолатредуктазу). Эпитопные метки включают, например, одну или более копий FLAG, His, myc, Tap, HA или любой детектируемой последовательности аминокислот. «Экспрессионные метки» включают последовательности, кодирующие репортеры, которые могут быть функционально связаны с требуемой генной последовательностью для мониторинга экспрессии представляющего интерес гена.[0094] "Reporter gene" or "reporter sequence" refers to any sequence that produces a protein product that is easy to measure, preferably, although not necessarily, using routine analysis. Suitable reporter genes include, but are not limited to, sequences encoding proteins that mediate antibiotic resistance (e.g., ampicillin resistance, neomycin resistance, G418 resistance, puromycin resistance), sequences encoding stained or fluorescent or luminescent proteins (eg , green fluorescent protein, enhanced green fluorescent protein, red fluorescent protein, luciferase), and proteins mediating enhanced cell growth and/or gene amplification (eg , dihydrofolate reductase). Epitope tags include, for example, one or more copies of FLAG, His, myc, Tap, HA, or any detectable amino acid sequence. "Expression tags" include sequences encoding reporters that can be operably linked to a desired gene sequence to monitor expression of a gene of interest.
[0095] «Эукариотические» клетки включают, не ограничиваясь перечисленными, клетки грибов (таких как дрожжи), клетки растений, клетки животных, клетки млекопитающих и клетки человека (например, T-клетки), в том числе стволовые клетки (плюрипотентные и мультипотентные).[0095] "Eukaryotic" cells include, but are not limited to, fungal cells (such as yeast), plant cells, animal cells, mammalian cells, and human cells (e.g., T cells), including stem cells (pluripotent and multipotent) .
[0096] Термины «функциональная связь» и «функционально связанный» используются взаимозаменяемо в отношении взаимного расположения двух или более компонентов (таких как элементы последовательности), при котором указанные компоненты организованы таким образом, чтобы обеспечивать нормальное функционирование обоих компонентов и возможность опосредования по меньшей мере одним компонентом функции, осуществляемой в отношении по меньшей мере одного другого компонента. Например, последовательность регуляции транскрипции, такая как промотор, функционально связана с кодирующей последовательностью, если указанная последовательность регуляции транскрипции контролирует уровень транскрипции указанной кодирующей последовательности в ответ на присутствие или отсутствие одного или более факторов регуляции транскрипции. Последовательность регуляции транскрипции обычно функционально цис-связана с кодирующей последовательностью, однако не обязательно непосредственно смежна с указанной кодирующей последовательностью. Например, энхансер представляет собой последовательность регуляции транскрипции, которая функционально связана с кодирующей последовательностью, даже если они не расположены непрерывно.[0096] The terms "operably linked" and "operably linked" are used interchangeably in relation to the relative positioning of two or more components (such as elements of a sequence), in which these components are organized in such a way as to ensure the normal functioning of both components and the possibility of mediating at least one component of a function performed on at least one other component. For example, a transcriptional regulatory sequence, such as a promoter, is operably linked to a coding sequence if said transcriptional regulatory sequence controls the level of transcription of said coding sequence in response to the presence or absence of one or more transcriptional regulatory factors. A transcriptional control sequence is typically cis-operably linked to a coding sequence, but need not be directly adjacent to said coding sequence. For example, an enhancer is a transcriptional regulation sequence that is operably linked to a coding sequence even though they are not contiguous.
[0097] «Функциональный фрагмент» белка, полипептида или нуклеиновой кислоты представляет собой белок, полипептид или нуклеиновую кислоту с последовательностью, не идентичной полноразмерному белку, полипептиду или полноразмерной нуклеиновой кислоте, но сохраняющий(ая) ту же функцию, что и полноразмерный белок, полипептид или нуклеиновая кислота. Функциональный фрагмент может содержать большее, меньшее или такое же число остатков, что и соответствующая природная молекула, и/или может содержать одну или более замен аминокислот или нуклеотидов. Способы определения функции нуклеиновой кислоты или белка (например, анализ кодирующей функции, способности гибридизоваться с другой нуклеиновой кислотой, ферментативной активности) хорошо известны в данной области техники.[0097] A "functional fragment" of a protein, polypeptide, or nucleic acid is a protein, polypeptide, or nucleic acid with a sequence that is not identical to the full-length protein, polypeptide, or full-length nucleic acid, but retains the same function as the full-length protein, polypeptide or nucleic acid. A functional fragment may contain more, fewer, or the same number of residues as the corresponding natural molecule, and/or may contain one or more amino acid or nucleotide substitutions. Methods for determining the function of a nucleic acid or protein (eg, analysis of coding function, ability to hybridize with another nucleic acid, enzymatic activity) are well known in the art.
[0098] Полинуклеотидный «вектор» или «конструкция» способны переносить последовательности генов в целевые клетки. Как правило, «векторная конструкция», «экспрессионный вектор», «экспрессионная конструкция», «экспрессионная кассета», и «вектор для переноса генов» означают любую конструкцию нуклеиновой кислоты, способную направлять экспрессию представляющего интерес гена и переносить последовательности гена в целевые клетки. Соответственно, указанный термин включает основы для клонирования и экспрессии, а также интегрирующие векторы.[0098] A polynucleotide "vector" or "construct" is capable of transferring gene sequences to target cells. Generally, "vector construct", "expression vector", "expression construct", "expression cassette", and "gene transfer vector" means any nucleic acid construct capable of directing expression of a gene of interest and transferring gene sequences to target cells. Accordingly, the term includes cloning and expression bases as well as integrating vectors.
[0099] Термины «субъект» и «пациент» используются взаимозаменяемо и относятся к млекопитающим, таким как пациенты-люди и не являющиеся человеком приматы, а также к таким экспериментальным животным, как кролики, собаки, кошки, крысы, мыши; и другим животным. Соответственно, термин «субъект» или «пациент» в настоящем документе означает любого пациента или субъекта - млекопитающего, которому могут быть введены экспрессионные кассеты согласно настоящему изобретению. Субъекты согласно настоящему изобретению включают субъектов, страдающих расстройством.[0099] The terms "subject" and "patient" are used interchangeably and refer to mammals such as human patients and non-human primates, as well as experimental animals such as rabbits, dogs, cats, rats, mice; and other animals. Accordingly, the term "subject" or "patient" as used herein means any patient or mammalian subject to whom the expression cassettes of the present invention may be administered. Subjects according to the present invention include subjects suffering from a disorder.
[0100] Термины «лечить» (или «обрабатывать») и «лечение» (или «обработка») в настоящем документе относятся к снижению тяжести и/или частоты симптомов, элиминации симптомов и/или первопричины, предотвращению возникновения симптомов и/или их первопричины, и облегчению или устранению повреждения. Рак, моногенные заболевания и болезнь «трансплантат против хозяина» являются неограничивающими примерами состояний, лечение которых может быть проведено с применением композиций и способов, описанных в настоящем документе.[0100] The terms "treat" (or "treat") and "treatment" (or "treatment") as used herein refer to reducing the severity and/or frequency of symptoms, eliminating symptoms and/or the underlying cause, preventing the onset of symptoms and/or their root cause, and alleviate or repair the damage. Cancer, monogenic diseases, and graft-versus-host disease are non-limiting examples of conditions that can be treated using the compositions and methods described herein.
[0101] «Хроматин» представляет собой нуклеопротеиновую структуру, содержащую клеточный геном. Клеточный хроматин содержит нуклеиновую кислоту, в первую очередь ДНК, и белок, в том числе гистоны и негистоновые хромосомные белки. часть хроматина эукариотических клеток находится в форме нуклеосом, при этом нуклеосомный кор содержит приблизительно 150 пар оснований ДНК, ассоциированных с октамером, содержащим по две копии каждого из гистонов H2A, H2B, H3 и H4; и линкерную ДНК (вариабельной длины в зависимости от организма), расположенную между нуклеосомными корами. Молекула гистона H1 обычно ассоциирована с линкерной ДНК. Подразумевается, что для целей настоящего изобретения термин «хроматин» охватывает все типы клеточных нуклеопротеинов, как прокариотических, так и эукариотических. Клеточный хроматин включает как хромосомный, так и эписомный хроматин.[0101] "Chromatin" is a nucleoprotein structure containing the cellular genome. Cellular chromatin contains nucleic acid, primarily DNA, and protein, including histones and nonhistone chromosomal proteins. part of the chromatin of eukaryotic cells is in the form of nucleosomes, while the nucleosome core contains approximately 150 base pairs of DNA associated with an octamer containing two copies of each of the histones H2A, H2B, H3 and H4; and linker DNA (of variable length depending on the organism) located between the nucleosomal cores. The H1 histone molecule is usually associated with linker DNA. For the purposes of the present invention, the term "chromatin" is intended to encompass all types of cellular nucleoproteins, both prokaryotic and eukaryotic. Cellular chromatin includes both chromosomal and episomal chromatin.
[0102] «Доступная область» представляет собой сайт в клеточном хроматине, где целевой сайт, присутствующий в нуклеиновой кислоте, может быть связан экзогенной молекулой, которая распознает указанный целевой сайт. Без связи с конкретной теорией, считается, что доступная область представляет собой область, не упакованную в нуклеосомную структуру. Отличительная структура доступной области часто может быть детектирована по чувствительности к химическим и ферментативным зондам, например, нуклеазам.[0102] An "accessible region" is a site in cellular chromatin where a target site present in a nucleic acid can be bound by an exogenous molecule that recognizes said target site. Without wishing to be bound by a particular theory, it is believed that the accessible region is the region not packaged in a nucleosomal structure. The distinctive structure of the accessible region can often be detected by sensitivity to chemical and enzymatic probes, such as nucleases.
[0103] «Целевой сайт» или «целевая последовательность» представляет собой последовательность нуклеиновой кислоты, определяющая часть нуклеиновой кислоты, с которой связывается связывающая молекула, если имеются условия, достаточные для связывания. Например, последовательность 5’GAATTC3’ представляет собой целевой сайт рестрикционной эндонуклеазы Eco RI. «Предусмотренная» или «целевая» последовательность представляет собой последовательность, с которой связывающая молекула предположительно будет связываться, а «непредусмотренная» или «нецелевая» последовательность включает любую последовательность, связываемую связывающей молекулой и не являющуюся предусмотренной мишенью.[0103] A "target site" or "target sequence" is a nucleic acid sequence that defines the portion of the nucleic acid to which the binding molecule binds, if there are sufficient conditions for binding. For example, the sequence 5'GAATTC3' is the target site of the Eco RI restriction endonuclease. A "intended" or "target" sequence is a sequence to which a binding molecule is expected to bind, and a "non-intended" or "non-target" sequence includes any sequence bound by a binding molecule that is not the intended target.
ДНК-связывающие молекулы/доменыDNA binding molecules/domains
[0104] В настоящем документе описаны композиции, содержащие ДНК-связывающую молекулу/домен, которая(ый) специфически связывается с целевым сайтом в любом представляющем интерес гене или локусе. Любая(ой) ДНК-связывающая(ий) молекула/домен может быть использован(а) в композициях и способах согласно описанию в настоящем документе, в том числе, но не ограничиваясь перечисленным, ДНК-связывающий домен с цинковыми пальцами, ДНК-связывающий домен TALE, ДНК-связывающая часть CRISPR/нуклеазы Cas (направляющие или онРНК) или ДНК-связывающий домен из мегануклеазы.[0104] This document describes compositions containing a DNA-binding molecule/domain that specifically binds to a target site at any gene or locus of interest. Any DNA binding molecule/domain may be used in the compositions and methods as described herein, including, but not limited to, zinc finger DNA binding domain, DNA binding domain TALE, DNA-binding portion of CRISPR/Cas nuclease (guides or sRNA) or DNA-binding domain from meganuclease.
[0105] Согласно некоторым вариантам реализации указанный ДНК-связывающий домен содержит белок с цинковыми пальцами. Предпочтительно, указанный белок с цинковыми пальцами не встречается в природе, в том смысле, что он сконструирован для связывания с выбранным целевым сайтом.См., например, источники: Beerliet al. (2002)Nature Biotechnol. 20:135-141; Paboet al. (2001)Ann. Rev. Biochem. 70:313-340; Isalanet al. (2001)Nature Biotechnol. 19:656-660; Segalet al. (2001)Curr. Opin. Biotechnol. 12:632-637; Chooet al. (2000)Curr. Opin. Struct. Biol. 10:411-416; патенты США №6,453,242; №6,534,261; №6,599,692; №6,503,717; №6,689,558; №7,030,215; №6,794,136; №7,067,317; №7,262,054; №7,070,934; №7,361,635; №7,253,273; и патентные публикации США №2005/0064474; №2007/0218528; №2005/0267061, каждый из которых включен в настоящий документ полностью посредством ссылки. Согласно некоторым вариантам реализации указанный ДНК-связывающий домен содержит белок с цинковыми пальцами, описанный в патентной публикации США №2012/0060230 (например,втаблице 1), включенном в настоящий документ полностью посредством ссылки.[0105] In some embodiments, said DNA binding domain comprises a zinc finger protein. Preferably, said zinc finger protein is non-naturally occurring, in the sense that it is designed to bind to the selected target site.See for example, sources: Beerliet al. (2002)nature biotechnol. 20:135-141; Paboet al. (2001)Ann. Rev. Biochem. 70:313-340; Isalanet al. (2001)nature biotechnol. 19:656-660; Segalet al. (2001)Curr. Opin. Biotechnol. 12:632-637; Chooet al. (2000)Curr. Opin. Struct. Biol. 10:411-416; US Pat. Nos. 6,453,242; #6,534,261; #6,599,692; No. 6,503,717; No. 6,689,558; No. 7,030,215; No. 6,794,136; No. 7,067,317; No. 7,262,054; No. 7,070,934; No. 7,361,635; No. 7,253,273; and US Patent Publications No. 2005/0064474; No. 2007/0218528; No. 2005/0267061, each of which is incorporated herein in its entirety by reference. In some embodiments, said DNA binding domain comprises the zinc finger protein described in US Patent Publication No. 2012/0060230 (for example,inTable 1), incorporated herein in its entirety by reference.
[0106] Сконструированный связывающий домен с цинковыми пальцами может обладать новой специфичностью связывания по сравнению с встречающимся в природе белком с цинковыми пальцами. Способы конструирования включают, не ограничиваясь перечисленными, рациональный дизайн и различные типы отбора. Рациональный дизайн включает, например, использование баз данных, содержащих триплетные (или квадруплетные) последовательности нуклеотидов и индивидуальные последовательности аминокислот цинковых пальцев, где каждая триплетная или квадруплетная последовательность нуклеотидов ассоциирована с одной или более последовательностей аминокислот цинковых пальцев, который связывают конкретный триплетную или квадруплетную последовательность. См., например, патенты США 6,453,242 и 6,534,261, полностью включенные посредством ссылки в настоящий документ.[0106] The engineered zinc finger binding domain may have novel binding specificity compared to a naturally occurring zinc finger protein. Design methods include, but are not limited to, rational design and various types of selection. Rational design includes, for example, the use of databases containing triplet (or quadruplet) nucleotide sequences and individual zinc finger amino acid sequences, where each triplet or quadruplet nucleotide sequence is associated with one or more zinc finger amino acid sequences that bind a particular triplet or quadruplet sequence. See, for example, US Pat. Nos. 6,453,242 and 6,534,261, incorporated herein by reference in their entirety.
[0107] Примеры способов выбора, в том числе с применением фагового дисплея и двухгибридных систем, описаны в патентах США 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; и 6,242,568; а также WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 и GB 2,338,237. Кроме того, повышение специфичности связывания для связывающих доменов с цинковыми пальцами было описано, например, в патенте США №6,794,136.[0107] Examples of selection methods, including using phage display and two-hybrid systems, are described in US patents 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; and 6,242,568; as well as WO 98/37186; W098/53057; WO00/27878; WO 01/88197 and GB 2,338,237. In addition, increased binding specificity for zinc finger binding domains has been described, for example, in US Pat. No. 6,794,136.
[0108] Кроме того, согласно описанию в указанном и других источниках, домены с цинковыми пальцами и/или белки с множеством цинковых пальцев могут быть соединены друг с другом с применением любых подходящих линкерных последовательностей, в том числе, например, линкеров длиной 5 или более аминокислот. См. также примеры линкерных последовательностей длиной 6 или более аминокислот в патентах США №6,479,626; №6,903,185; и №7,153,949. Белки, описанные в настоящем документе, могут содержать любую комбинацию подходящих линкеров между индивидуальными цинковыми пальцами указанного белка. Кроме того, повышение специфичности связывания для связывающих доменов с цинковыми пальцами было описано, например, в патенте США №6,794,136.[0108] In addition, as described in this and other references, zinc finger domains and/or multiple zinc finger proteins can be connected to each other using any suitable linker sequences, including, for example, linkers of
[0109] Выбор целевого сайта; ZFP и способы дизайна и конструирования гибридных белков (и кодирующих их полинуклеотидов) известны специалистам в данной области техники и подробно описаны в патентах США №6,140,081; №5,789,538; №6,453,242; №6,534,261; №5,925,523; №6,007,988; №6,013,453; №6,200,759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970 WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 и WO 03/016496.[0109] Selecting a target site; ZFPs and methods for designing and constructing fusion proteins (and the polynucleotides encoding them) are known to those skilled in the art and are detailed in US Pat. Nos. 6,140,081; No. 5,789,538; No. 6,453,242; #6,534,261; No. 5,925,523; No. 6,007,988; No. 6,013,453; No. 6,200,759; WO 95/19431; W096/06166; W098/53057; W098/54311; WO00/27878; WO 01/60970 WO 01/88197; WO 02/099084; W098/53058; W098/53059; W098/53060; WO 02/016536 and WO 03/016496.
[0110] Кроме того, согласно описанию в указанном и других источниках, домены с цинковыми пальцами и/или белки с множеством цинковых пальцев могут быть соединены друг с другом с применением любых подходящих линкерных последовательностей, в том числе например, линкеров длиной 5 или более аминокислот. См. также примеры линкерных последовательностей длиной 6 или более аминокислот в патентах США №6,479,626; №6,903,185; и №7,153,949. Описанные в настоящем документе белки могут включать любую комбинацию подходящих линкеров между индивидуальными цинковыми пальцами указанного белка.[0110] In addition, as described in this and other references, zinc finger domains and/or multiple zinc finger proteins can be connected to each other using any suitable linker sequences, including, for example, linkers of 5 or more amino acids in length. . See also examples of linker sequences of 6 or more amino acids in US Pat. Nos. 6,479,626; No. 6,903,185; and #7,153,949. The proteins described herein may include any combination of suitable linkers between the individual zinc fingers of said protein.
[0111] Обычно ZFP включают по меньшей мере три пальца. Определенные ZFP включают четыре, пять или шесть пальцев. ZFP, которые включают три пальца, как правило распознают целевой сайт, который включает 9 или 10 нуклеотидов; ZFP, которые включают четыре пальца, как правило, распознают целевой сайт, который включает от 12 до 14 нуклеотидов; тогда как ZFP, содержащие шесть пальцев, способен распознавать целевые сайты, которые включают от 18 до 21 нуклеотидов. ZFP могут также представлять собой гибридные белки, которые включают один или более регуляторных доменов, которые могут представлять собой домены активации или репрессии транскрипции.[0111] Typically, ZFPs include at least three fingers. Certain ZFPs include four, five, or six fingers. ZFPs that include three fingers typically recognize a target site that is 9 or 10 nucleotides long; ZFPs that include four fingers typically recognize a target site that is 12 to 14 nucleotides long; while ZFP containing six fingers is able to recognize target sites that include 18 to 21 nucleotides. ZFPs may also be fusion proteins that include one or more regulatory domains, which may be transcriptional activation or repression domains.
[0112] Согласно некоторым вариантам реализации указанный ДНК-связывающий домен может происходить из нуклеазы. Например, известны последовательности распознавания хоуминг-эндонуклеазами и мегануклеазами, такими как I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII и I-TevIII. См. также патент США №5,420,032; патент США №6,833,252; Belfortet al. (1997)Nucleic Acids Res.25:3379-3388; Dujonet al. (1989)Gene 82:115-118; Perleret al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996)Trends Genet. 12:224-228; Gimbleet al. (1996)J. Mol. Biol. 263:163-180; Argastet al. (1998)J. Mol. Biol. 280:345-353 и каталог New England Biolabs. Кроме того, ДНК-связывающая специфичность хоуминг-эндонуклеаз и мегануклеаз может быть сконструирована для связывания не встречающегося в природе целевого сайта.См., например, Chevalieret al. (2002)Molec. Cell 10:895-905; Epinatet al. (2003)Nucleic Acids Res.31:2952-2962; Ashworthet al. (2006)Nature 441:656-659; Paqueset al. (2007)Current Gene Therapy7:49-66; патентную публикацию США №20070117128.[0112] In some embodiments, said DNA-binding domain may be derived from a nuclease. For example, recognition sequences by homing endonucleases and meganucleases are known, such as I-Sce I, I-Ceu I,PI -Psp I, PI-Sce , I-Sce IV, I-Csm I, I-Pan I, I-Sce II, I-Ppo I, I-Sce III, I-Cre I, I-Tev I, I-Tev II and I-Tev III. See also U.S. Patent No. 5,420,032; US Pat. No. 6,833,252; Belfortet al. (1997)Nucleic Acids Res. 25:3379-3388; Dujonet al. (1989)Gene 82:115-118; Perleret al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996)Trends Genet. 12:224-228; Gimbleet al . (1996)J. Mol. Biol. 263:163-180; Argastet al. (1998)J. Mol. Biol. 280:345-353 and the New England Biolabs catalog. In addition, the DNA binding specificity of homing endonucleases and meganucleases can be engineered to bind to an unnatural target site.See, for example , Chevalieret al. (2002)Molec. Cell 10:895-905; Epinatet al. (2003)Nucleic Acids Res. 31:2952-2962; Ashworthet al. (2006)Nature 441:656-659; Paqueset al. (2007)Current Gene Therapy 7:49-66; U.S. Patent Publication No. 20070117128.
[0113] Согласно некоторым вариантам реализации белок с цинковыми пальцами, используемый с мутантными доменами расщепления, описанными в настоящем документе, содержит одну или более мутаций (замен, делеций и/или инсерций) в областях остова (например,области вне спиральной области распознавания размером 7 аминокислот, пронумерованных от -1 до 6), например, в одном или более из положений -14, -9 и/или -5 (см., например, Фиг. 5A). Остаток молекулы дикого типа в одном или более указанных положениях может быть делетирован, заменен на любой остаток аминокислоты и/или включает один или более дополнительных остатков. Согласно некоторым вариантам реализации Arg (R) в положении -5 заменяют на Tyr (Y), Asp (N), Glu (E), Leu (L), Gln (Q) или Ala (A). Согласно другим вариантам реализации Arg (R) в положении (-9) заменен на Ser (S), Asp (N) или Glu (E). Согласно дополнительным вариантам реализации Arg (R) в положении (-14) заменен на Ser (S) или Gln (Q). Согласно другим вариантам реализации гибридные полипептиды могут содержать мутации в ДНК-связывающем домене с цинковыми пальцами, при этом аминокислоты в положениях (-5), (-9) и/или (-14) заменяют на любые из вышеперечисленных аминокислот в любой комбинации.[0113] In some embodiments, the zinc finger protein used with the mutant cleavage domains described herein contains one or more mutations (substitutions, deletions, and/or insertions) in regions of the backbone (e.g., regions outside the helical recognition region of
[0114] Согласно другим вариантам реализации ДНК-связывающий домен содержит сконструированный домен из подобного активатору транскрипции (TAL) эффектора (TALE), аналогичный происходящим из патогенов растенийXanthomonas (см. Bochet al, (2009)Science 326: 1509-1512; и Moscou and Bogdanove, (2009)Science326: 1501) и Ralstonia (см. Heueret al (2007)Applied and Environmental Microbiology 73(13): 4379-4384); патентные публикации США №20110301073 и №20110145940. Патогенные бактерии растений из родаXanthomonas, как известно, вызывают множество заболеваний важных сельскохозяйственных растений. ПатогенностьXanthomonas зависит от консервативной системы секреции III типа (T3S), которая вводит более чем 25 разных эффекторных белков в растительную клетку. Среди указанных введенных белков - подобные активаторам транскрипции эффекторы (TALE), имитирующие активаторы транскрипции растений и манипулирующие транскриптомом растений (см. Kayet al (2007)Science318:648-651). Указанные белки содержат ДНК-связывающий домен и домен активации транскрипции. Один из наиболее хорошо описанных TALE представлен AvrBs3 изXanthomonas campestgrispv.Vesicatoria (см. Bonaset al (1989)Mol Gen Genet 218: 127-136 и WO 2010079430). TALE содержат расположенный по центру домен из тандемных повторов, где каждый повтор содержит приблизительно 34 аминокислот, играющих ключевую роль в ДНК-связывающей специфичности указанных белков. Кроме того, они содержат последовательность ядерной локализации и кислый домен активации транскрипции (см. обзор в источнике: Schornack S,et al (2006)J Plant Physiol 163(3): 256-272). Кроме того, у фитопатогенных бактерийRalstonia solanacearum, в штамме GMI1000 биовара 1 и в штамме RS1000 биовара 4R. solanacearum, обнаружены два гена, гомологичных семейству AvrBs3Xanthomonas, называемые brg11 и hpx17 (см. Heueret al (2007)Appl and Envir Micro73(13): 4379-4384). Указанные гены на 98,9% идентичны друг другу по последовательности нуклеотидов, но различаются делецией 1575 пар оснований в домене с повторами hpx17. Однако оба генных продукта обладают менее чем 40% идентичностью последовательностей семейству белков AvrBs3Xanthomonas.[0114] In other embodiments, the DNA binding domain comprises an engineered domain from a transcription activator (TAL)-like effector (TALE) similar to those derived from plant pathogensXanthomonas (see Bochet al , (2009)Science 326: 1509-1512; and Moscou and Bogdanove, (2009)Science 326: 1501) and Ralstonia (see Heueret al (2007)Applied and Environmental Microbiology 73(13): 4379-4384); U.S. Patent Publications No. 20110301073 and No. 20110145940. Plant pathogenic bacteria from the genusXanthomonas are known to cause many diseases in important agricultural plants. The pathogenicity ofXanthomonas depends on a conserved type III secretion system (T3S), which introduces more than 25 different effector proteins into the plant cell. Among these introduced proteins are transcription activator-like effectors (TALE) mimicking plant transcription activators and manipulating the plant transcriptome (see Kayet al (2007)Science 318:648-651). These proteins contain a DNA-binding domain and a transcriptional activation domain. One of the best described TALEs is AvrBs3 fromXanthomonas campestgris pv.Vesicatoria (see Bonaset al (1989)Mol Gen Genet 218: 127-136 and WO 2010079430). TALE contain a centrally located domain of tandem repeats, where each repeat contains approximately 34 amino acids, which play a key role in the DNA-binding specificity of these proteins. In addition, they contain a nuclear localization sequence and an acidic transcription activation domain (for a review see Schornack S,et al (2006)J Plant Physiol 163(3): 256-272). In addition, the phytopathogenic bacteriaRalstonia solanacearum ,
[0115] Специфичность указанных TAL-эффекторов зависит от последовательностей, обнаруживаемых в тандемных повторах. Повторяющаяся последовательность содержит приблизительно 102 пар оснований, и повторы, как правило, на 91-100% гомологичны друг другу (Bonas et al, там же). Полиморфизм повторов обычно локализован в положениях 12 и 13, и, по-видимому, имеется взаимно однозначное соответствие между идентичностью гипервариабельных двойных остатков (двойной остаток вариабельного повтора, или область RVD) в положениях 12 и 13, и идентичностью непрерывных нуклеотидов в целевой последовательности TAL-эффектора (см. Moscou and Bogdanove, (2009)Science 326:1501 и Bochet al (2009)Science 326:1509-1512). В условиях эксперимента было определено, что в естественном коде для распознавания ДНК указанных TAL-эффекторов последовательность HD в положениях 12 и 13 (двойной остаток вариабельного повтора, или RVD) приводит к связыванию с цитозином (C), NG связывается с T, NI с A, C, G или T, NN связывается с A или G, и ING связывается с T. Указанные ДНК-связывающие повторы были собраны в белки с новыми комбинациями и числом повторов, с получением искусственных транскрипционных факторов, способных взаимодействовать с новыми последовательностями и активировать экспрессию неэндогенного репортерного гена в клетках растений (Bochet al, там же). Сконструированные белки TAL соединяли с полудоменом расщепленияFokI, получая гибридизованы с нуклеазным доменом TAL-эффектор (TALEN), в том числе TALEN с атипичными RVD.См., например,патент США №8,586,526.[0115] The specificity of these TAL effectors depends on the sequences found in the tandem repeats. The repeat sequence contains approximately 102 base pairs, and the repeats are typically 91-100% homologous to each other (Bonaset al, ibid.). The repeat polymorphism is typically located at
[0116] Согласно некоторым вариантам реализации TALEN содержит домен расщепления или полудомен расщепления эндонуклеазы (например, FokI). Согласно другим вариантам реализации TALE-нуклеаза представляет собой мега-TAL. Указанные мега-TAL-нуклеазы представляют собой гибридные белки, содержащие ДНК-связывающий домен TALE и домен расщепления мегануклеазы. Домен расщепления мегануклеазы активен в форме мономера и не требует димеризации для активности. (См. Boisselet al., (2013)Nucl Acid Res: 1-13, doi: 10.1093/nar/gkt1224).[0116] In some embodiments, TALEN contains a cleavage domain or a cleavage half-domain of an endonuclease (eg, Fok I). In other embodiments, the TALE nuclease is mega-TAL. These mega-TAL nucleases are fusion proteins containing the TALE DNA-binding domain and the meganuclease cleavage domain. The meganuclease cleavage domain is active in monomer form and does not require dimerization to be active. (See Boisselet al ., (2013)Nucl Acid Res : 1-13, doi: 10.1093/nar/gkt1224).
[0117] Согласно другим дополнительным вариантам реализации нуклеаза содержит компактный TALEN. Это одноцепочечные гибридные белки, где ДНК-связывающий домен TALE соединен с нуклеазным доменом TevI. Указанный гибридный белок может либо функционировать в качестве никазы с локализацией, определяемой областью TALE, либо может создавать двуцепочечный разрыв, в зависимости от того, где локализован ДНК-связывающий домен TALE относительно нуклеазного домена TevI (см. Beurdeleyet al (2013)Nat Comm: 1-8 DOI: 10.1038/ncomms2782). Кроме того, нуклеазный домен может также проявлять ДНК-связывающие функции. Любые TALEN могут применяться в комбинации с дополнительными TALEN (например,содним или более TALEN (cTALEN илиFokI-TALEN) с одним или более мега-TALE.[0117] In other additional embodiments, the nuclease contains a compact TALEN. These are single-stranded fusion proteins where the TALE DNA-binding domain is linked to the TevI nuclease domain. This fusion protein can either function as a nickase with a localization defined by the TALE region, or can create a double-strand break, depending on where the TALE DNA-binding domain is located relative to the TevI nuclease domain (see Beurdeleyet al (2013)NatComm: 1-8 DOI: 10.1038/ncomms2782). In addition, the nuclease domain may also exhibit DNA-binding functions. Any TALEN can be used in combination with additional TALENs (for example,Withone or more TALEN (cTALEN orFoxI-TALEN) with one or more mega-TALE.
[0118] Кроме того, согласно описанию в указанных и других источниках, домены с цинковыми пальцами и/или белки с несколькими цинковыми пальцами или TALE могут быть соединены между собой с применением любых подходящих линкерных последовательностей, в том числе, например, линкеров длиной 5 или более аминокислот. См. также примеры линкерных последовательностей длиной 6 или более аминокислот в патентах США №6,479,626; №6,903,185; и №7,153,949. Описанные в настоящем документе белки могут содержать любую комбинацию подходящих линкеров между индивидуальными цинковыми пальцами белка. Кроме того, повышение специфичности связывания для связывающих доменов с цинковыми пальцами было описано, например, в патенте США №6,794,136. Согласно некоторым вариантам реализации ДНК-связывающий домен входит в состав системы CRISPR/нуклеаза Cas, включающей одиночную направляющую РНК (онРНК) ДНК-связывающую молекулу, которая связывается с ДНК.См., например,патент США №8,697,359 и патентные публикации США №20150056705 и №20150159172. Локус CRISPR (кластеризованные регулярно распределенные короткие палиндромные повторы), который кодирует РНК компоненты указанной системы, и локус Cas (CRISPR-ассоциированный), который кодирует белки (Jansenet al., 2002.Mol. Microbiol. 43: 1565-1575; Makarovaet al., 2002.Nucleic Acids Res.30: 482-496; Makarovaet al., 2006.Biol. Direct 1: 7; Haftet al., 2005.PLoS Comput. Biol. 1: e60) составляют последовательности генов системы CRISPR/нуклеаза Cas. Локусы CRISPR хозяев-микроорганизмов содержат комбинацию CRISPR-ассоциированных (Cas) генов, а также некодирующие РНК-элементы, способные к программированию специфичности опосредованного CRISPR расщепления нуклеиновых кислот.[0118] In addition, as described in these and other references, zinc finger domains and/or multiple zinc finger proteins or TALE can be linked together using any suitable linker sequences, including, for example, linkers of
[0119] Согласно некоторым вариантам реализации указанный ДНК-связывающий домен входит в состав системы TtAgo (см. Swartset al,там же; Shenget al,там же). У эукариот сайленсинг генов опосредован белками семейства Argonaute (Ago). Согласно указанной парадигме Ago связан с малыми (19-31 нуклеотид) РНК. Указанный сайленсирующий комплекс белка и РНК распознает целевые РНК посредством спаривания оснований по Уотсону-Крику между малой РНК и мишенью, и эндонуклеолитически расщепляет целевую РНК (Vogel (2014)Science 344:972-973). Напротив, прокариотические белки Ago связываются с малыми одноцепочечными фрагментами ДНК; их функция, предположительно, заключается в детекции и удалении чужеродной (часто вирусной) ДНК (Yuanet al., (2005)Mol. Cell 19, 405; Olovnikov,et al. (2013)Mol. Cell 51, 594; Swartset al., там же). Примеры прокариотических белков Ago включают белки изAquifex aeolicus,Rhodobacter sphaeroides иThermusthermophilus.[0119] In some embodiments, said DNA-binding domain is part of the TtAgo system (see Swartset al ,ibid ; Shenget al ,ibid ). In eukaryotes, gene silencing is mediated by proteins of the Argonaute (Ago) family. According to this paradigm, Ago is associated with small (19-31 nucleotides) RNA. This protein-RNA silencer recognizes target RNAs through Watson-Crick base pairing between small RNA and target, and cleaves the target RNA endonucleolytically (Vogel (2014)Science 344:972-973). In contrast, prokaryotic Ago proteins bind to small single-stranded DNA fragments; their function is presumably to detect and remove foreign (often viral) DNA (Yuanet al ., (2005)Mol.
[0120] Один из наиболее хорошо охарактеризованных прокариотических белков Ago представлен белком изT. thermophilus (TtAgo; Swartset al.там же). TtAgo связывается с одноцепочечными фрагментами ДНК длиной 15 нуклеотидов или 13-25 нуклеотидов с 5' фосфатными группами. Указанная «направляющая ДНК», связанная TtAgo, служит для направления комплекса белок-ДНК для связывания комплементарной по Уотсону-Крику последовательности ДНК в сторонней молекуле ДНК. После того как информация о последовательности в указанных направляющих ДНК обеспечила идентификацию целевой ДНК, комплекс TtAgo/направляющая ДНК расщепляет целевую ДНК. Такой механизм также поддерживается структурой комплекса TtAgo/направляющая ДНК, когда он связан с целевой ДНК (G. Shenget al., там же). Ago изRhodobacter sphaeroides(RsAgo) обладает аналогичным свойствами (Olivnikovet al., там же).[0120] One of the best characterized prokaryotic Ago proteins is fromT. thermophilus (TtAgo; Swartset al .ibid. ). TtAgo binds to single-stranded DNA fragments of 15 nucleotides or 13-25 nucleotides with 5' phosphate groups. This TtAgo-linked "guide DNA" serves to direct the protein-DNA complex to bind the Watson-Crick complementary DNA sequence in a foreign DNA molecule. Once the sequence information in these guide DNAs has provided identification of the target DNA, the TtAgo/guide DNA complex cleaves the target DNA. Such a mechanism is also supported by the structure of the TtAgo/guide DNA complex when bound to the target DNA (G. Shenget al., ibid. ). Ago fromRhodobacter sphaeroides (RsAgo) has similar properties (Olivnikovet al. ,ibid. ).
[0121] Экзогенными направляющими ДНК произвольной последовательности ДНК может быть нагружен белок TtAgo (Swartset al. там же.). Поскольку специфичностью расщепления TtAgo управляет направляющая ДНК, комплекс TtAgo/ДНК, образованный с участием экзогенной выбранной исследователем направляющей ДНК, соответственно, направляет целевое расщепление ДНК TtAgo на целевую ДНК, комплементарную выбранной исследователем. Таким образом может быть создан нацеленный двуцепочечный разрыв в ДНК. Применение системы TtAgo/направляющая ДНК (или ортологичных систем Ago/направляющая ДНК из других организмов) позволяет обеспечить нацеленное расщепление геномной ДНК в клетках. Такое расщепление может быть одно- или двуцепочечным. Для расщепления геномной ДНК млекопитающих предпочтительно применение варианта TtAgo, кодон-оптимизированного для экспрессии в клетках млекопитающих. Кроме того, может быть предпочтительной обработка клетки комплексом TtAgo-ДНК, образованнымin vitro, в котором белок TtAgo гибридизован с проникающим в клетки пептидом. Кроме того, может быть предпочтительным применение варианта белка TtAgo, который был изменен посредством мутагенеза, обеспечивающего повышенную активность при 37°C. Ago/РНК-опосредованное расщепление ДНК может применяться для влияния на множество исходов, в том числе нокаута генов, нацеленного добавления генов, коррекции генов, нацеленной делеции генов с применением стандартных в данной области техники методик, использующих разрывы ДНК.[0121] Exogenous DNA guides of an arbitrary DNA sequence can be loaded with the TtAgo protein (Swartset al. ibid. ). Since the specificity of TtAgo cleavage is controlled by the guide DNA, the TtAgo/DNA complex formed with the exogenous examiner-selected guide DNA accordingly directs the targeted TtAgo DNA cleavage to a target DNA complementary to the examiner-selected one. Thus, a targeted double-strand break in DNA can be created. The use of the TtAgo/guide DNA system (or orthologous Ago/guide DNA systems from other organisms) allows targeted cleavage of genomic DNA in cells. This cleavage may be single or double stranded. For cleavage of mammalian genomic DNA, it is preferable to use a TtAgo variant codon-optimized for expression in mammalian cells. In addition, it may be preferable to treat the cell with anin vitro TtAgo-DNA complex in which the TtAgo protein is hybridized to a cell-penetrating peptide. In addition, it may be preferable to use a TtAgo protein variant that has been altered by mutagenesis to provide increased activity at 37°C. Ago/RNA-mediated DNA cleavage can be used to influence a variety of outcomes, including gene knockout, targeted gene addition, gene editing, targeted gene deletion using standard DNA break techniques in the art.
[0122] Соответственно, может применяться любая ДНК-связывающая молекула/любой ДНК-связывающий домен.[0122] Accordingly, any DNA binding molecule/any DNA binding domain can be used.
Гибридные молекулыhybrid molecules
[0123] Также предложены гибридные молекулы, содержащие ДНК-связывающие домены (например, ZFP или TALE, компоненты CRISPR/Cas, такие как одиночная направляющая РНК) согласно описанию в настоящем документе, и гетерологичный регуляторный (функциональный) домен (или его функциональный фрагмент). Распространенные домены включают, например, домены транскрипционных факторов (активаторов, репрессоров, коактиваторов, корепрессоров), сайленсеры, онкогены (например, представители семейства myc, jun, fos, myb, max, mad, rel, ets, bcl, myb, mos и т.п.); ферменты репарации ДНК и ассоциированные с ними факторы и модификаторы; ферменты перестройки ДНК и ассоциированные с ними факторы и модификаторы; ассоциированные с хроматином белки и их модификаторы (например, киназы, ацетилазы и деацетилазы); а также модифицирующие ДНК ферменты (например, метилтрансферазы, топоизомеразы, геликазы, лигазы, киназы, фосфатазы, полимеразы, эндонуклеазы) и ассоциированные с ними факторы и модификаторы. См. подробное описание гибридных ДНК-связывающих доменов и нуклеазных доменов расщепления в патентных публикациях США №20050064474; №20060188987 и №2007/0218528, включенных в настоящий документ полностью посредством ссылки.[0123] Also provided are hybrid molecules containing DNA-binding domains (e.g. , ZFP or TALE, CRISPR/Cas components such as a single guide RNA) as described herein, and a heterologous regulatory (functional) domain (or a functional fragment thereof) . Common domains include, for example, transcription factor domains (activators, repressors, coactivators, corepressors), silencers, oncogenes (e.g. myc, jun, fos, myb, max, mad, rel, ets, bcl, myb, mos, etc.) .P.); DNA repair enzymes and their associated factors and modifiers; DNA rearrangement enzymes and associated factors and modifiers; chromatin-associated proteins and their modifiers (eg kinases, acetylases and deacetylases); as well as DNA-modifying enzymes (eg, methyltransferases, topoisomerases, helicases, ligases, kinases, phosphatases, polymerases, endonucleases) and their associated factors and modifiers. See U.S. Patent Publications No. 20050064474 for a detailed description of hybrid DNA binding domains and nuclease cleavage domains; No. 20060188987 and No. 2007/0218528, incorporated herein in their entirety by reference.
[0124] Подходящие домены для обеспечения активации включают домен активации HSV VP16 (см., например, Hagmannet al., J. Virol. 71, 5952-5962 (1997)), ядерные рецепторы гормонов (см., например, Torchiaet al., Curr. Opin. Cell. Biol. 10:373-383 (1998)); субъединицу p65 ядерного фактора каппа-B (Bitko & Barik,J. Virol. 72:5610-5618 (1998) и Doyle & Hunt,Neuroreport 8:2937-2942 (1997)); Liuet al., Cancer Gene Ther. 5:3-28 (1998)); или искусственные химерные функциональные домены, например, VP64 (Beerliet al., (1998)Proc. Natl. Acad. Sci. USA 95:14623-33); и дегрон (Molinariet al., (1999)EMBO J. 18, 6439-6447). Дополнительные примеры доменов активации включают Oct 1, Oct-2A, Sp1, AP-2 и CTF1 (Seipelet al., EMBO J. 11, 4961-4968 (1992), а также p300, CBP, PCAF, SRC1 PvALF, AtHD2A и ERF-2. См., например, Robyret al. (2000)Mol. Endocrinol. 14:329-347; Collingwoodet al. (1999)J. Mol. Endocrinol. 23:255-275; Leoet al. (2000)Gene 245:1-11; Manteuffel-Cymborowska (1999)Acta Biochim. Pol. 46:77-89; McKennaet al. (1999)J. Steroid Biochem. Mol. Biol. 69:3-12; Maliket al. (2000)Trends Biochem. Sci. 25:277-283; и Lemonet al. (1999)Curr. Opin. Genet. Dev. 9:499-504. Дополнительные примеры доменов активации включают, не ограничиваясь перечисленными, OsGAI, HALF-1, C1, AP1, ARF-5, -6, -7 и -8, CPRF1, CPRF4, MYC-RP/GP и TRAB1. См., например, Ogawaet al. (2000)Gene 245:21-29; Okanamiet al. (1996)Genes Cells 1:87-99; Goffet al. (1991)Genes Dev. 5:298-309; Choet al. (1999)Plant Mol. Biol. 40:419-429; Ulmasonet al. (1999)Proc. Natl. Acad. Sci. USA 96:5844-5849; Sprenger-Hausselset al. (2000)Plant J. 22:1-8; Gonget al. (1999)Plant Mol. Biol. 41:33-44; и Hoboet al. (1999)Proc. Natl. Acad. Sci. USA 96:15,348-15,353.[0124] Suitable domains for providing activation include the HSV VP16 activation domain (see, for example, Hagmannet al., J. Virol . 71, 5952-5962 (1997)), nuclear hormone receptors (see, for example, Torchiaet al ., Curr Opin Cell Biol 10:373-383 (1998)); nuclear factor kappa-B p65 subunit (Bitko & Barik,J. Virol . 72:5610-5618 (1998) and Doyle & Hunt,Neuroreport 8:2937-2942 (1997)); Liuet al., Cancer Gene Ther . 5:3-28 (1998)); or artificial chimeric functional domains, for example VP64 (Beerliet al ., (1998)Proc. Natl. Acad. Sci. USA 95:14623-33); and degron (Molinariet al ., (1999)EMBO J. 18, 6439-6447). Additional examples of activation domains include Oct 1, Oct-2A, Sp1, AP-2 and CTF1 (Seipelet al., EMBO J . 11, 4961-4968 (1992) as well as p300, CBP, PCAF, SRC1 PvALF, AtHD2A and ERF-2 See, for example, Robyret al (2000)Mol Endocrinol 14:329-347 Collingwoodet al (1999)J Mol Endocrinol 23:255-275 Leoet al ( 2000)Gene 245:1-11 Manteuffel-Cymborowska (1999)Acta Biochim Pol 46:77-89 McKennaet al (1999)J Steroid Biochem Mol Biol 69:3-12 Maliket al (2000)Trends Biochem Sci 25:277-283 and Lemonet al (1999)Curr Opin Genet Dev 9:499-504 Additional examples of activation domains include, but are not limited to, OsGAI, HALF-1, C1, AP1, ARF-5, -6, -7 and -8, CPRF1, CPRF4, MYC-RP/GP and TRAB1 See for example Ogawaet al (2000)Gene 245:21- 29 Okanamiet al (1996)Genes Cells 1:87-99 Goffet al (1991)Genes Dev 5:298-309 Choet al (1999)Plant Mol Biol 40:419-429 ; Ulmasonet al . (1999)Proc Natl Acad Sci USA 96:5844-5849; Sprenger- Hausselset al . (2000)Plant J. 22:1-8; Gonget al. (1999)Plant Mol. biol . 41:33-44; and Hoboet al . (1999)Proc. Natl. Acad. sci. USA 96:15,348-15,353.
[0125] Специалистам в данной области техники будет ясно, что при образовании гибридного белка (или кодирующей его нуклеиновой кислоты) между ДНК-связывающим доменом и функциональным доменом для применения в качестве функционального домена подходит либо домен активации, либо молекула, которая взаимодействует с доменом активации. По существу любая молекула, способная к рекрутингу активирующего комплекса и/или активирующей активности (такой как, например, ацетилирование гистонов) в отношении целевого гена, подходит для применения в качестве активирующего домена гибридного белка. Инсуляторные домены, домены локализации, и белки ремоделирования хроматина, такие как ISWI-содержащие домены, и/или содержащие метил-связывающие домены белки, подходящие для применения в качестве функциональных доменов в гибридных молекулах, описаны, например, в патентных публикациях США 2002/0115215 и 2003/0082552, а также в WO 02/44376.[0125] Those skilled in the art will appreciate that when a fusion protein (or nucleic acid encoding it) is formed between a DNA binding domain and a functional domain, either an activation domain or a molecule that interacts with an activation domain is suitable for use as a functional domain. . Substantially any molecule capable of recruiting an activating complex and/or activating activity (such as, for example, histone acetylation) to a target gene is suitable for use as the activating domain of the fusion protein. Insulator domains, localization domains, and chromatin remodeling proteins such as ISWI-containing domains and/or proteins containing methyl-binding domains suitable for use as functional domains in hybrid molecules are described, for example, in US Patent Publications 2002/0115215 and 2003/0082552 and also WO 02/44376.
[0126] Примеры репрессорных доменов включают, не ограничиваясь перечисленными, KRAB A/B, KOX, индуцируемый ТФР-бета ранний ген (TIEG), v-erbA, SID, MBD2, MBD3, представители семейства DNMT (например, DNMT1, DNMT3A, DNMT3B), Rb и MeCP2. См., например, Birdet al. (1999)Cell 99:451-454; Tyleret al. (1999)Cell 99:443-446; Knoepfleret al. (1999)Cell 99:447-450; и Robertsonet al. (2000)Nature Genet. 25:338-342. Дополнительные примеры репрессорных доменов включают, не ограничиваясь перечисленными, ROM2 и AtHD2A. См., например, Chemet al. (1996)Plant Cell 8:305-321; и Wuet al. (2000)Plant J. 22:19-27.[0126] Examples of repressor domains include, but are not limited to, KRAB A/B, KOX, TGF-beta inducible early gene (TIEG), v-erbA, SID, MBD2, MBD3, members of the DNMT family (e.g., DNMT1, DNMT3A, DNMT3B ), Rb and MeCP2. See, for example, Birdet al . (1999)Cell 99:451-454; Tyleret al . (1999)Cell 99:443-446; Knoepfleret al . (1999)Cell 99:447-450; and Robertsonet al . (2000)Nature Genet . 25:338-342. Additional examples of repressor domains include, but are not limited to, ROM2 and AtHD2A. See, for example, Chemet al . (1996)Plant Cell 8:305-321; and Wuet al . (2000)Plant J. 22:19-27.
[0127] Гибридные молекулы конструируют с применением способов клонирования и биохимической конъюгации, хорошо известных специалистам в данной области техники. Гибридные молекулы содержат ДНК-связывающий домен и функциональный домен (например, домен активации или репрессии транскрипции). Гибридные молекулы также необязательно содержат сигналы ядерной локализации (такие как, например, сигналы среднего T-антигена SV40) и эпитопные метки (такие как, например, FLAG и гемагглютинин). Гибридные белки (и кодирующие их нуклеиновые кислоты) получают путем дизайна таким образом, чтобы у всех гибридных компонентов сохранялась трансляционная рамка считывания.[0127] Fusion molecules are constructed using cloning and biochemical conjugation methods well known to those skilled in the art. Fusion molecules contain a DNA-binding domain and a functional domain (for example , a transcriptional activation or repression domain). The fusion molecules also optionally contain nuclear localization signals (such as, for example, SV40 mid-T antigen signals) and epitope tags (such as, for example, FLAG and hemagglutinin). Fusion proteins (and the nucleic acids encoding them) are produced by design so that all fusion components retain the translational reading frame.
[0128] Продукты слияния полипептидного компонента функционального домена (или его функциональным фрагментом) с одной стороны, и небелкового ДНК-связывающего домена (например, антибиотика, интеркалятора, связывающегося с малой бороздкой компонента, нуклеиновой кислоты) с другой стороны конструируют с применением способов биохимической конъюгации, известных специалистам в данной области техники. См., например, каталог Pierce Chemical Company (Рокфорд, Иллинойс). Были описаны способы и композиции для получения гибридизованого с полипептидом связывающегося с малой бороздкой компонента. Mappet al. (2000)Proc. Natl. Acad. Sci. USA 97:3930-3935. Кроме того, одиночная направляющая РНК системы CRISPR/Cas связывается с функциональными доменами с образованием активных регуляторов транскрипции и нуклеаз.[0128] Fusion products of a functional domain polypeptide component (or a functional fragment thereof) on the one hand and a non-protein DNA binding domain (e.g., antibiotic, intercalator, minor groove binding component, nucleic acid) on the other hand are constructed using biochemical conjugation methods known to those skilled in the art. See, for example, the catalog of the Pierce Chemical Company (Rockford, Illinois). Methods and compositions have been described for producing a minor groove-binding component hybridized to a polypeptide. Mappet al . (2000)Proc. Natl. Acad. sci. USA 97:3930-3935. In addition, the single guide RNA of the CRISPR/Cas system binds to functional domains to form active transcriptional regulators and nucleases.
[0129] Согласно некоторым вариантам реализации целевой сайт находится в доступной области клеточного хроматина. Доступные области могут быть определены согласно описанию, например, в патентах США №7,217,509 и №7,923,542. В тех случаях, когда целевой сайт не находится в доступной области клеточного хроматина, одна или более доступных областей могут быть получены согласно описанию в патентах США №7,785,792 и №8,071,370. Согласно дополнительным вариантам реализации ДНК-связывающий домен гибридной молекулы способен к связыванию с клеточным хроматином независимо от того, находится его целевой сайт в доступной области или нет. Например, такие ДНК-связывающие домены способны к связыванию с линкерной ДНК и/или нуклеосомной ДНК. Примеры указанного типа «пионерных» ДНК-связывающих доменов можно найти в определенных стероидных рецепторах и в ядерном факторе 3 гепатоцитов (HNF3) (Cordingleyet al. (1987)Cell 48:261-270; Pinaet al. (1990)Cell 60:719-731; и Cirilloet al. (1998)EMBO J. 17:244-254).[0129] In some embodiments, the target site is located in an accessible region of cellular chromatin. Accessible areas can be defined as described in, for example, US Pat. Nos. 7,217,509 and 7,923,542. In cases where the target site is not in an accessible region of the cellular chromatin, one or more accessible regions can be obtained as described in US Pat. Nos. 7,785,792 and 8,071,370. In additional embodiments, the DNA binding domain of the fusion molecule is capable of binding to cellular chromatin whether its target site is in an accessible region or not. For example, such DNA binding domains are capable of binding to linker DNA and/or nucleosomal DNA. Examples of this type of "pioneer" DNA binding domains can be found in certain steroid receptors and in hepatocyte nuclear factor 3 (HNF3) (Cordingleyet al . (1987)Cell 48:261-270; Pinaet al . (1990)Cell 60: 719-731 and Cirilloet al (1998)EMBO J 17:244-254).
[0130] Гибридная молекула может быть введена в состав вместе с фармацевтически приемлемым носителем, как известно специалистам в данной области техники. См., например, Remington’s Pharmaceutical Sciences, 17th ed., 1985; и патенты США №6,453,242 и №6,534,261.[0130] The hybrid molecule may be formulated with a pharmaceutically acceptable carrier, as is known to those skilled in the art. See, for example, Remington's Pharmaceutical Sciences, 17th ed., 1985; and US Pat. Nos. 6,453,242 and 6,534,261.
[0131] Функциональный компонент/домен гибридной молекулы может быть выбран из любых из множества разных компонентов, способных оказывать влияние на транскрипцию гена после того, как гибридная молекула связалась с целевой последовательностью посредством ее ДНК-связывающего домена. Таким образом, указанный функциональный компонент может включать, не ограничиваясь перечисленными, домены различных транскрипционных факторов, таких как активаторы, репрессоры, коактиваторы, корепрессоры и сайленсеры.[0131] The functional component/domain of the fusion molecule can be selected from any of a variety of different components capable of influencing gene transcription after the fusion molecule has bound to a target sequence via its DNA-binding domain. Thus, said functional component may include, but is not limited to, domains of various transcription factors such as activators, repressors, coactivators, corepressors, and silencers.
[0132] Дополнительные примеры функциональных доменов описаны, например, в патентах США №6,534,261 и №6,933,113.[0132] Additional examples of functional domains are described in, for example, US Pat. Nos. 6,534,261 and 6,933,113.
[0133] Могут также быть выбраны функциональные домены, регулируемые экзогенными малыми молекулами или лигандами. Например, может применяться технология RheoSwitch®, согласно которой функциональный домен переходит в активную конформацию только в присутствии внешнего лиганда RheoChem™ (см., например, US 20090136465). Соответственно, ZFP может быть функционально связана с поддающимся регуляции функциональным доменом, при этом итоговая активность ZFP-ТФ контролирует внешний лиганд.[0133] Functional domains regulated by exogenous small molecules or ligands can also be selected. For example, RheoSwitch® technology can be used, according to which the functional domain changes into an active conformation only in the presence of an external RheoChem™ ligand (see, for example, US 20090136465). Accordingly, ZFP can be operably linked to a regulable functional domain, with the resulting ZFP-TF activity controlled by an external ligand.
НуклеазыNucleases
[0134] Согласно некоторым вариантам реализации гибридный белок содержит ДНК-связывающий домен и домен расщепления (нуклеазный домен). Соответственно, модификация гена может быть достигнута с применением нуклеазы, например, сконструированной нуклеазы. Технология сконструированных нуклеаз основана на конструировании встречающихся в природе ДНК-связывающих белков. Например, было описано конструирование хоуминг-эндонуклеаз с индивидуализированной ДНК-связывающей специфичностью. Chameset al. (2005)Nucleic Acids Res 33(20):e178; Arnouldet al. (2006)J. Mol. Biol. 355:443-458. Кроме того, также было описано конструирование ZFP. См., например, патенты США №6,534,261; №6607882; №6824978; №6979539; №6933113; №7163824; и №7013219.[0134] In some embodiments, the fusion protein contains a DNA-binding domain and a cleavage domain (nuclease domain). Accordingly, gene modification can be achieved using a nuclease, such as an engineered nuclease. Engineered nuclease technology is based on the construction of naturally occurring DNA-binding proteins. For example, the construction of homing endonucleases with individualized DNA binding specificity has been described. Chameset al . (2005)Nucleic Acids Res 33(20):e178; Arnouldet al . (2006)J. Mol. biol . 355:443-458. In addition, the construction of ZFP has also been described. See, for example, US Pat. Nos. 6,534,261; No. 6607882; No. 6824978; No. 6979539; No. 6933113; No. 7163824; and No. 7013219.
[0135] Кроме того, ZFP и/или TALE сливали с нуклеазными доменами для получения ZFN и TALEN - функционального объекта, способного распознавать предусмотренную целевую нуклеиновую кислоту за счет сконструированного ДНК-связывающего домена (ZFP или TALE) и приводить к разрезанию ДНК возле сайта связывания ДНК за счет нуклеазной активности. См., например, Kimet al. (1996)Proc Nat'l Acad Sci USA 93(3):1156-1160. В последнее время такие нуклеазы применяли для модификации генома в различных организмах. См., например, патентные публикации США 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20060063231; и международную публикацию WO 07/014275.[0135] In addition, ZFP and/or TALE were fused to nuclease domains to produce ZFN and TALEN, a functional entity capable of recognizing the intended target nucleic acid by the engineered DNA binding domain (ZFP or TALE) and leading to DNA cleavage near the binding site DNA through nuclease activity. See, for example, Kimet al . (1996)Proc Nat'l Acad Sci USA 93(3):1156-1160. Recently, such nucleases have been used to modify the genome in various organisms. See, for example, US Patent Publications 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20060063231; and international publication WO 07/014275.
[0136] Соответственно, описанные в настоящем документе способы и композиции широко применимы и могут задействовать любую представляющую интерес нуклеазу. Неограничивающие примеры нуклеаз включают мегануклеазы, TALEN и нуклеазы с цинковыми пальцами. Указанная нуклеаза может содержать гетерологичные ДНК-связывающий домен и домен расщепления (например, нуклеазы с цинковыми пальцами; ДНК-связывающие домены мегануклеазы с гетерологичными доменами расщепления); или, как вариант, ДНК-связывающий домен встречающейся в природе нуклеазы может быть изменен таким образом, чтобы связываться с выбранным целевым сайтом (например, мегануклеаза, сконструированная таким образом, чтобы связываться с сайтом, отличным от когнатного сайта связывания).[0136] Accordingly, the methods and compositions described herein are broadly applicable and may involve any nuclease of interest. Non-limiting examples of nucleases include meganucleases, TALEN, and zinc finger nucleases. Said nuclease may contain a heterologous DNA binding domain and a cleavage domain (eg, zinc finger nucleases; meganuclease DNA binding domains with heterologous cleavage domains); or alternatively, the DNA-binding domain of a naturally occurring nuclease can be altered to bind to a chosen target site (eg , a meganuclease engineered to bind to a site other than the cognate binding site).
[0137] Любая из описанных в настоящем документе нуклеаз может содержать сконструированный ДНК-связывающий домен TALE и нуклеазный домен (например, домен эндонуклеазы и/или мегануклеазы), также называемые TALEN. Способы и композиции для конструирование указанных белков TALEN для устойчивого сайт-специфического взаимодействия с выбранной пользователем целевой последовательностью были описаны в опубликованных источниках (см. патент США №8,586,526). Согласно некоторым вариантам реализации указанный TALEN содержит домен расщепления или полудомен расщепления эндонуклеазы (например,FokI). Согласно другим вариантам реализации указанная TALE-нуклеаза представляет собой мега-TAL. Указанные мега-TAL-нуклеазы представляют собой гибридные белки, содержащие ДНК-связывающий домен TALE и домен расщепления мегануклеазы. Указанный домен расщепления мегануклеазы активен в форме мономера, и для его активности не требуется димеризация. (См. Boisselet al., (2013)Nucl Acid Res: 1-13, doi: 10.1093/nar/gkt1224.) Кроме того, нуклеазный домен может также проявлять ДНК-связывающие функции.[0137] Any of the nucleases described herein may contain an engineered TALE DNA binding domain and a nuclease domain (eg , an endonuclease and/or meganuclease domain), also referred to as TALEN. Methods and compositions for constructing these TALEN proteins for stable site-specific interaction with a user-selected target sequence have been described in published sources (see US patent No. 8,586,526). In some embodiments, said TALEN contains a cleavage domain or cleavage half-domain of an endonuclease (eg ,Fok I). In other embodiments, said TALE nuclease is mega-TAL. These mega-TAL nucleases are fusion proteins containing the TALE DNA-binding domain and the meganuclease cleavage domain. This meganuclease cleavage domain is active as a monomer and does not require dimerization for its activity. (See Boisselet al ., (2013)Nucl Acid Res : 1-13, doi: 10.1093/nar/gkt1224.) In addition, the nuclease domain may also exhibit DNA-binding functions.
[0138] Согласно другим дополнительным вариантам реализации нуклеаза содержит компактный TALEN (cTALEN). Это одноцепочечные гибридные белки, где ДНК-связывающий домен TALE соединен с нуклеазным доменом TevI. Указанный гибридный белок может функционировать либо в качестве никаз с локализацией, определяемой областью TALE, или может производить двуцепочечный разрыв, в зависимости от того, где локализован ДНК-связывающий домен TALE относительно нуклеазного доменаTevI (см. Beurdeleyet al (2013)Nat Comm: 1-8 DOI: 10.1038/ncomms2782). Любые TALEN могут применяться в комбинации с дополнительными TALEN (например, одним или более TALEN (cTALEN илиFokI-TALEN) с одним или более мега-TAL) или другими расщепляющими ДНК ферментами.[0138] In other additional embodiments, the nuclease contains a compact TALEN (cTALEN). These are single-stranded fusion proteins where the TALE DNA-binding domain is linked to the TevI nuclease domain. This fusion protein can either function as nicases with localization determined by the TALE region or can produce a double-strand break, depending on where the TALE DNA-binding domain is located relative to theTev I nuclease domain (see Beurdeleyet al (2013)Nat Comm : 1-8 DOI: 10.1038/ncomms2782). Any TALEN can be used in combination with additional TALENs (eg one or more TALENs (cTALEN orFok I-TALEN) with one or more mega-TALs) or other DNA-cleaving enzymes.
[0139] Согласно некоторым вариантам реализации нуклеаза содержит мегануклеазу (хоуминг-эндонуклеазу) или ее часть, проявляющую расщепляющую активность. Встречающиеся в природе мегануклеазы распознают сайты расщепления длиной 15-40 пар оснований и их, как правило, группируют в четыре семейства: семейство LAGLIDADG, семейство GIY-YIG, семейство His-Cyst-бокс и семейство HNH. Примеры хоуминг-эндонуклеаз включают I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII и I-TevIII. Известны последовательности их распознавания. См. также патент США №5,420,032; патент США №6,833,252; Belfortet al. (1997)Nucleic Acids Res.25:3379-3388; Dujonet al. (1989)Gene 82:115-118; Perleret al. (1994)Nucleic Acids Res.22, 1125-1127; Jasin (1996)Trends Genet. 12:224-228; Gimbleet al. (1996)J. Mol. Biol. 263:163-180; Argastet al. (1998)J. Mol. Biol. 280:345-353 и каталог New England Biolabs.[0139] In some embodiments, the nuclease contains a meganuclease (homing endonuclease) or a portion thereof that exhibits cleavage activity. Naturally occurring meganucleases recognize cleavage sites of 15-40 bp in length and are generally grouped into four families: the LAGLIDADG family, the GIY-YIG family, the His-Cyst-box family, and the HNH family. Examples of homing endonucleases include I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I -TevI, I-TevII and I-TevIII. The sequences of their recognition are known. See also US Pat. No. 5,420,032; US Pat. No. 6,833,252; Belfortet al. (1997)Nucleic Acids Res. 25:3379-3388; Dujonet al . (1989)Gene 82:115-118; Perleret al . (1994)Nucleic Acids Res. 22, 1125-1127; Jasin (1996)Trends Genet . 12:224-228; Gimbleet al . (1996)J. Mol. Biol. 263:163-180; Argastet al . (1998)J. Mol. biol . 280:345-353 and New England Biolabs catalog.
[0140] ДНК-связывающие домены из встречающихся в природе мегануклеаз, в первую очередь из семейства LAGLIDADG, применялись для содействия сайт-специфической модификации генома у растений, дрожжей, Drosophila, в клетках млекопитающих и мышей, однако указанный подход был ограничен модификацией либо гомологичных генов, сохраняющих последовательность распознавания мегануклеазы (Monetet al. (1999),Biochem. Biophysics. Res.Common. 255: 88-93), либо заранее сконструированных геномов, в которые была введена последовательность распознавания (Routeet al. (1994),Mol. Cell. Biol. 14: 8096-106; Chiltonet al. (2003),Plant Physiology. 133: 956-65; Puchtaet al. (1996),Proc. Natl. Acad. Sci. USA 93: 5055-60; Ronget al. (2002),Genes Dev. 16: 1568-81; Goubleet al. (2006),J. Gene Med. 8(5):616-622). Соответственно, были предприняты попытки сконструировать мегануклеазы, проявляющие новую специфичность связывания в релевантных с медицинской или биотехнологической точки зрения сайтах (Porteuset al. (2005),Nat. Biotechnol. 23: 967-73; Sussmanet al. (2004),J. Mol. Biol. 342: 31-41; Epinatet al. (2003),Nucleic Acids Res.31: 2952-62; Chevalieret al. (2002)Molec. Cell 10:895-905; Epinatet al. (2003)Nucleic Acids Res.31:2952-2962; Ashworthet al. (2006)Nature 441:656-659; Paqueset al. (2007)Current Gene Therapy7:49-66; патентные публикации США №20070117128; №20060206949; №20060153826; №20060078552; и №20040002092). Кроме того, встречающиеся в природе или сконструированные ДНК-связывающие домены из мегануклеаз могут быть функционально связаны с доменом расщепления из гетерологичной нуклеазы (например,FokI), и/или домены расщепления из мегануклеаз могут быть функционально связаны с гетерологичным ДНК-связывающим доменом (например, ZFP или TALE).[0140] DNA-binding domains from naturally occurring meganucleases, primarily from the LAGLIDADG family, have been used to promote site-specific genome modification in plants, yeast, Drosophila, mammalian cells, and mice, however this approach has been limited to modification of either homologous genes that retain the meganuclease recognition sequence (Monetet al. (1999),Biochem. Biophysics. Res .Common . 255: 88-93), or pre-engineered genomes into which the recognition sequence has been introduced (Routeet al . (1994),Mol Cell Biol 14: 8096-106 Chiltonet al (2003)Plant Physiology 133: 956-65 Puchtaet al (1996)Proc Natl Acad Sci USA 93: 5055-60 ; Ronget al . (2002),Genes Dev . 16:1568-81; Goubleet al . (2006),J. Gene Med . 8(5):616-622). Accordingly, attempts have been made to construct meganucleases exhibiting novel binding specificities at medically or biotechnologically relevant sites (Porteuset al . (2005),Nat. Biotechnol . 23:967-73; Sussmanet al. (2004),J. Mol Biol 342: 31-41 Epinatet al (2003)Nucleic Acids Res 31: 2952-62 Chevalieret al (2002)Molec Cell 10:895-905 Epinatet al (2003 )Nucleic Acids Res. 31:2952-2962; Ashworthet al . (2006)Nature 441:656-659; Paqueset al . (2007)Current Gene Therapy 7:49-66; US Pat. No. 20060153826; No. 20060078552; and No. 20040002092). In addition, naturally occurring or engineered DNA-binding domains from meganucleases can be operably linked to a cleavage domain from a heterologous nuclease (e.g.Fok I) and/or cleavage domains from meganucleases can be operably linked to a heterologous DNA-binding domain (e.g. , ZFP or TALE).
[0141] Согласно другим вариантам реализации указанная нуклеаза представляет собой нуклеазу с цинковыми пальцами (ZFN) или ДНК-связывающий домен TALE, гибридизованый с нуклеазой (TALEN). ZFN и TALEN содержат ДНК-связывающий домен (белок с цинковыми пальцами или ДНК-связывающий домен TALE), сконструированный таким образом, чтобы связываться с целевым сайтом в выбранном гене и доменом расщепления или полудоменом расщепления (например, из рестрикционной нуклеазы и/или мегануклеазы согласно описанию в настоящем документе).[0141] In other embodiments, said nuclease is a zinc finger nuclease (ZFN) or a nuclease-hybridized TALE DNA-binding domain (TALEN). ZFN and TALEN contain a DNA-binding domain (zinc finger protein or TALE DNA-binding domain) designed to bind to a target site in a selected gene and a cleavage domain or cleavage half-domain (e.g. , from a restriction nuclease and/or meganuclease according to described in this document).
[0142] Согласно подробному описанию выше, связывающие домены с цинковыми пальцами и ДНК-связывающие домены TALE могут быть сконструированы таким образом, чтобы связываться с выбранной последовательностью. См., например, Beerliet al. (2002)Nature Biotechnol. 20:135-141; Paboet al. (2001)Ann. Rev. Biochem. 70:313-340; Isalanet al. (2001)Nature Biotechnol. 19:656-660; Segalet al. (2001)Curr. Opin. Biotechnol. 12:632-637; Chooet al. (2000)Curr. Opin. Struct. Biol. 10:411-416. Сконструированный связывающий домен с цинковыми пальцами или белок TALE может обладать новой специфичностью связывания по сравнению с встречающимся в природе белком. Способы конструирования включают, не ограничиваясь перечисленными, рациональный дизайн и различные типы отбора. Рациональный дизайн включает, например, использование баз данных, содержащих триплеты (или квадруплеты) последовательностей нуклеотидов и индивидуальные последовательности аминокислот цинковых пальцев или TALE, где каждая триплетная или квадруплетная последовательность нуклеотидов ассоциирована с одной или более последовательностей аминокислот цинковых пальцев или единиц повторов TALE, связывающих конкретную триплетную или квадруплетную последовательность. См., например, патенты США №6,453,242 и №6,534,261, полностью включенные в настоящий документ посредством ссылки.[0142] As detailed above, zinc finger binding domains and TALE DNA binding domains can be designed to bind to a selected sequence. See, for example, Beerliet al . (2002)Nature Biotechnol . 20:135-141; Paboet al . (2001)Ann. Rev. Biochem. 70:313-340; Isalanet al. (2001)Nature Biotechnol . 19:656-660; Segalet al . (2001)Curr. Opin. Biotechnol . 12:632-637; Chooet al . (2000)Curr. Opin. Struct. biol . 10:411-416. The engineered zinc finger binding domain or TALE protein may have novel binding specificity compared to a naturally occurring protein. Design methods include, but are not limited to, rational design and various types of selection. Rational design includes, for example, the use of databases containing triplets (or quadruplets) of nucleotide sequences and individual zinc finger or TALE amino acid sequences, where each triplet or quadruplet nucleotide sequence is associated with one or more zinc finger amino acid sequences or TALE repeat units linking a particular triplet or quadruplet sequence. See, for example, US Pat. Nos. 6,453,242 and 6,534,261, incorporated herein by reference in their entirety.
[0143] Выбор целевого сайта, а также способы дизайна и конструирования гибридных белков (и кодирующих их полинуклеотидов) известны специалистам в данной области техники и подробно описаны в патентах США №7,888,121 и №8,409,861, полностью включенных посредством ссылки в настоящий документ.[0143] The choice of target site, as well as methods for designing and constructing fusion proteins (and the polynucleotides encoding them) are known to those skilled in the art and are described in detail in US Pat.
[0144] Кроме того, согласно описанию в указанном и других источниках, домены с цинковыми пальцами, TALE и/или белки с множеством цинковых пальцев могут быть соединены друг с другом с применением любых подходящих линкерных последовательностей, в том числе например, линкеров длиной 5 или более аминокислот (например, TGEKP (SEQ ID NO: 9), TGGQRP (SEQ ID NO: 10), TGQKP (SEQ ID NO: 11) и/или TGSQKP (SEQ ID NO: 12). См., например, примеры линкерных последовательностей длиной 6 или более аминокислот в патентах США №6,479,626; №6,903,185; и №7,153,949. Описанные в настоящем документе белки могут включать любую комбинацию подходящих линкеров между индивидуальными цинковыми пальцами указанного белка. См. также патент США №8,772,453.[0144] In addition, as described in this and other references, zinc finger domains, TALE, and/or multiple zinc finger proteins can be connected to each other using any suitable linker sequences, including, for example, linkers of
[0145] Соответственно, нуклеазы, такие как ZFN, TALEN и/или мегануклеазы, могут содержать любой ДНК-связывающий домен и любой нуклеазный (расщепляющий) домен (домен расщепления, полудомен расщепления). Как отмечалось выше, домен расщепления может быть гетерологичным относительно ДНК-связывающего домена, например, может быть использован цинковый палец или ДНК-связывающий домен TAL-эффектора, и домен расщепления из нуклеазы, или ДНК-связывающий домен мегануклеазы и домен расщепления из другой нуклеазы. Гетерологичные домены расщепления могут быть получены из любой эндонуклеазы или экзонуклеазы. Примеры эндонуклеаз, из которых может происходить домен расщепления, включают, не ограничиваясь перечисленными, рестрикционные эндонуклеазы и хоуминг-эндонуклеазы. См., например, каталог 2002-2003 гг. New England Biolabs, Беверли, Массачусетс; и Belfortet al. (1997)Nucleic Acids Res.25:3379-3388. Известны дополнительные ферменты, который расщепляют ДНК (например, нуклеаза S1; нуклеаза бобов мунг; панкреатическая ДНКаза I; нуклеаза микрококков; дрожжевая эндонуклеаза HO; см. также Linnet al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press,1993). Один или более из указанных ферментов (или их функциональных фрагментов) могут применяться в качестве источника доменов расщепления и полудоменов расщепления.[0145] Accordingly, nucleases such as ZFN, TALEN, and/or meganucleases may contain any DNA-binding domain and any nuclease (cleavage) domain (cleavage domain, cleavage half-domain). As noted above, the cleavage domain may be heterologous to the DNA binding domain, for example, a zinc finger or a TAL effector DNA binding domain and a cleavage domain from a nuclease, or a meganuclease DNA binding domain and a cleavage domain from another nuclease may be used. Heterologous cleavage domains can be derived from any endonuclease or exonuclease. Examples of endonucleases from which the cleavage domain may originate include, but are not limited to, restriction endonucleases and homing endonucleases. See, for example, the 2002-2003 catalog. New England Biolabs, Beverly, Massachusetts; and Belfortet al. (1997)Nucleic Acids Res. 25:3379-3388. Additional enzymes are known that cleave DNA (e.g. , nuclease S1; mung bean nuclease; pancreatic DNase I; micrococcal nuclease; yeast HO endonuclease; see also Linnet al . (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993). One or more of these enzymes (or functional fragments thereof) can be used as a source of cleavage domains and cleavage half-domains.
[0146] Аналогичным образом, полудомен расщепления может происходить из любой нуклеазы или ее части, согласно описанию выше, для расщепляющей активности которой требуется димеризация. В целом, два гибридных белка необходимы для расщепления, если указанные гибридные белки содержат полудомены расщепления. Как вариант, может быть использован один белок, содержащий два полудомена расщепления. Указанные два полудомена расщепления могут происходить из одной и той же эндонуклеазы (или ее функциональных фрагментов), или каждый полудомен расщепления может происходить из другой эндонуклеазы (или ее функциональных фрагментов). Кроме того, целевые сайты двух гибридных белков предпочтительно распределены относительно друг друга таким образом, что связывание указанных двух гибридных белков с соответствующими целевыми сайтами приводит к пространственной ориентации полудоменов расщепления друг относительно друга, позволяющей указанным полудоменам расщепления образовывать функциональный домен расщепления, например, путем димеризации. Соответственно, согласно некоторым вариантам реализации ближние края целевых сайтов разделены 5-10 нуклеотидами или 15-18 нуклеотидами. Однако между двумя целевыми сайтами может располагаться любое целое число нуклеотидов или пар нуклеотидов (например, от 2 до 50 пар нуклеотидов или более). В целом, сайт расщепления располагается между целевыми сайтами.[0146] Similarly, the cleavage half-domain may be from any nuclease, or portion thereof, as described above, whose cleavage activity requires dimerization. In general, two fusion proteins are required for cleavage if said fusion proteins contain cleavage half-domains. Alternatively, a single protein containing two cleavage half-domains can be used. The two cleavage half-domains may be derived from the same endonuclease (or functional fragments thereof), or each cleavage half-domain may be derived from a different endonuclease (or functional fragments thereof). In addition, the target sites of the two fusion proteins are preferably distributed relative to each other such that binding of said two fusion proteins to their respective target sites results in a spatial orientation of the cleavage half-domains relative to each other, allowing said cleavage half-domains to form a functional cleavage domain, e.g., by dimerization. Accordingly, in some embodiments, the near edges of the target sites are separated by 5-10 nucleotides or 15-18 nucleotides. However, any integer number of nucleotides or base pairs (eg , 2 to 50 base pairs or more) can be located between the two target sites. In general, the cleavage site is located between the target sites.
[0147] Рестрикционные эндонуклеазы (рестрикционные ферменты) присутствуют у многих видов и способны к специфическому в отношении последовательности связыванию с ДНК (в сайте распознавания) и расщеплению ДНК в сайте или возле сайта связывания. Определенные рестрикционные ферменты (например, типа IIS) расщепляют ДНК в сайтах, удаленных от сайта распознавания, и содержат разделяемые домены связывания и расщепления. Например, ферментFok I типа IIS катализирует двухцепочечное расщепление ДНК, на расстоянии 9 нуклеотидов от сайта распознавания на одной цепи и 13 нуклеотидов от сайта распознавания на другой цепи. См., например, патенты США 5,356,802; 5,436,150 и 5,487,994; а также Liet al. (1992)Proc. Natl. Acad. Sci. USA 89:4275-4279; Liet al. (1993)Proc. Natl. Acad. Sci. USA 90:2764-2768; Kimet al. (1994a)Proc. Natl. Acad. Sci. USA 91:883-887; Kimet al. (1994b)J. Biol. Chem. 269:31,978-31,982. Соответственно, согласно одному варианту реализации гибридные белки содержат домен расщепления (или полудомен расщепления) по меньшей мере из одного рестрикционного фермента типа IIS, и один или более связывающих доменов с цинковыми пальцами, которые могут быть сконструированными или нет.[0147] Restriction endonucleases (restriction enzymes) are present in many species and are capable of sequence-specific binding to DNA (at the recognition site) and cleaving DNA at or near the binding site. Certain restriction enzymes (such as type IIS) cleave DNA at sites remote from the recognition site and contain shared binding and cleavage domains. For example, the type IISFok I enzyme catalyzes double-stranded DNA cleavage, 9 nucleotides from the recognition site on one strand and 13 nucleotides from the recognition site on the other strand. See, for example, US Pat. Nos. 5,356,802; 5,436,150 and 5,487,994; and Liet al . (1992)Proc. Natl. Acad. sci. USA 89:4275-4279; Liet al . (1993)Proc. Natl. Acad. sci. USA 90:2764-2768; Kimet al . (1994a)Proc. Natl. Acad. sci. USA 91:883-887; Kimet al. (1994b)J. Biol. Chem. 269:31.978-31.982. Accordingly, in one embodiment, the fusion proteins comprise a cleavage domain (or cleavage half-domain) of at least one type IIS restriction enzyme, and one or more zinc finger binding domains, which may or may not be engineered.
[0148] Примером рестрикционного фермента типа IIS, домен расщепления которого может быть отделен от связывающего домена, являетсяFok I. Указанный конкретный фермент активен в форме димера. Bitinaiteet al. (1998)Proc. Natl. Acad. Sci. USA 95: 10,570-10,575. Соответственно, для целей настоящего изобретения часть ферментаFok I, используемую в описанных гибридных белках, считают полудоменом расщепления. Соответственно, для нацеленного двухцепочечного расщепления (расщепления двух цепей) и/или нацеленной замены клеточных последовательностей с применением гибридных c цинковыми пальцамиFok I могут быть использованы два гибридных белка, каждый из которых содержит полудомен расщепления FokI, с восстановлением каталитически активного домена расщепления. Как вариант, может также применяться одна полипептидная молекула, содержащая связывающий домен с цинковыми пальцами и два полудомена расщепленияFok I. Параметры для нацеленного расщепления и нацеленного изменения последовательности с применением гибридизованых c цинковыми пальцамиFok I описаны в различных разделах настоящего документа.[0148] An example of a type IIS restriction enzyme whose cleavage domain can be separated from the binding domain isFok I. This particular enzyme is active in the form of a dimer. Bitinaiteet al . (1998)Proc. Natl. Acad. sci. USA 95: 10.570-10.575. Accordingly, for the purposes of the present invention, the portion of theFok I enzyme used in the described fusion proteins is considered to be the cleavage half-domain. Accordingly, two fusion proteins each containing aFok I cleavage half-domain can be used for targeted double-strand cleavage (two-strand cleavage) and/or targeted replacement of cellular sequences usingFok I zinc finger fusions, with restoration of a catalytically active cleavage domain. Alternatively, a single polypeptide molecule containing a zinc finger binding domain and twoFok I cleavage half-domains can also be used. Parameters for targeted cleavage and targeted sequencing using zinc finger hybridizedFok I are described in various sections of this document.
[0149] Домен расщепления или полудомен расщепления может быть представлен любой частью белка, которая сохраняет расщепляющую активность или способность к мультимеризации (например, димеризуется) с образованием функционального домена расщепления.[0149] A cleavage domain or cleavage half-domain can be any portion of a protein that retains cleavage activity or the ability to multimerize (eg , dimerize) to form a functional cleavage domain.
[0150] Примеры рестрикционных ферментов типа IIS описаны в международной заявке WO 07/014275, полностью включенной в настоящий документ. Дополнительные рестрикционные ферменты также содержат разделяемые домены связывания и расщепления; указанные ферменты предусмотрены настоящим изобретением. См., например, Robertset al. (2003)Nucleic Acids Res.31:418-420.[0150] Examples of type IIS restriction enzymes are described in WO 07/014275, which is incorporated herein in its entirety. Additional restriction enzymes also contain shared binding and cleavage domains; these enzymes are provided by the present invention. See, for example, Robertset al . (2003)Nucleic Acids Res. 31:418-420.
[0151] Согласно некоторым вариантам реализации домен расщепления включает домен расщепленияFokI, используемый для получения кристаллических структур 1FOK.pdb и 2FOK.pdb (см. Wahet al (1997)Nature 388:97-100), с последовательностью, приведенной ниже:[0151] In some embodiments, the cleavage domain includes theFok I cleavage domain used to generate the 1FOK.pdb and 2FOK.pdb crystal structures (see Wahet al (1997)Nature 388:97-100), with the sequence given below:
Полудомен расщепленияFokI дикого типа (SEQ ID NO: 1)Wild-typeFok I cleavage half-domain (SEQ ID NO: 1)
QLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINF
[0152] Полудомены расщепления, происходящие изFokI, могут содержать мутацию в одном или более остатках аминокислот, как показано в последовательности SEQ ID NO: 1. Мутации включают замены (остатка аминокислоты молекулы дикого типа на другой остаток), инсерции (одного или более остатков аминокислот) и/или делеции (одного или более остатков аминокислот). Согласно некоторым вариантам реализации один или более остатков 414-426, 443-450, 467-488, 501-502 и/или 521-531 (при нумерации, соответствующей SEQ ID NO: 1 и последовательностям, представленным на Фиг. 17) мутированы, поскольку указанные остатки локализованы близко к остову ДНК в молекулярной модели ZFN, связанной с целевым сайтом, описанной в источнике: Milleret al. ((2007)Nat Biotechnol 25:778-784). Согласно некоторым вариантам реализации один или более остатков в положениях 416, 422, 447, 448 и/или 525 мутированы. Согласно некоторым вариантам реализации указанная мутация включает замену остатка молекулы дикого типа на любой другой остаток, например, остаток аланина (A), остаток цистеина (C), остаток аспарагиновой кислоты (D), остаток глутаминовой кислоты (E), остаток гистидина (H), остаток фенилаланина (F), остаток глицина (G), остаток аспарагина (N), остаток серина (S) или остаток треонина (T). Согласно другим вариантам реализации остатки молекулы дикого типа в одном или более из положений 416, 418, 422, 446, 448, 476, 479, 480, 481 и/или 525 заменены на любые другие остатки, в том числе, но не ограничиваясь перечисленными, R416D, R416E, S418E, S418D, R422H, S446D, K448A, N476D, I479Q, I479T, G480D, Q481A, Q481E, K525S, K525A, N527D, R416E+R422H, R416D+R422H, R416E+K448A, R416D+R422H, K448A+I479Q, K448A+Q481A, K448A+K525A.[0152]FokI -derived cleavage half-domains may contain a mutation at one or more amino acid residues as shown in SEQ ID NO: 1. amino acids) and/or deletions (of one or more amino acid residues). In some embodiments, one or more of residues 414-426, 443-450, 467-488, 501-502 and/or 521-531 (when numbered according to SEQ ID NO: 1 and the sequences shown in Fig. 17) are mutated, since these residues are localized close to the DNA backbone in the ZFN molecular model associated with the target site, described in the source: Milleret al . ((2007)Nat Biotechnol 25:778-784). In some embodiments, one or more residues at
[0153] Согласно некоторым вариантам реализации домен расщепления содержит один или более сконструированных полудоменов расщепления (также называемых мутантами доменов димеризации), которые минимизируют или предотвращают гомодимеризацию, согласно описанию, например, в патентах США №7,914,796; №8,034,598 и №8,623,618; и патентной публикации США №20110201055, содержание которых полностью включено посредством ссылки в настоящий документ. Остатки аминокислот в положениях 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 и 538Fok I (при нумерации, соответствующей SEQ ID NO: 1 и последовательностям, представленным на Фиг. 17) представляют собой мишени для воздействия на димеризацию полудоменов расщепления Fok I. Указанные мутации могут включать мутации остатков, обнаруживаемых в естественных рестрикционных ферментах, гомологичныхFokI. Согласно предпочтительному варианту реализации мутация в положениях 416, 422, 447, 448 и/или 525 (при нумерации, соответствующей SEQ ID NO: 1 и последовательностей представленных на Фиг. 17) включает замену положительно заряженные аминокислоты на незаряженную или отрицательно заряженную аминокислоту. Согласно другому варианту реализации сконструированные полудомены расщепления содержат мутации в остатках аминокислот 499, 496 и 486 помимо мутаций в одном или более остатках аминокислот 416, 422, 447, 448 или 525; вся нумерация соответствует SEQ ID NO: 1 или последовательностям, представленным на Фиг. 17.[0153] In some embodiments, the cleavage domain comprises one or more engineered cleavage half-domains (also referred to as dimerization domain mutants) that minimize or prevent homodimerization, as described in, for example, US Pat. Nos. 7,914,796; #8,034,598 and #8,623,618; and US Patent Publication No. 20110201055, the contents of which are hereby incorporated by reference in their entirety. Amino acid residues at
[0154] Согласно некоторым вариантам реализации композиции, описанные в настоящем документе, включают сконструированные полудомены расщепленияFok I, которые образуют облигатные гетеродимеры согласно описанию, например, в патентах США №7,914,796; №8,034,598; №8,961,281 и №8,623,618; и патентных публикациях США №20080131962 и №20120040398. Соответственно, согласно одному предпочтительному варианту реализации настоящего изобретения предложены гибридные белки, в которых сконструированный полудомен расщепления содержит полипептид, в котором остаток Gln (Q), присутствующий в положении 486 молекулы дикого типа, заменен на остаток Glu (E), остаток Ile (I), присутствующий в положении 499 молекулы дикого типа, заменен на остаток Leu (L); и остаток Asn (N), присутствующий в положении 496 молекулы дикого типа, заменен на остаток Asp (D) или Glu (E) («ELD» или «ELE»), помимо одной или более мутаций в положениях 416, 422, 447, 448 или 525 (при нумерации, соответствующей SEQ ID NO: 1 и последовательностям, представленным на Фиг. 17). Согласно другому варианту реализации сконструированные полудомены расщепления происходят из полудомена расщепленияFokI дикого типа и содержат мутации в остатках аминокислот 490, 538 и 537, при нумерации, соответствующейFokI дикого типа (SEQ ID NO: 1 и последовательности, представленные на Фиг. 17), помимо одной или более мутаций остатков аминокислот 416, 422, 447, 448 или 525. Согласно предпочтительному варианту реализации настоящего изобретения предложен гибридный белок, в котором сконструированный полудомен расщепления содержит полипептид, в котором остаток Glu (E), присутствующий в положении 490 молекулы дикого типа, заменен на остаток Lys (K), остаток Ile (I), присутствующий в положении 538 молекулы дикого типа, заменен на остаток Lys (K), а остаток His (H), присутствующий в положении 537 молекулы дикого типа, заменен на остаток Lys (K) или остаток Arg (R) («KKK» или «KKR») (см. US8962281, включенный в настоящий документ посредством ссылки), помимо одной или более мутаций в положениях 416, 422, 447, 448 или 525. См., например, патенты США №7,914,796; №8,034,598 и №8,623,618, содержание которых включено посредством ссылки полностью для любых целей. Согласно другим вариантам реализации сконструированные полудомены расщепления содержат «Sharkey» и/или мутации «Sharkey» (см. Guoet al, (2010)J. Mol. Biol. 400(1):96-107).[0154] In some embodiments, the compositions described herein include engineeredFok I cleavage half-domains that form obligate heterodimers as described in, for example, US Pat. Nos. 7,914,796; No. 8,034,598; #8,961,281 and #8,623,618; and US Patent Publication Nos. 20080131962 and 20120040398. Accordingly, according to one preferred embodiment of the present invention, fusion proteins are provided wherein the engineered cleavage half-domain comprises a polypeptide in which the Gln(Q) residue present at
[0155] Согласно другому варианту реализации сконструированные полудомены расщепления происходят из полудомена расщепленияFokI дикого типа и содержат мутации в остатках аминокислот 490 и 538, при нумерации, соответствующейFokI дикого типа или гомологуFokI,помимо одной или более мутаций остатков аминокислот 416, 422, 447, 448 или 525. Согласно предпочтительному варианту реализации настоящего изобретения предложен гибридный белок, отличающийся тем, что сконструированный полудомен расщепления содержит полипептид, в котором остаток Glu (E), присутствующий в положении 490 молекулы дикого типа, заменен на остаток Lys (K), и остаток Ile (I), присутствующий в положении 538 молекулы дикого типа, заменен на остаток Lys (K) («KK»), помимо одной или более мутаций в положениях 416, 422, 447, 448 или 525. Согласно предпочтительному варианту реализации настоящего изобретения предложен гибридный белок, в котором сконструированный полудомен расщепления содержит полипептид, в котором остаток Gln (Q), присутствующий в положении 486 молекулы дикого типа, заменен на остаток Glu (E), и остаток Ile (I), присутствующий в положении 499 молекулы дикого типа, заменен на остаток Leu (L) («EL») (см. US8034598, включенный в настоящий документ посредством ссылки), помимо одной или более мутаций в положениях 416, 422, 447, 448 или 525.[0155] In another embodiment, the engineered cleavage half-domains are derived from the wild-typeFok I cleavage half-domain and contain mutations at
[0156] Согласно одному аспекту настоящего изобретения предложен гибридный белок, в котором сконструированный полудомен расщепления содержит полипептид, в котором мутирован остаток аминокислоты молекулы дикого типа в одном или более из положений 387, 393, 394, 398, 400, 402, 416, 422, 427, 434, 439, 441, 447, 448, 469, 487, 495, 497, 506, 516, 525, 529, 534, 559, 569, 570, 571 в каталитическом доменеFokI. Предложены нуклеазные домены, содержащие одну или более мутаций, представленных в любых из прилагаемых таблиц и чертежей. Согласно некоторым вариантам реализации указанная одна или более мутаций изменяют аминокислоту молекулы дикого типа с заменой положительно заряженного остатка на нейтральный остаток или отрицательно заряженный остаток. Согласно любому из указанных вариантов реализации описанные мутанты могут также быть внесены в доменFokI, содержащий одну или более дополнительные мутаций. Согласно предпочтительным вариантам реализации указанные дополнительные мутации находятся в домене димеризации, например, в положениях 418, 432, 441, 481, 483, 486, 487, 490, 496, 499, 523, 527, 537, 538 и/или 559. Неограничивающие примеры мутаций включают мутации (например,замены) остатков молекулы дикого типа любого домена расщепления (например, FokI или гомологаFokI) в положениях 393, 394, 398, 416, 421, 422, 442, 444, 472, 473, 478, 480, 525 или 530 с заменой на любой остаток аминокислоты (например,K393X, K394X, R398X, R416S, D421X, R422X, K444X, S472X, G473X, S472, P478X, G480X, K525X и A530X, где первый остаток соответствует молекуле дикого типа, а X относится к любой аминокислоте, которой заменяют остаток молекулы дикого типа). Согласно некоторым вариантам реализации X представляет собой E, D, H, A, K, S, T, D или N. Другие примеры мутаций включают S418E, S418D, S446D, K448A, I479Q, I479T, Q481A, Q481N, Q481E, A530E и/или A530K, где нумерация остатков аминокислот соответствует полноразмерному домену расщепления FokI дикого типаиего гомологам (Фиг. 17). Согласно некоторым вариантам реализации комбинации могут включать 416 и 422, мутацию в положении 416 и K448A, K448A и I479Q, K448A и Q481A; и/или K448A и мутацию в положении 525. Согласно одному варианту реализации остаток, присутствующий в положении 416 молекулы дикого типа, может быть заменен на остаток Glu (E) (R416E), остаток, присутствующий в положении 422 молекулы дикого типа, заменен на остаток His (H) (R422H), и остаток, присутствующий в положении 525 молекулы дикого типа, заменен на остаток Ala (A). Домены расщепления согласно описанию в настоящем документе могут также включать дополнительные мутации, в том числе, но не ограничиваясь перечисленными, мутации в положениях 432, 441, 483, 486, 487, 490, 496, 499, 527, 537, 538 и/или 559, например мутанты домена димеризации (например,ELD, KKR) и/или никазные мутанты (мутации каталитического домена). Полудомены расщепления с мутациями согласно описанию в настоящем документе образуют гетеродимеры, как известно в данной области техники.[0156] According to one aspect of the present invention, a fusion protein is provided wherein the engineered cleavage half-domain comprises a polypeptide that has a wild-type molecule amino acid residue mutated at one or more of
[0157] Как вариант, нуклеазы могут быть собраныin vivo в целевом сайте нуклеиновой кислоты с применением так называемой технологии «разъединенных ферментов» (см., например, патентную публикацию США №20090068164). Компоненты таких разъединенных ферментов могут быть экспрессированы либо на отдельных экспрессионных конструкциях, либо могут быть соединены в одной открытой рамке считывания, при этом индивидуальные компоненты разделены, например, саморасщепляющимся пептидом 2A или последовательностью IRES. Компоненты могут представлять собой индивидуальные связывающие домены с цинковыми пальцами или домены связывающего нуклеиновую кислоту домена мегануклеазы.[0157] Alternatively, nucleases can be assembledin vivo at the target site of the nucleic acid using the so-called "decoupled enzyme" technology (see, for example, US Patent Publication No. 20090068164). The components of such decoupled enzymes may be expressed either on separate expression constructs, or may be linked in a single open reading frame, with the individual components separated by, for example, a 2A self-cleaving peptide or an IRES sequence. The components may be individual zinc finger binding domains or nucleic acid binding domains of a meganuclease.
[0158] Перед применением может быть проведен скрининг активности нуклеаз (например, ZFN и/или TALEN), например, в дрожжевой хромосомной системе согласно описанию в патенте США №8,563,314.[0158] Prior to use, nuclease activity (eg , ZFN and/or TALEN) may be screened for, for example, in the yeast chromosome system as described in US Pat. No. 8,563,314.
[0159] Согласно некоторым вариантам реализации указанная нуклеаза содержит систему CRISPR/Cas. Локус CRISPR («clustered regularly interspaced short palindromic repeats», кластеризованные регулярно распределенные короткие палиндромные повторы), который кодирует РНК-компоненты системы, и локус Cas («CRISPR-ассоциированный»), который кодирует белки (Jansenet al., 2002.Mol. Microbiol. 43: 1565-1575; Makarovaet al., 2002.Nucleic Acids Res.30: 482-496; Makarovaet al., 2006.Biol. Direct 1: 7; Haft etal., 2005.PLoS Comput. Biol. 1: e60) составляют генные последовательности системы CRISPR/ нуклеазы Cas. Локусы CRISPR у хозяев-микроорганизмов содержат комбинацию CRISPR-ассоциированных (Cas) генов, а также некодирующие РНК-элементы, способные к программированию специфичности опосредованного CRISPR расщепления нуклеиновых кислот.[0159] In some embodiments, said nuclease comprises the CRISPR/Cas system. The CRISPR locus (“clustered regularly interspaced short palindromic repeats”, clustered regularly distributed short palindromic repeats), which encodes the RNA components of the system, and the Cas (“CRISPR-associated”) locus, which encodes proteins (Jansenet al. , 2002.Mol Microbiol 43: 1565-1575 Makarovaet al 2002
[0160] CRISPR II типа представляет собой одну из наиболее хорошо охарактеризованных систем; она осуществляет нацеленный двухцепочечный разрыв ДНК в ходе четырех последовательных этапов. Сначала из локуса CRISPR транскрибируют две некодирующих РНК, массив пре-cr-РНК и tracr-РНК. На втором этапе tracr-РНК гибридизуется с областями повторов пре-cr-РНК и опосредует процессинг пре-cr-РНК в зрелые cr-РНК, содержащие индивидуальные спейсерные последовательности. На третьем этапе зрелый комплекс cr-РНК:tracr-РНК направляет Cas9 к целевой ДНК за счет спаривания оснований по Уотсону-Крику между спейсером на cr-РНК и протоспейсером на целевой ДНК рядом с мотивом, смежным с протоспейсером (PAM) - дополнительное требование для распознавания мишени. Наконец, Cas9 опосредует расщепление целевой ДНК с получением двуцепочечного разрыва в пределах протоспейсера. Активность системы CRISPR/Cas состоит из трех этапов: (i) встраивание чужеродных ДНК последовательностей в массив CRISPR для предотвращения будущих атак в ходе процесса, называемого «адаптацией», (ii) экспрессия релевантных белков, а также экспрессия и процессинг указанного массива с последующей (iii) РНК-опосредованной интерференцией с чужеродной нуклеиновой кислотой. Соответственно, в бактериальной клетке ряд так называемых белков «Cas» вовлечен в естественную функцию системы CRISPR/Cas и играют роль в таких функциях, как встраивание чужеродной ДНК и т.п.[0160] Type II CRISPR is one of the most well-characterized systems; it performs a targeted DNA double-strand break in four successive steps. First, two non-coding RNAs, an array of pre-cr RNA and a tracr RNA, are transcribed from the CRISPR locus. In the second step, tracr-RNA hybridizes with regions of pre-cr-RNA repeats and mediates the processing of pre-cr-RNA into mature cr-RNAs containing individual spacer sequences. In the third step, the mature cr-RNA:tracr-RNA complex directs Cas9 to the target DNA by Watson-Crick base-pairing between a spacer on the cr-RNA and a proto-spacer on the target DNA next to the proto-spacer adjacent motif (PAM) - an additional requirement for target recognition. Finally, Cas9 mediates cleavage of the target DNA to produce a double-strand break within the protospacer. The activity of the CRISPR/Cas system consists of three steps: (i) insertion of foreign DNA sequences into the CRISPR array to prevent future attacks in a process called "adaptation", (ii) expression of relevant proteins, and expression and processing of said array, followed by ( iii) RNA-mediated interference with a foreign nucleic acid. Accordingly, in the bacterial cell, a number of so-called "Cas" proteins are involved in the natural function of the CRISPR/Cas system and play a role in functions such as the insertion of foreign DNA and the like.
[0161] Согласно некоторым вариантам реализации используют систему CRISPR-Cpf1. Система CRISPR-Cpf1, идентифицированная у Francisella spp, представляет собой систему CRISPR-Cas класса 2, которая опосредует устойчивую интерференцию с ДНК в клетках человека. Хотя Cpf1 и Cas9 функционально консервативны, они различаются во многих аспектах, в том числе направляющими РНК и субстратной специфичностью (см. Fagerlundet al, (2015)Genom Bio 16:251). Основное различие между белками Cas9 и Cpf1 заключается в том, что Cpf1 не задействует tracr-РНК и, соответственно, требуется только cr-РНК. Длина cr-РНК FnCpf1 составляет 42-44 нуклеотидов (19-нуклеотидный повтор и 23-25-нуклеотидный спейсер) и они содержат одну «петлю-на-стебле», которая позволяет вносить в последовательность изменения с сохранением вторичной структуры. Кроме того, cr-РНК Cpf1 значимо короче, чем сконструированные онРНК размером ~100-нуклеотидов, которые требуются для Cas9, а требования к PAM для FnCpfl представлены 5'-TTN-3'и 5'-CTA-3' на замещаемой цепи. Хотя и Cas9, и Cpf1 создают двуцепочечные разрывы в целевой ДНК, Cas9 использует RuvC- и HNH-подобные домены для создания разрезов с тупыми концами в пределах затравочной последовательности направляющей РНК, тогда как Cpf1 использует RuvC-подобный домен для получения ступенчатых разрезов вне затравочной последовательности. Поскольку Cpf1 производит ступенчатые разрезы за пределами критической затравочной области, NHEJ не разрушает целевой сайт, таким образом, Cpf1 может продолжать производить разрезы в том же сайте до тех пор, пока не произойдет требуемая рекомбинация HDR. Соответственно, следует понимать, что в способах и композициях, описанных в настоящем документе, термин «Cas» включает и белки Cas9, и белки Cfp1. Соответственно, в настоящем документе «система CRISPR/Cas» относится как к CRISPR/Cas, так и/или к системам CRISPR/Cfp1, включающим системы как нуклеаз, так и/или транскрипционных факторов.[0161] In some embodiments, a CRISPR-Cpf1 system is used. The CRISPR-Cpf1 system identified in Francisella spp is a
[0162] Согласно некоторым вариантам реализации белок Cas может представлять собой «функциональное производное» встречающегося в природе белка Cas. «Функциональное производное» природной последовательности полипептида представляет собой соединение, обладающее характеристическим биологическим свойством, общим с природной последовательностью полипептида. «Функциональные производные» включают, не ограничиваясь перечисленными, фрагменты природной последовательности и производные природной последовательности полипептида и его фрагментов, при условии, что они обладают биологической активностью, общей с соответствующей природной последовательностью полипептида. Предусмотренная настоящим изобретением биологическая активность представлена способностью функционального производного гидролизовать ДНК-субстрат с образованием фрагментов. Термин «производное» охватывает и варианты последовательности аминокислот полипептида, и ковалентные модификации, и гибридные продукты, такие как производные белки Cas. Подходящие производные полипептида Cas или его фрагмента включают, не ограничиваясь перечисленными, мутанты, гибридные продукты, ковалентные модификации белка Cas или его фрагмента. Белок Cas, который включает белок Cas или его фрагмент, а также производные белка Cas или его фрагмента, может быть получен из клетки или синтезирован химически, или получен с применением комбинации указанных двух процедур. Указанная клетка может представлять собой клетку, которая естественным образом продуцирует белок Cas, или клетку, которая естественным образом продуцирует белок Cas и генетически сконструирована для продуцирования эндогенного белка Cas с более высоким уровнем экспрессии, или для продуцирования белка Cas с экзогенно введенной нуклеиновой кислотой, которая кодирует Cas, идентичный или отличный от эндогенного Cas. В некоторых случаях клетка естественным образом не продуцирует белок Cas и генетически сконструирована для продуцирования белка Cas. Согласно некоторым вариантам реализации указанный белок Cas представляет собой малый ортолог Cas9 для доставки с помощью вектора AAV (Ranet al (2015)Nature 510, p. 186).[0162] In some embodiments, the Cas protein may be a "functional derivative" of a naturally occurring Cas protein. A "functional derivative" of a naturally occurring polypeptide sequence is a compound that has a characteristic biological property in common with the naturally occurring polypeptide sequence. "Functional derivatives" include, but are not limited to, natural sequence fragments and derivatives of the natural sequence of a polypeptide and fragments thereof, provided that they have a biological activity in common with the corresponding natural sequence of the polypeptide. The biological activity contemplated by the present invention is represented by the ability of the functional derivative to hydrolyze the DNA substrate to form fragments. The term "derivative" encompasses both amino acid sequence variants of a polypeptide, covalent modifications, and fusion products such as derivatives of Cas proteins. Suitable derivatives of a Cas polypeptide or fragment thereof include, but are not limited to, mutants, fusion products, covalent modifications of the Cas protein or fragment thereof. The Cas protein, which includes the Cas protein or fragment thereof, as well as derivatives of the Cas protein or fragment thereof, can be obtained from a cell or chemically synthesized, or obtained using a combination of these two procedures. Said cell may be a cell that naturally produces a Cas protein, or a cell that naturally produces a Cas protein and is genetically engineered to produce an endogenous Cas protein with a higher level of expression, or to produce a Cas protein with an exogenously introduced nucleic acid that encodes Cas identical to or different from the endogenous Cas. In some cases, the cell does not naturally produce the Cas protein and is genetically engineered to produce the Cas protein. In some embodiments, said Cas protein is a small ortholog of Cas9 for delivery by an AAV vector (Ranet al (2015)
[0163] Указанная нуклеаза или нуклеазы могут производить один или более двуцепочечных и/или одноцепочечных разрезов в целевом сайте. Согласно некоторым вариантам реализации указанная нуклеаза содержит каталитически неактивный домен расщепления (например, FokI и/или белка Cas).См., например,патент США №9,200,266; №8,703,489 и Guillingeret al. (2014)Nature Biotech.32(6):577-582. Каталитически неактивный домен расщепления может, в комбинации с каталитически активным доменом, действовать как никаза, производя одноцепочечный разрез. Соответственно, две никазы могут применяться в комбинации для получения двуцепочечного разреза в специфической области. Дополнительные никазы также известны в данной области техники, например, источник: McCafferyet al. (2016)Nucleic Acids Res.44(2):e11. doi: 10,1093/nar/gkv878. Epub 2015 Oct 19.[0163] Said nuclease or nucleases can make one or more double-stranded and/or single-stranded cuts at the target site. In some embodiments, said nuclease contains a catalytically inactive cleavage domain (eg, Fok I and/or Cas protein).See, for example, US patent No. 9,200,266; No. 8,703,489 and Guillingeret al . (2014)Nature Biotech. 32(6):577-582. The catalytically inactive cleavage domain can, in combination with the catalytically active domain, act as a niqase to produce a single strand cut. Accordingly, two nikases can be used in combination to obtain a double-stranded cut in a specific region. Additional nickases are also known in the art, eg McCafferyet al . (2016)Nucleic Acids Res. 44(2):e11. doi:10.1093/nar/gkv878. Epub 2015
ДоставкаDelivery
[0164] Белки (например, нуклеазы), полинуклеотиды и/или композиции, содержащие белки и/или полинуклеотиды согласно описанию в настоящем документе, могут быть доставлены в целевую клетку любыми подходящими способами, в том числе, например, путем инъекции указанных белковых и/или мРНК-компонентов.[0164] Proteins (e.g. , nucleases), polynucleotides, and/or compositions containing proteins and/or polynucleotides as described herein can be delivered to a target cell by any suitable means, including, for example, by injecting said protein and/or or mRNA components.
[0165] Подходящие клетки включают, не ограничиваясь перечисленными, эукариотические и прокариотические клетки и/или линии клеток. Неограничивающие примеры таких клеток или линий клеток, полученных из таких клеток, включают T-клетки, клетки COS, CHO (например, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (например, HEK293-F, HEK293-H, HEK293-T) и perC6, а также клетки насекомых, таких какSpodoptera fugiperda (Sf), или клетки грибов, таких как Saccharomyces, Pichia и Schizosaccharomyces. Согласно некоторым вариантам реализации указанная линия клеток представляет собой линию клеток CHO-K1, MDCK или HEK293. Подходящие клетки также включают стволовые клетки, такие как, например, эмбриональные стволовые клетки, индуцированные плюрипотентные стволовые клетки (клетки иПСК), гематопоэтические стволовые клетки, нервные стволовые клетки и мезенхимальные стволовые клетки.[0165] Suitable cells include, but are not limited to, eukaryotic and prokaryotic cells and/or cell lines. Non-limiting examples of such cells or cell lines derived from such cells include T cells, COS cells, CHO (e.g., CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (e.g. HEK293-F, HEK293-H, HEK293-T) and perC6, as well as insect cells such asSpodoptera fugiperda (Sf), or cells of fungi such as Saccharomyces, Pichia and Schizosaccharomyces. In some embodiments, said cell line is a CHO-K1, MDCK, or HEK293 cell line. Suitable cells also include stem cells such as, for example, embryonic stem cells, induced pluripotent stem cells (iPSC cells), hematopoietic stem cells, neural stem cells and mesenchymal stem cells.
[0166] Способы доставки белков, содержащих ДНК-связывающие домены согласно описанию в настоящем документе, описаны, например, в патентах США №6,453,242; №6,503,717; №6,534,261; №6,599,692; №6,607,882; №6,689,558; №6,824,978; №6,933,113; №6,979,539; №7,013,219; и №7,163,824; содержание всех перечисленных патентов полностью включено посредством ссылки в настоящий документ.[0166] Methods for delivering proteins containing DNA binding domains as described herein are described, for example, in US patents No. 6,453,242; No. 6,503,717; #6,534,261; #6,599,692; No. 6,607,882; No. 6,689,558; No. 6,824,978; No. 6,933,113; #6,979,539; No. 7,013,219; and No. 7,163,824; the contents of all listed patents are hereby incorporated by reference in their entirety.
[0167] ДНК-связывающие домены и гибридные белки, содержащие указанные ДНК-связывающие домены согласно описанию в настоящем документе, могут также быть доставлены с применением векторов, содержащих последовательности, кодирующие один или более ДНК-связывающих белков. Кроме того, с помощью указанных векторов также могут быть доставлены дополнительные нуклеиновые кислоты (например, донорные). Могут применяться любые векторные системы, в том числе, но не ограничиваясь перечисленными, плазмидные векторы, ретровирусные векторы, лентивирусные векторы, аденовирусные векторы, поксвирусные векторы; герпесвирусные векторы, векторы на основе аденоассоциированного вируса; и т.п. См. также патенты США №6,534,261; №6,607,882; №6,824,978; №6,933,113; №6,979,539; №7,013,219; и №7,163,824, полностью включенные посредством ссылки в настоящий документ. Кроме того, понятно, что любые из указанных векторов могут, при необходимости, содержать одну или более кодирующих ДНК-связывающий белок последовательностей и/или дополнительных нуклеиновых кислот. Соответственно, при введении в клетку одного или более ДНК-связывающих белков согласно описанию в настоящем документе и, при необходимости, дополнительных ДНК, их может переносить один и тот же вектор или разные векторы. При использовании нескольких векторов каждый вектор может содержать последовательность, кодирующую один или несколько ДНК-связывающих белков и, при необходимости, дополнительных нуклеиновых кислот.[0167] DNA binding domains and fusion proteins containing said DNA binding domains as described herein can also be delivered using vectors containing sequences encoding one or more DNA binding proteins. In addition, additional nucleic acids (for example , donor ones) can also be delivered using these vectors. Any vector systems may be used, including, but not limited to, plasmid vectors, retroviral vectors, lentiviral vectors, adenovirus vectors, poxvirus vectors; herpesvirus vectors, adeno-associated virus vectors; etc. See also US Pat. Nos. 6,534,261; No. 6,607,882; No. 6,824,978; No. 6,933,113; #6,979,539; No. 7,013,219; and No. 7,163,824, incorporated herein by reference in their entirety. In addition, it is understood that any of these vectors may optionally contain one or more DNA-binding protein-encoding sequences and/or additional nucleic acids. Accordingly, when one or more of the DNA-binding proteins as described herein, and optionally additional DNA, are introduced into a cell, they may be carried by the same vector or by different vectors. When using multiple vectors, each vector may contain a sequence encoding one or more DNA-binding proteins and, if necessary, additional nucleic acids.
[0168] Для введения нуклеиновых кислот, кодирующих сконструированные ДНК-связывающие белки, в клетки (например, клетки млекопитающих) и целевые ткани и, при необходимости, для совместного введения дополнительных последовательностей нуклеотидов могут применяться стандартные вирусные или невирусные способы переноса генов. Такие способы могут также применяться для введения нуклеиновых кислот (например, кодирующих ДНК-связывающие белки и/или донорных НК) в клеткиin vitro. Согласно некоторым вариантам реализации нуклеиновые кислоты вводят для применения в генной терапииin vivo илиex vivo. Невирусные векторные системы доставки включают ДНК-плазмиды, депротеинизированные нуклеиновые кислоты и комплексы нуклеиновых кислот с основой для доставки, такой как липосома или полоксамер. Вирусные векторные системы доставки включают ДНК- и РНК-вирусы, который содержат либо эписомные, либо интегрированные геномы после доставки в клетку. Обзорную информацию о процедурах генной терапии можно найти в источниках: Anderson,Science 256:808-813 (1992); Nabel & Felgner,TIBTECH 11:211-217 (1993); Mitani & Caskey,TIBTECH 11:162-166 (1993); Dillon,TIBTECH 11:167-175 (1993); Miller,Nature 357:455-460 (1992); Van Brunt,Biotechnology 6(10):1149-1154 (1988); Vigne,Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet,British Medical Bulletin 51(1):31-44 (1995); Haddadaet al., в издании:Current Topics in Microbiology and Immunology, Doerfler and (eds.) (1995); и Yuet al.,Gene Therapy 1:13-26 (1994).[0168] Standard viral or non-viral gene transfer techniques can be used to introduce nucleic acids encoding engineered DNA-binding proteins into cells (e.g., mammalian cells) and target tissues and, if necessary, to co-administer additional nucleotide sequences. Such methods can also be used to introduce nucleic acids (eg encoding DNA-binding proteins and/or donor NAs) into cellsin vitro . In some embodiments, nucleic acids are administered for use inin vivo orex vivo gene therapy. Non-viral vector delivery systems include DNA plasmids, deproteinized nucleic acids, and complexes of nucleic acids with a delivery backbone such as a liposome or poloxamer. Viral vector delivery systems include DNA and RNA viruses that contain either episomal or integrated genomes after delivery into a cell. An overview of gene therapy procedures can be found in: Anderson,Science 256:808-813 (1992); Nabel & Felgner,TIBTECH 11:211-217 (1993); Mitani & Caskey,TIBTECH 11:162-166 (1993); Dillon,TIBTECH 11:167-175 (1993); Miller,Nature 357:455-460 (1992); Van Brunt,Biotechnology 6(10):1149-1154 (1988); Vigne,Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet,British Medical Bulletin 51(1):31-44 (1995); Haddadaet al ., inCurrent Topics in Microbiology and Immunology , Doerfler and (eds.) (1995); and Yuet al .,Gene Therapy 1:13-26 (1994).
[0169] Способы невирусной доставки нуклеиновых кислот включают электропорацию, липофекцию, микроинъекцию, биолистику, виросомы, липосомы, иммунолипосомы, поликатионы или конъюгаты липидов с нуклеиновыми кислотами, депротеинизированную ДНК, мРНК, искусственные вирионы и усиленное агентами поглощение ДНК. Для доставки нуклеиновых кислот может также применяться сонопорация с применением, например, системы Sonitron 2000 (Rich-Mar). Согласно предпочтительному варианту реализации одну или более нуклеиновых кислот доставляют в виде мРНК. Также предпочтительно применение кэпированных мРНК для увеличения эффективности трансляции и/или стабильности мРНК. В частности, предпочтительными являются аналоги кэпов без возможности включения в обратной ориентации (ARCA, «anti-reverse cap analog») или их варианты. См. патенты США №.7,074,596 и №8,153,773, включенные в настоящий документ посредством ссылки.[0169] Methods for non-viral delivery of nucleic acids include electroporation, lipofection, microinjection, biolistics, virosomes, liposomes, immunoliposomes, polycations or lipid-nucleic acid conjugates, deproteinized DNA, mRNA, artificial virions, and agent-enhanced DNA uptake. Sonoporation can also be used to deliver nucleic acids using, for example, the Sonitron 2000 system (Rich-Mar). In a preferred embodiment, one or more nucleic acids are delivered as mRNA. It is also preferred to use capped mRNAs to increase translation efficiency and/or mRNA stability. In particular, cap analogs without the possibility of switching in reverse orientation (ARCA, "anti-reverse cap analog") or their variants are preferred. See US Pat. Nos. 7,074,596 and 8,153,773, incorporated herein by reference.
[0170] Дополнительные примеры систем доставки нуклеиновых кислот включают поставляемые Amaxa Biosystems (Кельн, Германия), Maxcyte, Inc. (Роквилл, Мэриленд), BTX Molecular Delivery Systems (Холлистон, Массачусетс) и Copernicus Therapeutics Inc, (см., например US6008336). Липофекция описана,например, в US 5049386, US 4946787; и US 4897355); в продаже имеются реагенты для липофекции (например, Трансфектам™, Липофектин™ и Липофектамин™ (Lipofectamine RNAiMAX). Катионные и нейтральные липиды, которые подходят для эффективной липофекции полинуклеотидами с распознаванием рецепторами, включают описанные Felgner (WO 91/17424, WO 91/16024). Может осуществляться доставка в клетки (введение ex vivo) или в целевые ткани (введение in vivo).[0170] Additional examples of nucleic acid delivery systems include those supplied by Amaxa Biosystems (Cologne, Germany), Maxcyte, Inc. (Rockville, Maryland), BTX Molecular Delivery Systems (Holliston, Massachusetts) and Copernicus Therapeutics Inc, (see eg US6008336). Lipofection is described,for example , in US 5049386, US 4946787; and US 4,897,355); commercially available lipofection reagents (e.g. Transfectam™, Lipofectin™ and Lipofectamine™ (Lipofectamine RNAiMAX). Cationic and neutral lipids that are suitable for efficient lipofection with receptor recognition polynucleotides include those described by Felgner (WO 91/17424, WO 91/16024 May be delivered to cells (ex vivo administration) or to target tissues (in vivo administration).
[0171] Получение комплексов липидов с нуклеиновой кислотой, в том числе нацеленных липосом, таких как иммунолипидные комплексы, хорошо известно специалисту в данной области техники (см., например, Crystal,Science 270:404-410 (1995); Blaeseet al.,Cancer Gene Ther. 2:291-297 (1995); Behret al.,Bioconjugate Chem. 5:382-389 (1994); Remyet al.,BioconjugateChem. 5:647-654 (1994); Gaoet al.,Gene Therapy 2:710-722 (1995); Ahmadet al.,Cancer Res. 52:4817-4820 (1992); патенты США №4,186,183, №4,217,344, №4,235,871, №4,261,975, №4,485,054, №4,501,728, №4,774,085, №4,837,028 и №4,946,787).[0171] The preparation of nucleic acid lipid complexes, including targeted liposomes such as immunolipid complexes, is well known to those skilled in the art (see, e.g., Crystal,Science 270:404-410 (1995); Blaeseet al . ,Cancer Gene Ther 2:291-297 (1995), Behret al ,Bioconjugate Chem 5:382-389 (1994), Remyet al ,BioconjugateChem 5:647-654 (1994), Gaoet al .al .,Gene Therapy 2:710-722 (1995), Ahmadet al.,Cancer Res . 52:4817-4820 (1992), US Pat. , #4,774,085, #4,837,028 and #4,946,787).
[0172] Дополнительные способы доставки включают упаковку доставляемых нуклеиновых кислот в основы для доставки EnGeneIC (EDV). Указанные EDV специфически доставляют в целевые ткани с применением биспецифических антител; одно «плечо» указанного антитела обладает специфичностью в отношении целевой ткани, а другое обладает специфичностью в отношении EDV. Указанное антитело транспортирует EDV на поверхность целевой клетки, после чего EDV попадает внутрь указанной клетки путем эндоцитоза. После попадания в клетку содержимое высвобождается (см. MacDiarmidet al (2009)Nature Biotechnology 27(7) p. 643).[0172] Additional delivery methods include packaging the delivered nucleic acids into EnGeneIC delivery backbones (EDVs). These EDVs are specifically delivered to target tissues using bispecific antibodies; one arm of said antibody is specific for the target tissue and the other is specific for EDV. The specified antibody transports the EDV to the surface of the target cell, after which the EDV enters the inside of the specified cell by endocytosis. After entering the cell, the contents are released (see MacDiarmidet al (2009)Nature Biotechnology 27(7) p. 643).
[0173] Применение РНК или ДНК на основе вирусных систем доставки нуклеиновых кислот, кодирующих сконструированные ДНК-связывающие белки, и/или доноров (например, CAR или ACTR), при необходимости, обеспечивает преимущество, заключающееся в усовершенствованных процессах нацеливания вируса на специфические клетки в организме и транспортировки вирусной нагрузки в ядро. Вирусные векторы могут быть введены непосредственно пациентам (in vivo) или могут применяться для обработки клеток in vitro, после чего модифицированные клетки вводят пациентам (ex vivo). Стандартные системы доставки нуклеиновых кислот на основе вирусов включают, не ограничиваясь перечисленными, ретровирусные, лентивирусные, аденовирусные векторы, векторы для переноса генов на основе аденоассоциированного вируса, вируса осповакцины и простого герпеса. Интеграция в геном хозяина возможна с применением способов переноса генов на основе ретровирусов, лентивирусов и аденоассоциированного вируса, часто обеспечивающих долгосрочную экспрессию встроенного трансгена. Кроме того, наблюдалась высокая эффективность трансдукции в клетках и целевых тканях множества разных типов.[0173] The use of RNA or DNA-based viral delivery systems for nucleic acids encoding engineered DNA-binding proteins and/or donors (e.g. , CAR or ACTR) as needed provides the advantage of improved processes for targeting virus to specific cells in body and transport the viral load to the nucleus. Viral vectors can be administered directly to patients (in vivo ) or can be used to treat cells in vitro, after which the modified cells are administered to patients (ex vivo ). Standard virus-based nucleic acid delivery systems include, but are not limited to, retroviral, lentiviral, adenovirus, adeno-associated virus, vaccinia virus, and herpes simplex gene transfer vectors. Integration into the host genome is possible using retroviral, lentivirus, and adeno-associated virus-based gene transfer techniques, often providing long-term expression of the inserted transgene. In addition, high transduction efficiency has been observed in many different types of cells and target tissues.
[0174] Тропизм ретровируса может быть изменен путем включения чужеродных белков оболочки, с расширением потенциальной популяции целевых клеток. Лентивирусные векторы представляют собой ретровирусные векторы, способные трансдуцировать или инфицировать неделящиеся клетки и, как правило, обеспечивающие получение высоких вирусных титров. Выбор ретровирусной системы переноса генов зависит от целевой ткани. Ретровирусные векторы состоят из цис-действующих длинных концевых повторов с пакующей емкостью до 6-10 Кб чужеродной последовательности. Минимальные цис-действующие LTR достаточны для репликации и упаковки векторов, которые затем используют для интеграции терапевтического гена в целевую клетку с обеспечением постоянной трансгенной экспрессии. Широко используемые ретровирусные векторы включают векторы на основе вируса лейкоза мышей (MuLV), вируса лейкоза гиббонов (GaLV), вируса иммунодефицита обезьян (SIV), вируса иммунодефицита человека (ВИЧ) и их комбинаций (см., например, Buchscheret al.,J. Virol. 66:2731-2739 (1992); Johannet al.,J. Virol. 66:1635-1640 (1992); Sommerfeltet al.,Virol. 176:58-59 (1990); Wilsonet al.,J. Virol. 63:2374-2378 (1989); Milleret al.,J. Virol. 65:2220-2224 (1991); PCT/US94/05700).[0174] Retrovirus tropism can be altered by incorporating foreign envelope proteins, expanding the potential target cell population. Lentiviral vectors are retroviral vectors capable of transducing or infecting non-dividing cells and generally producing high viral titers. The choice of retroviral gene transfer system depends on the target tissue. Retroviral vectors consist of cis-acting long terminal repeats with a packaging capacity of up to 6-10 kb of foreign sequence. The minimal cis-acting LTRs are sufficient to replicate and package the vectors, which are then used to integrate the therapeutic gene into the target cell for consistent transgene expression. Commonly used retroviral vectors include murine leukemia virus (MuLV), gibbon leukemia virus (GaLV), simian immunodeficiency virus (SIV), human immunodeficiency virus (HIV), and combinations thereof (see, e.g., Buchscheret al .,J Virol 66:2731-2739 (1992) Johannet al .,J. Virol 66:1635-1640 (1992) Sommerfeltet al .,Virol 176:58-59 (1990) Wilsonet al . ,J. Virol 63:2374-2378 (1989); Milleret al.,J. Virol 65:2220-2224 (1991); PCT/US94/05700).
[0175] В вариантах применения, согласно которым предпочтительна транзиентная экспрессия, могут применяться системы на основе аденовирусов. Векторы на основе аденовирусов способны обеспечивать очень высокую эффективность трансдукции во многих типах клеток и не требуют деления клеток. При использовании таких векторов были получены высокие титры и высокие уровни экспрессии. Указанный вектор может быть получен в количествах в относительно простой системе. Векторы на основе аденоассоциированного вируса («AAV») также применяют для трансдукции клеток целевыми нуклеиновыми кислотами, например, при получении нуклеиновых кислот и пептидов in vitro и при процедурах генной терапииin vivo иex vivo (см., например, Westet al., Virology 160:38-47 (1987); патент США №4,797,368; WO 93/24641; Kotin,Human Gene Therapy 5:793-801 (1994); Muzyczka,J. Clin. Invest. 94:1351 (1994). Конструирование рекомбинантных AAV-векторов описано в ряде публикаций, в том числе в патенте США №5,173,414; у Tratschinet al.,Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin,et al.,Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka,PNAS USA 81:6466-6470 (1984); и Samulskiet al.,J. Virol. 63:03822-3828 (1989).[0175] In applications where transient expression is preferred, adenovirus-based systems can be used. Adenovirus-based vectors are capable of very high transduction efficiency in many cell types and do not require cell division. When using such vectors, high titers and high levels of expression were obtained. The specified vector can be obtained in quantities in a relatively simple system. Adeno-associated virus ("AAV") vectors are also used to transduce cells with target nucleic acids, for example, inin vitro production of nucleic acids and peptides and inin vivo andex vivo gene therapy procedures (see, for example, Westet al ., Virology 160:38-47 (1987), U.S. Patent No. 4,797,368, WO 93/24641, Kotin,Human Gene Therapy 5:793-801 (1994), Muzyczka,J. Clin Invest 94:1351 (1994). Recombinant AAV vectors have been described in a number of publications, including US Patent No. 5,173,414, Tratschinet al. ,Mol. Cell. Biol . 5:3251-3260 (1985); 4:2072-2081 (1984), Hermonat & Muzyczka,PNAS USA 81:6466-6470 (1984), and Samulskiet al .,J. Virol 63:03822-3828 (1989).
[0176] В настоящее время в клинических испытаниях используют по меньшей мере шесть подходов для переноса генов на основе вирусных векторов, задействующих подходы, которые включают комплементацию дефектных векторов генами, встроенными в клетки хелперных линий для получения трансдуцирующего агента.[0176] At least six viral vector-based gene transfer approaches are currently being used in clinical trials, involving approaches that include complementing defective vectors with genes inserted into helper cell lines to produce a transducing agent.
[0177] pLASN и MFG-S представляют собой примеры ретровирусных векторов, которые применялись в клинических испытаниях (Dunbaret al.,Blood 85:3048-305 (1995); Kohnet al.,Nat. Med.1:1017-102 (1995); Malechet al., PNAS USA 94:22 12133-12138 (1997)). PA317/pLASN был первым терапевтическим вектором, использованным в испытаниях генной терапии. (Blaeseet al.,Science 270:475-480 (1995)). Эффективность трансдукции 50% или выше наблюдалась для упакованных векторов MFG-S. (Ellemet al.,Immunol Immunother. 44(1):10-20 (1997); Dranoffet al.,Hum. Gene Ther. 1:111-2 (1997).[0177] pLASN and MFG-S are examples of retroviral vectors that have been used in clinical trials (Dunbaret al .,Blood 85:3048-305 (1995); Kohnet al .,Nat. Med. 1:1017-102 ( 1995); Malechet al., PNAS USA 94:22 12133-12138 (1997)). PA317/pLASN was the first therapeutic vector used in gene therapy trials. (Blaeseet al .,Science 270:475-480 (1995)). Transduction efficiencies of 50% or higher have been observed for packaged MFG-S vectors. (Ellemet al .,Immunol Immunother . 44(1):10-20 (1997); Dranoffet al .,Hum. Gene Ther . 1:111-2 (1997).
[0178] Рекомбинантные векторы на основе аденоассоциированного вируса (rAAV) представляют собой многообещающую альтернативную систему доставки генов, основанную на дефектной непатогенном аденоассоциированном парвовирусе 2 типа. Все векторы происходят из плазмиды, в которой сохранены только инвертированные концевые повторы AAV длиной 145 пар оснований, фланкирующие несущую трансген экспрессионную кассету. Эффективный перенос генов и стабильная доставка трансгенов за счет интеграции в геномы трансдуцированных клеток являются ключевыми признаками указанной векторной системы. (Wagneret al.,Lancet 351:9117 1702-3 (1998), Kearnset al.,Gene Ther. 9:748-55 (1996)). Другие серотипы AAV, в том числе AAV1, AAV3, AAV4, AAV5, AAV6, AAV8, AAV8.2, AAV9 и AAVrh10 и псевдотипированные AAV, такие как AAV2/8, AAV2/5 и AAV2/6, могут также применяться в соответствии с настоящим изобретением.[0178] Recombinant adeno-associated virus (rAAV) vectors are a promising alternative gene delivery system based on the defective non-pathogenic adeno-associated
[0179] Дефектные по репликации рекомбинантные аденовирусные векторы (Ad) могут быть получены с высокими титрами и легко инфицируют ряд разных типов клеток. Большинство аденовирусных векторов конструируют таким образом, что трансген заменяет гены Ad E1a, E1b и/или E3; затем дефектный по репликации вектор размножают в клетках 293 человека, которые обеспечивают функцию делетированного генатранс-активным образом. Ad-векторами можно трансдуцировать несколько типов тканей in vivo, в том числе неделящиеся дифференцированные клетки, например, присутствующие в печени, почках и мышцах. Стандартные Ad-векторы обладают значительной несущей способностью. Пример применения Ad-вектора в ходе клинического испытания включал терапию полинуклеотидами для противоопухолевой иммунизации путем внутримышечной инъекции (Stermanet al.,Hum. Gene Ther. 7:1083-9 (1998)). Дополнительные примеры применения аденовирусных векторов для переноса генов в клинических испытаниях включают описанные в источниках: Roseneckeret al.,Infection 24:1 5-10 (1996); Stermanet al.,Hum. Gene Ther. 9:7 1083-1089 (1998); Welshet al.,Hum. Gene Ther. 2:205-18 (1995); Alvarezet al.,Hum. Gene Ther. 5:597-613 (1997); Topfet al.,Gene Ther. 5:507-513 (1998); Stermanet al.,Hum. Gene Ther. 7:1083-1089 (1998).[0179] Replication-deficient recombinant adenoviral vectors (Ad) can be produced at high titers and easily infect a number of different cell types. Most adenoviral vectors are designed such that the transgene replaces the Ad E1a, E1b and/or E3 genes; the replication-deficient vector is then propagated in human 293 cells which provide the function of the deleted gene in atransactive manner. Ad vectors can transduce several tissue types in vivo, including non-dividing, differentiated cells such as those present in liver, kidney, and muscle. Standard Ad-vectors have a significant bearing capacity. An example of the use of an Ad vector in a clinical trial included polynucleotide therapy for antitumor immunization by intramuscular injection (Stermanet al .,Hum. Gene Ther . 7:1083-9 (1998)). Additional examples of the use of adenoviral vectors for gene transfer in clinical trials include those described in: Roseneckeret al .,Infection 24:1 5-10 (1996); Stermanet al .,Hum. Gene Ther . 9:7 1083-1089 (1998); Welshet al .,Hum. Gene Ther . 2:205-18 (1995); Alvarezet al .,Hum. Gene Ther . 5:597-613 (1997); Topfet al .,Gene Ther . 5:507-513 (1998); Stermanet al .,Hum. Gene Ther . 7:1083-1089 (1998).
[0180] Пакующие клетки используют для получения вирусных частиц, способных инфицировать клетку-хозяина. Такие клетки включают клетки 293, пакующие аденовирусы, и клетки ψ2 или клетки PA317, пакующие ретровирусы. Вирусные векторы для применения в генной терапии обычно получают в линии клеток-продуцентов, пакующих вектор с нуклеиновой кислотой в вирусную частицу. Указанные векторы, как правило, содержат минимальные вирусные последовательности, необходимые для упаковки и последующей интеграции в геном хозяина (в подходящих случаях); другие вирусные последовательности заменены экспрессионной кассетой, кодирующей белок, который нужно экспрессировать. Отсутствующие вирусные функции восполняются за счеттранс-активности клетками линии пакующих клеток. Например, AAV-векторы, применяемые в генной терапии, как правило, содержат только последовательности инвертированных концевых повторов (ITR) из генома AAV, необходимые для упаковки и интеграции в геном хозяина. Вирусную ДНК пакуют клетки линии, содержащей хелперную плазмиду, кодирующую другие гены AAV, а именно, rep и cap, однако не содержащую последовательности ITR. Указанную линию клеток также инфицируют аденовирусом в качестве хелперного вируса. Хелперный вирус способствует репликации AAV-вектора и экспрессии генов AAV с хелперной плазмиды. Хелперная плазмида не пакуется в значимых количествах ввиду отсутствия последовательностей ITR. Заражение аденовирусом может быть снижено с помощью, например, термообработки, к которой аденовирус более чувствителен, чем AAV.[0180] Packaging cells are used to produce viral particles capable of infecting a host cell. Such cells include 293 cells that package adenoviruses and ψ2 cells or PA317 cells that package retroviruses. Viral vectors for use in gene therapy are usually produced in a producer cell line that packages a nucleic acid vector into a viral particle. These vectors typically contain the minimum viral sequences required for packaging and subsequent integration into the host genome (if appropriate); the other viral sequences are replaced by an expression cassette encoding the protein to be expressed. Missing viral functions are replenished bytrans activity by the cells of the packaging cell line. For example, AAV vectors used in gene therapy typically contain only inverted terminal repeat (ITR) sequences from the AAV genome required for packaging and integration into the host genome. The viral DNA is packaged in a cell line containing a helper plasmid encoding other AAV genes, namely rep and cap, but lacking the ITR sequence. Said cell line is also infected with adenovirus as a helper virus. The helper virus promotes replication of the AAV vector and expression of the AAV genes from the helper plasmid. The helper plasmid does not pack in significant amounts due to the lack of ITR sequences. Adenovirus infection can be reduced by, for example, heat treatment, to which adenovirus is more sensitive than AAV.
[0181] Во многих вариантах применения для генной терапии желательна доставка вектора для генной терапии с высокой степенью специфичности в конкретный тип ткани. Соответственно, вирусный вектор может быть модифицирован таким образом, чтобы обладать специфичностью в отношении определенного типа клеток, за счет экспрессии лиганда в виде белка, гибридизованого с белком вирусной оболочки на внешней поверхности вируса. Выбирают лиганд, обладающий аффинностью в отношении рецептора, который, как известно, присутствует на клетке представляющего интерес типа. Например, Han с соавторами (Hanet al.,Proc. Natl. Acad. Sci. USA 92:9747-9751 (1995)) сообщают, что вирус лейкоза мышей Молони может быть модифицирован для экспрессии херегулина человека, гибридизованого с gp70, и что указанный рекомбинантный вирус инфицирует определенные клетки рака молочной железы человека, экспрессирующие рецептор эпидермального фактора роста человека. Указанный принцип может быть распространен на другие пары вирус/целевая клетка, в которых целевая клетка экспрессирует рецептор, а вирус экспрессирует гибридный белок, содержащий лиганд рецептора на поверхности клетки. Например, может быть сконструирован нитчатый фаг для дисплея фрагментов антитела (например, FAB или Fv), обладающих специфической аффинностью связывания в отношении практически любого выбранного клеточного рецептора. Хотя описание выше относится в первую очередь к вирусным векторам, те же принципы могут применяться в отношении невирусных векторов. Могут быть сконструированы такие векторы, содержащие специфические последовательности для поглощения, способствующие поглощению специфическими целевыми клетками.[0181] In many gene therapy applications, delivery of a gene therapy vector with a high degree of specificity to a particular tissue type is desirable. Accordingly, the viral vector can be modified to be cell type specific by expressing the ligand as a protein hybridized to the viral envelope protein on the outer surface of the virus. A ligand is selected that has affinity for a receptor known to be present on the cell type of interest. For example, Hanet al .,Proc. Natl. Acad. Sci. USA 92:9747-9751 (1995)) report that Moloney murine leukemia virus can be modified to express human heregulin hybridized to gp70, and that said recombinant virus infects certain human breast cancer cells expressing the human epidermal growth factor receptor. This principle can be extended to other virus/target cell pairs in which the target cell expresses the receptor and the virus expresses a fusion protein containing the receptor ligand on the cell surface. For example, a filamentous phage can be engineered to display antibody fragments (eg , FAB or Fv) that have a specific binding affinity for virtually any chosen cellular receptor. Although the description above applies primarily to viral vectors, the same principles can be applied to non-viral vectors. Such vectors can be designed to contain specific uptake sequences to promote uptake by specific target cells.
[0182] Способы доставки систем CRISPR/Cas могут включать способы, описанные выше. Например, в моделях на животных транскрибированнаяin vitro кодирующая Cas мРНК или рекомбинантный белок Cas могут быть инъецированы непосредственно в эмбрионы животных с редактируемым геномом на стадии одной клетки с применением стеклянных игл. Как правило, для экспрессии Cas и направляющих РНК в клеткахin vitro клетки трансфицируют плазмидами, которые их кодируют, посредством липофекции или электропорации. Также может быть получен комплекс рекомбинантного белка Cas с транскрибированнойin vitro направляющей РНК, при этом рибонуклеопротеин Cas и направляющей РНК поглощается представляющими интерес клетками (Kimet al (2014)Genome Res 24(6):1012). При терапевтическом применении Cas и направляющие РНК могут быть доставлены с помощью комбинации вирусных и невирусных методик. Например, мРНК, кодирующая Cas, может быть доставлена с помощью наночастиц, а направляющие РНК и любой требуемый трансген или матрицу для репарации доставляют с помощью AAV (Yinet al (2016)Nat Biotechnol 34(3) p. 328).[0182] Delivery methods for CRISPR/Cas systems may include the methods described above. For example, in animal models,in vitro transcribed Cas-encoding mRNA or recombinant Cas protein can be injected directly into genome-edited animal embryos at the single cell stage using glass needles. Typically, in order to express Cas and guide RNAs in cellsin vitro , cells are transfected with plasmids that encode them by lipofection or electroporation. A complex of the recombinant Cas protein with anin vitro transcribed guide RNA can also be made, with the Cas ribonucleoprotein and the guide RNA being taken up by the cells of interest (Kimet al (2014)Genome Res 24(6):1012). In therapeutic applications, Cas and guide RNAs can be delivered using a combination of viral and non-viral techniques. For example, mRNA encoding Cas can be delivered by nanoparticles, and guide RNAs and any desired transgene or repair template delivered by AAV (Yinet al (2016)Nat Biotechnol 34(3) p. 328).
[0183] Геннотерапевтические векторы могут быть доставленыin vivo путем введения индивидуальному пациенту, как правило, путем системного введения (например, внутривенной, внутрибрюшинной, внутримышечной, субдермальной или интракраниальной инфузии) или местного применения согласно приведенному ниже описанию. Как вариант, векторы могут быть доставлены в клеткиex vivo, например, в клетки, эксплантированные из организма индивидуального пациента (например, лимфоциты, аспират костного мозга, биоптаты ткани), или универсальные донорные гематопоэтические стволовые клетки, с последующей реимплантацией клеток пациенту, обычно после отбора клеток, включивших указанный вектор.[0183] Gene therapy vectors can be deliveredin vivo by administration to an individual patient, typically by systemic administration (e.g. , intravenous, intraperitoneal, intramuscular, subdermal, or intracranial infusion) or topical application as described below. Alternatively, vectors can be delivered toex vivo cells, such as cells explanted from an individual patient (e.g. , lymphocytes, bone marrow aspirate, tissue biopsy), or universal donor hematopoietic stem cells, followed by reimplantation of the cells into the patient, usually after selection of cells that included the specified vector.
[0184] Трансфекция клетокex vivo для диагностики, исследований, трансплантации или для генной терапии (например, посредством реинфузии трансфицированных клеток в организм хозяина) хорошо известна специалистам в данной области техники. Согласно предпочтительному варианту реализации клетки выделяют из организма субъекта, трансфицируют нуклеиновой кислотой ДНК-связывающих белков (генной или кДНК), и повторно инфузируют в организм субъекта (например, пациента). Различные типы клеток, подходящие для трансфекции ex vivo, хорошо известных специалистам в данной области техники (см., например, обсуждение способов выделения и культивирования клеток, полученных от пациентов, в руководстве: Freshneyet al.,Culture of Animal Cells, A Manual of Basic Technique (3rd ed. 1994)) и в упоминаемых в настоящем документе источниках).[0184]Ex vivo transfection of cells for diagnosis, research, transplantation, or for gene therapy (eg , via reinfusion of transfected cells into a host) is well known to those skilled in the art. In a preferred embodiment, cells are isolated from a subject, transfected with a nucleic acid of DNA-binding proteins (gene or cDNA), and re-infused into the subject (eg , patient). Various cell types suitable for ex vivo transfection are well known to those skilled in the art (see, for example, the discussion of methods for isolating and culturing patient-derived cells in Freshneyet al. ,Culture of Animal Cells, A Manual of Basic Technique (3rd ed. 1994) and references cited herein).
[0185] Согласно одному варианту реализации стволовые клетки используют в процедурахex vivo для трансфекции клеток и генной терапии. Преимущество применения стволовых клеток заключается в том, что они могут дифференцировать в другие типы клеток in vitro, или могут быть введены млекопитающему (например, донору клеток), где приживутся в костном мозге. Известны способы дифференцировки CD34+ клеток in vitro в клинически важные типы иммунных клеток с применением цитокинов, таких как ГМ-КСФ, ИФН-γ и ФНО-α (см. Inabaet al.,J. Exp. Med. 176:1693-1702 (1992)).[0185] In one embodiment, stem cells are used inex vivo procedures for cell transfection and gene therapy. An advantage of using stem cells is that they can differentiate into other cell types in vitro, or can be injected into a mammal (eg, a cell donor) where they become established in the bone marrow. Methods are known to differentiate CD34+ cells in vitro into clinically important immune cell types using cytokines such as GM-CSF, IFN-γ, and TNF-α (see Inabaet al .,J. Exp. Med. 176:1693-1702 ( 1992)).
[0186] Стволовые клетки выделяют для трансдукции и дифференцировки с применением известных способов. Например, стволовые клетки выделяют из клеток костного мозга путем пэннинга клеток костного мозга с антителами, которые связывают нежелательные клетки, такие как CD4+ и CD8+ (T-клетки), CD45+ (пан-B клетки), GR-1 (гранулоциты) и Iad (дифференцированные антигенпрезентирующие клетки) (см. Inabaet al.,J. Exp. Med. 176:1693-1702 (1992)).[0186] Stem cells are isolated for transduction and differentiation using known methods. For example, stem cells are isolated from bone marrow cells by panning bone marrow cells with antibodies that bind unwanted cells such as CD4+ and CD8+ (T cells), CD45+ (pan-B cells), GR-1 (granulocytes), and Iad ( differentiated antigen presenting cells) (see Inabaet al .,J. Exp. Med . 176:1693-1702 (1992)).
[0187] Согласно некоторым вариантам реализации могут также применяться стволовые клетки, которые были модифицированы. Например, в качестве терапевтических композиций могут применяться нервные стволовые клетки, которым была придана устойчивость к апоптозу, и при это также содержащие ТФ ZFP согласно настоящему изобретению. Устойчивость к апоптозу может быть обеспечена, например, путем нокаута BAX и/или BAK с применением BAX- или BAK-специфических ZFN (см. патент США №8,597,912) в стволовых клетках, или разрушения каспазы, опять же, с применением, например, каспаза-6-специфических ZFN.[0187] In some embodiments, stem cells that have been modified may also be used. For example, neural stem cells that have been rendered resistant to apoptosis and also contain the ZFP TFs of the present invention can be used as therapeutic compositions. Apoptosis resistance can be achieved, for example, by knocking out BAX and/or BAK using BAX- or BAK-specific ZFNs (see U.S. Patent No. 8,597,912) in stem cells, or destroying caspase, again using, for example, caspase -6-specific ZFNs.
[0188] Векторы (например, ретровирусы, аденовирусы, липосомы и т.п.), содержащие терапевтические ДНК-связывающие белки (или нуклеиновые кислоты, кодирующие указанные белки) могут также быть введены непосредственно в организм для трансдукции клетокin vivo. Как вариант, может быть введена депротеинизированная ДНК. Введение осуществляют через любой маршрут, обычно используемый для приведения молекулы в максимальный контакт с кровью или тканевыми клетками, в том числе, но не ограничиваясь перечисленными, путем инфекции, инфузии, местного применения и электропорации. Подходящие способы введения таких нуклеиновых кислот доступны и хорошо известны специалистам в данной области техники; при этом, хотя для введения конкретной композиции может быть использован более чем один маршрут, часто какой-либо конкретный маршрут может обеспечивать более быструю и более эффективную реакцию по сравнению с другим маршрутом.[0188] Vectors (eg , retroviruses, adenoviruses, liposomes, etc.) containing therapeutic DNA-binding proteins (or nucleic acids encoding said proteins) can also be introduced directly into the body forin vivo cell transduction. Alternatively, deproteinized DNA may be introduced. Administration is via any route commonly used to bring the molecule into maximum contact with blood or tissue cells, including, but not limited to, infection, infusion, topical application, and electroporation. Suitable methods for introducing such nucleic acids are available and well known to those skilled in the art; while more than one route may be used to introduce a particular composition, often a particular route may provide a faster and more efficient response than another route.
[0189] Способы введения ДНК в гематопоэтические стволовые клетки описаны, например, в патенте США №5,928,638. Векторы, подходящие для введения трансгенов в гематопоэтические стволовые клетки, например, CD34+ клетки, включают аденовирус типа 35.[0189] Methods for introducing DNA into hematopoietic stem cells are described, for example, in US patent No. 5,928,638. Suitable vectors for introducing transgenes into hematopoietic stem cells, such as CD34+ cells, include
[0190] Векторы, подходящие для введения трансгенов в иммунные клетки (например, T-клетки), включают неинтегрируемые лентивирусные векторы. См., например, Oryet al. (1996)Proc. Natl. Acad. Sci. USA 93:11382-11388; Dullet al. (1998)J. Virol. 72:8463-8471; Zufferyet al. (1998)J. Virol. 72:9873-9880; Follenziet al. (2000)Nature Genetics 25:217-222.[0190] Vectors suitable for introducing transgenes into immune cells (eg , T cells) include non-integrable lentiviral vectors. See, for example, Oryet al . (1996)Proc. Natl. Acad. sci. USA 93:11382-11388; Dullet al . (1998)J. Virol . 72:8463-8471; Zufferyet al . (1998)J. Virol . 72:9873-9880; Follenziet al . (2000)Nature Genetics 25:217-222.
[0191] Фармацевтически приемлемые носители определяют отчасти с учетом конкретной композиции для введения, а также конкретного способа, используемого для введения указанной композиции. Соответственно, доступен широкий спектр подходящих составов фармацевтических композиций согласно приведенному ниже описанию (см., например, Remington’s Pharmaceutical Sciences, 17th ed., 1989).[0191] Pharmaceutically acceptable carriers are determined in part by the particular composition for administration, as well as the particular method used to administer said composition. Accordingly, a wide range of suitable formulations of pharmaceutical compositions are available as described below (see, for example, Remington's Pharmaceutical Sciences, 17th ed., 1989).
[0192] Как отмечалось выше, описанные способы и композиции подходят для применения в клетках любого типа, в том числе, но не ограничиваясь перечисленными, прокариотических клетках, клетках грибов, клетках архей, клетках растений, клетках насекомых, клетках животных, клетках позвоночных, клетках млекопитающих и клетках человека, в том числе T-клетках и стволовых клетках любого типа. Подходящие линии клеток для экспрессии белка известны специалистам в данной области техники и включают, не ограничиваясь перечисленными, COS, CHO (например, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (например, HEK293-F, HEK293-H, HEK293-T), perC6, клетки насекомых, таких какSpodoptera fugiperda (Sf), и клетки грибов, таких как Saccharomyces, Pichia и Schizosaccharomyces. Могут также применяться потомство, варианты и производные клеток указанных линий.[0192] As noted above, the described methods and compositions are suitable for use in any type of cell, including, but not limited to, prokaryotic cells, fungal cells, archaeal cells, plant cells, insect cells, animal cells, vertebrate cells, cells mammalian and human cells, including T-cells and stem cells of any type. Suitable cell lines for protein expression are known to those skilled in the art and include, but are not limited to, COS, CHO (e.g., CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (e.g., HEK293-F, HEK293-H, HEK293-T), perC6, insect cells such asSpodoptera fugiperda (Sf), and cells fungi such as Saccharomyces, Pichia and Schizosaccharomyces. Progeny, variants and derivatives of these cell lines may also be used.
Варианты примененияApplications
[0193] Применение сконструированных нуклеаз для лечения и предотвращения заболевания предположительно будет представлять собой в ближайшие годы одну из областей наиболее значимого прогресса в медицине. Описанные в настоящем документе способы и композиции служат для увеличения специфичности указанных новых инструментов, позволяющей обеспечить, чтобы требуемый целевой сайт представлял собой первичное место расщепления. Для полной реализации потенциала всех вариантов примененияуказанной технологии in vitro,in vivo иex vivo требуется минимизация или элиминация нецелевого расщепления.[0193] The use of engineered nucleases to treat and prevent disease is expected to represent one of the most significant advances in medicine in the coming years. The methods and compositions described herein serve to increase the specificity of these new tools to ensure that the desired target site is the primary cleavage site. To realize the full potential of all applicationsspecified technologyin vitro,in vivo andex vivo minimization or elimination of off-target splitting is required.
[0194] Примеры генетических заболеваний включают, не ограничиваясь перечисленными, ахондроплазию, ахроматопсию, дефицит кислой мальтазы, дефицит аденозиндезаминазы (OMIM №102700), адренолейкодистрофию, синдром Экарди, дефицит альфа-1-антитрипсина, альфа-талассемию, синдром нечувствительности к андрогенам, синдром Аперта, аритмогенную дисплазию правого желудочка, дисплазию, атаксию-телеангиэктазию, синдром Барта, бета-талассемию, синдром синего пузырчатого невуса, болезнь Канавана, хронические гранулематозные заболевания (CGD), синдром кошачьего крика, кистозный фиброз, болезнь Деркума, эктодермальную дисплазию, анемию Фанкони, прогрессирующую оссифицирующую фибродисплазию, синдром ломкой X-хромосомы, галактоземию, болезнь Гоше, генерализованные ганглиозидозы (например, GM1), гемохроматоз, мутацию гемоглобина C в 6 кодоне бета-глобина (HbC), гемофилию, болезнь Гентингтона, синдром Гурлер, гипофосфатазию, синдром Клайнфельтера, болезнь Краббе, синдром Лангера-Гидиона, недостаточность адгезии лейкоцитов (LAD, OMIM №116920), лейкодистрофию, синдром удлиненного QT, синдром Марфана, синдром Мебиуса, мукополисахаридоз (MPS), синдром ногтей-надколенника, нефрогенный несахарный диабет, нейрофиброматоз, болезнь Ниманна-Пика, несовершенный остеогенез, фенилкетонурию (PKU), порфирию, синдром Прадера-Вилли, прогерию, синдром Протея, ретинобластому, синдром Ретта, синдром Рубинштейна-Тэйби, синдром Санфилиппо, тяжелый комбинированный иммунодефицит (ТКИД), синдром Швачмана, серповидноклеточную болезнь (серповидноклеточную анемию), синдром Смит-Магенис, синдром Стиклера, болезнь Тея-Сакса, синдром тромбоцитопении с отсутствием лучевой кости (TAR), синдром Тричера-Коллинза, трисомию, туберозный склероз, синдром Тернера, расстройство цикла мочевины, болезнь фон Гиппеля-Линдау, синдром Ваарденбурга, синдром Вильямса, болезнь Вильсона, синдром Вискотта-Олдрича, Х-сцепленный лимфопролиферативный синдром (XLP, OMIM №308240).[0194] Examples of genetic diseases include, but are not limited to, achondroplasia, achromatopsia, acid maltase deficiency, adenosine deaminase deficiency (OMIM No. 102700), adrenoleukodystrophy, Ecardi syndrome, alpha-1 antitrypsin deficiency, alpha thalassemia, androgen insensitivity syndrome, Apert, arrhythmogenic right ventricular dysplasia, dysplasia, ataxia-telangiectasia, Barth's syndrome, beta thalassemia, blue blister nevus syndrome, Canavan disease, chronic granulomatous diseases (CGD), crying cat syndrome, cystic fibrosis, Derkum's disease, ectodermal dysplasia, Fanconi anemia , progressive fibrodysplasia ossificans, fragile X syndrome, galactosemia, Gaucher disease, generalized gangliosidoses (e.g. GM1), hemochromatosis, hemoglobin C mutation at codon 6 of beta-globin (HbC), hemophilia, Huntington's disease, Hurler syndrome, hypophosphatasia, syndrome Klinefelter, Krabbe disease, Langer-Gidion syndrome, a deficiency leukocyte adhesion (LAD, OMIM No. 116920), leukodystrophy, long QT syndrome, Marfan syndrome, Mobius syndrome, mucopolysaccharidosis (MPS), patellar nail syndrome, nephrogenic diabetes insipidus, neurofibromatosis, Niemann-Pick disease, osteogenesis imperfecta, phenylketonuria (PKU) , porphyria, Prader-Willi syndrome, progeria, Proteus syndrome, retinoblastoma, Rett syndrome, Rubinstein-Taybi syndrome, Sanfilippo syndrome, severe combined immunodeficiency (SCID), Schwachmann syndrome, sickle cell disease (sickle cell anemia), Smith-Magenis syndrome, Stickler syndrome , Tay-Sachs disease, thrombocytopenia with absent radius (TAR), Treacher-Collins syndrome, trisomy, tuberous sclerosis, Turner syndrome, urea cycle disorder, von Hippel-Lindau disease, Waardenburg syndrome, Williams syndrome, Wilson's disease, Wiskott syndrome -Aldrich, X-linked lymphoproliferative syndrome (XLP, OMIM No. 308240).
[0195] Дополнительные примеры заболеваний, лечение которых может проводиться путем нацеленного расщепления и/или гомологичной рекомбинации ДНК включают приобретенный иммунодефицит, лизосомные болезни накопления (например, болезнь Гоше, ганглиозидоз GM1, болезнь Фабри и болезнь Тея-Сакса), мукополисахаридоз (например, болезнь Хантера, болезнь Гурлер), гемоглобинопатии (например, серповидноклеточные анемии, HbC, α-талассемию, β-талассемию) и гемофилии.[0195] Additional examples of diseases that can be treated by targeted DNA cleavage and/or homologous recombination include acquired immunodeficiency, lysosomal storage diseases (e.g. Gaucher disease, GM1 gangliosidosis, Fabry disease and Tay-Sachs disease), mucopolysaccharidosis (e.g. Hunter, Hurler's disease), hemoglobinopathies (eg , sickle cell anemia, HbC, α-thalassemia, β-thalassemia), and hemophilia.
[0196] Такие способы также позволяют проводить лечение инфекций (вирусных или бактериальных) у хозяина (например,путем блокирования экспрессии вирусных или бактериальных рецепторов, с предотвращением таким образом инфекции и/или распространения в организме хозяина) для лечения генетических заболеваний.[0196] Such methods also allow the treatment of infections (viral or bacterial) in the host (for example, by blocking the expression of viral or bacterial receptors, thus preventing infection and/or spread in the host) to treat genetic diseases.
[0197] Для лечения вирусных инфекций у хозяина может применяться нацеленное расщепление геномов инфицирующих или интегрированных вирусов. Кроме того, для блокирования экспрессии таких рецепторов может применяться нацеленное расщепление генов, кодирующих рецепторы вирусов, с предотвращением таким образом вирусной инфекции и/или распространения вируса в организме-хозяина. Нацеленный мутагенез генов, кодирующих вирусные рецепторы (например, рецепторы ВИЧ CCR5 и CXCR4), может применяться для придания указанным рецепторам неспособности связываться с вирусом, с предотвращением таким образом новой инфекции и блокированием распространения существующей инфекции. См. патентную публикацию США №2008/015996. Неограничивающие примеры вирусов или вирусных рецепторов, которые могут быть целевыми, включают вирус простого герпеса (HSV), такой как HSV-1 и HSV-2, вирус ветряной оспы (VZV), вирус Эпштейна-Барра (EBV) и цитомегаловирус (CMV), HHV6 и HHV7. Семейство вирусов гепатита включает вирус гепатита A (HAV), вирус гепатита B (HBV), вирус гепатита C (HCV), вирус гепатита дельта (HDV), вирус гепатита E (HEV) и вирус гепатита G (HGV). Может быть осуществлено нацеливание на другие вирусы или их рецепторы, в том числе, но не ограничиваясь перечисленными, Picornaviridae (например, полиовирусы и т.п.); Caliciviridae; Togaviridae (например, вирус краснухи, вирус денге и т.п.); Flaviviridae; Coronaviridae; Reoviridae; Birnaviridae; Rhabodoviridae (например, вирус бешенства и т.п.); Filoviridae; Paramyxoviridae (например, вирус эпидемического паротита, вирус кори, респираторно-синцитиальный вирус и т.п.); Orthomyxoviridae (например, вирус гриппа типа A, B и C и т.п.); Bunyaviridae; Arenaviridae; Retroviradae; лентивирусы (например, HTLV-I; HTLV-II; ВИЧ-1 (также известный как HTLV-III, LAV, ARV, hTLR и т.п.), ВИЧ-II); вирус иммунодефицита обезьян (SIV), папилломавирус человека (HPV), вирус гриппа и вирусы клещевого энцефалита. См., например, описание указанных и других вирусов в источниках: Virology, 3rd Edition (W.K. Joklik ed. 1988); Fundamental Virology, 2nd Edition (B.N. Fields и D.M. Knipe, eds. 1991). Рецепторы ВИЧ, например, включают CCR-5 и CXCR-4.[0197] Targeted cleavage of the genomes of the infecting or integrated viruses can be used to treat viral infections in the host. In addition, targeted cleavage of genes encoding viral receptors can be used to block the expression of such receptors, thereby preventing viral infection and/or spread of the virus in the host. Targeted mutagenesis of genes encoding viral receptors (eg HIV receptors CCR5 and CXCR4) can be used to render said receptors incapable of binding to a virus, thus preventing new infection and blocking the spread of an existing infection. See US Patent Publication No. 2008/015996. Non-limiting examples of viruses or viral receptors that may be targeted include herpes simplex virus (HSV), such as HSV-1 and HSV-2, varicella zoster virus (VZV), Epstein-Barr virus (EBV), and cytomegalovirus (CMV), HHV6 and HHV7. The hepatitis virus family includes hepatitis A virus (HAV), hepatitis B virus (HBV), hepatitis C virus (HCV), hepatitis delta virus (HDV), hepatitis E virus (HEV), and hepatitis G virus (HGV). Other viruses or their receptors may be targeted, including, but not limited to, Picornaviridae (eg , polioviruses, etc.); Caliciviridae; Togaviridae (e.g. rubella virus, dengue virus, etc.); Flaviviridae; Coronaviridae; Reoviridae; Birnaviridae; Rhabodoviridae (e.g. rabies virus, etc.); Filoviridae; Paramyxoviridae (e.g. mumps virus, measles virus, respiratory syncytial virus, etc.); Orthomyxoviridae (e.g. influenza virus types A, B and C, etc.); Bunyaviridae; arenaviridae; Retroviradae; lentiviruses (eg HTLV-I; HTLV-II; HIV-1 (also known as HTLV-III, LAV, ARV, hTLR, etc.), HIV-II); simian immunodeficiency virus (SIV), human papillomavirus (HPV), influenza virus and tick-borne encephalitis viruses. See, for example, descriptions of these and other viruses in Virology, 3rd Edition (WK Joklik ed. 1988); Fundamental Virology, 2nd Edition (BN Fields and DM Knipe, eds. 1991). HIV receptors, for example, include CCR-5 and CXCR-4.
[0198] Соответственно, варианты гетеродимерных доменов расщепления согласно описанию в настоящем документе находят широкое применение для повышения специфичности ZFN, используемых для модификации генов. Указанные варианты доменов расщепления могут быть легко включены в любой существующий ZFN с помощью либо сайт-направленного мутагенеза, либо субклонирования с повышением специфичности любых димеров ZFN in vivo.[0198] Accordingly, heterodimeric cleavage domain variants as described herein are widely used to increase the specificity of ZFNs used to modify genes. These cleavage domain variants can easily be incorporated into any existing ZFN using either site-directed mutagenesis orin vivo specificity-enhancing subcloning of any ZFN dimers.
[0199] Как отмечалось выше, композиции и способы, описанные в настоящем документе, могут применяться для модификации генов, генной коррекции и разрушения генов. Неограничивающие примеры модификации генов включают нацеленную интеграцию на основе направляемой гомологией репарации (HDR); генную коррекцию на основе HDR; модификация генов на основе HDR; разрушение генов на основе HDR; разрушение генов на основе NHEJ и/или комбинации HDR, NHEJ, и/или одноцепочечный отжиг (SSA). Одноцепочечный отжиг (SSA) относится к репарации двуцепочечного разрыва между двумя повторяющимися последовательностями в одинаковой ориентации путем вырезания ДЦР 5’-3’-экзонуклеазами с экспонированием 2 комплементарных областей. Затем одиночные цепи, кодирующие 2 прямых повтора, аннелируют между собой, и аннелированный промежуточный продукт может быть процессирован таким образом, что одноцепочечные «хвосты» (часть одноцепочечной ДНК, не аннелированная с какой-либо последовательностью) отщепляются, пропуски заполняются ДНК-полимеразой, и концы ДНК вновь соединяются. Это приводит к делеции последовательностей, локализованных между указанными прямыми повторами.[0199] As noted above, the compositions and methods described herein can be used for gene modification, gene editing, and gene disruption. Non-limiting examples of gene modification include targeted integration based on homology-directed repair (HDR); gene correction based on HDR; gene modification based on HDR; HDR-based gene disruption; gene disruption based on NHEJ and/or a combination of HDR, NHEJ, and/or single strand annealing (SSA). Single strand annealing (SSA) refers to the repair of a double strand break between two repeat sequences in the same orientation by excision of LCBs with 5'-3' exonucleases, exposing 2 complementary regions. The single strands encoding the 2 direct repeats are then annulated with each other, and the annulated intermediate can be processed such that the single stranded "tails" (the portion of the single stranded DNA not annelated to any sequence) are cleaved off, the gaps filled in by DNA polymerase, and DNA ends reconnect. This results in the deletion of sequences located between these direct repeats.
[0200] Композиции, содержащие домены расщепления (например,ZFN, TALEN, системы CRISPR/Cas), и способы, описанные в настоящем документе, могут также применяться в лечении различных генетических заболеваний и/или инфекционных заболеваний.[0200] Compositions containing cleavage domains (eg, ZFN, TALEN, CRISPR/Cas systems) and the methods described herein may also be used in the treatment of various genetic diseases and/or infectious diseases.
[0201] Указанные композиции и способы могут также применяться во вариантах терапии на основе стволовых клеток, в том числе, но не ограничиваясь перечисленным: для коррекции мутаций соматических клеток путем конверсии генов короткими последовательностями или нацеленной интеграции для моногенной генной терапии; для разрушения доминантно-негативных аллелей; для разрушения генов, необходимых для попадания в клетки или продуктивной инфекции патогенов в клетках; улучшенной тканевой инженерии, например, путем модификации активности гена, способствующей дифференцировке или формированию функциональных тканей; и/или разрушения активности гена, способствующего дифференцировке или формированию функциональных тканей; блокирования или индукции дифференцировки, например, путем разрушения генов, блокирующих дифференцировку, способствующего дифференцировке стволовых клеток в направлении специфической линии, нацеленного встраивания гена или экспрессионной кассеты с малой интерферирующей РНК (миРНК), которые могут стимулировать дифференцировку стволовых клеток, нацеленного встраивания гена или экспрессионной кассеты с миРНК, которые могут блокировать дифференцировку стволовых клеток и обеспечивать лучшее размножение и поддержание плюрипотентности, и/или для нацеленного встраивания репортерного гена внутрь рамки с эндогенным геном, представляющего собой маркер плюрипотентности или статуса дифференцировки, обеспечивающий удобный маркер для оценки статуса дифференцировки стволовых клеток и того, как изменения среды, цитокины, условия роста, экспрессия генов, экспрессия молекул миРНК, мшРНК или микроРНК, воздействие антителами к маркерам клеточной поверхности или лекарственные средства изменяют указанный статус; для переноса ядер соматических клеток, например, могут быть выделены собственные соматические клетки пациента, предусмотренный целевой ген модифицирован подходящим образом, получены клоны клеток (и проведен контроль качества для обеспечения безопасности генома) и ядра из указанных клеток выделены и перенесены в неоплодотворенные яйцеклетки для получения пациент-специфических клеток чЭСК, которые могут быть прямо инъецированы или дифференцированы перед прививкой пациенту, с уменьшением или элиминацией таким образом отторжения ткани; для получения универсальных стволовых клеток путем нокаута рецепторов MHC (например,для получения клеток с ослабленной или полностью устраненной иммунологической идентичностью). Типы клеток для указанной процедуры включают, не ограничиваясь перечисленными, T-клетки, B-клетки, гематопоэтические стволовые клетки и эмбриональные стволовые клетки. Кроме того, могут применяться индуцированные плюрипотентные стволовые клетки (иПСК), которые также получают из собственных соматических клеток пациента. Соответственно, указанные стволовые клетки или их производные (дифференцированные типы клеток или тканей) могут быть потенциально привиты любому человеку независимо от их происхождения или гистосовместимости.[0201] These compositions and methods may also be used in stem cell-based therapies, including but not limited to: correcting somatic cell mutations by short-sequence gene conversion or targeted integration for monogenic gene therapy; to destroy dominant negative alleles; to destroy genes necessary for entry into cells or productive infection of pathogens in cells; improved tissue engineering, for example, by modifying the activity of a gene to promote differentiation or the formation of functional tissues; and/or disrupting the activity of a gene that promotes differentiation or formation of functional tissues; blocking or inducing differentiation, for example, by destroying genes that block differentiation, promoting differentiation of stem cells towards a specific lineage, targeted insertion of a gene or small interfering RNA (siRNA) expression cassette that can stimulate stem cell differentiation, targeted insertion of a gene or expression cassette with siRNAs that can block stem cell differentiation and allow for better propagation and maintenance of pluripotency, and/or for the targeted insertion of a reporter gene into a frame with an endogenous gene, which is a marker of pluripotency or differentiation status, providing a convenient marker for assessing stem cell differentiation status and how environmental changes, cytokines, growth conditions, gene expression, expression of miRNA, shRNA or miRNA molecules, exposure to antibodies to cell surface markers, or drugs alter the specified hundred tus; for transfer of somatic cell nuclei, for example, the patient's own somatic cells can be isolated, the intended target gene is appropriately modified, cell clones are obtained (and quality control is carried out to ensure genome safety), and the nuclei from these cells are isolated and transferred into unfertilized eggs to obtain a patient -specific hESC cells that can be directly injected or differentiated prior to inoculation to a patient, thereby reducing or eliminating tissue rejection; to obtain universal stem cells by knocking out MHC receptors (for example, to obtain cells with a weakened or completely eliminated immunological identity). Cell types for this procedure include, but are not limited to, T cells, B cells, hematopoietic stem cells, and embryonic stem cells. In addition, induced pluripotent stem cells (iPSCs), which are also obtained from the patient's own somatic cells, can be used. Accordingly, these stem cells or their derivatives (differentiated types of cells or tissues) can potentially be inoculated into any person, regardless of their origin or histocompatibility.
[0202] Указанные композиции и способы могут также применяться для соматической клеточной терапии, обеспечивая таким образом получение запасов клеток, которые были модифицированы для усиления их биологических свойств. Такие клетки могут быть инфузированы различным пациентам независимо от донорского источника указанных клеток и их гистосовместимости с реципиентом.[0202] These compositions and methods can also be used for somatic cell therapy, thus providing a stock of cells that have been modified to enhance their biological properties. Such cells can be infused into various patients regardless of the donor source of these cells and their histocompatibility with the recipient.
[0203] Помимо терапевтического применения повышенная специфичность, обеспечиваемая описанными в настоящем документе вариантами, при их применении в сконструированных нуклеазах, может быть использована для конструирования сельскохозяйственных культур, конструирования линий клеток и конструирования моделей заболеваний. Облигатно гетеродимерные полудомены расщепления обеспечивают простой способ улучшения свойств нуклеаз.[0203] In addition to therapeutic applications, the increased specificity provided by the variants described herein, when used in engineered nucleases, can be used for the design of crops, the construction of cell lines, and the construction of disease models. Obligate heterodimeric cleavage half-domains provide an easy way to improve the properties of nucleases.
[0204] Описанные сконструированные полудомены расщепления могут также применяться в протоколах модификации гена, требующих одновременного расщепления по нескольким мишеням, либо для делеции промежуточной области, либо для одновременного изменения двух специфических локусов. Расщепление по двум мишеням требует клеточной экспрессии четырех ZFN или TALEN, что потенциально может давать 10 разных комбинаций активных ZFN или TALEN. В таких вариантах применения замена нуклеазного домена дикого типа на указанные новые варианты элиминирует активность нежелательных комбинаций и снижает вероятность нецелевого расщепления. В тех случаях, когда для расщепления по определенной требуемой ДНК-мишени требуется активность пары нуклеаз A+B, а для одновременного расщепления по второй требуемой ДНК-мишень требуется активность пары нуклеаз X+Y, использование описанных в настоящем документе мутаций может предотвращать спаривание A с A, A с X, A с Y, и так далее. Соответственно, указанные мутацииFokI уменьшают неспецифическую расщепляющую активность в результате образования «незаконных» пар и обеспечивают получение более эффективных ортогональных мутантных пар нуклеаз (см. совместные патентные публикации США №20080131962 и №20090305346).[0204] The described engineered cleavage half-domains may also be used in gene modification protocols requiring simultaneous cleavage to multiple targets, either to delete an intermediate region or to modify two specific loci simultaneously. Cleavage at two targets requires cellular expression of four ZFNs or TALENs, potentially resulting in 10 different combinations of active ZFNs or TALENs. In such applications, replacing the wild-type nuclease domain with these new variants eliminates the activity of undesired combinations and reduces the likelihood of off-target cleavage. In cases where cleavage at a particular desired DNA target requires the activity of a pair of nucleases A + B, and simultaneous cleavage at a second desired DNA target requires the activity of a pair of nucleases X + Y, the use of the mutations described herein can prevent the pairing of A with A, A with X, A with Y, and so on. Accordingly, theseFok I mutations reduce non-specific cleavage activity as a result of the formation of "illegal" pairs and provide more effective orthogonal mutant pairs of nucleases (see joint US patent publications No. 20080131962 and No. 20090305346).
ПРИМЕРЫEXAMPLES
Пример 1: Получение ZFNExample 1: Receive ZFN
[0205] ZFN, нацеленные на сайты в генах BCL11A иTCRA (нацеленные на константную область, также известную как TRAC) получали путем дизайна и включали в плазмидные векторы по существу согласно описанию в источниках: Urnovet al. (2005)Nature 435(7042):646-651, Perezet al (2008)Nature Biotechnology 26(7): 808-816, а также патентной PCT-публикации WO 2016183298 и PCT-публикации WO 2017106528. Также использовали ZFN, нацеливаемые AAVS1, согласно описанию в публикации США №20150110762.[0205] ZFNs targeted at sites in the BCL11Aand TCRA genes (targeting the constant region, also known as TRAC) were designed and incorporated into plasmid vectors essentially as described in the references: Urnovet al . (2005)Nature 435(7042):646-651, Perezet al (2008)Nature Biotechnology 26(7): 808-816, as well as PCT Patent Publication WO 2016183298 and PCT Publication WO 2017106528. AAVS1 as described in US Publication No. 20150110762.
Пример 2: Мутанты по остаткамFokI, нацеливающие взаимодействие с фосфатамиExample 2 Mutants atFok I Residues Targeting Phosphate Interaction
[0206] С применением моделей домена расщепленияFokI (Milleret al (2007)Nat Biotech25(7):778-85), идентифицировали положительно заряженные остатки аминокислот аргинина или лизина (Фиг. 1), которые потенциально взаимодействуют с фосфатами на остове ДНК.[0206] UsingFok I cleavage domain models (Milleret al (2007)Nat Biotech 25(7):778-85), positively charged arginine or lysine amino acid residues (FIG. 1) were identified that potentially interact with backbone phosphates. DNA.
[0207] Указанные идентифицированные положения в доменеFokI (аминокислоты 416, 422, 447, 448 и 525) затем специфически изменяли (мутировали) на остатки серина для элиминации взаимодействия между оригинальной положительно заряженной аминокислоты и отрицательно заряженными фосфатами на ДНК (см. Фиг. 2A и 2B). Если указанные мутации содержат оба партнера ZFN, возможно возникновение ряда различных комбинаций (см. иллюстрацию на Фиг. 2C). Указанные новые мутантыFokI получали в партнере «KKR»FokI гетеродимеров ELD/KKR (см. патент США №8,962,281), и затем соединяли с парой ZFN, специфической в отношении энхансерной области BCL11A, SBS#51857 ELD/SBS#51949 KKR или SBS#51857_KKR/SBS#51949_ELD; «исходные» белки на Фиг. 3 выделены серым. Получали мутации в каждом партнере, а затем тестировали на расщепляющую активность в отношении оригинальной мишени BCL11A в клетках CD34+ в различных комбинациях, как показано на Фиг. 3. Нецелевые сайты были идентифицированы ранее с применением несмещенного анализа захвата (патентная PCT-публикация WO 2016/183298). Указанные нецелевые сайты перечислены ниже в таблице 1, где каждый сайт идентифицирован с использованием уникального сгенерированного случайным образом идентифицирующего буквенного «регистрационного знака», где «регистрационным знаком» PRJIYLFN обозначена предусмотренная целевая последовательность BCL11A. В приведенной ниже таблице также указан локус каждого сайта (координаты приведены в соответствии со сборкой hg38 из базы последовательностей U.C. Santa Cruz Human Genome Browser (Kentet al (2002),Genome Res.12(6):996-1006).[0207] These identified positions in theFok I domain (
Таблица 1: Идентифицированные сайты расщепления SBS#51857/SBS#51949Table 1: Identified cleavage sites for
(предусмотренная мишень)PRJIYLFN
 (provided target)
[0208] Представленные на Фиг. 3 данные продемонстрировали, что определенные мутации уменьшали активность белков в отношении когнатного целевого сайта BCL11A, при соразмерном падении нецелевой расщепляющей активности (см.,например, 51857-ELD/51949-KKR_R447S: целевая активность снижена до 11,60% инделей против 80,59% для исходных последовательностей; активность в нецелевом NIFMAEVG также падала до 0,05% против значения 9,04% для исходных последовательностей, а активность в нецелевом PEVYOHIU падала до 0,03% со значения 0,65% для исходных последовательностей ((Фиг. 3A)). Однако при других мутациях целевая расщепляющая активность оставалась устойчивой при уменьшении по существу активности в обоих оцениваемых нецелевых сайтах. Например, пара 51857-ELD/51949-KKR_R416S проявляла целевую активность в отношении BCL11A, в значительной степени аналогичную активности исходных белков (80,63% инделей для мутантной пары против 80,59% для исходной пары при дозе 2 мкг (20 мкг/мл)), тогда как активность в двух нецелевых сайтах по существу уменьшалась (0,75% в нецелевом сайте NIFMAEVG для мутантной пары против 9,04% для исходников, и 0,08% в нецелевом сайте PEVYOHIU для мутантной пары против 0,65% для исходников) (Фиг. 3A).[0208] Shown in FIG. 3 data demonstrated that certain mutations reduced the activity of proteins towards the BCL11A cognate target site, with a commensurate drop in non-targeted cleavage activity (seee.g. % for the original sequences; activity in the non-target NIFMAEVG also dropped to 0.05% versus 9.04% for the original sequences, and activity in the non-target PEVYOHIU dropped to 0.03% from the value of 0.65% for the original sequences ((Fig. 3A)).However, with other mutations, the target cleavage activity remained stable, with substantially reduced activity at both non-target sites assessed. For example, the 51857-ELD/51949-KKR_R416S pair exhibited a target activity against BCL11A substantially similar to that of the parent proteins (80 .63% indels for the mutant pair versus 80.59% for the original pair at a dose of 2 μg (20 μg/ml)), while the activity in the two non-target sites for substantially decreased (0.75% in the non-target NIFMAEVG site for the mutant pair vs. 9.04% for the originals, and 0.08% in the non-target site PEVYOHIU for the mutant pair vs. 0.65% for the originals) (Fig. 3A).
[0209] Также собирали мутантные белки, используя противоположную ориентацию гетеродимерных доменовFokI,т.е.на Фиг. 3A показаны результаты для 51857-ELD/51949-KKR, а на Фиг. 3B представлены результаты для 51857-KKR/51949-ELD. И в этих случаях также некоторые пары обеспечивали поддержание устойчивой целевой активности (например 51857-KKR/51949-ELD_K448S), аналогичной активности исходной пары (83,02% против 88,28%, соответственно), однако в нецелевых локализациях наблюдалось уменьшение активности (1,00% против 9,26% для NIFMAEVG; 0,33% против 0,87% для PEVYOHIU (Фиг. 3B).[0209] Mutant proteins were also assembled using the opposite orientation of theFok I heterodimeric domains,ie. in FIG. 3A shows the results for 51857-ELD/51949-KKR and FIG. 3B shows the results for 51857-KKR/51949-ELD. And in these cases, some pairs also maintained a stable target activity (for example , 51857-KKR/51949-ELD_K448S), similar to the activity of the original pair (83.02% vs. 88.28%, respectively), but a decrease in activity was observed in non-target locations (1 .00% vs. 9.26% for NIFMAEVG, 0.33% vs. 0.87% for PEVYOHIU (Fig. 3B).
[0210] Также проводили эксперименты с применением пары TCRA (TRAC)-специфических ZFN: SBS#52742_ELD/SBS#52774_KKR (патентная публикация США № US-2017-0211075-A1). Указанные эксперименты проводили в клетках K562, которые обрабатывали либо 100, либо 400 нг мРНК, кодирующей каждую ZFN. Указанные пары ZFN состояли из мутированного партнера из приведенных в таблице 2 ниже, и одного немутированного партнера. В указанных экспериментах все положительно заряженные аминокислоты, указанные на Фиг. 1, были мутированы с заменой на серин (S). Вкратце, использовали 2 × 10e5 клеток на трансфекцию, при этом мРНК доставляли в указанную клетку с применением 96-луночной челночной системы Amaxa. Трансфицированные клетки собирали на 3 день после трансфекции и обрабатывали для анализа MiSeq (Illumina) стандартными способами. Указанные данные приведены в таблице 2; они демонстрируют, что при некоторых мутациях сохранялась устойчивая целевая активность, тогда как другие (например, 52742 ELD_K469S, идентифицированный как остаток активного сайта, на Фиг. 1) нокаутировали расщепляющую активность.[0210] Experiments were also performed using a pair of TCRA (TRAC)-specific ZFNs: SBS#52742_ELD/SBS#52774_KKR (US Patent Publication No. US-2017-0211075-A1). These experiments were performed in K562 cells that were treated with either 100 or 400 ng of the mRNA encoding each ZFN. These ZFN pairs consisted of a mutated partner from those listed in Table 2 below and one unmutated partner. In these experiments, all of the positively charged amino acids indicated in FIG. 1 were mutated to serine (S). Briefly, 2 x 10e5 cells per transfection were used, with mRNA delivered to the target cell using an Amaxa 96-well shuttle system. Transfected cells were harvested 3 days post-transfection and processed for MiSeq analysis (Illumina) by standard methods. These data are shown in table 2; they demonstrate that some mutations retained persistent target activity, while others (eg , 52742 ELD_K469S, identified as an active site residue, in Figure 1) knocked out cleavage activity.
Таблица 2: Целевые результаты для нацеленной на TCRA (TRAC) ZFN с мутациямиFokITable 2: Target outcomes for TCRA-targeted (TRAC) ZFN withFok I mutations
[0211] Также проводили анализ нецелевых мишеней для определения наиболее частых нецелевых сайтов расщепления по оценке с применением несмещенного анализа захвата (патентная PCT-публикация WO 2016/183298). Четыре геномных локуса (предусмотренная мишень в TCRA (TRAC) и три нецелевых локуса), идентифицированные для указанной пары ZFN с применением несмещенного анализа захвата, представлены ниже в таблице 3.[0211] Off-target analysis was also performed to determine the most frequent off-target cleavage sites as assessed using an unbiased capture assay (PCT Patent Publication WO 2016/183298). The four genomic loci (provided target in TCRA (TRAC) and three non-target loci) identified for this ZFN pair using an unbiased capture assay are shown in Table 3 below.
Таблица 3: Сайты расщепления для TCRA (TRAC)-специфической ZFNTable 3: Cleavage sites for TCRA (TRAC)-specific ZFN
[0212] Анализировали нуклеазную активность в двух нецелевых сайтах (называемых OT11, или XVFENVRX и OT16, или XSKWTVWD, представленных выше в таблице 3) при дозе 400 нг мРНК каждой ZFN, при этом один партнер в паре ZFN содержал указанную мутацию, тогда как в другом сохранялся немодифицированный доменFokI ELD или KKR. Представленные данные (Таблица 4) отражают процент инделей (активность), наблюдаемый при применении 400 нг каждого партнера ZFN. Указанные данные также показали, что при некоторых мутациях сохранялась почти эквивалентная целевая активность наряду с уменьшением нецелевой активности. Например, для SBS#52774_KKR_K387S наблюдалась целевая активность, равная 89,06% инделей при использовании 400 нг (по сравнению с 89,08 для исходного 52774_KKR), и комбинированная нецелевая активность в OT11 и OT16, равная 6,39% инделей (по сравнению с 15,07% для исходного 52774_KKR). Результаты включали мутацииFokI, протестированные в BCL11A-специфических ZFN, где изменение положительных зарядов в положениях 416, 422, 447, 448 и 525 снижало нецелевую активность.[0212] Nuclease activity was analyzed at two non-target sites (referred to as OT11, or XVFENVRX and OT16, or XSKWTVWD, presented in Table 3 above) at a dose of 400 ng of mRNA of each ZFN, with one partner in the ZFN pair containing the specified mutation, while in the other retained the unmodifiedFok I ELD or KKR domain. The data presented (Table 4) reflects the percentage of indels (activity) observed with 400 ng of each ZFN partner. These data also showed that some mutations retained nearly equivalent target activity along with a reduction in off-target activity. For example, SBS#52774_KKR_K387S had a target activity of 89.06% indels at 400 ng (compared to 89.08 for the original 52774_KKR) and a combined off-target activity in OT11 and OT16 of 6.39% indels (compared to from 15.07% for the original 52774_KKR). The results includedFok I mutations tested in BCL11A-specific ZFNs, where changing the positive charges at
Таблица 4: Нецелевое расщепление TRAC ZFN, мутантнымипоFokITable 4: Off-target cleavage of TRAC ZFN, mutantonFoxI
[0213] Затем указанные данные сравнивали с расчетным расстоянием между мутированным остатком аминокислоты и молекулой ДНК для изучения эффекта как на целевое, так и на нецелевое расщепление (Фиг. 4). Активность каждой пары ZFN представлена одной точкой данных; было продемонстрировано, что белки с наиболее желательными профилями (высокая целевая активность и низкая нецелевая активность) были представлены белками с мутациями в пределах 10 от молекулы ДНК (Фиг. 4). Отмечены точки данных, соответствующие парам ZFN, где одна ZFN несет мутациюFokI в положении 416, 422, 447, 448 или 525.[0213] These data were then compared with the calculated distance between the mutated amino acid residue and the DNA molecule to study the effect on both targeted and non-targeted cleavage (FIG. 4). The activity of each ZFN pair is represented by one data point; it was demonstrated that proteins with the most desirable profiles (high target activity and low non-target activity) were represented by proteins with mutations within 10 from the DNA molecule (Fig. 4). Data points are marked corresponding to pairs of ZFNs where one ZFN carries aFok I mutation at
[0214] Указанные результаты продемонстрировали, что мутации одного или более остатков 416, 422, 447, 448 или 525 может увеличивать целевую активность наряду с уменьшением нецелевой активности.[0214] These results demonstrated that mutations of one or
Пример 3: Дизайн новых сконструированных мутаций остова с цинковыми пальцамиExample 3: Design of New Engineered Zinc Finger Backbone Mutations
[0215] Предыдущие исследования указывают на возможность некоторого взаимодействия между положительно заряженными остатками аминокислот в «остове» с цинковыми пальцами (области структуры, не вовлеченные в сайт-специфическое распознавание нуклеотидов ДНК) и фосфатами на молекуле ДНК (Elrod-Ericksonet al,там же), см. Фиг. 5A. Аминокислоты в положениях -14, -9 и -5 (все положения указаны относительно стандартной нумерации альфа-спиральной области) часто положительно заряжены и могут взаимодействовать с отрицательно заряженными фосфатами в остове ДНК (см. Фиг. 5B). Соответственно, анализировали 4867 последовательностей цинковых пальцев на присутствие остатков аминокислот в каждом положении в последовательности пальца (см. Фиг. 6). В положении -5 с низкой, однако ненулевой частотой наблюдали нейтральные аминокислоты аланин, лейцин и глутамин, таким образом, указанные аминокислоты использовали при модификациях пальцев остова. Положения в ZFP с 6 и 5 пальцами также идентифицировали наряду с потенциальными заменами (Фиг. 7A и 7B).[0215] Previous studies indicate the possibility of some interaction between positively charged amino acid residues in the "backbone" with zinc fingers (regions of the structure not involved in site-specific DNA nucleotide recognition) and phosphates on the DNA molecule (Elrod-Ericksonet al ,ibid. ), see FIG. 5A. The amino acids at positions -14, -9, and -5 (all positions are relative to the standard alpha-helical region numbering) are often positively charged and can interact with negatively charged phosphates in the DNA backbone (see Fig. 5B). Accordingly, 4867 zinc finger sequences were analyzed for the presence of amino acid residues at each position in the finger sequence (see FIG. 6). At position -5, the neutral amino acids alanine, leucine and glutamine were observed with low but non-zero frequency, thus these amino acids were used in the modifications of the backbone fingers. Positions in ZFP with 6 and 5 fingers were also identified along with potential substitutions (FIGS. 7A and 7B).
[0216] Осуществляли мутации в TCRA (TRAC)-специфической паре ZFN SBS#52774/SBS#52742 (см. PCT-публикацию WO 2017106528). Для указанных белков получали в общей сложности 21 вариант каждого партнера ((F1, F3, F5, F1+F3, F1+F5, F3+F5, F1+F3+F5) × (R→A, R→Q, R→L)). Репрезентативная подборка данных (таблица 5) показала, что многие пары демонстрировали уменьшение нецелевой активности в отношении трех проанализированных нецелевых мишеней. В указанной таблице ZFN 52774 комбинировали с вариантами ZFN 52742, несущими указанные мутации в положении -5 пальца 1 (F1), пальца 3 (F3) и пальца 5 (F5). Также указан тип мутации; все мутанты в указанном наборе данных представлены мутантами с заменой аргинина (R) на глутамина (Q). Например, белок, обозначенный как 52742-F1RQ, соответствует мутанту, где аргинин в положении -5 в пальце 1 был изменен на глутамин. В верхней части таблицы приведена активность, представленная как % инделей, а в нижней половине таблице показана активность, представленная как относительный уровень среднего значения активности двух репликатов исходной пары ZFN 52774/52742. Эти эксперименты продемонстрировали, что указанные мутации могут оказывать влияние на нецелевое расщепление. Например, для мутанта 52742-F1RQ; F3RQ; F5RQ при сохранении устойчивого уровня целевого расщепления (целевая активность 69,96% относительно активности 62,59% для исходных белков при дозе 6 мкг) уровень нецелевого расщепления падал (для OT16 показана расщепляющая активность 19,16% для исходных белков и активность 1,43% у тройного мутанта).[0216] Mutations were carried out in the TCRA (TRAC)-specific ZFN pair SBS#52774/SBS#52742 (see PCT publication WO 2017106528). For these proteins, a total of 21 variants of each partner ((F1, F3, F5, F1+F3, F1+F5, F3+F5, F1+F3+F5) × (R→A, R→Q, R→L )). A representative set of data (Table 5) showed that many couples showed a decrease in off-target activity against the three off-targets analyzed. In this table, ZFN 52774 was combined with ZFN 52742 variants carrying the indicated mutations at position -5 of finger 1 (F1), finger 3 (F3), and finger 5 (F5). The type of mutation is also indicated; all mutants in this dataset are arginine (R) to glutamine (Q) substitution mutants. For example, the protein designated 52742-F1RQ corresponds to a mutant where the arginine at position -5 in
[0217] Начиная с TCRA (TRAC)-специфических исходных ZFN 52742 и 52774, аргинины (R) в первом пальце каждого модуля заменяли на аланин (A), глутамин (Q) или лейцин (L). Указанные конструкции тестировали в клетках CD34+, обрабатывая их 6 мкг мРНК, кодирующей каждый партнер ZFN (см. Фиг. 8A). В указанных наборах данных каждый столбец соответствует среднему значению данных для всех мутаций каждого типа, а стандартная ошибка обозначена планками погрешностей. Например, на Фиг. 8A левый столбец черного цвета, соответствующий целевой активности, указывает на значение, представляющее собой среднее значение целевой активности для всех 6 мутантов в паре ZFN которые могут содержать одиночную мутацию. На диаграмме на Фиг. 7 указанные мутации включают, соответственно, одиночную мутацию в N-концевом пальце модуля A 52742 (F1 в полноразмерном белке), одиночную мутацию в N-концевом пальце модуля B 52742 (F3 в полноразмерном белке), одиночную мутацию в N-концевом пальце модуля C 52742 (F5 в полноразмерном белке) и аналогичный набор мутаций в партнере - белке 52774. Объединенный уровень целевой активности на втором столбце черного цвета (соответствующем целевой активности) представлен средним значением для всех белков с 2 мутациями (набор из 6 возможных вариантов при внесении мутаций в один партнер ZFN), а на третьем столбце черного цвета объединенный уровень целевой активности представлен средним значением для 2 возможных вариантов с мутациями во всех трех модулях левой или правой ZFN. Для данных по нецелевой активности, которым соответствуют серые столбцы, получали аналогичные объединенные уровни, за исключением того, что данные для трех нецелевых сайтов комбинировали таким образом, что каждая совокупность объединенных данных для одиночных или двойных мутаций в наборе данных о нецелевой активности включала 18 точек данных, а совокупность объединенных данных для трех мутаций включала 6 точек данных. Указанные мутации обеспечивали уменьшение нецелевой активности вплоть до 4,8-кратного.[0217] Starting with TCRA (TRAC)-specific parent ZFNs 52742 and 52774, arginine (R) in the first finger of each module was replaced with alanine (A), glutamine (Q), or leucine (L). These constructs were tested in CD34+ cells by treating them with 6 μg of the mRNA encoding each ZFN partner (see Fig. 8A). In the indicated data sets, each column corresponds to the mean of the data for all mutations of each type, and the standard error is indicated by error bars. For example, in FIG. 8A, the black left bar corresponding to the target activity indicates a value representing the average of the target activity for all 6 mutants in a ZFN pair that may contain a single mutation. In the diagram in Fig. 7, these mutations include, respectively, a single mutation in the N-terminal finger of module A 52742 (F1 in the full-length protein), a single mutation in the N-terminal finger of module B 52742 (F3 in the full-length protein), a single mutation in the N-terminal finger of module C 52742 (F5 in the full-length protein) and a similar set of mutations in partner protein 52774. The pooled level of target activity in the second column in black (corresponding to target activity) is the average value for all proteins with 2 mutations (a set of 6 possible options when introducing mutations in one ZFN partner) and in the third column in black the pooled level of target activity is the mean of the 2 possible variants with mutations in all three left or right ZFN modules. For off-target activity data corresponding to gray bars, similar pooled levels were obtained, except that the data for the three off-target sites were combined such that each pooled data set for single or double mutations in the off-target activity data set included 18 data points. , and the pooled data set for the three mutations included 6 data points. These mutations provided a decrease in off-target activity up to 4.8-fold.
[0218] Также проводили эксперименты, в которых оба партнера в паре ZFN были мутированы аналогичным образом (правая половина Фиг. 8B). Например, если N-концевой палец в модуле A изменен на аланин, (52742-F1RA), белок-партнер также мутирован в N-концевом пальце в модуле A (52774-F1RA), что дает в общей сложности 2 мутации в димере ZFN. Замены только на аланин тестировали одновременно в обеих ZFN в димере; указанные данные приведены на правой половине Фиг. 8B (обозначенные как 2, 4 или 6). Мутации R→A вводят только в одну ZFN в димере (обозначенную как 1, 2 или 3) из левой трети Фиг. 8A, для сравнения еще раз приведенной на левой половине Фиг. 8B. Фиг. 8C аналогична правой части Фиг. 8A за исключением использования только 2 мкг (20 мкг/мл) РНК. Эти эксперименты продемонстрировали что указанные мутации могут обеспечивать 27-кратное уменьшение нецелевой активности при наличии в общей сложности шести мутаций в обеих ZFN в димере.[0218] Also conducted experiments in which both partners in a pair of ZFN were mutated in a similar way (right half of Fig. 8B). For example, if the N-terminal finger in module A is changed to alanine, (52742-F1RA), the partner protein is also mutated in the N-terminal finger in module A (52774-F1RA), giving a total of 2 mutations in the ZFN dimer. Alanine-only substitutions were tested simultaneously in both ZFNs in the dimer; these data are shown on the right half of FIG. 8B (designated as 2, 4 or 6). R→A mutations are introduced into only one ZFN in the dimer (designated as 1, 2, or 3) from the left third of FIG. 8A, shown again on the left half of FIG. 8B. Fig. 8C is similar to the right side of FIG. 8A except for using only 2 μg (20 μg/ml) of RNA. These experiments demonstrated that these mutations can provide a 27-fold reduction in off-target activity with a total of six mutations in both ZFNs in the dimer.
[0219] Указанные эксперименты также проводили с BCL11A-специфической парой ZFN 51857-ELD/51949-KKR, описанной выше. Дизайн экспериментов был аналогичен описанному для TCRA (TRAC)-специфической пары ZFN; результаты приведены на Фиг. 9A. Представленные данные отражают результаты для пар, содержащих либо мутации R→Q (Gln), либо мутации R→L (Leu) при использовании в дозе 2 мкг (20 мкг/мл), при этом для нецелевой активности приведены только результаты для одного нецелевого сайта (NIFMAEVG, см. таблицу 1).[0219] These experiments were also performed with the BCL11A-specific ZFN 51857-ELD/51949-KKR pair described above. Experimental design was similar to that described for the TCRA (TRAC)-specific ZFN pair; the results are shown in FIG. 9A. Data shown reflects results for pairs containing either R→Q (Gln) or R→L (Leu) mutations at 2 μg (20 μg/mL), with only results for one non-target site reported for off-target activity. (NIFMAEVG, see table 1).
[0220] Дополнительные варианты аминокислот в положении -5 получали путем замены R на E, N, Y, A или L. Помимо изменения аминокислот в положении -5 вводили ряд мутаций в положения -9 и -14 в Пальце 1 BCL11A-специфической пары ZFN 51857/51949. Указанные мутации тестировали на целевую и нецелевую активность согласно описанию выше, отдельно и в комбинации с изменениями в положении -5 в пальцах 2-6. Данные приведены ниже в таблице 6. Каждый белок содержал одинаковые ДНК-специфичные спиральные области согласно описанию для исходных белков выше, но получал новый идентификационный номер SBS, отражающий мутации остова ZFP. Вкратце, полные названия белков отражают перечисленные варианты мутаций в пальце. Соответственно, «cR»-часть полного названия относится к изменениям, вносимым в C-концевой палец модуля с двумя пальцами (см. Фиг. 7), а «nR» относится к изменениям, вносимым в N-концевой палец модуля с двумя пальцами. Описание «rQa» соответствует изменениям, вносимым в положении -5 в модуле A, а палец, в который были внесены указанные изменения, обозначен либо как cR, либо как nR. Соответственно, SBS#65461 (полное название 51857-NELD-cR-5Qa) представляет собой производное SBS#51857, где изменения внесены в C-концевой палец в положении -5, при этом Q заменяет R в модуле A. Указанные обозначения использованы также в таблице, в ячейках, где Q присутствует в колонке -5 для F2. При внесении изменений в положении -14, как в случае SBS#65459 (полное название 51857-NELD-nR-14Q-5Qabc), это указано в таблице. Соответственно, SBS#65459 представляет собой производное SBS#51857, где изменения в модулях внесены в N-концевой палец, при этом R заменена на Q в положении -14 Пальца 1 и в положениях -5 в N-концевом пальце модулей A, B и C. В случае SBS#65460, в положении -14 Пальца 1 R заменена на S. Это также отражено в таблице. Обозначения «NELD» и «CKKR» указывают на тип нуклеазных доменовFokI (вариант домена FokI «ELD» или «KKR») и другие аспекты указанного вектора (см. PCT-публикацию WO 2017/136049). В таблице 6A приведены подборки пар мутаций, введены в производные партнеров SBS#51857, с любым из партнеров: SBS#51949 или SBS#51949, содержащим изменения с инсерциями Q в N-концевых пальцах в положениях -5 в модулях A, B и C, где указанный партнер дополнительно содержит мутацию R416S в домене FokI, при этом эксперименты проводили с использованием 2 мкг мРНК, кодирующей каждый ZFN. Указанные эксперименты проводили также с использованием мутаций в белке SBS#51949 (см. таблицу 6B), при этом мутации взаимодействующих с фосфатом аминокислот доменаFokI тестировали также в комбинации с мутациями остова. Эти данные показывают, что дополнительные изменения были способны оказывать влияние на специфичность пар ZFN.[0220] Additional amino acid variants at position -5 were generated by replacing R with E, N, Y, A, or L. In addition to changing the amino acids at position -5, a number of mutations were introduced at positions -9 and -14 in
Таблица 6A: Изменения в положениях в остове ZFN SBS#51857Table 6A: Changes in positions in the ZFN
Таблица 6B: Изменения в других положениях в остове иFokI в ZFN SBS#51949Table 6B: Changes to other positions in the skeleton andFok I in
* 63022-R416S также известен как SBS#65721.* 63022-R416S is also known as SBS#65721.
** 63022-K525S также известен как SBS#65722.** 63022-K525S is also known as SBS#65722.
[0221] Эксперименты повторяли на CD34+ клетках, при этом РНК доставляли в указанные клетки с применением системы трансфекция BTX в условиях, оптимизированных в соответствии с инструкциями изготовителя. Использовали три концентрации РНК: конечную концентрацию 60, 20 и 5 мкг/мл. Данные приведены ниже в таблице 6C и демонстрируют, что устойчивое целевое расщепление может быть детектировано даже при очень низких уровнях мРНК ZFN, таким образом, нецелевое расщепление по существу снижается (>100x). Мутации обозначены согласно номенклатуре на Фиг. 2C. Эксперимент повторяли с применением только исходной пары и пары 3x(R→Q)/3x(R→Q) из таблицы 6C ниже для определения устойчивости результатов. Как видно из таблицы 6D, результаты отличались высокой воспроизводимостью.[0221] The experiments were repeated on CD34+ cells, with RNA delivered to these cells using the BTX transfection system under conditions optimized according to the manufacturer's instructions. Three concentrations of RNA were used: a final concentration of 60, 20, and 5 μg/ml. The data are shown in Table 6C below and demonstrate that robust target cleavage can be detected even at very low levels of ZFN mRNA, thus non-target cleavage is substantially reduced (>100x). Mutations are designated according to the nomenclature in FIG. 2C. The experiment was repeated using only the original pair and the 3x(R→Q)/3x(R→Q) pair from Table 6C below to determine the robustness of the results. As can be seen from Table 6D, the results were highly reproducible.
Таблица 6C: Целевые и нецелевые эффекты при титровании:Table 6C: Target and non-target effects in titration:
SBS630143x (R→Q)
 SBS63014
SBS657213x (R→Q)*
 SBS65721
SBS630143x (R→Q)
 SBS63014
SBS655264x (R→Q)*
 SBS65526
SBS630143x (R→Q)
 SBS63014
SBS655275x (R→Q)*
 SBS65527
Числа в скобках соответствуют значениям, при которых не было обнаружено признаков нуклеазного расщепления.The numbers in brackets correspond to the values at which no signs of nuclease cleavage were detected.
* показывает, что правая ZFN дополнительно содержала дополнительную мутацию R416S в нуклеазном домене FokI.* indicates that the right ZFN additionally contained an additional R416S mutation in theFok I nuclease domain.
Таблица 6D: Повторные измерения целевой активностиTable 6D: Repeated measures of target activity
SBS630143x (R→Q)
 SBS63014
SBS657213x (R→Q)*
 SBS65721
* показывает, что правая ZFN дополнительно содержала дополнительную мутацию R416S в нуклеазном домене FokI.* indicates that the right ZFN additionally contained an additional R416S mutation in theFok I nuclease domain.
Пример 4: Титрование партнеров ZFN для оптимальной целевой активностиExample 4 Titration of ZFN Partners for Optimal Target Activity
[0222] Индивидуальное титрование каждого партнера в паре ZFN может обеспечить определение оптимальной концентрации каждого партнера ZFN, и, соответственно, максимальную целевую модификацию указанной парой наряду с минимизацией нецелевых модификаций. Каждый индивидуальный полудомен ZFN может обладать собственной кинетикой связывания с когнатной ДНК-мишенью, таким образом, оптимальная активность может быть достигнута путем отдельного титрования каждого полудомена. Соответственно, использовали BCL11A-специфическую пару SBS#51949/SBS#51857 для исследования титрования в клетках CD34+ с применением ZFN, введенных в виде мРНК, при этом использовали высокие концентрации ZFN, позволяющие детектировать нецелевое расщепление. В ходе экспериментов (таблица 7, ниже) было обнаружено, что титрование партнера SBS#51857 приводило к уменьшению нецелевого расщепления (приблизительно 8-кратно) при сохранении устойчивого целевого расщепления. Например, при использовании 60 мкг/мл мРНК 51949 в комбинации с 6,6 мкг/мл мРНК 51857, уровень целевой модификации оставался приблизительно таким же, как и при использовании 60 мкг/мл каждой из ZFN (76,1% инделей при использовании 60 мкг/мл каждой из ZFN, 78,3% инделей при использовании 60 мкг/мл 51949 в комбинации с 6,6 мкг/мл 51857), тогда как совокупный уровень нецелевой модификации опускался с 32,4% инделей до 4,0%. Отметим, что уменьшение введения мРНК обеих ZFN в равной степени приводило к постепенному снижению уровня целевой модификации, тогда как уровень нецелевой модификации по существу снижался только при снижении уровня целевой модификации.[0222] Individual titration of each partner in a ZFN pair can determine the optimal concentration of each ZFN partner, and thus the maximum target modification by said pair, while minimizing off-target modifications. Each individual ZFN half-domain may have its own binding kinetics to the cognate target DNA, thus optimal activity can be achieved by titrating each half-domain separately. Accordingly, the BCL11A-specific pair SBS#51949/SBS#51857 was used to study titration in CD34+ cells using ZFN introduced as mRNA, using high concentrations of ZFN to allow detection of off-target cleavage. During the experiments (table 7, below) it was found that the titration of partner SBS#51857 led to a decrease in off-target cleavage (approximately 8-fold) while maintaining a stable target cleavage. For example, when using 60 μg/ml of 51949 mRNA in combination with 6.6 μg/ml of 51857 mRNA, the level of target modification remained approximately the same as when using 60 μg/ml of each ZFN (76.1% indels when using 60 µg/mL of each ZFN, 78.3% indels when using 60 µg/
Таблица 7: Титрование одной ZFNTable 7: Titration of one ZFN
OT1NIFMAEVG
 OT1
OT2GJZEIYTO
 OT2
OT3PEVYOHIU
 OT3
OT4ZJCRPAXW
 OT4
OT5TXHULGPN
 OT5
[0223] Также проводили анализ методом вестерн-блоттинга, чтобы продемонстрировать, что экспрессия каждого партнера ZFN коррелировала с количеством доставляемой кодирующей ZFN мРНК (Фиг. 10). В указанном эксперименте CD34+ клетки трансфицировали указанными ZFN и через 24 часа детектировали экспрессию белков ZFN с применением антитела против Flag (экспрессионные конструкции содержали закодированную метку Flag). Также анализировали экспрессию двух белков при совместном введении указанных ZFN в виде одной РНК, разделенной саморасщепляющийся пептидной последовательностью 2a (см. дорожку 2 на Фиг. 10).[0223] Western blot analysis was also performed to demonstrate that the expression of each ZFN partner correlated with the amount of ZFN-encoding mRNA delivered (FIG. 10). In this experiment, CD34+ cells were transfected with the indicated ZFNs and expression of ZFN proteins was detected 24 hours later using an anti-Flag antibody (the expression constructs contained the encoded Flag tag). The expression of the two proteins was also analyzed when these ZFNs were co-administered as a single RNA separated by a self-
[0224] Титрование повторяли с вариациями обеих ZFN независимо друг от друга, чтобы обнаружить какой-либо эффект на целевую или нецелевую расщепляющую активность. Результаты (Фиг. 11) показали, что титрование со снижением дозы обоих партнеров уменьшало нецелевое расщепление, но максимальный эффект наблюдался для SBS#51857. На Фиг. 11 в таблице для мишени BCL11A в рамки заключены ячейки, соответствующие сохранению расщепляющей активности в отношении предусмотренной мишени BCL11A при использовании 60 мкг мРНК SBS#51949 либо с 6,6 мкг, либо с 60 мкг мРНК SBS#51857, при этом нецелевая активность в сайте NIFMAEVG при уменьшении дозы SBS#51857 опускалась с 27 до 4% инделей.[0224] The titration was repeated with variations of both ZFNs independently of each other to detect any effect on the target or non-target cleavage activity. The results (FIG. 11) showed that down-titration of both partners reduced off-target cleavage, but the maximum effect was observed for SBS#51857. On FIG. 11 in the table for the BCL11A target, boxed cells correspond to the retention of cleavage activity against the intended BCL11A target when using 60 μg of SBS#51949 mRNA with either 6.6 μg or 60 μg of SBS#51857 mRNA, with non-target activity at the site NIFMAEVG decreased from 27% to 4% of indels when the dose of SBS#51857 was reduced.
Пример 5: Комбинирование титрования партнеров ZFN и мутаций контактирующих с фосфатом остатков FokIExample 5: Combination of ZFN partner titrations and phosphate-contactingFok I residue mutations
[0225] Затем проводили анализы для измерения активности при титровании партнеров ZFN в комбинации с примерами мутаций FokI. BCL11A-специфические ZFN, содержащие мутацииFok, использовали в соотношениях, показанных выше, для сохранения целевой активности наряду с уменьшением уровня нецелевых разрезов. Указанные эксперименты проводили в клетках CD34+, трансфицированных мРНК, кодирующими указанные ZFN. Указанные данные представлены ниже в таблице 8. «Соотношение целевого/нецелевого расщепления» означает соотношение целевой и полной объединенной нецелевой активности для указанного образца. МутантFokI с комбинацией 6,6 мкг/мл SBS#51857 и 60 мкг/мл SBS#51949-R416S обеспечивал аналогичные уровни целевой активности (84,85% против 78,17% для 60 мкг обеих исходных ZFN) при резком снижении активности во всех пяти отслеживаемых нецелевых сайтах, что давало 32-кратное повышение соотношения целевого/нецелевого расщепления (89,52 против 2,76 для 60 мкг/мл каждой из исходных ZFN).[0225] Assays were then performed to measure titration activity of ZFN partners in combination with exemplaryFok I mutations. BCL11A-specific ZFNs containingFok mutations were used in the ratios shown above to maintain target activity while reducing the level of off-target cuts. These experiments were performed in CD34+ cells transfected with mRNA encoding the indicated ZFNs. These data are presented in Table 8 below. "Target/non-target split ratio" means the ratio of target and total combined non-target activity for the specified sample. TheFok I mutant with the combination of 6.6 μg/ml SBS#51857 and 60 μg/ml SBS#51949-R416S provided similar levels of target activity (84.85% vs. at all five non-target sites monitored, resulting in a 32-fold increase in target/non-target cleavage ratio (89.52 vs. 2.76 for 60 μg/ml of each of the original ZFNs).
Таблица 8: Комбинирование мутантовFokI и титрования партнеров ZFN со снижением дозы:Table 8: Combination ofFok I mutants and dose reduction titration of ZFN partners:
% активности NHEJ% NHEJ activity
OT1NIFMAEVG
 OT1
OT2GJZEIYTO
 OT2
OT3PEVYOHIU
 OT3
OT4ZJCRPAXW
 OT4
OT5TXHULGPN
 OT5
[0226] Все нецелевые сайты, перечисленные выше в таблице 1, изучали на предмет эффекта на нецелевую активность путем комбинирования титрования и подхода с мутантамиFokI (см. Фиг. 12).[0226] All off-target sites listed above in Table 1 were examined for effect on off-target activity by a combination of titration andFok I mutant approach (see FIG. 12).
[0227] Данные продемонстрировали приблизительно 30-кратное совокупное уменьшение нецелевой активности.[0227] The data demonstrated an approximately 30-fold cumulative reduction in off-target activity.
[0228] Данные также анализировали в отношении числа захватов, детектируемых с помощью несмещенного анализа захвата, описанного выше, после расщепления. Использовали BCL11A-специфические пары, описанные выше в таблице 6D, как исходную пару (SBS51857/SBS51949), так и вариант пары (SBS63014/SBS65721), и анализировали число нецелевых захватов. В указанном эксперименте ZFN вводили в CD34+ клетки либо в равных количествах (конечная концентрация 60 мкг/мл), либо в конечной концентрации 6,6 мкг и 60 мкг, для исходной пары, и 20 мкг и 60 мкг для варианта.[0228] The data was also analyzed for the number of captures detected using the unbiased capture assay described above after digestion. The BCL11A-specific pairs described in Table 6D above, both the original pair (SBS51857/SBS51949) and the variant pair (SBS63014/SBS65721) were used and the number of off-target captures was analyzed. In this experiment, ZFN was injected into CD34+ cells either in equal amounts (
[0229] Результаты приведены на Фиг. 13 и демонстрируют, что, хотя и исходная пара, и вариант продемонстрировали устойчивую расщепляющую активность в обоих вариантах концентраций (>80% инделей), число нецелевых захватов было значительно снижено, в частности, для варианта пары при доставке в неравных дозах. Комбинация мутацийFokI ZFN и неравных концентраций партнеров ZFN приводила к 350-кратному увеличению специфичности расщепления.[0229] The results are shown in FIG. 13 and demonstrate that although both the parent pair and the variant exhibited consistent cleavage activity at both concentrations (>80% indels), the number of off-target uptakes was significantly reduced, particularly for the variant of the pair when delivered at unequal doses. The combination ofFok I ZFN mutations and unequal concentrations of ZFN partners resulted in a 350-fold increase in cleavage specificity.
Пример 6: Комбинирование мутаций остова ZFP с мутациями контактирующих с фосфатом остатков FokIExample 6 Combination of ZFP backbone mutations with mutations in phosphate contactingFok I residues
[0230] Авторы также получали ZFN, содержащие мутации остова с цинковыми пальцами, описанного в примере 3 с мутациями контактирующих с фосфатом остатковFokI, описанными в примере 2. Указанную комбинацию тестировали с BCL11A-специфической парой ZFN в клетках CD34+ в двух дозах: 6 мкг или 2 мкг. Результаты представлены ниже в таблице 9 и демонстрируют, что комбинирование указанных двух типов подходов может значимо влиять на уровень нецелевой активности. В указанной таблице мутации остова представлены как тип мутации на модуль (A, B и/или C, см. Фиг. 7). Например, в образце, обозначенном как 51949 LeuABC R416S, белок содержал замены R→L в остове пальцев 1 (модуль A), 3 (модуль B), и 5 (модуль C), и дополнительно нес мутацию FokI R416S. В нескольких примерах пары ZFN демонстрировали отсутствие детектируемой нецелевой активности при сохранении полной целевой активности. Указанные примеры заключены в рамку в таблице 9.[0230] We also generated ZFNs containing the zinc finger backbone mutations described in Example 3 with the phosphate-contactingFok I residue mutations described in Example 2. This combination was tested with a BCL11A-specific ZFN pair in CD34+ cells at two doses: 6 mcg or 2 mcg. The results are presented in Table 9 below and demonstrate that a combination of these two types of approaches can significantly affect the level of off-target activity. In this table, backbone mutations are presented as type of mutation per module (A, B and/or C, see Fig. 7). For example, in the sample designated 51949 LeuABC R416S, the protein contained R→L substitutions in the backbones of fingers 1 (module A), 3 (module B), and 5 (module C), and additionally carried theFok I R416S mutation. In several examples, ZFN pairs showed no detectable off-target activity while maintaining full target activity. These examples are boxed in Table 9.
Пример 7: Комбинирование титрования партнеров, мутаций остова ZFP и контактирующих с фосфатом остатковFokIExample 7 Combination of partner titrations, ZFP backbone mutations and phosphate contactingFok I residues
[0231] Также проводили измерения активности при комбинировании оптимальных вариантов титрования партнеров с ZFN, содержащими мутации остова ZFP и мутации FokI ZFN. Указанные ZFN тестируют в клетках CD34+ согласно описанию выше; они демонстрируют увеличение специфичности пары ZFN за счет уменьшения уровня нецелевой активности.[0231] Activity measurements were also performed by combining optimal titration partners with ZFNs containing ZFP backbone mutations and ZFNFok I mutations. These ZFNs are tested in CD34+ cells as described above; they demonstrate an increase in the specificity of the ZFN pair at the expense of a decrease in the level of off-target activity.
Пример 8: Специфичность ZFN в клетках CD34+ в клиническом масштабеExample 8 Clinical Scale Specificity of ZFN in CD34+ Cells
[0232] Специфичность в отношении BCL11A варианта пары SBS63014/SBS65722 также тестировали в ходе крупномасштабной процедуры, подходящей для получения клеточных материалов для клинического испытания. Вкратце, трансдуцировали приблизительно 95-130 млн CD34+ клеток на партию с применением устройства Maxcyte в соответствии со спецификацией производителя. Использовали 80 мкг/мл мРНК SBS63014 и 20 мкг/мл мРНК SBS#65722, и нецелевое расщепление в клетках анализировали через два дней с применением несмещенного анализа захвата.[0232] The specificity for the BCL11A variant of the SBS63014/SBS65722 pair was also tested in a large scale procedure suitable for obtaining cellular materials for a clinical trial. Briefly, approximately 95-130 million CD34+ cells per batch were transduced using the Maxcyte device according to the manufacturer's specification. 80 μg/ml SBS63014 mRNA and 20 μg/ml SBS#65722 mRNA were used and off-target cleavage in cells was analyzed two days later using an unbiased capture assay.
[0233] Результаты показали, что при ПЦР-анализе 47 разных потенциальных локусов захвата (см. Фиг. 14) не было детектировано значимых модификаций, за исключением целевой локализации, где было обнаружено 79,54% инделей. Указанный данные демонстрируют, что нуклеазы согласно описанию в настоящем документе высокоспецифичны даже при использовании в крупномасштабной производственной процедуре.[0233] The results showed that PCR analysis of 47 different potential capture loci (see Fig. 14) did not detect significant modifications, with the exception of the target localization, where 79.54% of indels were found. This data demonstrates that the nucleases as described herein are highly specific even when used in a large scale manufacturing procedure.
Пример 9: Дополнительные исследования специфичностиExample 9 Additional Specificity Studies
[0234] Исследования специфичности также проводили с применением AAVS1-нацеленных ZFN с различными мутациями согласно описанию выше. В частности, для анализов активность согласно описанию выше использовали ZFN SBS#30035 и SBS#30054 согласно описанию в публикации США №20150110762 для исследования различных мутантов, в том числе мутантов домена димеризации (например,ELD, KKR и дополнительных мутантов), других мутаций (например,Sharkey), а также мутантов по контактирующих с фосфатами остаткам.[0234] Specificity studies were also performed using AAVS1-targeted ZFNs with various mutations as described above. In particular, for activity assays as described above, ZFN SBS#30035 and SBS#30054 as described in US Publication No. 20150110762 were used to study various mutants, including dimerization domain mutants (e.g., ELD, KKR and additional mutants), other mutations (for example, Sharkey), as well as mutants in contact with phosphate residues.
[0235] Для получения результатов, представленных в таблицах ниже, указанный(ые) мутант(ы)FokI вводили либо в доменFokI ELD SBS 30035 (обозначен как ELD_X, где X представляет собой мутацию FokI), доменFokI KKR SBS 30054 (обозначен как KKR_X, где X представляет собой собой мутацию FokI), либо в доменыFokI обеих конструкций (обозначен как ELD_KKR_X, где X представляет собой одну и ту же мутациюFokI, введенную в оба домена FokI ELD и KKR). Результаты для комбинации немодифицированных «исходных конструкций» 30035 и 30054 отмечены как «исходные», «исходники», «исходные ZFN» или т.п. Более низкая доза каждой исходной конструкции часто обозначены как «полудоза». Отрицательный контроль без нуклеаз обычно обозначен как «GFP». Соотношение, представляющее собой % инделей в предусмотренном локусе (часто обозначенных как «AAVS1»), разделенный на сумму % инделей во всех нецелевых локусах по оценке в определенном эксперименте часто обозначают как «соотношение», «соотношение целевого/нецелевого расщепления» и т.п.[0235] To obtain the results presented in the tables below, the specifiedFok I mutant(s) were introduced into either theFok I domain of the ELD SBS 30035 (designated as ELD_X, where X is aFok I mutation), theFok I domain of the KKR SBS 30054 (designated as KKR_X, where X is aFok I mutation), or into theFok I domains of both constructs (designated as ELD_KKR_X, where X is the sameFok I mutation introduced into bothFok I ELD and KKR domains) . The results for the combination of unmodified "original constructs" 30035 and 30054 are marked as "original", "original", "original ZFN", or the like. The lower dose of each parent construct is often labeled as a "half dose". The negative control without nucleases is usually labeled "GFP". The ratio, which is the % indels at the intended locus (often referred to as "AAVS1") divided by the sum of the % indels at all non-target loci as assessed in a particular experiment, is often referred to as "ratio", "target/non-target cleavage ratio", etc. .
[0236] Локализация целевой мишени AAVS1 и нецелевых мишеней показана ниже, где «hg38» означает данные сборки генома в соответствии с базой данных UCSC Genome Browser, вариант компоновки hg38:[0236] The localization of the AAVS1 target and non-targets is shown below, where "hg38" means genome assembly data according to the UCSC Genome Browser database, hg38 layout variant:
[0237] В таблицах 10A-10C представлены результаты расщепления в 2 разных экспериментах целевой мишени (AAVS1) и трех нецелевых мишеней (OT1, OT2, OT3), а также соотношение целевого и нецелевого расщепления для мутантов димеризации ELD, KKR и ELD-KKR с дополнительной мутацией замены (каждой аминокислоты на АК молекулы дикого типа) по R416 или K525. Также приведены результаты для мутантов ELD_S418D, ELD_N476D, ELD_I479T, ELD_Q481E, ELD_N527D, и ELD_Q531R.[0237] Tables 10A-10C present the results of cleavage in 2 different experiments of the target target (AAVS1) and three non-target targets (OT1, OT2, OT3), as well as the ratio of target and non-target cleavage for ELD, KKR and ELD-KKR dimerization mutants with an additional substitution mutation (each amino acid per wild-type AA molecule) at R416 or K525. Also shown are the results for the ELD_S418D, ELD_N476D, ELD_I479T, ELD_Q481E, ELD_N527D, and ELD_Q531R mutants.
Таблица 10ATable 10A
Таблица 10BTable 10B
Таблица 10CTable 10C
[0238] В таблицах 11A-11C представлены результаты расщепления в 2 разных экспериментах целевой мишени (AAVS1) и трех нецелевых мишеней (OT1, OT2, OT3), а также соотношение целевого и нецелевого расщепления для указанных мутантов, в том числе мутантов с заменами в положениях 418, 422 и 525 в комбинации с мутантами домена димеризации ELD и/или KKR.[0238] Tables 11A-11C present the results of cleavage in 2 different experiments of the target target (AAVS1) and three non-target targets (OT1, OT2, OT3), as well as the ratio of target and non-target cleavage for these mutants, including mutants with substitutions in
Таблица 11ATable 11A
Таблица 11BTable 11B
Таблица 11CTable 11C
[0239] В таблицах 12A-12C представлены результаты расщепления в 2 разных экспериментах целевой мишени (AAVS1) и трех нецелевых мишеней (OT1, OT2, OT3), а также соотношение целевого и нецелевого расщепления для указанных мутантов.[0239] Tables 12A-12C present the results of cleavage in 2 different experiments of the target target (AAVS1) and three non-target targets (OT1, OT2, OT3), as well as the ratio of target and non-target cleavage for these mutants.
Таблица 12ATable 12A
Таблица 12BTable 12B
Таблица 12CTable 12C
[0240] В таблицах 13A-13C представлено целевое и нецелевое расщепление при применением нацеленных на AAVS1 ZFN с указанными мутациями (ELD, KKR, ELD/KKR и другие указанные мутации).[0240] Tables 13A-13C show targeted and non-targeted cleavage using AAVS1-targeted ZFNs with the indicated mutations (ELD, KKR, ELD/KKR and other indicated mutations).
Таблица 13ATable 13A
Таблица 13BTable 13B
Таблица 13CTable 13C
[0241] В таблицах 14A-14C приведены результаты для указанных мутантов.[0241] Tables 14A-14C show the results for the indicated mutants.
Таблица 14ATable 14A
Таблица 14BTable 14B
Таблица 14CTable 14C
[0242] В таблицах 15A-15C приведены результаты экспериментов в двух повторностях с указанными мутантами.[0242] Tables 15A-15C show the results of duplicate experiments with the indicated mutants.
Таблица 15ATable 15A
Таблица 15BTable 15B
Таблица 15CTable 15C
Таблица 16BTable 16B
[0243] В таблицах 17A-17C приведены результаты при использовании указанных примеров мутантов, в том числе двойных мутантов.[0243] Tables 17A-17C show the results using the indicated examples of mutants, including double mutants.
Таблица 17ATable 17A
Таблица 17BTable 17B
Таблица 17CTable 17C
[0244] В таблицах 18A-18C приведены результаты применения указанных мутантных доменов расщепления.[0244] Tables 18A-18C show the results of applying the indicated mutant cleavage domains.
Таблица 18ATable 18A
Таблица 18BTable 18B
Таблица 18CTable 18C
[0245] На Фиг. 15 и 16 также приведена обзорная информация о выбранных результатах с указанными мутантами.[0245] In FIG. 15 and 16 also provide an overview of the selected results with the indicated mutants.
[0246] Указанные результаты демонстрируют высокоспецифичное расщепление при использовании мутантов, описанных в настоящем документе.[0246] These results demonstrate highly specific cleavage using the mutants described herein.
[0247] Все патенты, патентные заявки и публикации, упоминаемые в настоящем документе, полностью включены в настоящий документ посредством ссылок.[0247] All patents, patent applications, and publications referred to herein are incorporated herein by reference in their entirety.
Хотя настоящее изобретение было достаточно подробно описано с привлечением иллюстративного материала и примеров для ясности понимания, специалистам в данной области техники будет понятно, что могут быть внесены различные изменения и модификации без отступления от существа или объема настоящего изобретения. Соответственно, приведенные выше описания и примеры не должны быть истолкованы как ограничивающие.While the present invention has been described in sufficient detail with reference to illustrative material and examples for clarity of understanding, it will be clear to those skilled in the art that various changes and modifications can be made without departing from the spirit or scope of the present invention. Accordingly, the above descriptions and examples are not to be construed as limiting.
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST
<110> SANGAMO THERAPEUTICS, INC./САНГАМО ТЕРАПЬЮТИКС, ИНК.<110> SANGAMO THERAPEUTICS, INC./SANGAMO THERAPEUTICS, INC.
<120> ENGINEERED TARGET SPECIFIC NUCLEASES/СКОНСТРУИРОВАННЫЕ<120> ENGINEERED TARGET SPECIFIC NUCLEASES/DESIGNED
МИШЕНЬ-СПЕЦИФИЧЕСКИЕ НУКЛЕАЗЫ TARGET-SPECIFIC NUCLEASE
<130> 8325-0156.40<130> 8325-0156.40
<140> PCT/US2017/048409<140> PCT/US2017/048409
<141> 2017-08-24<141> 2017-08-24
<150> 62/443981<150> 62/443981
<151> 2017-01-09<151> 2017-01-09
<150> 62/378978<150> 62/378978
<151> 2016-08-24<151> 2016-08-24
<160> 72<160> 72
<170> PatentIn, верс. 3.5<170> PatentIn, Rev. 3.5
<210> 1<210> 1
<211> 196<211> 196
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Неизвестен<213> Unknown
<220><220>
<223> Описание неизвестной последовательности:<223> Description of the unknown sequence:
Полудомен расщепления FokI дикого типа Wild-type FokI cleavage half-domain
<400> 1<400> 1
Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg HisGln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His
1 5 10 151 5 10 15
Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile AlaLys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala
20 25 30 20 25 30
Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu PheArg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe
35 40 45 35 40 45
Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser ArgPhe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg
50 55 60 50 55 60
Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr GlyLys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly
65 70 75 8065 70 75 80
Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro IleVal Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile
85 90 95 85 90 95
Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr ArgGly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg
100 105 110 100 105 110
Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser SerAsn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser
115 120 125 115 120 125
Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly AsnVal Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn
130 135 140 130 135 140
Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn GlyTyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly
145 150 155 160145 150 155 160
Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile LysAla Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys
165 170 175 165 170 175
Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn GlyAla Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly
180 185 190 180 185 190
Glu Ile Asn PheGlu Ile Asn Phe
195 195
<210> 2<210> 2
<211> 588<211> 588
<212> DNA/ДНК<212> DNA
<213> Неизвестен<213> Unknown
<220><220>
<223> Описание неизвестной последовательности:<223> Description of the unknown sequence:
Полудомен расщепления FokI дикого типа Wild-type FokI cleavage half-domain
<400> 2<400> 2
cagctggtga agagcgagct ggaggagaag aagtccgagc tgcggcacaa gctgaagtac 60cagctggtga agagcgagct ggaggagaag aagtccgagc tgcggcacaa gctgaagtac 60
gtgccccacg agtacatcga gctgatcgag atcgccagga acagcaccca ggaccgcatc 120gtgccccacg agtacatcga gctgatcgag atcgccagga acagcaccca ggaccgcatc 120
ctggagatga aggtgatgga gttcttcatg aaggtgtacg gctacagggg aaagcacctg 180ctggagatga aggtgatgga gttcttcatg aaggtgtacg gctacagggg aaagcacctg 180
ggcggaagca gaaagcctga cggcgccatc tatacagtgg gcagccccat cgattacggc 240ggcggaagca gaaagcctga cggcgccatc tatacagtgg gcagccccat cgattacggc 240
gtgatcgtgg acacaaaggc ctacagcggc ggctacaatc tgcctatcgg ccaggccgac 300gtgatcgtgg acacaaaggc ctacagcggc ggctacaatc tgcctatcgg ccaggccgac 300
gagatgcaga gatacgtgga ggagaaccag acccggaata agcacatcaa ccccaacgag 360gagatgcaga gatacgtgga ggagaaccag acccggaata agcacatcaa ccccaacgag 360
tggtggaagg tgtaccctag cagcgtgacc gagttcaagt tcctgttcgt gagcggccac 420tggtggaagg tgtaccctag cagcgtgacc gagttcaagt tcctgttcgt gagcggccac 420
ttcaagggca actacaaggc ccagctgacc aggctgaacc acatcaccaa ctgcaatggc 480ttcaagggca actacaaggc ccagctgacc aggctgaacc acatcaccaa ctgcaatggc 480
gccgtgctga gcgtggagga gctgctgatc ggcggcgaga tgatcaaagc cggcaccctg 540gccgtgctga gcgtggagga gctgctgatc ggcggcgaga tgatcaaagc cggcaccctg 540
acactggagg aggtgcggcg caagttcaac aacggcgaga tcaacttc 588acactggagg aggtgcggcg caagttcaac aacggcgaga tcaacttc 588
<210> 3<210> 3
<211> 28<211> 28
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Неизвестен<213> Unknown
<220><220>
<223> Описание неизвестной последовательности:<223> Description of the unknown sequence:
Белок с цинковыми пальцами Protein with zinc fingers
<400> 3<400> 3
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser AspLys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp
1 5 10 151 5 10 15
His Leu Thr Thr His Ile Arg Thr His Thr Gly GluHis Leu Thr Thr His Ile Arg Thr His Thr Gly Glu
20 25 20 25
<210> 4<210> 4
<211> 23<211> 23
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Неизвестен<213> Unknown
<220><220>
<223> Описание неизвестной последовательности:<223> Description of the unknown sequence:
Белок с цинковыми пальцами Protein with zinc fingers
<400> 4<400> 4
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His LeuPhe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu
1 5 10 151 5 10 15
Thr Thr His Ile Arg Thr HisThr Thr His Ile Arg Thr His
20 twenty
<210> 5<210> 5
<211> 23<211> 23
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Неизвестен<213> Unknown
<220><220>
<223> Описание неизвестной последовательности:<223> Description of the unknown sequence:
Белок с цинковыми пальцами Protein with zinc fingers
<400> 5<400> 5
Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu ArgPhe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg
1 5 10 151 5 10 15
Lys Arg His Thr Lys Ile HisLys Arg His Thr Lys Ile His
20 twenty
<210> 6<210> 6
<211> 23<211> 23
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Неизвестен<213> Unknown
<220><220>
<223> Описание неизвестной последовательности:<223> Description of the unknown sequence:
Белок с цинковыми пальцами Protein with zinc fingers
<400> 6<400> 6
Phe Ala Cys Pro Glu Cys Pro Lys Arg Phe Met Arg Ser Asp His LeuPhe Ala Cys Pro Glu Cys Pro Lys Arg Phe Met Arg Ser Asp His Leu
1 5 10 151 5 10 15
Ser Lys His Ile Lys Thr HisSer Lys His Ile Lys Thr His
20 twenty
<210> 7<210> 7
<211> 179<211> 179
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
полипептид polypeptide
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (8)..(8)<222>(8)..(8)
<223> Q, S или R<223> Q, S or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (13)..(13)<222> (13)..(13)
<223> E, N, S или R<223> E, N, S or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (17)..(17)<222> (17)..(17)
<223> A, Q, L, E, N, Y или R<223> A, Q, L, E, N, Y or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (21)..(27)<222> (21)..(27)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (45)..(45)<222> (45)..(45)
<223> A, Q, L или R<223> A, Q, L, or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (49)..(55)<222> (49)..(55)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (70)..(70)<222> (70)..(70)
<223> E, N, S или R<223> E, N, S or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (74)..(74)<222> (74)..(74)
<223> A, Q, L, E, N, Y или R<223> A, Q, L, E, N, Y or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (78)..(84)<222> (78)..(84)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (102)..(102)<222> (102)..(102)
<223> A, Q, L или R<223> A, Q, L, or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (106)..(112)<222> (106)..(112)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (127)..(127)<222> (127)..(127)
<223> E, N, S или R<223> E, N, S or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (131)..(131)<222> (131)..(131)
<223> A, Q, L, E, N, Y или R<223> A, Q, L, E, N, Y or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (135)..(141)<222> (135)..(141)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (159)..(159)<222> (159)..(159)
<223> A, Q, L или R<223> A, Q, L, or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (163)..(169)<222> (163)..(169)
<223> Любая аминокислота<223> Any amino acid
<400> 7<400> 7
Val Pro Ala Ala Met Ala Glu Xaa Pro Phe Gln Cys Xaa Ile Cys MetVal Pro Ala Ala Met Ala Glu Xaa Pro Phe Gln Cys Xaa Ile Cys Met
1 5 10 151 5 10 15
Xaa Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Ile Arg Thr HisXaa Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Ile Arg Thr His
20 25 30 20 25 30
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Xaa Lys Phe AlaThr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Xaa Lys Phe Ala
35 40 45 35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Lys Ile His Thr Gly Ser GlnXaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Lys Ile His Thr Gly Ser Gln
50 55 60 50 55 60
Lys Pro Phe Gln Cys Xaa Ile Cys Met Xaa Asn Phe Ser Xaa Xaa XaaLys Pro Phe Gln Cys Xaa Ile Cys Met Xaa Asn Phe Ser Xaa Xaa Xaa
65 70 75 8065 70 75 80
Xaa Xaa Xaa Xaa His Ile Arg Thr His Thr Gly Glu Lys Pro Phe AlaXaa Xaa Xaa Xaa His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala
85 90 95 85 90 95
Cys Asp Ile Cys Gly Xaa Lys Phe Ala Xaa Xaa Xaa Xaa Xaa Xaa XaaCys Asp Ile Cys Gly Xaa Lys Phe Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110 100 105 110
His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Xaa IleHis Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Xaa Ile
115 120 125 115 120 125
Cys Met Xaa Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Ile ArgCys Met Xaa Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Ile Arg
130 135 140 130 135 140
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Xaa LysThr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Xaa Lys
145 150 155 160145 150 155 160
Phe Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr His Thr Lys Ile His LeuPhe Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr His Thr Lys Ile His Leu
165 170 175 165 170 175
Arg Gly SerArg Gly Ser
<210> 8<210> 8
<211> 151<211> 151
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
полипептид polypeptide
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (8)..(8)<222>(8)..(8)
<223> Q, S или R<223> Q, S or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (13)..(13)<222> (13)..(13)
<223> E, N, S или R<223> E, N, S or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (17)..(17)<222> (17)..(17)
<223> A, Q, L, E, N, Y или R<223> A, Q, L, E, N, Y or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (21)..(27)<222> (21)..(27)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (42)..(42)<222> (42)..(42)
<223> E, N, S или R<223> E, N, S or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (46)..(46)<222> (46)..(46)
<223> A, Q, L, E, N, Y или R<223> A, Q, L, E, N, Y or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (50)..(56)<222> (50)..(56)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (74)..(74)<222> (74)..(74)
<223> A, Q, L или R<223> A, Q, L, or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (78)..(84)<222> (78)..(84)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (99)..(99)<222> (99)..(99)
<223> E, N, S или R<223> E, N, S or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (103)..(103)<222> (103)..(103)
<223> A, Q, L, E, N, Y или R<223> A, Q, L, E, N, Y or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (107)..(113)<222> (107)..(113)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (131)..(131)<222> (131)..(131)
<223> A, Q, L или R<223> A, Q, L, or R
<220><220>
<221> MOD_RES/МОДИФИЦИРОВАННЫЕ ОСТАТКИ<221> MOD_RES/MODIFIED REMAINS
<222> (135)..(141)<222> (135)..(141)
<223> Любая аминокислота<223> Any amino acid
<400> 8<400> 8
Val Pro Ala Ala Met Ala Glu Xaa Pro Phe Gln Cys Xaa Ile Cys MetVal Pro Ala Ala Met Ala Glu Xaa Pro Phe Gln Cys Xaa Ile Cys Met
1 5 10 151 5 10 15
Xaa Lys Phe Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Lys Ile HisXaa Lys Phe Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Lys Ile His
20 25 30 20 25 30
Thr Gly Ser Gln Lys Pro Phe Gln Cys Xaa Ile Cys Met Xaa Asn PheThr Gly Ser Gln Lys Pro Phe Gln Cys Xaa Ile Cys Met Xaa Asn Phe
35 40 45 35 40 45
Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Ile Arg Thr His Thr Gly GluSer Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Ile Arg Thr His Thr Gly Glu
50 55 60 50 55 60
Lys Pro Phe Ala Cys Asp Ile Cys Gly Xaa Lys Phe Ala Xaa Xaa XaaLys Pro Phe Ala Cys Asp Ile Cys Gly Xaa Lys Phe Ala Xaa Xaa Xaa
65 70 75 8065 70 75 80
Xaa Xaa Xaa Xaa His Thr Lys Ile His Thr Gly Ser Gln Lys Pro PheXaa Xaa Xaa Xaa His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe
85 90 95 85 90 95
Gln Cys Xaa Ile Cys Met Xaa Asn Phe Ser Xaa Xaa Xaa Xaa Xaa XaaGln Cys Xaa Ile Cys Met Xaa Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110 100 105 110
Xaa His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp IleXaa His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
115 120 125 115 120 125
Cys Gly Xaa Lys Phe Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr His ThrCys Gly Xaa Lys Phe Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr His Thr
130 135 140 130 135 140
Lys Ile His Leu Arg Gly SerLys Ile His Leu Arg Gly Ser
145 150145 150
<210> 9<210> 9
<211> 5<211> 5
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
пептид peptide
<400> 9<400> 9
Thr Gly Glu Lys ProThr Gly Glu Lys Pro
1 5fifteen
<210> 10<210> 10
<211> 6<211> 6
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
пептид peptide
<400> 10<400> 10
Thr Gly Gly Gln Arg ProThr Gly Gly Glyn Arg Pro
1 5fifteen
<210> 11<210> 11
<211> 5<211> 5
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
пептид peptide
<400> 11<400> 11
Thr Gly Gln Lys ProThr Gly Gln Lys Pro
1 5fifteen
<210> 12<210> 12
<211> 6<211> 6
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
пептид peptide
<400> 12<400> 12
Thr Gly Ser Gln Lys ProThr Gly Ser Gln Lys Pro
1 5fifteen
<210> 13<210> 13
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 13<400> 13
ctaatcagag gccaaaccct tcctggagcc tgtgataaaa gcaactgtta gcttgcacta 60ctaatcagag gccaaaccct tcctggagcc tgtgataaaa gcaactgtta gcttgcacta 60
gactagcttc aaagtt 76gactagcttc aaagtt 76
<210> 14<210> 14
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 14<400> 14
cttcctgcgg ggttttgtgc aaataaccca tgctcgggag cgaggccctg ggaaggagta 60cttcctgcgg ggttttgtgc aaataaccca tgctcgggag cgaggccctg ggaaggagta 60
tctcgcttct ttgggt                                                  76
<210> 15<210> 15
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 15<400> 15
cctaccccca ccacctcacc ttccctcagc cttgtgtttc agccccagtt agctgccctt 60cctaccccca ccacctcacc ttccctcagc cttgtgtttc agccccagtt agctgccctt 60
agttgctgat gtattg                                                  76
<210> 16<210> 16
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 16<400> 16
agcacgtttc tccagtttcc agcctggggc ctggctataa agcaaatgct cagtccagca 60agcacgtttc tccagtttcc agcctggggc ctggctataa agcaaatgct cagtccagca 60
ttgcggaatg caaggg                                                  76
<210> 17<210> 17
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 17<400> 17
acagcaccgt gctgcacggc gtcctccggc cttgctgcct ggcaatgggt agccacctgg 60acagcaccgt gctgcacggc gtcctccggc cttgctgcct ggcaatgggt agccacctgg 60
cgtctgtctc agaata 76cgtctgtctc agaata 76
<210> 18<210> 18
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 18<400> 18
ttcccagaag gcgattgaac ctgaagctgc gcctggcgcg tgagcctgtg ggggggacgc 60ttcccagaag gcgattgaac ctgaagctgc gcctggcgcg tgagcctgtg ggggggacgc 60
ggctgagggg ctttga                                                  76
<210> 19<210> 19
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 19<400> 19
tatcccttcc ccaagtgcaa ccaacagttg ctctaaagct aggctggtgg agttggggaa 60tatcccttcc ccaagtgcaa ccaacagttg ctctaaagct aggctggtgg agttggggaa 60
agggccagca agtgag                                                  76
<210> 20<210> 20
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 20<400> 20
tcctccatgc tcagaaagcc tttcttggag ccaggcacac aggaaatgtt agctagttag 60tcctccatgc tcagaaagcc ttttcttggag ccaggcacac aggaaatgtt agctagttag 60
cattggctct aatact                                                  76
<210> 21<210> 21
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 21<400> 21
tagctgggga gagattgcct ctctcagggc ctagccagtt cctagaaata gcaagggctc 60tagctgggga gagattgcct ctctcaggggc ctagccagtt cctagaaata gcaagggctc 60
agctgagagc atgctt                                                  76
<210> 22<210> 22
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 22<400> 22
tcccccggaa gtgtccgcac ctcctagagc ccagcgagcg agcgtttgtg cttttgtcct 60tccccgggaa gtgtccgcac ctcctagagc ccagcgagcg agcgtttgtg cttttgtcct 60
ttgaaccggg tgtggt                                                  76
<210> 23<210> 23
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 23<400> 23
gactcattca tccactcatt ctgagcactt gctgcacact aggccctggg ctggggcttc 60gactcattca tccactcatt ctgagcactt gctgcacact aggccctggg ctggggcttc 60
agcccaggag ttcact                                                  76
<210> 24<210> 24
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 24<400> 24
atgtagtctg acggccgcga ctggttcgta gcttttgagt gaggcggcgg gaagggagcg 60atgtagtctg acggccgcga ctggttcgta gcttttgagt gaggcggcgg gaagggagcg 60
agggaagagc ggcagt                                                  76
<210> 25<210> 25
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 25<400> 25
tcatgttatg gaagtggctt ctttccttaa gccttatgaa taagcctctg ctagcttcaa 60tcatgttatg gaagtggctt ctttccttaa gccttatgaa taagcctctg ctagcttcaa 60
actttgtgtg cagctt                                                  76
<210> 26<210> 26
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 26<400> 26
cataaagcac ttacaacagt gcctggcaaa tgcctagtgc acagcaagtg ttagctattg 60cataaagcac ttacaacagt gcctggcaaa tgcctagtgc acagcaagtg ttagctattg 60
ttaatgacta tccatt                                                  76
<210> 27<210> 27
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 27<400> 27
atttttgccc ctgtcttctc ttttcctcct ttgctgcatc ccaggctcca gcctttcagc 60atttttgccc ctgtcttctc ttttcctcct ttgctgcatc ccaggctcca gcctttcagc 60
cctatttgca gtaccc                                                  76
<210> 28<210> 28
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 28<400> 28
acaaggggtt caaggttatg aataacctgt gctaatccca gaggccccag gacagagtaa 60acaaggggtt caaggttatg aataacctgt gctaatccca gaggccccag gacagagtaa 60
gtgggaacaa acactg                                                  76
<210> 29<210> 29
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 29<400> 29
cggaagttaa tatgatcatt gctaacattt gctgtgtttc aggcactgta agcatgtata 60cggaagttaa tatgatcatt gctaacattt gctgtgtttc aggcactgta agcatgtata 60
tgggtcctta aaggga                                                  76
<210> 30<210> 30
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 30<400> 30
tgagcccaga aaccccttac ccttcctcct gcctcttgag aggccagtgt taggtgttag 60tgagcccaga aaccccttac ccttcctcct gcctcttgag aggccagtgt taggtgttag 60
ccggggtgca aagctc 76ccggggtgca aagctc 76
<210> 31<210> 31
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 31<400> 31
aacctggtgc gagcagcccg ggctacaggg ttgcctgagg tgtgggtccc aggatggagg 60aacctggtgc gagcagcccg ggctacaggg ttgcctgagg tgtgggtccc aggatgggagg 60
agccccaggc cggcgg                                                  76
<210> 32<210> 32
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 32<400> 32
acttcggtga aggaagtcat cagtgcagtt gccgacaagc tgggctccgg ggagggcctg 60acttcggtga aggaagtcat cagtgcagtt gccgacaagc tgggctccgg ggagggcctg 60
atcatagtca agatga                                                  76
<210> 33<210> 33
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 33<400> 33
ggggccaggc aggaagaaca gctaactcta gctcacctgc aaggctcagc actgggttca 60ggggccaggc aggaagaaca gctaactcta gctcacctgc aaggctcagc actgggttca 60
tttgaagtag tgtcct                                                  76
<210> 34<210> 34
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 34<400> 34
ctcctttggg tgtggacggg actaacactt gctccatgtc agggctgcag gacctcctgg 60ctcctttggg tgtggacggg actaacactt gctccatgtc agggctgcag gacctcctgg 60
ctgttgacag caggca                                                  76
<210> 35<210> 35
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 35<400> 35
gatgtttgaa aagcgctgag cctggcctgg cacctaaaca gctcagcaag tgttagccag 60gatgtttgaa aagcgctgag cctggcctgg cacctaaaca gctcagcaag tgttagccag 60
gatcactagc agtaat                                                  76
<210> 36<210> 36
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 36<400> 36
accctgccga tttccttcca gttgctcgct ggggcaaccg gctaggctgg aggaagggcg 60accctgccga ttttccttcca gttgctcgct ggggcaaccg gctaggctgg aggaagggcg 60
aggacggtgt cacccc                                                  76
<210> 37<210> 37
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 37<400> 37
gaacatggtg aggacaaaat gatgtccagg agccttttct ttggccattg ctagcctgag 60gaacatggtg aggacaaaat gatgtccagg agccttttct ttggccattg ctagcctgag 60
acgaaaagtc agtggc 76acgaaaagtc agtggc 76
<210> 38<210> 38
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 38<400> 38
agtctgtcag tctatcgtcc ctacctgcag cccaaagcat aagcaacatc ttgcccagct 60agtctgtcag tctatcgtcc ctacctgcag cccaaagcat aagcaacatc ttgcccagct 60
cagaggtgac aacctc 76cagaggtgac aacctc 76
<210> 39<210> 39
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 39<400> 39
caccgaccca aggaccactc cttccaggaa cctagcctaa agcaaaggtg cagacagccc 60caccgaccca aggaccactc cttccaggaa cctagcctaa agcaaaggtg cagacagccc 60
ggggccaccg ctgacc                                                  76
<210> 40<210> 40
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 40<400> 40
ttgcaaaagg aagtttgaag ctagcagagg ctgattcatg aggttcaagg aaagaagtca 60ttgcaaaagg aagtttgaag ctagcagagg ctgattcatg aggttcaagg aaagaagtca 60
tctctgtaac ataaaa                                                  76
<210> 41<210> 41
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 41<400> 41
cgtcccccag agtcctgttt cctctccttc agcccccaaa tgagcaaagg ttaggcccca 6060
cccctgctga gtcagc                                                  76
<210> 42<210> 42
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 42<400> 42
gtcaggggac agggtttcct agcatccgcg agccttacag aaaggcaact gtgcagtgct 60gtcaggggac agggtttcct agcatccgcg agccttacag aaaggcaact gtgcagtgct 60
ccagctggct ttctca                                                  76
<210> 43<210> 43
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 43<400> 43
accatcagag aagctaacct ttcctgaggc ctaactactt tgcaggtcct gtattatgtc 60accatcagag aagctaacct ttcctgaggc ctaactactt tgcaggtcct gtattatgtc 60
ctctatagac attagg                                                  76
<210> 44<210> 44
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 44<400> 44
gatcatttca aagaaaacat tctggaacag ttgcctatgg gcacggcagg gtgacggtgc 60gatcatttca aagaaaacat tctggaacag ttgcctatgg gcacggcagg gtgacggtgc 60
tgcttctggg tttgac                                                  76
<210> 45<210> 45
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 45<400> 45
gaagggcaga gaactataat gacacagttg ctttattgct ggacccagga cagtttatac 60gaagggcaga gaactataat gacacagttg ctttattgct ggacccagga cagtttatac 60
agcagttcgg aaaggc                                                  76
<210> 46<210> 46
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 46<400> 46
acttattgta agtgacgcat gtgaccagtt gccaattgtt caggctacag cttggatctg 60acttattgta agtgacgcat gtgaccagtt gccaattgtt caggctacag cttggatctg 60
ttagcatcct cattta                                                  76
<210> 47<210> 47
<211> 76<211> 76
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 47<400> 47
cccaggggct gtgggacact cagagagcct atgcctgtgc cctgggctcc gggaggggag 60cccaggggct gtgggacact cagagagcct atgcctgtgc cctgggctcc gggaggggag 60
aggatctggg ggccag                                                  76
<210> 48<210> 48
<211> 77<211> 77
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 48<400> 48
ccccaggggc tgtgggacac tcagagagcc tatgcctgtg ccctgggctc cgggagggga 60ccccaggggc tgtgggacac tcagagagcc tatgcctgtg ccctgggctc cgggagggga 60
gaggatctgg gggccag 77gaggatctgg gggccag 77
<210> 49<210> 49
<211> 42<211> 42
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 49<400> 49
agcttcctgc agcctccctc aaagcagatg ttagcactat ta 42agcttcctgc agcctccctc aaagcagatg ttagcactat ta 42
<210> 50<210> 50
<211> 42<211> 42
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 50<400> 50
cctcacctag aacctgggcc cctgcaactg taacctgtgg ca                     42cctcacctag aacctgggcc cctgcaactg taacctgtgg
<210> 51<210> 51
<211> 42<211> 42
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 51<400> 51
ccagaggaag aacagttgct tgggtctagg cctcaggaag gg 42ccagaggaag aacagttgct tgggtctaggg cctcaggaag gg 42
<210> 52<210> 52
<211> 43<211> 43
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 52<400> 52
cctgtgctgg ggcctgggag gcaggcggct gctagccatc ctg 43cctgtgctgg ggcctgggag gcaggcggct gctagccatc ctg 43
<210> 53<210> 53
<211> 42<211> 42
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 53<400> 53
tgacttagga agcagttgct acctgccagg ccccaggcta gg 42tgacttagga agcagttgct acctgccagg ccccaggcta gg 42
<210> 54<210> 54
<211> 40<211> 40
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 54<400> 54
tcagtgattg ggttccgaat cctcctcctg aaagtggccg 40tcagtgattg ggttccgaat ccctcctcctg aaagtggccg 40
<210> 55<210> 55
<211> 40<211> 40
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 55<400> 55
ccatatgcag aaaacagaaa ctgtacccct tccttacacc 40ccatatgcag aaaacagaaa ctgtacccct tccttacacc 40
<210> 56<210> 56
<211> 40<211> 40
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 56<400> 56
tggccctttg cagaaaaggt tgttgaaccc taccgtaaac 40tggccctttg cagaaaaggt tgttgaaccc taccgtaaac 40
<210> 57<210> 57
<211> 40<211> 40
<212> DNA/ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 57<400> 57
ccggagagaa ggctccggtt cagcactgag atcaggacgg 40ccggagagaa ggctccggtt cagcactgag atcaggacgg 40
<210> 58<210> 58
<211> 195<211> 195
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
полипептид polypeptide
<400> 58<400> 58
Leu Val Lys Gly Glu Met Glu Lys Lys Lys Ser Asp Leu Arg His LysLeu Val Lys Gly Glu Met Glu Lys Lys Lys Ser Asp Leu Arg His Lys
1 5 10 151 5 10 15
Leu Lys His Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala GlnLeu Lys His Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Gln
20 25 30 20 25 30
Asp Ser Lys Gln Asn Arg Leu Phe Glu Phe Lys Val Val Glu Phe LeuAsp Ser Lys Gln Asn Arg Leu Phe Glu Phe Lys Val Val Glu Phe Leu
35 40 45 35 40 45
Lys Glu Val Tyr Asp Tyr Asn Gly Lys His Leu Gly Gly Ser Arg LysLys Glu Val Tyr Asp Tyr Asn Gly Lys His Leu Gly Gly Ser Arg Lys
50 55 60 50 55 60
Pro Asp Gly Ala Leu Tyr Thr Asn Gly Leu Lys Thr Asp Tyr Gly IlePro Asp Gly Ala Leu Tyr Thr Asn Gly Leu Lys Thr Asp Tyr Gly Ile
65 70 75 8065 70 75 80
Ile Leu Asp Thr Lys Ala Tyr Lys Asp Gly Tyr Ser Leu Pro Ile SerIle Leu Asp Thr Lys Ala Tyr Lys Asp Gly Tyr Ser Leu Pro Ile Ser
85 90 95 85 90 95
Gln Ala Asp Glu Met Gln Arg Tyr Val Asp Glu Asn Asn Asn Arg AsnGln Ala Asp Glu Met Gln Arg Tyr Val Asp Glu Asn Asn Asn Asn Arg Asn
100 105 110 100 105 110
Ala Ile Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Asn Ser IleAla Ile Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Asn Ser Ile
115 120 125 115 120 125
Leu Asp Phe Lys Phe Leu Phe Val Ser Gly Phe Phe Lys Gly Asp TyrLeu Asp Phe Lys Phe Leu Phe Val Ser Gly Phe Phe Lys Gly Asp Tyr
130 135 140 130 135 140
Lys Lys Gln Leu Ala Arg Val Ser Asn Leu Thr Lys Arg Lys Gly AlaLys Lys Gln Leu Ala Arg Val Ser Asn Leu Thr Lys Arg Lys Gly Ala
145 150 155 160145 150 155 160
Val Leu Ser Val Glu Gln Leu Leu Leu Gly Gly Glu Lys Ile Lys AspVal Leu Ser Val Glu Gln Leu Leu Leu Gly Gly Glu Lys Ile Lys Asp
165 170 175 165 170 175
Gly Ser Leu Thr Leu Glu Asp Val Gly Asp Lys Phe Asn Asn Asp GluGly Ser Leu Thr Leu Glu Asp Val Gly Asp Lys Phe Asn Asn Asp Glu
180 185 190 180 185 190
Ile Ile PheIle Ile Phe
195 195
<210> 59<210> 59
<211> 192<211> 192
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
полипептид polypeptide
<400> 59<400> 59
Gln Ile Val Lys Ser Ser Ile Glu Met Ser Lys Ala Asn Met Arg AspGln Ile Val Lys Ser Ser Ile Glu Met Ser Lys Ala Asn Met Arg Asp
1 5 10 151 5 10 15
Asn Leu Gln Met Leu Pro His Asp Tyr Ile Glu Leu Ile Glu Ile SerAsn Leu Gln Met Leu Pro His Asp Tyr Ile Glu Leu Ile Glu Ile Ser
20 25 30 20 25 30
Gln Asp Pro Tyr Gln Asn Arg Ile Phe Glu Met Lys Val Met Asp LeuGln Asp Pro Tyr Gln Asn Arg Ile Phe Glu Met Lys Val Met Asp Leu
35 40 45 35 40 45
Phe Ile Asn Glu Tyr Gly Phe Ser Gly Ser His Leu Gly Gly Ser ArgPhe Ile Asn Glu Tyr Gly Phe Ser Gly Ser His Leu Gly Gly Ser Arg
50 55 60 50 55 60
Lys Pro Asp Gly Ala Met Tyr Ala His Gly Phe Gly Val Ile Val AspLys Pro Asp Gly Ala Met Tyr Ala His Gly Phe Gly Val Ile Val Asp
65 70 75 8065 70 75 80
Thr Lys Ala Tyr Lys Asp Gly Tyr Asn Leu Pro Ile Ser Gln Ala AspThr Lys Ala Tyr Lys Asp Gly Tyr Asn Leu Pro Ile Ser Gln Ala Asp
85 90 95 85 90 95
Glu Met Glu Arg Tyr Val Arg Glu Asn Ile Asp Arg Asn Glu His ValGlu Met Glu Arg Tyr Val Arg Glu Asn Ile Asp Arg Asn Glu His Val
100 105 110 100 105 110
Asn Ser Asn Arg Trp Trp Asn Ile Phe Pro Glu Asp Thr Asn Glu TyrAsn Ser Asn Arg Trp Trp Asn Ile Phe Pro Glu Asp Thr Asn Glu Tyr
115 120 125 115 120 125
Lys Phe Leu Phe Val Ser Gly Phe Phe Lys Gly Asn Phe Glu Lys GlnLys Phe Leu Phe Val Ser Gly Phe Phe Lys Gly Asn Phe Glu Lys Gln
130 135 140 130 135 140
Leu Glu Arg Ile Ser Ile Asp Thr Gly Val Gln Gly Gly Ala Leu SerLeu Glu Arg Ile Ser Ile Asp Thr Gly Val Gln Gly Gly Ala Leu Ser
145 150 155 160145 150 155 160
Val Glu His Leu Leu Leu Gly Ala Glu Tyr Ile Lys Arg Gly Ile LeuVal Glu His Leu Leu Leu Gly Ala Glu Tyr Ile Lys Arg Gly Ile Leu
165 170 175 165 170 175
Thr Leu Tyr Asp Phe Lys Asn Ser Phe Leu Asn Lys Glu Ile Gln PheThr Leu Tyr Asp Phe Lys Asn Ser Phe Leu Asn Lys Glu Ile Gln Phe
180 185 190 180 185 190
<210> 60<210> 60
<211> 189<211> 189
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
полипептид polypeptide
<400> 60<400> 60
Lys Ser Ser Thr Glu Glu Leu Lys Ala Gln Leu Arg Thr Gln Leu ThrLys Ser Ser Thr Glu Glu Leu Lys Ala Gln Leu Arg Thr Gln Leu Thr
1 5 10 151 5 10 15
Asn Ile Ser Leu Asp Tyr Leu Gln Leu Val Asp Ile Ser Thr Asp SerAsn Ile Ser Leu Asp Tyr Leu Gln Leu Val Asp Ile Ser Thr Asp Ser
20 25 30 20 25 30
Lys Gln Asn Arg Leu Phe Glu Met Lys Val Met Asp Leu Phe Ile AsnLys Gln Asn Arg Leu Phe Glu Met Lys Val Met Asp Leu Phe Ile Asn
35 40 45 35 40 45
Glu Leu Asp Phe Lys Gly Ser His Leu Gly Gly Gly Arg Lys Pro AspGlu Leu Asp Phe Lys Gly Ser His Leu Gly Gly Gly Arg Lys Pro Asp
50 55 60 50 55 60
Gly Ala Val Tyr Thr Thr Asn Tyr Gly Ile Ile Val Asp Thr Lys AlaGly Ala Val Tyr Thr Thr Asn Tyr Gly Ile Ile Val Asp Thr Lys Ala
65 70 75 8065 70 75 80
Tyr Lys Asp Gly Tyr Asn Leu Pro Ile Ser Gln Ala Asp Glu Met GluTyr Lys Asp Gly Tyr Asn Leu Pro Ile Ser Gln Ala Asp Glu Met Glu
85 90 95 85 90 95
Arg Tyr Val Arg Glu Asn Ile Asp Arg Asn Lys Gly Ile Asn Pro AsnArg Tyr Val Arg Glu Asn Ile Asp Arg Asn Lys Gly Ile Asn Pro Asn
100 105 110 100 105 110
Glu Trp Trp Thr Ile Phe Pro Ser Ser Ile Asn Asp Phe Thr Phe LeuGlu Trp Trp Thr Ile Phe Pro Ser Ser Ile Asn Asp Phe Thr Phe Leu
115 120 125 115 120 125
Phe Val Ser Gly Tyr Phe Lys Gly Asn Phe Glu Gly Gln Leu Gln ArgPhe Val Ser Gly Tyr Phe Lys Gly Asn Phe Glu Gly Gln Leu Gln Arg
130 135 140 130 135 140
Ile Ser Met Ser Thr Gly Ile Lys Gly Gly Ala Ile Gly Val Glu HisIle Ser Met Ser Thr Gly Ile Lys Gly Gly Ala Ile Gly Val Glu His
145 150 155 160145 150 155 160
Leu Leu Leu Cys Ala Glu Tyr Tyr Lys Arg Gly Ile Leu Ser His GlnLeu Leu Leu Cys Ala Glu Tyr Tyr Lys Arg Gly Ile Leu Ser His Gln
165 170 175 165 170 175
Asp Ile Arg Asp Ser Phe Lys Asn Ala Glu Ile Glu PheAsp Ile Arg Asp Ser Phe Lys Asn Ala Glu Ile Glu Phe
180 185 180 185
<210> 61<210> 61
<211> 192<211> 192
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
полипептид polypeptide
<400> 61<400> 61
Ile Lys Ser Asn Ile Ser Leu Leu Lys Asp Glu Leu Arg Gly Gln IleIle Lys Ser Asn Ile Ser Leu Leu Lys Asp Glu Leu Arg Gly Gln Ile
1 5 10 151 5 10 15
Ser His Ile Ser His Glu Tyr Leu Ser Leu Ile Asp Leu Ala Phe AspSer His Ile Ser His Glu Tyr Leu Ser Leu Ile Asp Leu Ala Phe Asp
20 25 30 20 25 30
Ser Lys Gln Asn Arg Leu Phe Glu Met Lys Val Leu Glu Leu Leu ValSer Lys Gln Asn Arg Leu Phe Glu Met Lys Val Leu Glu Leu Leu Val
35 40 45 35 40 45
Asn Glu Tyr Gly Phe Lys Gly Arg His Leu Gly Gly Ser Arg Lys ProAsn Glu Tyr Gly Phe Lys Gly Arg His Leu Gly Gly Ser Arg Lys Pro
50 55 60 50 55 60
Asp Gly Ile Val Tyr Ser Thr Thr Leu Glu Asp Asn Phe Gly Ile IleAsp Gly Ile Val Tyr Ser Thr Thr Leu Glu Asp Asn Phe Gly Ile Ile
65 70 75 8065 70 75 80
Val Asp Thr Lys Ala Tyr Ser Glu Gly Tyr Ser Leu Pro Ile Ser GlnVal Asp Thr Lys Ala Tyr Ser Glu Gly Tyr Ser Leu Pro Ile Ser Gln
85 90 95 85 90 95
Ala Asp Glu Met Glu Arg Tyr Val Arg Glu Asn Ser Asn Arg Asp GluAla Asp Glu Met Glu Arg Tyr Val Arg Glu Asn Ser Asn Arg Asp Glu
100 105 110 100 105 110
Glu Val Asn Pro Asn Lys Trp Trp Glu Asn Phe Ser Glu Glu Val LysGlu Val Asn Pro Asn Lys Trp Trp Glu Asn Phe Ser Glu Glu Val Lys
115 120 125 115 120 125
Lys Tyr Tyr Phe Val Phe Ile Ser Gly Ser Phe Lys Gly Lys Phe GluLys Tyr Tyr Phe Val Phe Ile Ser Gly Ser Phe Lys Gly Lys Phe Glu
130 135 140 130 135 140
Glu Gln Leu Arg Arg Leu Ser Met Thr Thr Gly Val Asn Gly Ser AlaGlu Gln Leu Arg Arg Leu Ser Met Thr Thr Gly Val Asn Gly Ser Ala
145 150 155 160145 150 155 160
Val Asn Val Val Asn Leu Leu Leu Gly Ala Glu Lys Ile Arg Ser GlyVal Asn Val Val Asn Leu Leu Leu Gly Ala Glu Lys Ile Arg Ser Gly
165 170 175 165 170 175
Glu Met Thr Ile Glu Glu Leu Glu Arg Ala Met Phe Asn Asn Ser GluGlu Met Thr Ile Glu Glu Glu Leu Glu Arg Ala Met Phe Asn Asn Ser Glu
180 185 190 180 185 190
<210> 62<210> 62
<211> 186<211> 186
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
полипептид polypeptide
<400> 62<400> 62
Lys Leu Ala Lys Ser Ser Gln Ser Glu Thr Lys Glu Lys Leu Arg GluLys Leu Ala Lys Ser Ser Gln Ser Glu Thr Lys Glu Lys Leu Arg Glu
1 5 10 151 5 10 15
Lys Leu Arg Asn Leu Pro His Glu Tyr Leu Ser Leu Val Asp Leu AlaLys Leu Arg Asn Leu Pro His Glu Tyr Leu Ser Leu Val Asp Leu Ala
20 25 30 20 25 30
Tyr Asp Ser Lys Gln Asn Arg Leu Phe Glu Met Lys Val Ile Glu LeuTyr Asp Ser Lys Gln Asn Arg Leu Phe Glu Met Lys Val Ile Glu Leu
35 40 45 35 40 45
Leu Thr Glu Glu Cys Gly Phe Gln Gly Leu His Leu Gly Gly Ser ArgLeu Thr Glu Glu Cys Gly Phe Gln Gly Leu His Leu Gly Gly Ser Arg
50 55 60 50 55 60
Arg Pro Asp Gly Val Leu Tyr Thr Ala Gly Leu Thr Asp Asn Tyr GlyArg Pro Asp Gly Val Leu Tyr Thr Ala Gly Leu Thr Asp Asn Tyr Gly
65 70 75 8065 70 75 80
Ile Ile Leu Asp Thr Lys Ala Tyr Ser Ser Gly Tyr Ser Leu Pro IleIle Ile Leu Asp Thr Lys Ala Tyr Ser Ser Gly Tyr Ser Leu Pro Ile
85 90 95 85 90 95
Ala Gln Ala Asp Glu Met Glu Arg Tyr Val Arg Glu Asn Gln Thr ArgAla Gln Ala Asp Glu Met Glu Arg Tyr Val Arg Glu Asn Gln Thr Arg
100 105 110 100 105 110
Asp Glu Leu Val Asn Pro Asn Gln Trp Trp Glu Asn Phe Glu Asn GlyAsp Glu Leu Val Asn Pro Asn Gln Trp Trp Glu Asn Phe Glu Asn Gly
115 120 125 115 120 125
Leu Gly Thr Phe Tyr Phe Leu Phe Val Ala Gly His Phe Asn Gly AsnLeu Gly Thr Phe Tyr Phe Leu Phe Val Ala Gly His Phe Asn Gly Asn
130 135 140 130 135 140
Val Gln Ala Gln Leu Glu Arg Ile Ser Arg Asn Thr Gly Val Leu GlyVal Gln Ala Gln Leu Glu Arg Ile Ser Arg Asn Thr Gly Val Leu Gly
145 150 155 160145 150 155 160
Ala Ala Ala Ser Ile Ser Gln Leu Leu Leu Leu Ala Asp Ala Ile ArgAla Ala Ala Ser Ile Ser Gln Leu Leu Leu Leu Ala Asp Ala Ile Arg
165 170 175 165 170 175
Gly Gly Arg Met Asp Arg Glu Arg Leu ArgGly Gly Arg Met Asp Arg Glu Arg Leu Arg
180 185 180 185
<210> 63<210> 63
<211> 190<211> 190
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
полипептид polypeptide
<400> 63<400> 63
Lys Ile Ser Lys Thr Asn Ile Leu Glu Leu Lys Asp Lys Val Arg AspLys Ile Ser Lys Thr Asn Ile Leu Glu Leu Lys Asp Lys Val Arg Asp
1 5 10 151 5 10 15
Lys Leu Lys Tyr Val Asp His Arg Tyr Leu Ala Leu Ile Asp Leu AlaLys Leu Lys Tyr Val Asp His Arg Tyr Leu Ala Leu Ile Asp Leu Ala
20 25 30 20 25 30
Tyr Asp Gly Thr Ala Asn Arg Asp Phe Glu Ile Gln Thr Ile Asp LeuTyr Asp Gly Thr Ala Asn Arg Asp Phe Glu Ile Gln Thr Ile Asp Leu
35 40 45 35 40 45
Leu Ile Asn Glu Leu Lys Phe Lys Gly Val Arg Leu Gly Glu Ser ArgLeu Ile Asn Glu Leu Lys Phe Lys Gly Val Arg Leu Gly Glu Ser Arg
50 55 60 50 55 60
Lys Pro Asp Gly Ile Ile Ser Tyr Asn Ile Asn Gly Val Ile Ile AspLys Pro Asp Gly Ile Ile Ser Tyr Asn Ile Asn Gly Val Ile Ile Asp
65 70 75 8065 70 75 80
Asn Lys Ala Tyr Ser Thr Gly Tyr Asn Leu Pro Ile Asn Gln Ala AspAsn Lys Ala Tyr Ser Thr Gly Tyr Asn Leu Pro Ile Asn Gln Ala Asp
85 90 95 85 90 95
Glu Met Ile Arg Tyr Ile Glu Glu Asn Gln Thr Arg Asp Glu Lys IleGlu Met Ile Arg Tyr Ile Glu Glu Asn Gln Thr Arg Asp Glu Lys Ile
100 105 110 100 105 110
Asn Ser Asn Lys Trp Trp Glu Ser Phe Asp Glu Lys Val Lys Asp PheAsn Ser Asn Lys Trp Trp Glu Ser Phe Asp Glu Lys Val Lys Asp Phe
115 120 125 115 120 125
Asn Tyr Leu Phe Val Ser Ser Phe Phe Lys Gly Asn Phe Lys Asn AsnAsn Tyr Leu Phe Val Ser Ser Phe Phe Lys Gly Asn Phe Lys Asn Asn
130 135 140 130 135 140
Leu Lys His Ile Ala Asn Arg Thr Gly Val Asn Gly Gly Ala Ile AsnLeu Lys His Ile Ala Asn Arg Thr Gly Val Asn Gly Gly Ala Ile Asn
145 150 155 160145 150 155 160
Val Glu Asn Leu Leu Tyr Phe Ala Glu Glu Leu Lys Ala Gly Arg IleVal Glu Asn Leu Leu Tyr Phe Ala Glu Glu Leu Lys Ala Gly Arg Ile
165 170 175 165 170 175
Ser Tyr Leu Asp Ser Phe Lys Met Tyr Asn Asn Asp Glu IleSer Tyr Leu Asp Ser Phe Lys Met Tyr Asn Asn Asp Glu Ile
180 185 190 180 185 190
<210> 64<210> 64
<211> 190<211> 190
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
полипептид polypeptide
<400> 64<400> 64
Val Lys Ser Glu Val Ser Val Phe Lys Asp Tyr Leu Arg Thr His LeuVal Lys Ser Glu Val Ser Val Phe Lys Asp Tyr Leu Arg Thr His Leu
1 5 10 151 5 10 15
Thr His Val Asp His Arg Tyr Leu Ile Leu Val Asp Leu Gly Phe AspThr His Val Asp His Arg Tyr Leu Ile Leu Val Asp Leu Gly Phe Asp
20 25 30 20 25 30
Gly Ser Ser Asp Arg Asp Tyr Glu Met Lys Thr Ala Glu Leu Phe ThrGly Ser Ser Asp Arg Asp Tyr Glu Met Lys Thr Ala Glu Leu Phe Thr
35 40 45 35 40 45
Ala Glu Leu Gly Phe Met Gly Ala Arg Leu Gly Asp Thr Arg Lys ProAla Glu Leu Gly Phe Met Gly Ala Arg Leu Gly Asp Thr Arg Lys Pro
50 55 60 50 55 60
Asp Val Cys Val Tyr His Gly Ala Asn Gly Leu Ile Ile Asp Asn LysAsp Val Cys Val Tyr His Gly Ala Asn Gly Leu Ile Ile Asp Asn Lys
65 70 75 8065 70 75 80
Ala Tyr Gly Lys Gly Tyr Ser Leu Pro Ile Lys Gln Ala Asp Glu IleAla Tyr Gly Lys Gly Tyr Ser Leu Pro Ile Lys Gln Ala Asp Glu Ile
85 90 95 85 90 95
Tyr Arg Tyr Ile Glu Glu Asn Lys Glu Arg Asp Ala Arg Leu Asn ProTyr Arg Tyr Ile Glu Glu Asn Lys Glu Arg Asp Ala Arg Leu Asn Pro
100 105 110 100 105 110
Asn Gln Trp Trp Lys Val Phe Asp Glu Ser Val Thr His Phe Arg PheAsn Gln Trp Trp Lys Val Phe Asp Glu Ser Val Thr His Phe Arg Phe
115 120 125 115 120 125
Ala Phe Ile Ser Gly Ser Phe Thr Gly Gly Phe Lys Asp Arg Ile GluAla Phe Ile Ser Gly Ser Phe Thr Gly Gly Phe Lys Asp Arg Ile Glu
130 135 140 130 135 140
Leu Ile Ser Met Arg Ser Gly Ile Cys Gly Ala Ala Val Asn Ser ValLeu Ile Ser Met Arg Ser Gly Ile Cys Gly Ala Ala Val Asn Ser Val
145 150 155 160145 150 155 160
Asn Leu Leu Leu Met Ala Glu Glu Leu Lys Ser Gly Arg Leu Asp TyrAsn Leu Leu Leu Met Ala Glu Glu Leu Lys Ser Gly Arg Leu Asp Tyr
165 170 175 165 170 175
Glu Glu Trp Phe Gln Tyr Phe Asp Asn Asp Glu Ile Ser PheGlu Glu Trp Phe Gln Tyr Phe Asp Asn Asp Glu Ile Ser Phe
180 185 190 180 185 190
<210> 65<210> 65
<211> 192<211> 192
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
полипептид polypeptide
<400> 65<400> 65
Gln Glu Leu Lys Asp Glu Gln Ala Glu Lys Arg Lys Ala Lys Phe LeuGln Glu Leu Lys Asp Glu Gln Ala Glu Lys Arg Lys Ala Lys Phe Leu
1 5 10 151 5 10 15
Lys Glu Thr Asn Leu Pro Met Lys Tyr Ile Glu Leu Leu Asp Ile AlaLys Glu Thr Asn Leu Pro Met Lys Tyr Ile Glu Leu Leu Asp Ile Ala
20 25 30 20 25 30
Tyr Asp Gly Lys Arg Asn Arg Asp Phe Glu Ile Val Thr Met Glu LeuTyr Asp Gly Lys Arg Asn Arg Asp Phe Glu Ile Val Thr Met Glu Leu
35 40 45 35 40 45
Phe Arg Asn Val Tyr Arg Leu His Ser Lys Leu Leu Gly Gly Gly ArgPhe Arg Asn Val Tyr Arg Leu His Ser Lys Leu Leu Gly Gly Gly Arg
50 55 60 50 55 60
Lys Pro Asp Gly Leu Leu Tyr Gln Asp Arg Phe Gly Val Ile Val AspLys Pro Asp Gly Leu Leu Tyr Gln Asp Arg Phe Gly Val Ile Val Asp
65 70 75 8065 70 75 80
Thr Lys Ala Tyr Gly Lys Gly Tyr Ser Lys Ser Ile Asn Gln Ala AspThr Lys Ala Tyr Gly Lys Gly Tyr Ser Lys Ser Ile Asn Gln Ala Asp
85 90 95 85 90 95
Glu Met Ile Arg Tyr Ile Glu Asp Asn Lys Arg Arg Asp Glu Asn ArgGlu Met Ile Arg Tyr Ile Glu Asp Asn Lys Arg Arg Asp Glu Asn Arg
100 105 110 100 105 110
Asn Pro Ile Lys Trp Trp Glu Ala Phe Pro Asp Thr Ile Pro Glu PheAsn Pro Ile Lys Trp Trp Glu Ala Phe Pro Asp Thr Ile Pro Glu Phe
115 120 125 115 120 125
Tyr Phe Met Trp Val Ser Ser Lys Phe Ile Gly Lys Phe Gln Glu GlnTyr Phe Met Trp Val Ser Ser Lys Phe Ile Gly Lys Phe Gln Glu Gln
130 135 140 130 135 140
Leu Asp Tyr Thr Ser Asn Glu Thr Gln Ile Lys Gly Ala Ala Leu AsnLeu Asp Tyr Thr Ser Asn Glu Thr Gln Ile Lys Gly Ala Ala Leu Asn
145 150 155 160145 150 155 160
Val Glu Gln Leu Leu Leu Gly Ala Asp Leu Val Leu Lys Gly Gln LeuVal Glu Gln Leu Leu Leu Gly Ala Asp Leu Val Leu Lys Gly Gln Leu
165 170 175 165 170 175
His Ile Ser Asp Leu Pro Ser Tyr Phe Gln Asn Lys Glu Ile Glu PheHis Ile Ser Asp Leu Pro Ser Tyr Phe Gln Asn Lys Glu Ile Glu Phe
180 185 190 180 185 190
<210> 66<210> 66
<211> 189<211> 189
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
полипептид polypeptide
<400> 66<400> 66
Lys Val Ser Lys Thr Asn Ile Leu Glu Leu Lys Asp Asn Thr Arg GluLys Val Ser Lys Thr Asn Ile Leu Glu Leu Lys Asp Asn Thr Arg Glu
1 5 10 151 5 10 15
Lys Leu Val Tyr Leu Asp His Arg Tyr Leu Ser Leu Phe Asp Leu AlaLys Leu Val Tyr Leu Asp His Arg Tyr Leu Ser Leu Phe Asp Leu Ala
20 25 30 20 25 30
Tyr Asp Asp Lys Ala Ser Arg Asp Phe Glu Ile Gln Thr Ile Asp LeuTyr Asp Asp Lys Ala Ser Arg Asp Phe Glu Ile Gln Thr Ile Asp Leu
35 40 45 35 40 45
Leu Ile Asn Glu Leu Gln Phe Lys Gly Leu Arg Leu Gly Glu Arg ArgLeu Ile Asn Glu Leu Gln Phe Lys Gly Leu Arg Leu Gly Glu Arg Arg
50 55 60 50 55 60
Lys Pro Asp Gly Ile Ile Tyr Gly Val Asn Gly Val Ile Ile Asp AsnLys Pro Asp Gly Ile Ile Tyr Gly Val Asn Gly Val Ile Ile Asp Asn
65 70 75 8065 70 75 80
Lys Ala Tyr Ser Lys Gly Tyr Asn Leu Pro Ile Arg Gln Ala Asp GluLys Ala Tyr Ser Lys Gly Tyr Asn Leu Pro Ile Arg Gln Ala Asp Glu
85 90 95 85 90 95
Met Ile Arg Tyr Ile Gln Glu Asn Gln Ser Arg Asp Glu Lys Leu AsnMet Ile Arg Tyr Ile Gln Glu Asn Gln Ser Arg Asp Glu Lys Leu Asn
100 105 110 100 105 110
Pro Asn Lys Trp Trp Glu Asn Phe Glu Glu Glu Thr Ser Lys Phe AsnPro Asn Lys Trp Trp Glu Asn Phe Glu Glu Glu Thr Ser Lys Phe Asn
115 120 125 115 120 125
Tyr Leu Phe Ile Ser Ser Lys Phe Ile Ser Gly Phe Lys Lys Asn LeuTyr Leu Phe Ile Ser Ser Lys Phe Ile Ser Gly Phe Lys Lys Asn Leu
130 135 140 130 135 140
Gln Tyr Ile Ala Asp Arg Thr Gly Val Asn Gly Gly Ala Ile Asn ValGln Tyr Ile Ala Asp Arg Thr Gly Val Asn Gly Gly Ala Ile Asn Val
145 150 155 160145 150 155 160
Glu Asn Leu Leu Cys Phe Ala Glu Met Leu Lys Ser Gly Lys Leu GluGlu Asn Leu Leu Cys Phe Ala Glu Met Leu Lys Ser Gly Lys Leu Glu
165 170 175 165 170 175
Tyr Asn Asp Phe Phe Asn Gln Tyr Asn Asn Asp Glu IleTyr Asn Asp Phe Phe Asn Gln Tyr Asn Asn Asp Glu Ile
180 185 180 185
<210> 67<210> 67
<211> 185<211> 185
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
полипептид polypeptide
<400> 67<400> 67
Ile Glu Glu Gln Lys Ala Ile Phe Leu Gln Lys Thr Lys Leu Pro LeuIle Glu Glu Gln Lys Ala Ile Phe Leu Gln Lys Thr Lys Leu Pro Leu
1 5 10 151 5 10 15
Ser Tyr Ile Glu Leu Leu Glu Ile Ala Arg Asp Gly Lys Arg Ser ArgSer Tyr Ile Glu Leu Leu Glu Ile Ala Arg Asp Gly Lys Arg Ser Arg
20 25 30 20 25 30
Asp Phe Glu Phe Ile Thr Met Glu Leu Phe Lys Asn Ile Tyr Lys IleAsp Phe Glu Phe Ile Thr Met Glu Leu Phe Lys Asn Ile Tyr Lys Ile
35 40 45 35 40 45
Asn Ala Arg Ile Leu Gly Gly Ala Arg Lys Pro Asp Gly Val Leu TyrAsn Ala Arg Ile Leu Gly Gly Ala Arg Lys Pro Asp Gly Val Leu Tyr
50 55 60 50 55 60
Met Pro Glu Phe Gly Val Ile Val Asp Thr Lys Ala Tyr Ala Asp GlyMet Pro Glu Phe Gly Val Ile Val Asp Thr Lys Ala Tyr Ala Asp Gly
65 70 75 8065 70 75 80
Tyr Ser Lys Ser Ile Ala Gln Ala Asp Glu Met Ile Arg Tyr Ile GluTyr Ser Lys Ser Ile Ala Gln Ala Asp Glu Met Ile Arg Tyr Ile Glu
85 90 95 85 90 95
Asp Asn Lys Arg Arg Asp Pro Ser Arg Asn Ser Thr Lys Trp Trp GluAsp Asn Lys Arg Arg Asp Pro Ser Arg Asn Ser Thr Lys Trp Trp Glu
100 105 110 100 105 110
His Phe Pro Thr Ser Ile Asn Asn Phe Tyr Phe Leu Trp Val Ser SerHis Phe Pro Thr Ser Ile Asn Asn Phe Tyr Phe Leu Trp Val Ser Ser
115 120 125 115 120 125
Val Phe Val Asn Lys Phe His Glu Gln Leu Ser Tyr Thr Ala Gln GluVal Phe Val Asn Lys Phe His Glu Gln Leu Ser Tyr Thr Ala Gln Glu
130 135 140 130 135 140
Thr Gln Thr Val Gly Ala Ala Leu Ser Val Glu Gln Leu Leu Leu GlyThr Gln Thr Val Gly Ala Ala Leu Ser Val Glu Gln Leu Leu Leu Gly
145 150 155 160145 150 155 160
Ala Asp Ser Val Leu Lys Gly Asn Leu Thr Thr Glu Lys Phe Ile AspAla Asp Ser Val Leu Lys Gly Asn Leu Thr Thr Glu Lys Phe Ile Asp
165 170 175 165 170 175
Ser Phe Lys Asn Gln Glu Ile Val PheSer Phe Lys Asn Gln Glu Ile Val Phe
180 185 180 185
<210> 68<210> 68
<211> 9<211> 9
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Неизвестен<213> Unknown
<220><220>
<223> Описание неизвестной последовательности:<223> Description of the unknown sequence:
Последовательность пептидного мотива семейства "LAGLIDADG" The sequence of the peptide motif of the "LAGLIDADG" family
<400> 68<400> 68
Leu Ala Gly Leu Ile Asp Ala Asp GlyLeu Ala Gly Leu Ile Asp Ala Asp Gly
1 5fifteen
<210> 69<210> 69
<211> 4<211> 4
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
пептид peptide
<400> 69<400> 69
Asn Glu Leu AspAsn Glu Leu Asp
1one
<210> 70<210> 70
<211> 4<211> 4
<212> PRT/БЕЛОК<212> PRT/PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
пептид peptide
<400> 70<400> 70
Cys Lys Lys ArgCys Lys Lys Arg
1one
<210> 71<210> 71
<211> 18<211> 18
<212> DNA/ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
олигонуклеотид oligonucleotide
<400> 71<400> 71
tgtcaggatt gggttccg                                                18
<210> 72<210> 72
<211> 18<211> 18
<212> DNA/ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Artificial sequence description: synthetic
олигонуклеотид oligonucleotide
<400> 72<400> 72
ctcctgaaag tggccggg                                              18
<---<---
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| US201662378978P | 2016-08-24 | 2016-08-24 | |
| US62/378,978 | 2016-08-24 | ||
| US201762443981P | 2017-01-09 | 2017-01-09 | |
| US62/443,981 | 2017-01-09 | ||
| PCT/US2017/048409WO2018039448A1 (en) | 2016-08-24 | 2017-08-24 | Engineered target specific nucleases | 
| Application Number | Title | Priority Date | Filing Date | 
|---|---|---|---|
| RU2022127957ADivisionRU2022127957A (en) | 2016-08-24 | 2017-08-24 | DESIGNED TARGET-SPECIFIC NUCLEASE | 
| Publication Number | Publication Date | 
|---|---|
| RU2019108242A RU2019108242A (en) | 2020-09-25 | 
| RU2019108242A3 RU2019108242A3 (en) | 2021-04-09 | 
| RU2782794C2true RU2782794C2 (en) | 2022-11-02 | 
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| US5356802A (en)* | 1992-04-03 | 1994-10-18 | The Johns Hopkins University | Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease | 
| US20080131962A1 (en)* | 2006-05-25 | 2008-06-05 | Sangamo Biosciences, Inc. | Engineered cleavage half-domains | 
| US20130130350A1 (en)* | 2010-07-27 | 2013-05-23 | Srinivasan Chandrasegaran | Obligate heterodimer variants of foki cleavage domain | 
| RU2014145942A (en)* | 2012-04-25 | 2016-06-10 | Регенерон Фармасьютикалс, Инк. | NUCLEASE-MEDIATED TARGETING WITH LARGE TARGET VECTORS | 
| US20180340189A1 (en)* | 2013-03-15 | 2018-11-29 | The General Hospital Corporation | Using RNA-guided FokI Nucleases (RFNs) to Increase Specificity for RNA-Guided Genome Editing | 
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| US5356802A (en)* | 1992-04-03 | 1994-10-18 | The Johns Hopkins University | Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease | 
| US20080131962A1 (en)* | 2006-05-25 | 2008-06-05 | Sangamo Biosciences, Inc. | Engineered cleavage half-domains | 
| US20130130350A1 (en)* | 2010-07-27 | 2013-05-23 | Srinivasan Chandrasegaran | Obligate heterodimer variants of foki cleavage domain | 
| RU2014145942A (en)* | 2012-04-25 | 2016-06-10 | Регенерон Фармасьютикалс, Инк. | NUCLEASE-MEDIATED TARGETING WITH LARGE TARGET VECTORS | 
| US20180340189A1 (en)* | 2013-03-15 | 2018-11-29 | The General Hospital Corporation | Using RNA-guided FokI Nucleases (RFNs) to Increase Specificity for RNA-Guided Genome Editing | 
| Publication | Publication Date | Title | 
|---|---|---|
| US11827900B2 (en) | Engineered target specific nucleases | |
| US11834686B2 (en) | Engineered target specific base editors | |
| US10179918B2 (en) | Methods and compositions for increasing transgene activity | |
| JP7275152B2 (en) | Engineered target-specific nucleases | |
| RU2782794C2 (en) | Constructed target-specific nucleases | |
| HK40069273A (en) | Engineered target specific nucleases | |
| JP2022500052A (en) | Programmed cell death 1 (PD1) specific nuclease | |
| NZ791740A (en) | Engineered target specific nucleases | |
| NZ791711A (en) | Engineered target specific nucleases | |
| HK40011095B (en) | Engineered target specific nucleases | |
| NZ791732A (en) | Engineered target specific nucleases |