






ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY
Настоящее изобретение относится к области биотехнологии, иммунологии, вирусологии, генетики и молекулярной биологии. Более конкретно, настоящее изобретение относится к выделенному рекомбинантному рецептор-связывающему домену гликопротеина S (RBD-S) вируса SARS-CoV-2 (коронавирус 2 типа, вызывающий тяжёлый острый респираторный синдром), нуклеиновой кислоте, которая кодирует RBD-S вируса SARS-CoV-2, экспрессионной кассете и вектору на ее основе, а также к рекомбинантному вирусу на основе AAV5 (аденоассоциированный вирус 5 серотипа) для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2, вакцине на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2, и их применению для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2.The present invention relates to the field of biotechnology, immunology, virology, genetics and molecular biology. More specifically, the present invention relates to an isolated recombinant SARS-CoV-2 (severe acute respiratory syndrome coronavirus type 2) glycoprotein S (RBD-S) receptor-binding domain, a nucleic acid that encodes RBD-S of SARS-CoV. -2, an expression cassette and a vector based on it, as well as to a recombinant virus based on AAV5 (adeno-associated virus serotype 5) for the induction of specific immunity to the SARS-CoV-2 virus and / or the prevention of coronavirus infection caused by SARS-CoV-2, an AAV5-based vaccine for induction of specific immunity to the SARS-CoV-2 virus and/or prevention of coronavirus infection caused by SARS-CoV-2, and their use for the induction of specific immunity to SARS-CoV-2 virus and/or prevention of coronavirus infection, caused by SARS-CoV-2.
УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE INVENTION
Коронавирус SARS-CoV-2 (коронавирус 2 типа, вызывающий тяжёлый острый респираторный синдром) относится к роду Betacoronavirus, подроду Sarbecovirus.Coronavirus SARS-CoV-2 (type 2 coronavirus that causes severe acute respiratory syndrome) belongs to the genus Betacoronavirus, subgenus Sarbecovirus.
Вирус SARS-CoV-2 обнаружен в декабре 2019 года в результате анализа образцов, взятых у пациентов с пневмонией. 31 декабря 2019 года Всемирная организация здравоохранения была оповещена о нескольких случаях вирусной пневмонии, вызванной ранее неизвестным патогеном. Впервые геном вируса был полностью расшифрован в Китае.The SARS-CoV-2 virus was discovered in December 2019 as a result of analysis of samples taken from patients with pneumonia. On December 31, 2019, the World Health Organization was alerted to several cases of viral pneumonia caused by a previously unknown pathogen. For the first time, the genome of the virus was completely deciphered in China.
Коронавирусы, к которым относится SARS-CoV-2, обычно вызывают острые респираторные заболевания. К этому же семейству относятся вирусы SARS-CoV и MERS-CoV, вызывающие тяжёлый острый респираторный синдром и ближневосточный респираторный синдром соответственно.Coronaviruses, which include SARS-CoV-2, usually cause acute respiratory infections. The SARS-CoV and MERS-CoV viruses that cause severe acute respiratory syndrome and the Middle East respiratory syndrome, respectively, belong to this family.
Коронавирусом SARS-CoV-2 обусловлена продолжающаяся пандемия COVID-19. В январе 2020 года Всемирная организация здравоохранения объявила вспышку эпидемии, связанной с SARS-CoV-2, чрезвычайной ситуацией в области здравоохранения международного значения, а 11 марта 2020 года охарактеризовала принявшее мировой масштаб распространение болезни как пандемию.The SARS-CoV-2 coronavirus is responsible for the ongoing COVID-19 pandemic. In January 2020, the World Health Organization declared the SARS-CoV-2 outbreak a public health emergency of international concern, and on March 11, 2020, characterized the worldwide spread of the disease as a pandemic.
В БД GenBank, Wu F., Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1, complete genome, 2020, GenBank: MN908947.3 (https://www.ncbi.nlm.nih.gov/nuccore/MN908947) и в статье Fan Wu ET AL., A new coronavirus associated with human respiratory disease in China, 2020, Nature, volume 579, pp. 265–269 (https://www.nature.com/articles/s41586-020-2008-3) представлена информация о геноме SARS-CoV-2.In GenBank database, Wu F., Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1, complete genome, 2020, GenBank: MN908947.3 (https://www.ncbi.nlm.nih.gov/nuccore/MN908947) and in Fan Wu ET AL., A new coronavirus associated with human respiratory disease in China, 2020, Nature, volume 579, pp. 265–269 (https://www.nature.com/articles/s41586-020-2008-3) provides information on the SARS-CoV-2 genome.
В патентном документе CN110951756 (B) описаны последовательности нуклеотидных кислот, кодирующие пептид антигена вируса SARS-CoV-2, и указано, что данные последовательности нуклеотидных кислот могут использоваться для индукции соответствующих реакций иммунной защиты, и ожидается, что они будут использованы в вакцинах против SARS-CoV-2.Patent document CN110951756 (B) describes the nucleotide sequences encoding the SARS-CoV-2 antigen peptide and states that these nucleotide sequences can be used to induce appropriate immune defense responses and are expected to be used in SARS vaccines. -CoV-2.
В патентном документе CN110974950B описана вакцина для предотвращения инфекции SARS-CoV-2, где вакцина содержит аденовирусный вектор Ad5, включающий последовательность нуклеиновой кислоты, кодирующую пептид антигена вируса SARS-CoV-2.Patent document CN110974950B describes a vaccine for preventing SARS-CoV-2 infection, wherein the vaccine contains an Ad5 adenoviral vector comprising a nucleic acid sequence encoding a SARS-CoV-2 virus antigen peptide.
В патентном документе RU2720614 C1 (Национальный исследовательский центр эпидемиологии и микробиологии имени академика Н.Ф. Гамалеи Минздрава России (ФГБУ "НИЦЭМ им. Н.Ф. Гамалеи" Минздрава России)) описана вакцина на основе рекомбинантных аденовирусных частиц 5 и/или 26 серотипа, которые содержат ген белка S вируса SARS-CoV-2.Patent document RU2720614 C1 (National Research Center for Epidemiology and Microbiology named after Academician N.F. Gamaleya of the Ministry of Health of Russia (FGBU "NITsEM named after N.F. Gamaleya" of the Ministry of Health of Russia)) describes a vaccine based on recombinant adenovirus particles of serotype 5 and / or 26 that contain the gene for the S protein of the SARS-CoV-2 virus.
На дату подачи данной заявки, коронавирусом SARS-CoV-2 заболело более 23 миллионов человек, более 800 тысяч человек умерли от коронавируса SARS-CoV-2. Более того, пандемия COVID-19 продолжается и на дату подачи заявки. Таким образом, существует острая общемировая потребность в эффективных средствах профилактики и лечения заболеваний, вызванных вирусом тяжелого острого респираторного синдрома SARS-CoV-2.As of the filing date of this application, more than 23 million people have become ill with the SARS-CoV-2 coronavirus, and more than 800,000 people have died from the SARS-CoV-2 coronavirus. Moreover, the COVID-19 pandemic continues as of the application date. Thus, there is an urgent global need for effective means for the prevention and treatment of diseases caused by the severe acute respiratory syndrome virus SARS-CoV-2.
Описание изобретенияDescription of the invention
Авторами изобретения был разработан выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2, который используется в качестве антигена для эффективной иммунизации млекопитающих с индукцией специфического иммунитета к вирусу SARS-CoV-2, что будет обуславливать профилактику заболеваний, вызванных вирусом SARS-CoV-2. Авторами изобретения были также разработаны средства доставки вышеуказанного антигена в организм млекопитающего, а именно экспрессионный вектор, который включает нуклеиновую кислоту, кодирующую вышеуказанный антиген, рекомбинантный вирус на основе AAV5 (аденоассоциированный вирус 5 серотипа), который включает нуклеиновую кислоту, кодирующую вышеуказанный антиген, вакцины, которые включают вышеуказанные объекты и способы их применения для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2.The authors of the invention have developed an isolated recombinant receptor-binding domain of the glycoprotein S (RBD-S) of the SARS-CoV-2 virus, which is used as an antigen for the effective immunization of mammals with the induction of specific immunity to the SARS-CoV-2 virus, which will cause disease prevention caused by the SARS-CoV-2 virus. The authors of the invention have also developed means for delivering the above antigen to a mammalian body, namely an expression vector that includes a nucleic acid encoding the above antigen, a recombinant virus based on AAV5 (adeno-associated virus serotype 5), which includes a nucleic acid encoding the above antigen, vaccines, which include the above objects and methods of their use for the induction of specific immunity to the SARS-CoV-2 virus and/or the prevention of coronavirus infection caused by SARS-CoV-2.
Краткое описание изобретенияBrief description of the invention
В одном из аспектов настоящее изобретение относится к выделенному рекомбинантному рецептор-связывающему домену гликопротеина S (RBD-S) вируса SARS-CoV-2, который представлен аминокислотной последовательностью SEQ ID NO:1.In one aspect, the present invention relates to an isolated recombinant SARS-CoV-2 glycoprotein S (RBD-S) receptor-binding domain, which is represented by the amino acid sequence of SEQ ID NO:1.
В одном из аспектов настоящее изобретение относится к выделенному рекомбинантному рецептор-связывающему домену гликопротеина S (RBD-S) вируса SARS-CoV-2 (коронавирус 2 типа, вызывающий тяжёлый острый респираторный синдром), который представлен аминокислотной последовательностью SEQ ID NO:1.In one aspect, the present invention relates to an isolated recombinant receptor-binding domain of glycoprotein S (RBD-S) of the SARS-CoV-2 (severe acute respiratory syndrome type 2 coronavirus), which is represented by the amino acid sequence of SEQ ID NO:1.
В одном из аспектов настоящее изобретение относится к выделенной нуклеиновой кислоте, которая кодирует вышеуказанный выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2.In one aspect, the present invention provides an isolated nucleic acid that encodes the above isolated recombinant SARS-CoV-2 glycoprotein S (RBD-S) receptor-binding domain.
В некоторых вариантах выделенная нуклеиновая кислота представляет собой ДНК.In some embodiments, the isolated nucleic acid is DNA.
В некоторых вариантах выделенная нуклеиновая кислота представляет собой нуклеотидную последовательность SEQ ID NO:2.In some embodiments, the isolated nucleic acid is the nucleotide sequence of SEQ ID NO:2.
В некоторых вариантах выделенная нуклеиновая кислота представляет собой кодон-оптимизированную нуклеотидную последовательность.In some embodiments, the isolated nucleic acid is a codon-optimized nucleotide sequence.
В одном из аспектов настоящее изобретение относится к экспрессионной кассете, которая включает любую из вышеуказанных нуклеиновых кислот, которая кодирует вышеуказанный выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2.In one aspect, the present invention relates to an expression cassette that includes any of the above nucleic acids, which encodes the above isolated recombinant receptor-binding domain of SARS-CoV-2 glycoprotein S (RBD-S).
В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the expression cassette includes the following elements in the 5' to 3' direction:
левый (первый) ITR (инвертированные концевые повторы);left (first) ITR (inverted terminal repeats);
CMV (цитомегаловирусный) энхансер;CMV (cytomegalovirus) enhancer;
CMV (цитомегаловирусный) промотер;CMV (cytomegalovirus) promoter;
интрон гена hBG1 (ген субъединицы гемоглобина гамма-1);hBG1 gene intron (gamma-1 hemoglobin subunit gene);
любую из вышеуказанных нуклеиновых кислот, которая кодирует вышеуказанный выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2;any of the above nucleic acids that encodes the above isolated recombinant receptor-binding domain of SARS-CoV-2 glycoprotein S (RBD-S);
сигнал полиаденилирования hGH1 (сигнал полиаденилирования гена гормона роста человека);hGH1 polyadenylation signal (human growth hormone gene polyadenylation signal);
правый (второй) ITR.right (second) ITR.
В некоторых вариантах экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 3.In some embodiments, the expression cassette includes the nucleic acid of SEQ ID NO: 3.
В одном из аспектов настоящее изобретение относится к экспрессионному вектору, который включает любую из вышеуказанных нуклеиновых кислот, которая кодирует вышеуказанный выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2, или любую из вышеуказанных экспрессионных кассет.In one aspect, the present invention relates to an expression vector that includes any of the above nucleic acids that encodes the above isolated recombinant SARS-CoV-2 glycoprotein S (RBD-S) recombinant receptor-binding domain, or any of the above expression cassettes.
В одном из аспектов настоящее изобретение относится к выделенному рекомбинантному вирусу на основе AAV5 (аденоассоциированный вирус 5 серотипа) для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции вызванной SARS-CoV-2, который включает капсид и любую из вышеуказанных экспрессионных кассет.In one aspect, the present invention relates to an isolated recombinant virus based on AAV5 (adeno-associated virus serotype 5) for inducing specific immunity to the SARS-CoV-2 virus and/or preventing SARS-CoV-2 coronavirus infection, which includes a capsid and any of the above expression cassettes.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5.In some embodiments, the recombinant AAV5 virus has a capsid that includes the AAV5 VP1 protein.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV, имеющий аминокислотную последовательность SEQ ID NO: 4.In some embodiments, the recombinant AAV5-based virus has a capsid that includes the AAV VP1 protein having the amino acid sequence of SEQ ID NO: 4.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5, имеющий аминокислотную последовательность SEQ ID NO: 4 с одной или несколькими точечными мутациями.In some embodiments, the recombinant AAV5-based virus has a capsid that includes an AAV5 VP1 protein having the amino acid sequence of SEQ ID NO: 4 with one or more point mutations.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5, имеющий аминокислотную последовательность SEQ ID NO: 5 (S2A и T711S).In some embodiments, the recombinant AAV5-based virus has a capsid that includes the AAV5 VP1 protein having the amino acid sequence of SEQ ID NO: 5 (S2A and T711S).
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5, имеющий аминокислотную последовательность SEQ ID NO: 4 или аминокислотную последовательность SEQ ID NO: 4 с одной или несколькими точечными мутациями, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the recombinant AAV5-based virus has a capsid that includes the AAV5 VP1 protein having the amino acid sequence of SEQ ID NO: 4 or the amino acid sequence of SEQ ID NO: 4 with one or more point mutations, and the expression cassette includes the following elements in the direction from 5 '-end to 3'-end:
левый (первый) ITR (инвертированные концевые повторы);left (first) ITR (inverted terminal repeats);
CMV (цитомегаловирусный) энхансер;CMV (cytomegalovirus) enhancer;
CMV (цитомегаловирусный) промотер;CMV (cytomegalovirus) promoter;
интрон гена hBG1 (ген субъединицы гемоглобина гамма-1);hBG1 gene intron (gamma-1 hemoglobin subunit gene);
любую из вышеуказанных нуклеиновых кислот, которая кодирует вышеуказанный выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2;any of the above nucleic acids that encodes the above isolated recombinant receptor-binding domain of SARS-CoV-2 glycoprotein S (RBD-S);
сигнал полиаденилирования hGH1 (сигнал полиаденилирования гена гормона роста человека);hGH1 polyadenylation signal (human growth hormone gene polyadenylation signal);
правый (второй) ITR.right (second) ITR.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5, имеющий аминокислотную последовательность SEQ ID NO: 4 или аминокислотную последовательность SEQ ID NO: 4 с одной или несколькими точечными мутациями, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 3.In some embodiments, the recombinant AAV5-based virus has a capsid that includes the AAV5 VP1 protein having the amino acid sequence of SEQ ID NO: 4 or the amino acid sequence of SEQ ID NO: 4 with one or more point mutations, and the expression cassette includes the nucleic acid of SEQ ID NO: : 3.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5, имеющий аминокислотную последовательность SEQ ID NO: 4 с одной или несколькими точечными мутациями, представляет собой аминокислотную последовательностью SEQ ID NO: 5 (S2A и T711S).In some embodiments, the recombinant AAV5-based virus has a capsid that includes the AAV5 VP1 protein having the amino acid sequence of SEQ ID NO: 4 with one or more point mutations, is the amino acid sequence of SEQ ID NO: 5 (S2A and T711S).
В одном из аспектов настоящее изобретение относится к фармацевтической композиции для профилактики коронавирусной инфекции, вызванной вирусом SARS-CoV-2, которая включает любой из вышеуказанных рекомбинантных вирусов на основе AAV5 в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.In one aspect, the present invention relates to a pharmaceutical composition for the prevention of coronavirus infection caused by the SARS-CoV-2 virus, which includes any of the above recombinant AAV5-based viruses in combination with one or more pharmaceutically acceptable excipients.
В одном из аспектов настоящее изобретение относится к фармацевтической композиции для индукции специфического иммунитета к вирусу SARS-CoV-2, которая включает любой из вышеуказанных рекомбинантных вирусов на основе AAV5 в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.In one aspect, the present invention relates to a pharmaceutical composition for inducing specific immunity to the SARS-CoV-2 virus, which includes any of the above recombinant AAV5 viruses in combination with one or more pharmaceutically acceptable excipients.
В одном из аспектов настоящее изобретение относится к применению любого из вышеуказанных рекомбинантных вирусов на основе AAV5 или вышеуказанной фармацевтической композиции для профилактики коронавирусной инфекции, вызванной вирусом SARS-CoV-2.In one aspect, the present invention relates to the use of any of the above recombinant AAV5 viruses or the above pharmaceutical composition for the prevention of SARS-CoV-2 coronavirus infection.
В одном из аспектов настоящее изобретение относится к применению любого из вышеуказанных рекомбинантных вирусов на основе AAV5 или вышеуказанной фармацевтической композиции для индукции специфического иммунитета к вирусу SARS-CoV-2.In one aspect, the present invention relates to the use of any of the above recombinant AAV5 viruses or the above pharmaceutical composition to induce specific immunity to the SARS-CoV-2 virus.
В одном из аспектов настоящее изобретение относится к вакцине для профилактики коронавирусной инфекции, вызванной вирусом SARS-CoV-2, которая включает любой из вышеуказанных рекомбинантных вирусов на основе AAV5 в эффективном количестве.In one aspect, the present invention relates to a vaccine for the prevention of coronavirus infection caused by the SARS-CoV-2 virus, which includes any of the above recombinant AAV5-based viruses in an effective amount.
В одном из аспектов настоящее изобретение относится к вакцине для индукции специфического иммунитета к вирусу SARS-CoV-2, которая включает любой из вышеуказанных рекомбинантных вирусов на основе AAV5 в эффективном количестве.In one aspect, the present invention relates to a vaccine for inducing specific immunity to the SARS-CoV-2 virus, which comprises any of the above recombinant AAV5-based viruses in an effective amount.
В одном из аспектов настоящее изобретение относится к способу индукции специфического иммунитета к вирусу SARS-CoV-2, который включает введение в организм млекопитающих любого из вышеуказанных рекомбинантных вирусов на основе AAV5, вышеуказанной композиции или вышеуказанной вакцины для индукции специфического иммунитета к вирусу SARS-CoV-2, в эффективном количестве.In one aspect, the present invention relates to a method for inducing specific immunity to the SARS-CoV-2 virus, which comprises administering to a mammalian body any of the above AAV5-based recombinant viruses, the above composition, or the above vaccine to induce specific immunity to the SARS-CoV-2 virus. 2 in an effective amount.
В одном из аспектов настоящее изобретение относится к способу для профилактики коронавирусной инфекции, вызванной вирусом SARS-CoV-2, включающий введение в организм млекопитающих любого из вышеуказанных рекомбинантных вирусов на основе AAV5, вышеуказанной композиции или вышеуказанной вакцины для профилактики коронавирусной инфекции, вызванной вирусом SARS-CoV-2, в эффективном количестве.In one aspect, the present invention relates to a method for preventing SARS-CoV-2 coronavirus infection, comprising administering to a mammalian body any of the above AAV5-based recombinant viruses, the above composition, or the above vaccine for preventing SARS-CoV-2 coronavirus infection. CoV-2, in an effective amount.
Краткое описание чертежейBrief description of the drawings
Фигура 1 представляет собой схему плазмиды pAAV-RBD-S, предназначенной для получения AAV вектора с экспрессионной кассетой, содержащей последовательность гена RBD-S рекомбинантного рецептор-связывающего домена гликопротеина S (RBD-S) вируса SARS-CoV-2Figure 1 is a diagram of the plasmid pAAV-RBD-S, designed to obtain an AAV vector with an expression cassette containing the sequence of the RBD-S gene of the recombinant receptor-binding domain of the glycoprotein S (RBD-S) of the SARS-CoV-2 virus
Leader peptide – лидерный пептид, обеспечивающий секрецию целевого белкаLeader peptide - leader peptide that provides the secretion of the target protein
RBD-S – рекомбинантный рецептор-связывающий домен гликопротеина S вируса SARS-CoV-2RBD-S, recombinant receptor-binding domain of SARS-CoV-2 glycoprotein S
AmpR – ген бета-лактамазы, обеспечивающий устойчивость к ампициллину,AmpR is a beta-lactamase gene that provides resistance to ampicillin,
pUC origin- pUC ориджин репликации в бактериях,pUC origin - pUC origin of replication in bacteria,
ITR – инвертированные терминальные повторы,ITR - inverted terminal repeats,
CMV-Enhancer – энхансер цитомегаловируса,CMV-Enhancer - cytomegalovirus enhancer,
CMV-Promoter – промотор ранних генов цитомегаловируса,CMV-Promoter - promoter of early cytomegalovirus genes,
Poly A - последовательность сигнала полиаденилирования, для повышения стабильности мРНК,Poly A - polyadenylation signal sequence, to improve mRNA stability,
HBG Intron – (human beta globine intron), фрагмент гена β глобина человека, несущий интрон.HBG Intron - (human beta globine intron), a fragment of the human β globin gene that carries an intron.
Фигура 2 представляет собой график, показывающий концентрацию белка RBD-S в культурах клеток CHO-K1-S спустя 3 дня после трансдукции клеток вирусным препаратом AAV5-RBD-S.Figure 2 is a graph showing RBD-S protein concentration in CHO-K1-S cell cultures 3 days after cell transduction with AAV5-RBD-S virus preparation.
Фигура 3 представляет собой график, показывающий содержание антител к белку RBD-S в плазме крови экспериментальных животных после проведения иммунизации препаратом AAV5-RBD-S (внутримышечное введение из расчета 1х1011 VG/мышь; объем введения – 200 мкл). 3А – индивидуальные показатели для каждого животного в исследовании. 3Б – средние значения ± стандартное отклонение (n=8). VG – viral genomes или вирусные геномы.Figure 3 is a graph showing the content of antibodies to the RBD-S protein in the blood plasma of experimental animals after immunization with the AAV5-RBD-S preparation (intramuscular injection at the rate of 1x1011 VG/mouse; injection volume - 200 μl). 3A are individual scores for each animal in the study. 3B – mean values ± standard deviation (n=8). VG - viral genomes or viral genomes.
Фигура 4 представляет собой график, показывающий содержание антител к белку RBD-S в плазме крови экспериментальных животных после проведения иммунизации препаратом AAV5-RBD-S (внутримышечное введение из расчета 4х1011 VG/мышь; объем введения – 200 мкл). 4А –индивидуальные показатели для каждого животного в исследовании. 4Б – средние значения ± стандартное отклонение (n=8). VG – viral genomes или вирусные геномы.Figure 4 is a graph showing the content of antibodies to the RBD-S protein in the blood plasma of experimental animals after immunization with the AAV5-RBD-S preparation (intramuscular injection at the rate of 4x1011 VG/mouse; injection volume - 200 μl). 4A - Individual scores for each animal in the study. 4B – mean values ± standard deviation (n=8). VG - viral genomes or viral genomes.
Фигура 5 представляет собой график, показывающий содержание антител к белку RBD-S в плазме крови экспериментальных животных после проведения иммунизации препаратом AAV5, геном которого не содержит экспрессионную кассету с геном RBD-S (препарат с пустыми капсидами AAV5). Внутримышечное введение из расчета 8,6×1010CP/мышь; объем введения – 200 мкл). На графике приведены индивидуальные показатели для каждого животного в исследовании. CP – viral capsids или вирусные капсиды.Figure 5 is a graph showing the content of antibodies to the RBD-S protein in the blood plasma of experimental animals after immunization with an AAV5 preparation whose genome does not contain an expression cassette with the RBD-S gene (AAV5 empty capsid preparation). Intramuscular injection at the rate of 8.6×1010 CP/mouse; injection volume - 200 µl). The graph shows the individual scores for each animal in the study. CP - viral capsids or viral capsids.
Фигура 6 представляет собой график, показывающий содержание антител к белку RBD-S в плазме крови экспериментальных животных после проведения иммунизации препаратом очищенного рекомбинантного белка RBD-S. (внутримышечное введение из расчета 20 мкг/мышь). 6А – индивидуальные показатели для каждого животного в исследовании. 6Б - средние значения ± стандартное отклонение (n=7).Figure 6 is a graph showing the content of antibodies to the RBD-S protein in the blood plasma of experimental animals after immunization with a preparation of purified recombinant RBD-S protein. (intramuscular injection at the rate of 20 µg/mouse). 6A are individual scores for each animal in the study. 6B - mean values ± standard deviation (n=7).
Фигура 7 представляет собой график, показывающий содержание антител к белку RBD-S в плазме крови экспериментальных животных после проведения иммунизации контрольным препаратом, не содержащим AAV. На графике приведены индивидуальные показатели для каждого животного в исследовании.Figure 7 is a graph showing the content of antibodies to the RBD-S protein in the blood plasma of experimental animals after immunization with a control drug that does not contain AAV. The graph shows the individual scores for each animal in the study.
Определения и общие методыDefinitions and Common Methods
Если иное не определено в настоящем документе, научные и технические термины, используемые в связи с настоящим изобретением, будут иметь значения, которые обычно понятны специалистам в данной области.Unless otherwise defined herein, scientific and technical terms used in connection with the present invention will have meanings that are commonly understood by those skilled in the art.
Кроме того, если по контексту не требуется иное, термины в единственном числе включают в себя термины во множественном числе, и термины во множественном числе включают в себя термины в единственном числе. Как правило, используемая классификация и методы культивирования клеток, молекулярной биологии, иммунологии, микробиологии, генетики, аналитической химии, химии органического синтеза, медицинской и фармацевтической химии, а также гибридизации и химии белка и нуклеиновых кислот, описанные в настоящем документе, хорошо известны специалистам и широко применяются в данной области. Ферментативные реакции и способы очистки осуществляют в соответствии с инструкциями производителя, как это обычно осуществляется в данной области, или как описано в настоящем документе.In addition, unless the context requires otherwise, terms in the singular include terms in the plural, and terms in the plural include terms in the singular. The generally used classification and methods of cell culture, molecular biology, immunology, microbiology, genetics, analytical chemistry, organic synthesis chemistry, medicinal and pharmaceutical chemistry, as well as hybridization and protein and nucleic acid chemistry described herein are well known to those skilled in the art and widely used in this area. Enzymatic reactions and purification methods are carried out according to the manufacturer's instructions, as is commonly done in the art, or as described herein.
«Выделенный» означает измененный или удаленный из природного состояния. Например, нуклеиновая кислота или пептид, в природе присутствующие в животном, не являются «выделенными», но те же нуклеиновая кислота или пептид, частично или полностью отделенные от материалов, сопутствующих им в их природном состоянии, являются «выделенными». Выделенная нуклеиновая кислота или белок могут существовать, по существу, в очищенной форме или могут существовать в неприродном окружении, таком как, например, генетически модифицированной клетке."Isolated" means altered or removed from the natural state. For example, a nucleic acid or peptide naturally present in an animal is not "isolated", but the same nucleic acid or peptide, partially or completely separated from the materials accompanying it in its natural state, is "isolated". An isolated nucleic acid or protein may exist in a substantially purified form, or may exist in a non-natural environment such as, for example, a genetically modified cell.
Определения «встречающийся в природе», «нативный» или «дикого типа» используют для описания объекта, который можно обнаружить в природе как отличающийся от получаемого искусственно. Например, белок или нуклеотидная последовательность, присутствующие в организме (включая вирус), которые можно изолировать из источника в природе, и которые не модифицированы умышленно специалистом в лаборатории, являются встречающимися в природе.The terms "naturally occurring", "native" or "wild type" are used to describe an object that can be found in nature as being different from that produced artificially. For example, a protein or nucleotide sequence present in an organism (including a virus) that can be isolated from a source in nature, and that is not intentionally modified by a person skilled in the laboratory, is naturally occurring.
Термин «геном» относится к полному генетическому материалу организма.The term "genome" refers to the complete genetic material of an organism.
В настоящем описании и в последующей формуле изобретения, если контекстом не предусмотрено иное, слова «включать» и «содержать» или их вариации, такие как «имеющий», «включает», «включающий», «содержит» или «содержащий», следует понимать как включение указанного целого или группы целых, но не исключение любого другого целого или группы целых.In the present description and in the following claims, unless the context otherwise requires, the words "comprise" and "comprise" or variations thereof, such as "having", "includes", "including", "comprises", or "comprising", should be understood as the inclusion of the specified integer or group of integers, but not the exclusion of any other integer or group of integers.
Белок (Пептид)Protein (Peptide)
В настоящем описании термины «пептид», «полипептид» и «белок» используют взаимозаменяемо, и они относятся к соединению, состоящему из аминокислотных остатков, ковалентно связанных пептидными связями. Белок или пептид должен содержать по меньшей мере две аминокислоты, и не существует ограничений по максимальному количеству аминокислот, которые может содержать последовательность белка или пептида. Полипептиды включают любой пептид или белок, содержащий две или более аминокислот, соединенных друг с другом пептидными связями. Как применяют в настоящем описании, термин относится и к коротким цепям, также общепринято обозначаемым в этой области, например, как пептиды, олигопептиды и олигомеры, и к более длинным цепям, как правило, обозначаемым в этой области как белки, множество типов которых существует. «Полипептиды» включают, помимо прочего, например, биологически активные фрагменты, по существу, гомологичные полипептиды, олигопептиды, гомодимеры, гетеродимеры, варианты полипептидов, модифицированные полипептиды, производные, аналоги, слитные белки. Полипептиды включают природные пептиды, рекомбинантные пептиды, синтетические пептиды или их комбинацию.In the present description, the terms "peptide", "polypeptide" and "protein" are used interchangeably, and they refer to a compound consisting of amino acid residues covalently linked by peptide bonds. A protein or peptide must contain at least two amino acids, and there is no limit to the maximum number of amino acids that a protein or peptide sequence can contain. Polypeptides include any peptide or protein containing two or more amino acids connected to each other by peptide bonds. As used herein, the term refers to both short chains, also commonly referred to in the art, such as peptides, oligopeptides, and oligomers, and longer chains, commonly referred to in the art as proteins, of which many types exist. "Polypeptides" include, but are not limited to, for example, biologically active fragments, substantially homologous polypeptides, oligopeptides, homodimers, heterodimers, polypeptide variants, modified polypeptides, derivatives, analogs, fusion proteins. Polypeptides include natural peptides, recombinant peptides, synthetic peptides, or combinations thereof.
Молекулы нуклеиновых кислотNucleic acid molecules
Термины «нуклеиновая кислота», «нуклеиновая последовательность» или «нуклеиновокислотная последовательность», «полинуклеотид», «олигонуклеотид», «полинуклеотидная последовательность» и «нуклеотидная последовательность», которые используются равнозначно в данном описании, обозначают четкую последовательность нуклеотидов, модифицированных или не модифицированных, определяющую фрагмент или участок нуклеиновой кислоты, содержащую или не содержащую неприродные нуклеотиды и являющуюся либо двухцепочечной ДНК или РНК, либо одноцепочечной ДНК или РНК, либо продуктами транскрипции указанных ДНК.The terms "nucleic acid", "nucleic acid sequence" or "nucleic acid sequence", "polynucleotide", "oligonucleotide", "polynucleotide sequence" and "nucleotide sequence", which are used interchangeably in this specification, refer to a distinct sequence of nucleotides, whether or not modified , which defines a fragment or region of a nucleic acid, containing or not containing non-natural nucleotides and which is either double-stranded DNA or RNA, or single-stranded DNA or RNA, or transcription products of these DNA.
Специалист в этой области имеет общие знания о том, что нуклеиновые кислоты являются полинуклеотидами, которые можно гидролизовать до мономерных «нуклеотидов». Мономерные нуклеотиды можно гидролизовать в нуклеозиды. Как применяют в настоящем описании, полинуклеотиды включают, в качестве неограничивающих примеров, все последовательности нуклеиновой кислоты, получаемые любыми способами, доступными в этой области, включая, в качестве неограничивающих примеров, рекомбинантные способы, т.е. клонирование последовательностей нуклеиновой кислоты из рекомбинантной библиотеки или генома клетки, использование обычной технологии клонирования и ПЦР и т.п., и способами синтеза.One skilled in the art would have general knowledge that nucleic acids are polynucleotides that can be hydrolyzed to monomeric "nucleotides". Monomeric nucleotides can be hydrolyzed into nucleosides. As used herein, polynucleotides include, but are not limited to, all nucleic acid sequences obtained by any means available in the art, including, but not limited to, recombinant methods, i. cloning nucleic acid sequences from a recombinant library or cell genome, using conventional cloning technology and PCR, and the like, and synthetic methods.
Здесь также следует упомянуть, что данное изобретение не относится к нуклеотидным последовательностям в их природной хромосомной среде, т.е. в природном состоянии. Последовательности данного изобретения были выделены и/или очищены, т.е. были взяты прямо или косвенно, например, путем копирования, при этом их среда была по меньшей мере частично модифицирована. Таким образом, также здесь следует подразумевать изолированные нуклеиновые кислоты, полученные путем генетической рекомбинации, например, с помощью принимающих клеток (клеток-хозяев), или полученные путем химического синтеза.It should also be mentioned here that the present invention does not apply to nucleotide sequences in their natural chromosomal environment, i.e. in a natural state. The sequences of the present invention have been isolated and/or purified, i. were taken directly or indirectly, for example, by copying, while their environment was at least partially modified. Thus, isolated nucleic acids obtained by genetic recombination, for example by means of host cells, or obtained by chemical synthesis, are also to be understood here.
Термин нуклеотидная последовательность охватывает его комплемент, если не указано иное. Таким образом, нуклеиновую кислоту, имеющую определенную последовательность следует понимать как охватывающие ее комплементарную цепь с ее комплементарной последовательностью.The term nucleotide sequence embraces its complement unless otherwise indicated. Thus, a nucleic acid having a particular sequence is to be understood as spanning its complementary strand with its complementary sequence.
Термины «трасформация», «трансфекция», «трансдукция» относятся к любому способу или средствам, с помощью которых нуклеиновая кислота вводится в клетку или организм-хозяин, и могут быть использованы взаимозаменяемо для передачи аналогичного значения. Такие способы включают в себя без ограничения трансфекцию, электропорацию, микроинъекции, инфицирование, ПЭГ-сплавление и тому подобное.The terms "transformation", "transfection", "transduction" refer to any method or means by which a nucleic acid is introduced into a cell or host organism and may be used interchangeably to convey a similar meaning. Such methods include, without limitation, transfection, electroporation, microinjection, infection, PEG fusion, and the like.
Аденоассоциированный вирус (AAV)Adeno-associated virus (AAV)
Вирусы семейства Parvoviridae представляют собой небольшие ДНК-содержащие вирусы животных. Семейство Parvoviridae может быть разделено на два подсемейства: Parvovirinae, представители которого инфицируют позвоночных животных, и Densovirinae, представители которого инфицируют насекомых. К 2006 году были описаны 11 серотипов аденоассоциированного вируса (Mori, S. ET AL., 2004, «Two novel adeno-associated viruses from cynomolgus monkey: pseudotyping characterization of capsid protein», Virology, Т. 330 (2): 375-83). Все известные серотипы могут инфицировать клетки многих видов тканей. Тканевая специфичность определяется серотипом белков капсида, поэтому векторы на основе аденоассоциированого вируса конструируют, задавая необходимый серотип. Дополнительная информация по парвовирусам и другим представителям Parvoviridae описана в литературе (Kenneth I. Berns, «Parvoviridae: The Viruses and Their Replication», Chapter 69 in Fields Virology (3rd Ed. 1996)).Viruses of the Parvoviridae family are small DNA-containing animal viruses. The family Parvoviridae can be divided into two subfamilies: Parvovirinae, whose members infect vertebrates, and Densovirinae, whose members infect insects. By 2006, 11 adeno-associated virus serotypes had been described (Mori, S. ET AL., 2004, "Two novel adeno-associated viruses from cynomolgus monkey: pseudotyping characterization of capsid protein", Virology, T. 330 (2): 375-83 ). All known serotypes can infect cells in many tissue types. Tissue specificity is determined by the serotype of the capsid proteins, so adeno-associated virus-based vectors are constructed by specifying the desired serotype. Additional information on parvoviruses and other members of the Parvoviridae is described in the literature (Kenneth I. Berns, "Parvoviridae: The Viruses and Their Replication", Chapter 69 in FieldsVirology (3rd Ed. 1996)).
Геномная организация всех известных серотипов AAV очень сходна. Геном AAV представляет собой линейную одноцепочечную молекулу ДНК, которая содержит менее чем примерно 5000 нуклеотидов (нт) в длину. Инвертированные концевые повторы (ITR) фланкируют уникальные кодирующие нуклеотидные последовательности репликации неструктурных белков (Rep) и структурных белков (Cap). Ген Cap кодирует белки VP (VP1, VP2 и VP3), которые образуют капсид. Концевые 145 нуклеотидов являются самокомплементарными и организованы таким образом, что может быть сформирован энергетически стабильный внутримолекулярный дуплекс, образующий Т-образную шпилечную структуру. Такие шпилечные структуры функционируют как точки начала репликации ДНК вируса, являясь праймерами для клеточного ДНК-полимеразного комплекса. После инфекции клеток млекопитающих AAV дикого типа (wtAAV) гены Rep (например, Rep78 и Rep52) экспрессируются с помощью P5 промотора и P19 промотора, соответственно, и оба белка Rep выполняют определенную функцию в репликации генома вируса. Сплайсинг в открытой рамке считывания Rep (Rep ORF) приводит к экспрессии фактически четырех белков Rep (например, Rep78, Rep68, Rep52 и Rep40). Однако было показано, что несплайсированная мРНК, кодирующая белки Rep78 и Rep52, является достаточной для продукции вектора AAV в клетках млекопитающих.The genomic organization of all known AAV serotypes is very similar. The AAV genome is a linear single stranded DNA molecule that is less than about 5000 nucleotides (nt) in length. Inverted terminal repeats (ITRs) flank unique coding nucleotide sequences for the replication of non-structural proteins (Rep) and structural proteins (Cap). The Cap gene encodes the VP proteins (VP1, VP2, and VP3) that form the capsid. The terminal 145 nucleotides are self-complementary and arranged in such a way that an energetically stable intramolecular duplex can be formed, forming a T-shaped hairpin structure. Such hairpin structures function as origins of viral DNA replication, serving as primers for the cellular DNA polymerase complex. Following infection of mammalian cells with wild-type AAV (wtAAV), Rep genes (eg, Rep78 and Rep52) are expressed by the P5 promoter and P19 promoter, respectively, and both Rep proteins have a specific function in viral genome replication. Splicing in the Rep open reading frame (Rep ORF) results in the expression of actually four Rep proteins (eg, Rep78, Rep68, Rep52, and Rep40). However, unspliced mRNA encoding Rep78 and Rep52 proteins has been shown to be sufficient for AAV vector production in mammalian cells.
ВекторVector
Термин «вектор» при использовании в настоящем документе означает молекулу нуклеиновой кислоты, способную транспортировать другую нуклеиновую кислоту, с которой она соединена.The term "vector" as used herein means a nucleic acid molecule capable of transporting another nucleic acid to which it is linked.
Термины «инфекционная единица» (ие), «инфекционная частица» или «репликационная единица», как используется в отношении вирусного титра, относятся к числу инфекционных частиц рекомбинантного вектора AAV, которое измеряют посредством анализа инфекционных центров, также известного как анализ репликационных центров, описанный, например, в публикации McLaughlin et al., J. Virol. (1988) 62:1963-1973.The terms "infectious unit"(s), "infectious particle" or "replication unit", as used in relation to viral titer, refers to the number of infectious particles of a recombinant AAV vector, which is measured by infection center assay, also known as replication center assay, described , for example, in McLaughlin et al., J. Virol. (1988) 62:1963-1973.
Термин «гетерологичный», когда он относится к последовательностям нуклеиновых кислот, таким как кодирующие последовательности и последовательности регуляции, обозначает последовательности, которые обычно не соединены вместе и/или обычно не связаны с конкретной клеткой. Таким образом, «гетерологичная» область конструкции нуклеиновой кислоты или вектора представляет собой фрагмент нуклеиновой кислоты, расположенный внутри или присоединенный к другой молекуле нуклеиновой кислоты, которая в природе не найдена совместно с другой молекулой. Например, гетерологичная область конструкции нуклеиновой кислоты может содержать кодирующую последовательность, фланкированную последовательностями, которые в природе не найдены совместно с кодирующей последовательностью. Другой пример гетерологичной кодирующей последовательности представляет собой конструкцию, где сама кодирующая последовательность не найдена в природе (например, синтетические последовательности, которые содержат кодоны, отличные от нативного гена).The term "heterologous" when referring to nucleic acid sequences, such as coding and regulatory sequences, means sequences that are not normally linked together and/or are not normally associated with a particular cell. Thus, a "heterologous" region of a nucleic acid construct or vector is a nucleic acid fragment located within or attached to another nucleic acid molecule that is not naturally found together with another molecule. For example, a heterologous region of a nucleic acid construct may contain a coding sequence flanked by sequences that are not naturally found together with the coding sequence. Another example of a heterologous coding sequence is a construct where the coding sequence itself is not found in nature (eg, synthetic sequences that contain codons other than the native gene).
Как применяют в настоящем описании, термин «экспрессия» определяют как транскрипцию и/или трансляцию конкретной нуклеотидной последовательности, запускаемую ее промотором.As used herein, the term "expression" is defined as the transcription and/or translation of a particular nucleotide sequence driven by its promoter.
ПрименениеApplication
Термин «профилактика» или «предупреждение» и подобные им означает замедление или предотвращение появления симптомов заболевания, расстройства или инфекции.The term "prophylaxis" or "prevention" and the like means slowing down or preventing the onset of symptoms of a disease, disorder, or infection.
Термин «индукция иммунного ответа» как используют в настоящем изобретении, относится к специфическому контролю или к влиянию на активность иммунного ответа и включает активацию иммунного ответа, стимуляцию иммунного ответа, усиление иммунного ответа.The term "inducing an immune response" as used herein refers to specifically controlling or influencing the activity of an immune response and includes activating an immune response, stimulating an immune response, enhancing an immune response.
Термин «специфический иммунитет» как используют в настоящем изобретении, относится к состоянию невосприимчивости к заболеванию в следствие индукции иммунного ответа.The term "specific immunity" as used in the present invention refers to a state of immunity to a disease due to the induction of an immune response.
Термин «нарушение» означает любое состояние, которое можно улучшить в результате лечения по настоящему изобретению. В определение данного термина входят хронические и острые нарушения или заболевания, включающие в себя патологические состояния, которые вызывают предрасположенность млекопитающего к возникновению данного нарушения.The term "disorder" means any condition that can be improved as a result of the treatment of the present invention. The definition of this term includes chronic and acute disorders or diseases, including pathological conditions that predispose a mammal to the occurrence of this disorder.
«Заболевание» является состоянием здоровья животного, где животное не может поддерживать гомеостаз, и где, если заболевание не облегчают, то здоровье животного продолжает ухудшаться."Disease" is a state of health in an animal where the animal cannot maintain homeostasis, and where, if the disease is not alleviated, the health of the animal continues to deteriorate.
Термин «субъект», «пациент», «индивидуум» и т.п. используют в настоящем описании взаимозаменяемо, и они относятся к любому животному, поддающемуся воздействию способами, представленными в настоящем описании. В конкретных неограничивающих вариантах осуществления субъект, пациент или индивидуум является человеком. Вышеупомянутый субъект может быть мужского или женского пола любого возраста.The term "subject", "patient", "individual", etc. are used interchangeably herein and refer to any animal amenable to the methods presented herein. In specific non-limiting embodiments, the subject, patient, or individual is a human. The above subject may be male or female of any age.
«Терапевтически эффективным количеством» или «эффективным количеством» считается количество вводимого терапевтического агента, которое избавит в определенной степени от одного или нескольких симптомов заболевания, по поводу которого проводится профилактика.A "therapeutically effective amount" or "effective amount" is the amount of a therapeutic agent administered that will relieve to some extent one or more of the symptoms of the disease for which prophylaxis is being sought.
Подробное описание изобретенияDetailed description of the invention
Пептидный антигенPeptide antigen
В одном из аспектов настоящее изобретение относится к выделенному рекомбинантному рецептор-связывающему домену гликопротеина S (RBD-S) вируса SARS-CoV-2 (коронавирус 2 типа, вызывающий тяжёлый острый респираторный синдром), который представлен аминокислотной последовательностьюIn one aspect, the present invention relates to an isolated recombinant receptor-binding domain of glycoprotein S (RBD-S) of the SARS-CoV-2 virus (type 2 coronavirus that causes severe acute respiratory syndrome), which is represented by the amino acid sequence
RVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYG VSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNY NYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFEL LHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEIL DITPSSFGGVS (SEQ ID NO:1).RVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYG VSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNY NYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFEL LHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEIL DITPSSFGGVS (SEQ ID NO:1).
Данный RBD-S вируса SARS-CoV-2 был получен из полноразмерного гликопротеина S вируса SARS-CoV-2, который описан в БД GenBank, Wu F., Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1, complete genome, 2020, GenBank: MN908947.3 (https://www.ncbi.nlm.nih.gov/nuccore/MN908947) и в статье Fan Wu ET AL., A new coronavirus associated with human respiratory disease in China, 2020, Nature, volume 579, pages 265–269 (https://www.nature.com/articles/s41586-020-2008-3) и имеет следующую аминокислотную последовательность:This RBD-S of the SARS-CoV-2 virus was obtained from the full-length glycoprotein S of the SARS-CoV-2 virus, which is described in the GenBank database, Wu F., Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1, complete genome, 2020 , GenBank: MN908947.3 (https://www.ncbi.nlm.nih.gov/nuccore/MN908947) and in Fan Wu ET AL., A new coronavirus associated with human respiratory disease in China, 2020, Nature, volume 579, pages 265–269 (https://www.nature.com/articles/s41586-020-2008-3) and has the following amino acid sequence:
MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVT WFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVC EFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDG YFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYV GYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNL CPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIR GDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTE IYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCV NFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQ VAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQ TQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYIC GDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSK PSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLA GTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNMFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVT WFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVC EFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDG YFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYV GYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNL CPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIR GDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTE IYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCV NFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQ VAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQ TQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYIC GDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSK PSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLA GTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQN
VLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILS RLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLM SFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTD NTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRL NEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCC KFDEDDSEPVLKGVKLHYT (SEQ ID NO:6).VLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILS RLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLM SFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTD NTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRL NEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCC KFDEDDSEPVLKGVKLHYT (SEQ ID NO:6).
Из вышеуказанной последовательности гликопротеина S вируса SARS-CoV-2 был выбран на основе анализа структуры данного гликопротеина (См. пример 1) рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2, который имеет следующую аминокислотную последовательностьFrom the above sequence of SARS-CoV-2 glycoprotein S, the receptor-binding domain of SARS-CoV-2 glycoprotein S (RBD-S) was selected based on the analysis of the structure of this glycoprotein (See Example 1), which has the following amino acid sequence
RVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYG VSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNY NYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFEL LHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEIL DITPCSFGGVS (SEQ ID NO:7).RVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYG VSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNY NYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFEL LHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEIL DITPCSFGGVS (SEQ ID NO:7).
Далее в аминокислотную последовательность с SEQ ID NO:7 была внесена точечная аминокислотная замена C272S для обеспечения дополнительной стабильности белка RBD-S вируса SARS-CoV-2 и, таким образом, был получен рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2 с аминокислотной последовательностью SEQ ID NO: 1.Further, a point amino acid substitution C272S was introduced into the amino acid sequence with SEQ ID NO: 7 to provide additional stability of the RBD-S protein of the SARS-CoV-2 virus and, thus, a recombinant receptor-binding domain of the glycoprotein S (RBD-S) of the virus was obtained. SARS-CoV-2 with the amino acid sequence of SEQ ID NO: 1.
Нуклеиновая кислотаNucleic acid
В одном из аспектов настоящее изобретение относится к выделенной нуклеиновой кислоте, которая кодирует вышеуказанный выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2.In one aspect, the present invention provides an isolated nucleic acid that encodes the above isolated recombinant SARS-CoV-2 glycoprotein S (RBD-S) receptor-binding domain.
«Выделенная» молекула нуклеиновой кислоты представляет собой молекулу нуклеиновой кислоты, которая идентифицирована и отделена от по меньшей мере одной молекулы нуклеиновой кислоты-примеси, с которой она обычно связана в естественном источнике нуклеиновой кислоты нуклеазы. Выделенная молекула нуклеиновой кислоты отличается от той формы или набора, в которых она находится в естественных условиях. Таким образом, выделенная молекула нуклеиновой кислоты отличается от молекулы нуклеиновой кислоты, существующей в клетках в естественных условиях. Однако выделенная молекула нуклеиновой кислоты включает молекулу нуклеиновой кислоты, находящуюся в клетках, в которых в норме происходит экспрессия нуклеазы, например, в случае, если молекула нуклеиновой кислоты имеет локализацию в хромосоме, отличную от ее локализации в клетках в естественных условиях.An "isolated" nucleic acid molecule is a nucleic acid molecule that has been identified and separated from at least one contaminant nucleic acid molecule with which it is normally associated in a natural source of a nuclease nucleic acid. An isolated nucleic acid molecule is different from the form or set in which it occurs naturally. Thus, an isolated nucleic acid molecule is different from a nucleic acid molecule that exists naturally in cells. However, an isolated nucleic acid molecule includes a nucleic acid molecule found in cells in which the nuclease is normally expressed, for example, if the nucleic acid molecule has a different chromosomal localization from its natural cell localization.
В некоторых вариантах выделенная нуклеиновая кислота представляет собой ДНК.In some embodiments, the isolated nucleic acid is DNA.
В некоторых вариантах выделенная нуклеиновая кислота представляет собой нуклеотидную последовательностьIn some embodiments, the isolated nucleic acid is a nucleotide sequence
AGAGTCCAACCAACAGAATCTATTGTTAGATTTCCTAATATTACAAACTTGTGCCCTTTTGGT GAAGTTTTTAACGCCACCAGATTTGCATCTGTTTATGCTTGGAACAGGAAGAGAATCAGCAACTGTGT TGCTGATTATTCTGTCCTATATAATTCCGCATCATTTTCCACTTTTAAGTGTTATGGAGTGTCTCCTA CTAAATTAAATGATCTCTGCTTTACTAATGTCTATGCAGATTCATTTGTAATTAGAGGTGATGAAGTC AGACAAATCGCTCCAGGGCAAACTGGAAAGATTGCTGATTATAATTATAAATTACCAGATGATTTTAC AGGCTGCGTTATAGCTTGGAATTCTAACAATCTTGATTCTAAGGTTGGTGGTAATTATAATTACCTGT ATAGATTGTTTAGGAAGTCTAATCTCAAACCTTTTGAGAGAGATATTTCAACTGAAATCTATCAGGCC GGTAGCACACCTTGTAATGGTGTTGAAGGTTTTAATTGTTACTTTCCTTTACAATCATATGGTTTCCA ACCCACTAATGGTGTTGGTTACCAACCATACAGAGTAGTAGTACTTTCTTTTGAACTTCTACATGCAC CAGCAACTGTTTGTGGACCTAAAAAGTCTACTAATTTGGTTAAAAACAAATGTGTCAATTTCAACTTC AATGGTTTAACAGGCACAGGTGTTCTTACTGAGTCTAACAAAAAGTTTCTGCCTTTCCAACAATTTGG CAGAGACATTGCTGACACTACTGATGCTGTCCGTGATCCACAGACACTTGAGATTCTTGACATTACAC CATCTTCTTTTGGTGGTGTCAGT (SEQ ID NO: 2).AGAGTCCAACCAACAGAATCTATTGTTAGATTTCCTAATATTACAAACTTGTGCCCTTTTGGT GAAGTTTTTAACGCCACCAGATTTGCATCTGTTTATGCTTGGAACAGGAAGAGAATCAGCAACTGTGT TGCTGATTATTCTGTCCTATATAATTCCGCATCATTTTCCACTTTTAAGTGTTATGGAGTGTCTCCTA CTAAATTAAATGATCTCTGCTTTACTAATGTCTATGCAGATTCATTTGTAATTAGAGGTGATGAAGTC AGACAAATCGCTCCAGGGCAAACTGGAAAGATTGCTGATTATAATTATAAATTACCAGATGATTTTAC AGGCTGCGTTATAGCTTGGAATTCTAACAATCTTGATTCTAAGGTTGGTGGTAATTATAATTACCTGT ATAGATTGTTTAGGAAGTCTAATCTCAAACCTTTTGAGAGAGATATTTCAACTGAAATCTATCAGGCC GGTAGCACACCTTGTAATGGTGTTGAAGGTTTTAATTGTTACTTTCCTTTACAATCATATGGTTTCCA ACCCACTAATGGTGTTGGTTACCAACCATACAGAGTAGTAGTACTTTCTTTTGAACTTCTACATGCAC CAGCAACTGTTTGTGGACCTAAAAAGTCTACTAATTTGGTTAAAAACAAATGTGTCAATTTCAACTTC AATGGTTTAACAGGCACAGGTGTTCTTACTGAGTCTAACAAAAAGTTTCTGCCTTTCCAACAATTTGG CAGAGACATTGCTGACACTACTGATGCTGTCCGTGATCCACAGACACTTGAGATTCTTGACATTACAC CATCTTCTTTTGGTGGTGTCAGT (SEQ ID NO: 2).
В некоторых вариантах выделенная нуклеиновая кислота представляет собой кодон-оптимизированную нуклеотидную последовательность.In some embodiments, the isolated nucleic acid is a codon-optimized nucleotide sequence.
Экспрессионная кассета. Экспрессионный вектор.Expression cassette. Expression vector.
В одном из аспектов настоящее изобретение относится к экспрессионной кассете, которая включает любую из вышеуказанных нуклеиновых кислот, которая кодирует вышеуказанный выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2.In one aspect, the present invention relates to an expression cassette that includes any of the above nucleic acids, which encodes the above isolated recombinant receptor-binding domain of SARS-CoV-2 glycoprotein S (RBD-S).
Термин «экспрессионная кассета» при использовании в данном документе, в частности, относится к фрагменту ДНК, который способен в соответствующей обстановке запускать экспрессию полинуклеотида, кодирующего представляющий интерес полипептид, который включен в указанную экспрессионную кассету. При введении в клетку-хозяина экспрессионная кассета помимо прочего способна задействовать клеточные механизмы для транскрипции полинуклеотида, кодирующего представляющий интерес полипептид, в РНК, которая затем обычно дополнительно процессируется и, наконец, транслируется в представляющий интерес полипептид. Экспрессионная кассета может содержаться в экспрессионном векторе.The term "expression cassette" as used herein particularly refers to a DNA fragment that is capable, in the appropriate setting, of driving the expression of a polynucleotide encoding a polypeptide of interest that is included in said expression cassette. When introduced into a host cell, the expression cassette is, among other things, capable of activating cellular machinery to transcribe the polynucleotide encoding the polypeptide of interest into RNA, which is then typically further processed and finally translated into the polypeptide of interest. The expression cassette may be contained in an expression vector.
Экспрессионная кассета по настоящему изобретению содержит в качестве элемента промотор. Термин «промотор», используемый в настоящем документе, в частности, относится к элементу ДНК, который способствует транскрипции полинуклеотида, с которым функционально связан промотор. Промотор может также составлять часть элемента «промотор/энхансер». Хотя физические границы между элементами «промотор» и «энхансер» не всегда ясны, термин «промотор» обычно относится к месту на молекуле нуклеиновой кислоты, с которым связывается РНК-полимераза и/или связанные с ней факторы, и с которого инициируется транскрипция. Энхансеры усиливают активность промотора во времени, а также пространственно. В данной области известно множество промоторов, которые транскрипционно активны в широком диапазоне типов клеток. Промоторы могут быть разделены на два класса: на тех, которые функционируют конститутивно, и тех, которые регулируются индукцией или снятием репрессии. Для экспрессии белка пригодны оба класса. Промоторы, которые используются для продукции высокого уровня полипептидов в эукариотических клетках и, в частности, в клетках млекопитающих, должны быть сильными и, предпочтительно, должны быть активными в широком диапазоне типов клеток. Сильные конститутивные промоторы, которые способны запускать экспрессию во многих типах клеток, хорошо известны в данной области и, поэтому, нет необходимости в их подробном описании в данном документе. В соответствии с идеей настоящего изобретения предпочтительно использовать промотор цитомегаловируса (CMV). Промотор или промотор/энхансер, полученные из немедленной ранней (IE) области цитомегаловируса (hCMV) человека, в особенности подходят в качестве промотора в экспрессионной кассете по настоящему изобретению. Немедленная ранняя (IE) область цитомегаловируса (hCMV) человека и полученные из нее функциональные запускающие экспрессию фрагменты и/или функциональные усиливающие экспрессию фрагменты, например, описаны в ЕР0173177 и ЕР0323997, а также хорошо известны в данной области. Таким образом, несколько фрагментов немедленной ранней (IE) области hCMV могут использоваться в качестве промотора и/или промотора/энхансера. Согласно одному варианту осуществления изобретения промотор CMV человека используется в экспрессионной кассете по настоящему изобретению.The expression cassette of the present invention contains a promoter as an element. The term "promoter" as used herein specifically refers to a DNA element that promotes the transcription of a polynucleotide to which the promoter is operably linked. A promoter may also form part of a promoter/enhancer element. Although the physical boundaries between the promoter and enhancer elements are not always clear, the term promoter generally refers to the location on a nucleic acid molecule to which RNA polymerase and/or its associated factors bind and from which transcription is initiated. Enhancers enhance promoter activity temporally as well as spatially. Many promoters are known in the art that are transcriptionally active in a wide range of cell types. Promoters can be divided into two classes: those that function constitutively and those that are regulated by the induction or release of repression. Both classes are suitable for protein expression. Promoters that are used to produce high levels of polypeptides in eukaryotic cells, and in particular in mammalian cells, must be strong and preferably must be active in a wide range of cell types. Strong constitutive promoters that are capable of driving expression in many cell types are well known in the art and therefore do not need to be detailed here. In accordance with the idea of the present invention, it is preferable to use the cytomegalovirus (CMV) promoter. A promoter or promoter/enhancer derived from the immediate early (IE) region of human cytomegalovirus (hCMV) is particularly suitable as a promoter in the expression cassette of the present invention. The human cytomegalovirus (hCMV) immediate early (IE) region and functional expression triggering and/or functional expression enhancing fragments derived therefrom are, for example, described in EP0173177 and EP0323997 and are well known in the art. Thus, several fragments of the hCMV immediate early (IE) region can be used as a promoter and/or a promoter/enhancer. According to one embodiment of the invention, a human CMV promoter is used in the expression cassette of the present invention.
В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the expression cassette includes the following elements in the 5' to 3' direction:
левый (первый) ITR (инвертированные концевые повторы);left (first) ITR (inverted terminal repeats);
CMV (цитомегаловирусный) энхансер;CMV (cytomegalovirus) enhancer;
CMV (цитомегаловирусный) промотер;CMV (cytomegalovirus) promoter;
интрон гена hBG1 (ген субъединицы гемоглобина гамма-1);hBG1 gene intron (gamma-1 hemoglobin subunit gene);
любую из вышеуказанных нуклеиновых кислот, которая кодирует вышеуказанный выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2;any of the above nucleic acids that encodes the above isolated recombinant receptor-binding domain of SARS-CoV-2 glycoprotein S (RBD-S);
сигнал полиаденилирования hGH1 (сигнал полиаденилирования гена гормона роста человека);hGH1 polyadenylation signal (human growth hormone gene polyadenylation signal);
правый (второй) ITR.right (second) ITR.
В некоторых вариантах левый (первый) ITR (инвертированные концевые повторы) имеет следующую последовательность нуклеиновой кислоты:In some embodiments, the left (first) ITR (inverted terminal repeats) has the following nucleic acid sequence:
Cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggt cgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcct (SEQ ID NO: 8).(SEQ ID NO: 8).
В некоторых вариантах CMV (цитомегаловирусный) энхансер имеет следующую последовательность нуклеиновой кислоты:In some embodiments, the CMV (cytomegalovirus) enhancer has the following nucleic acid sequence:
Cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgac gtcaataatgacgtatgttcccatagtaacgCcaatagggactttccattgacgtcaatgggtggagt atttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgac gtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttg gcagtacatctacgtattagtcatcgctattaccatg (SEQ ID NO: 9).Cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgac gtcaataatgacgtatgttcccatagtaacgCcaatagggactttccattgacgtcaatgggtggagt atttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgac gtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttg gcagtacatctacgtattagtcatcgctattaccatg (SEQ ID NO: 9).
В некоторых вариантах CMV (цитомегаловирусный) промотер имеет следующую последовательность нуклеиновой кислоты:In some embodiments, the CMV (cytomegalovirus) promoter has the following nucleic acid sequence:
Gtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttcca agtctccaccccattgacgtcaatgggagtttgttttgGcaccaaaatcaacgggactttccaaaatg tcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagca gagct (SEQ ID NO: 10).Gtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttcca agtctccaccccattgacgtcaatgggagtttgttttgGcaccaaaatcaacgggactttccaaaatg tcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagca NO: 10 gagct (SEQ ID 1).
В некоторых вариантах интрон гена hBG1 (ген субъединицы гемоглобина гамма-1) имеет следующую последовательность нуклеиновой кислоты:In some embodiments, the intron of the hBG1 gene (gamma-1 hemoglobin subunit gene) has the following nucleic acid sequence:
Cgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagta ccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatacttttttgtttatctta tttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgca ccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatt tctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctacca ttctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaa tcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccat cactttggcaaagaattgggat (SEQ ID NO: 11).Cgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagta ccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatacttttttgtttatctta tttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgca ccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatt tctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctacca ttctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaa tcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccat cactttggcaaagaattgggat (SEQ ID NO: 11).
В некоторых вариантах сигнал полиаденилирования hGH1 (сигнал полиаденилирования гена гормона роста человека) имеет следующую последовательность нуклеиновой кислоты:In some embodiments, the hGH1 polyadenylation signal (human growth hormone gene polyadenylation signal) has the following nucleic acid sequence:
Acgggtggcatccctgtgacccctccccagtgcctctcctggccctggaagttgccactccag tgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataat attatggggtggaggggggtggtatggagcaaggggcaagttgggaagacaacctgtagggcctgcgg ggtctattgggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctggg ttcaagcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagc taatttttgtttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatc tcaggtgatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccactgctcccttcc ctgtcctt (SEQ ID NO: 12).Acgggtggcatccctgtgacccctccccagtgcctctcctggccctggaagttgccactccag tgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataat attatggggtggaggggggtggtatggagcaaggggcaagttgggaagacaacctgtagggcctgcgg ggtctattgggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctggg ttcaagcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagc taatttttgtttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatc tcaggtgatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccactgctcccttcc ctgtcctt (SEQ ID NO: 12).
В некоторых вариантах правый (второй) ITR имеет следующую последовательность нуклеиновой кислоты:In some embodiments, the right (second) ITR has the following nucleic acid sequence:
Aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccg ggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagc tgcctgcagg (SEQ ID NO: 13).(SEQ ID NO: 13).
В некоторых вариантах экспрессионная кассета включает нуклеиновую кислоту с нуклеотидной последовательностью:In some embodiments, the expression cassette includes a nucleic acid with the nucleotide sequence:
Cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggt cgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcctg cggccgcacgcgtctagttattaatagtaatcaattacggggtcattagttcatagcccatatatgga gttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattga cgtcaataatgacgtatgttcccatagtaacgCcaatagggactttccattgacgtcaatgggtggag tatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattga cgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctactt ggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatggg cgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgtt ttgGcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcg gtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcgcctggaga cgccatccacgctgttttgacctccatagaagacaccgggaccgatccagcctccgcggattcgaatc ccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctataga gtctataggcccacaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatact ttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaag aataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataa attgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgctttta ttttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcata cctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaa agaattgggattcgaacatcgCGATaattaGCCGCCACCATGGAGACCGACACCCTGCTGCTGTGGGT GCTGCTGCTGTGGGTGCCCGGGTCGACCGGGAGAGTCCAACCAACAGAATCTATTGTTAGATTTCCTA ATATTACAAACTTGTGCCCTTTTGGTGAAGTTTTTAACGCCACCAGATTTGCATCTGTTTATGCTTGG AACAGGAAGAGAATCAGCAACTGTGTTGCTGATTATTCTGTCCTATATAATTCCGCATCATTTTCCAC TTTTAAGTGTTATGGAGTGTCTCCTACTAAATTAAATGATCTCTGCTTTACTAATGTCTATGCAGATT CATTTGTAATTAGAGGTGATGAAGTCAGACAAATCGCTCCAGGGCAAACTGGAAAGATTGCTGATTAT AATTATAAATTACCAGATGATTTTACAGGCTGCGTTATAGCTTGGAATTCTAACAATCTTGATTCTAA GGTTGGTGGTAATTATAATTACCTGTATAGATTGTTTAGGAAGTCTAATCTCAAACCTTTTGAGAGAG ATATTTCAACTGAAATCTATCAGGCCGGTAGCACACCTTGTAATGGTGTTGAAGGTTTTAATTGTTAC TTTCCTTTACAATCATATGGTTTCCAACCCACTAATGGTGTTGGTTACCAACCATACAGAGTAGTAGT ACTTTCTTTTGAACTTCTACATGCACCAGCAACTGTTTGTGGACCTAAAAAGTCTACTAATTTGGTTA AAAACAAATGTGTCAATTTCAACTTCAATGGTTTAACAGGCACAGGTGTTCTTACTGAGTCTAACAAA AAGTTTCTGCCTTTCCAACAATTTGGCAGAGACATTGCTGACACTACTGATGCTGTCCGTGATCCACA GACACTTGAGATTCTTGACATTACACCATCTTCTTTTGGTGGTGTCAGTtaaGgatcctctagagtcg acctgcagaagcttgcctcgagcagcgctgctcgagagatctacgggtggcatccctgtgacccctcc ccagtgcctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaag ttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagca aggggcaagttgggaagacaacctgtagggcctgcggggtctattgggaaccaagctggagtgcagtg gcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccga gttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggtt tcaccatattggccaggctggtctccaactcctaatctcaggtgatctacccaccttggcctcccaaa ttgctgggattacaggcgtgaaccactgctcccttccctgtccttctgattttgtaggtaaccacgtg cggaccgagcggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgct cactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagc gagcgcgcagctgcctgcagg (SEQ ID NO: 3).Cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggt cgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcctg cggccgcacgcgtctagttattaatagtaatcaattacggggtcattagttcatagcccatatatgga gttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattga cgtcaataatgacgtatgttcccatagtaacgCcaatagggactttccattgacgtcaatgggtggag tatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattga cgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctactt ggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatggg cgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgtt ttgGcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcg gtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcgcctggaga cgccatccacgctgttttgacctccatagaagacaccgggaccgatccagcctccgcggattcgaatc ccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctataga gtctataggcccacaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatact ttccctaatctctttctttcagggcaataatgatacaat gtatcatgcctctttgcaccattctaaag aataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataa attgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgctttta ttttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcata cctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaa agaattgggattcgaacatcgCGATaattaGCCGCCACCATGGAGACCGACACCCTGCTGCTGTGGGT GCTGCTGCTGTGGGTGCCCGGGTCGACCGGGAGAGTCCAACCAACAGAATCTATTGTTAGATTTCCTA ATATTACAAACTTGTGCCCTTTTGGTGAAGTTTTTAACGCCACCAGATTTGCATCTGTTTATGCTTGG AACAGGAAGAGAATCAGCAACTGTGTTGCTGATTATTCTGTCCTATATAATTCCGCATCATTTTCCAC TTTTAAGTGTTATGGAGTGTCTCCTACTAAATTAAATGATCTCTGCTTTACTAATGTCTATGCAGATT CATTTGTAATTAGAGGTGATGAAGTCAGACAAATCGCTCCAGGGCAAACTGGAAAGATTGCTGATTAT AATTATAAATTACCAGATGATTTTACAGGCTGCGTTATAGCTTGGAATTCTAACAATCTTGATTCTAA GGTTGGTGGTAATTATAATTACCTGTATAGATTGTTTAGGAAGTCTAATCTCAAACCTTTTGAGAGAG ATATTTCAACTGAAATCTATCAGGCCGGTAGCACACCTTGTAATGGTGTTGAAGGTTTTAATTGTTAC TTTCCTTTACAATCATATGGTTTCCAACCCACTAATGGTGTTGGTTACCAACCATACAGAGTAGTAGT ACTT TCTTTTGAACTTCTACATGCACCAGCAACTGTTTGTGGACCTAAAAAGTCTACTAATTTGGTTA AAAACAAATGTGTCAATTTCAACTTCAATGGTTTAACAGGCACAGGTGTTCTTACTGAGTCTAACAAA AAGTTTCTGCCTTTCCAACAATTTGGCAGAGACATTGCTGACACTACTGATGCTGTCCGTGATCCACA GACACTTGAGATTCTTGACATTACACCATCTTCTTTTGGTGGTGTCAGTtaaGgatcctctagagtcg acctgcagaagcttgcctcgagcagcgctgctcgagagatctacgggtggcatccctgtgacccctcc ccagtgcctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaag ttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagca aggggcaagttgggaagacaacctgtagggcctgcggggtctattgggaaccaagctggagtgcagtg gcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccga gttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggtt tcaccatattggccaggctggtctccaactcctaatctcaggtgatctacccaccttggcctcccaaa ttgctgggattacaggcgtgaaccactgctcccttccctgtccttctgattttgtaggtaaccacgtg cggaccgagcggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgct cactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagc gagcgcgcagctgcctgcagg (SEQ ID NO: 3).
В одном из аспектов настоящее изобретение относится к экспрессионному вектору, который включает любую из вышеуказанных нуклеиновых кислот, которая кодирует вышеуказанный выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2, или любую из вышеуказанных экспрессионных кассет.In one aspect, the present invention relates to an expression vector that includes any of the above nucleic acids that encodes the above isolated recombinant SARS-CoV-2 glycoprotein S (RBD-S) recombinant receptor-binding domain, or any of the above expression cassettes.
В некоторых вариантах осуществления изобретения вектор представляет собой плазмиду, т.е. кольцевую двухцепочечную часть ДНК, в которую могут быть лигированы дополнительные сегменты ДНК.In some embodiments, the vector is a plasmid, i.e. a circular double-stranded piece of DNA into which additional DNA segments can be ligated.
В некоторых вариантах осуществления изобретения вектор представляет собой вирусный вектор, в котором дополнительные сегменты ДНК могут быть лигированы в вирусный геном.In some embodiments, the vector is a viral vector in which additional DNA segments can be ligated into the viral genome.
В некоторых вариантах осуществления изобретения векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, имеющие бактериальный сайт инициации репликации и эписомные векторы млекопитающих). В других вариантах осуществления изобретения векторы (например, неэписомальные векторы млекопитающих) могут быть интегрированы в геном клетки-хозяина при введении в клетку-хозяина, и таким образом реплицируются вместе с геном хозяина. Более того, некоторые векторы способны направлять экспрессию генов, с которыми они функционально соединены. Такие векторы упоминаются в данном документе как «рекомбинантные экспрессирующие векторы» (или просто «экспрессирующие векторы» («вектор экспрессии» или «экспрессионный вектор»)).In some embodiments, the vectors are capable of autonomous replication in the host cell into which they are introduced (eg, bacterial vectors having a bacterial origin of replication and mammalian episomal vectors). In other embodiments, the vectors (eg, non-episomal mammalian vectors) can be integrated into the genome of a host cell when introduced into the host cell, and thus replicate along with the host's genome. Moreover, some vectors are capable of directing the expression of the genes to which they are operably linked. Such vectors are referred to herein as "recombinant expression vectors" (or simply "expression vectors" ("expression vector" or "expression vector")).
Экспрессионные векторы включают плазмиды, ретровирусы, аденовирусы, аденоассоциированные вирусы (AAV), вирусы растений, такие как вирус мозаики цветной капусты, вирусы табачной мозаики, космиды, YAC, EBV полученные эписомы и тому подобное. Молекулы ДНК могут быть лигированы в вектор таким образом, что последовательности, контролирующие транскрипцию и трансляцию в векторе, выполняют предусмотренную функцию регуляции транскрипции и трансляции ДНК. Экспрессионный вектор и последовательности контроля экспрессии могут быть выбраны таким образом, чтобы быть совместимыми с используемой экспрессирующей клеткой-хозяином. Молекулы ДНК могут быть введены в экспрессионный вектор стандартными способами (например, лигированием комплементарных сайтов рестрикции или лигированием тупых концов, если сайты рестрикции отсутствуют).Expression vectors include plasmids, retroviruses, adenoviruses, adeno-associated viruses (AAVs), plant viruses such as cauliflower mosaic virus, tobacco mosaic viruses, cosmids, YAC, EBV derived episomes, and the like. The DNA molecules can be ligated into the vector such that transcription and translation control sequences in the vector perform their intended function of regulating transcription and translation of the DNA. The expression vector and expression control sequences can be chosen to be compatible with the expression host cell used. DNA molecules can be introduced into an expression vector by standard methods (eg, ligation of complementary restriction sites or blunt end ligation if no restriction sites are present).
Рекомбинантный экспрессионный вектор также может кодировать лидерный пептид (или сигнальный пептид), который облегчает выработку белка-интереса клеткой-хозяином. Ген белка-интереса может быть клонирован в вектор таким образом, что сигнальный пептид соединен с рамкой считывания аминоконца белка-интереса. Лидерным пептидом (или сигнальным пептидом) может быть лидерный пептид иммуноглобулина или гетерологичный лидерный пептид (то есть лидерный пептид белка не иммуноглобулиновой природы).The recombinant expression vector may also encode a leader peptide (or signal peptide) that facilitates production of the protein of interest by the host cell. The gene of the protein of interest can be cloned into a vector such that the signal peptide is linked to the amino terminus of the protein of interest. The leader peptide (or signal peptide) can be an immunoglobulin leader peptide or a heterologous leader peptide (ie, a leader peptide of a non-immunoglobulin protein).
Помимо гена RBD-S вируса SARS-CoV-2 по данному изобретению, рекомбинантная экспрессия векторов по данному изобретению может нести регулирующие последовательности, которые контролируют экспрессию гена RBD-S вируса SARS-CoV-2 в клетке-хозяине. Специалистам в этой области будет понятно, что дизайн экспрессионного вектора, включая выбор регулирующих последовательностей, может зависеть от таких факторов, как селекция клетки-хозяина для трансформации, уровень экспрессии желаемого белка, и т.д. Предпочтительные регулирующие последовательности для экспрессирующей клетки-хозяина млекопитающих включают вирусные элементы обеспечивающие высокий уровень экспрессии белков в клетках млекопитающих, таких как промоторы и/или энхансеры, полученные из ретровирусной LTR, цитомегаловируса (CMV) (например, CMV промотора/энхансера), обезьяньего вируса 40 (SV40) (например, SV40 промотора/энхансера), аденовируса, (например, большого позднего промотора аденовируса (AdMLP)), вирус полиомы, а также сильных промоторов млекопитающих, таких как промотор нативных иммуноглобулинов или промотор актина.In addition to the SARS-CoV-2 RBD-S gene of the present invention, recombinant expression of the vectors of the present invention may carry regulatory sequences that control the expression of the SARS-CoV-2 RBD-S gene in the host cell. Those skilled in the art will appreciate that the design of the expression vector, including the choice of regulatory sequences, may depend on such factors as the selection of the host cell for transformation, the level of expression of the desired protein, and so on. Preferred regulatory sequences for a mammalian expression host cell include viral elements that provide high levels of protein expression in mammalian cells, such as promoters and/or enhancers derived from retroviral LTR, cytomegalovirus (CMV) (e.g., CMV promoter/enhancer), simian virus 40 (SV40) (eg, SV40 promoter/enhancer), adenovirus (eg, adenovirus large late promoter (AdMLP)), polyoma virus, as well as strong mammalian promoters such as the native immunoglobulin promoter or the actin promoter.
Выражение «контролирующие последовательности» относится к последовательностям ДНК, необходимым для экспрессии функционально связанной кодирующей последовательности в определенном организме-хозяине. Пригодные для прокариот контролирующие последовательности представляют собой, например, промотор, необязательно оператор и сайт связывания рибосомы. Как известно, в эукариотических клетках присутствуют промоторы, сигналы полиаденилирования и энхансеры.The expression "control sequences" refers to DNA sequences necessary for the expression of an operably linked coding sequence in a particular host organism. Control sequences suitable for prokaryotes are, for example, a promoter, optionally an operator, and a ribosome binding site. As is known, promoters, polyadenylation signals, and enhancers are present in eukaryotic cells.
В контексте настоящего описания термин «промотор» или «регуляторная последовательность транскрипции» или «регуляторная последовательность» относится к фрагменту нуклеиновой кислоты, который контролирует транскрипцию одной или нескольких кодирующих последовательностей, и который расположен против направления считывания информации относительно направления транскрипции от сайта инициации транскрипции кодирующей последовательности, а также который структурно идентифицируется по наличию сайта связывания для ДНК-зависимой РНК-полимеразы, сайтов инициации транскрипции и других последовательностей ДНК, включающих, без ограничения, сайты связывания фактора транскрипции, сайты связывания репрессора и активатора белка, а также любые другие последовательности нуклеотидов, известные специалистам в данной области, которые непосредственно или опосредованно регулируют уровень транскрипции с данным промотором. «Конститутивный» промотор представляет собой такой промотор, который активен в большинстве тканей в обычных физиологических условиях и условиях развития. «Индуцибельный» промотор представляет собой промотор, который подвергается физиологической регуляции или регуляции в ходе развития, например, при воздействии химического индуктора. «Тканеспецифичный» промотор активен только в конкретных типах тканей или клеток.In the context of the present description, the term "promoter" or "regulatory sequence of transcription" or "regulatory sequence" refers to a nucleic acid fragment that controls the transcription of one or more coding sequences, and which is located against the direction of reading information relative to the direction of transcription from the site of transcription initiation of the coding sequence , and which is also structurally identified by the presence of a binding site for DNA-dependent RNA polymerase, transcription initiation sites and other DNA sequences, including, without limitation, transcription factor binding sites, repressor and protein activator binding sites, as well as any other nucleotide sequences, known to those skilled in the art that directly or indirectly regulate the level of transcription with a given promoter. A "constitutive" promoter is one that is active in most tissues under normal physiological and developmental conditions. An "inducible" promoter is a promoter that is subject to physiological or developmental regulation, such as by exposure to a chemical inducer. A "tissue-specific" promoter is only active in specific tissue or cell types.
Термины «энхансеры» или «энхансер», используемые в изобретении, могут относиться к последовательности ДНК, которая расположена как смежная с последовательностью ДНК, кодирующей рекомбинантный продукт. Энхансерные элементы обычно расположены в 5'-направлении от промоторного элемента или могут быть расположены ниже или в пределах кодирующей последовательности ДНК (например, последовательности ДНК, транскрибированной или транслированной в рекомбинантный продукт или продукты). Таким образом, энхансерный элемент может быть расположен на расстоянии 100 пар оснований, 200 пар оснований или 300 или больше пар оснований перед последовательностью ДНК, которая кодирует рекомбинантный продукт, или после этой последовательности. Энхансерные элементы могут увеличивать количество экспрессируемого рекомбинантного продукта от последовательности ДНК, превышая экспрессию, обусловленную одиночным промоторным элементом. Специалистам в данной области техники доступно множество энхансерных элементов.The terms "enhancers" or "enhancer" as used herein may refer to a DNA sequence that is located adjacent to a DNA sequence encoding a recombinant product. Enhancer elements are typically located 5' from the promoter element, or may be located downstream or within the DNA coding sequence (eg, the DNA sequence transcribed or translated into the recombinant product or products). Thus, the enhancer element can be located 100 base pairs, 200 base pairs, or 300 or more base pairs before or after the DNA sequence that encodes the recombinant product. Enhancer elements can increase the amount of expressed recombinant product from a DNA sequence, exceeding the expression due to a single promoter element. Many enhancer elements are available to those skilled in the art.
В дополнение к вышеуказанным генам и регулирующим последовательностям, рекомбинантные векторы экспрессии изобретения могут нести дополнительные последовательности, такие как последовательности, которые регулируют репликацию вектора в клетках-хозяевах (например, точки начала репликации) и гены селектируемого маркера. Ген селектируемого маркера облегчает селекцию клеток-хозяев, в которые был введен вектор (см., например, патенты США 4,399,216, 4,634,665 и 5,179,017). Например, обычно ген селектируемого маркера придает устойчивость к лекарственным средствам, таким как G418, гигромицин или метотрексат, клетке-хозяину, в которую вектор введен. Например, гены селектируемого маркера включают ген дигидрофолат редуктазы (DHFR) (для использования в dhfr-клетках-хозяевах при селекции/амплификации метотрексата), ген нео (для селекции G418) и ген синтетазы глутамата.In addition to the above genes and control sequences, the recombinant expression vectors of the invention may carry additional sequences, such as sequences that control the replication of the vector in host cells (eg origins of replication) and selectable marker genes. The selectable marker gene facilitates the selection of host cells into which the vector has been introduced (see, for example, US Pat. For example, typically a selectable marker gene confers resistance to drugs such as G418, hygromycin, or methotrexate to the host cell into which the vector is introduced. For example, selectable marker genes include the dihydrofolate reductase (DHFR) gene (for use in dhfr host cells in methotrexate selection/amplification), the neo gene (for G418 selection), and the glutamate synthetase gene.
Термин «последовательность контроля экспрессии», используемый в данном описании, означает полинуклеотидные последовательности, которые необходимы для воздействия на экспрессию и процессинг кодирующих последовательностей, к которым они лигированы. Контролирующие экспрессию последовательности включают соответствующие последовательности инициации транскрипции, терминации, промотора и энхансера; эффективные сигналы процессинга РНК, такие как сплайсинг и сигналы полиаденилирования; последовательности, которые стабилизируют цитоплазматическую мРНК; последовательности, которые повышают эффективность трансляции (т.е. консенсусная последовательность Козака); последовательности, которые повышают стабильность белка; и, при желании, последовательности, которые усиливают секрецию белка. Характер таких контролирующих последовательностей различается в зависимости от организма-хозяина; в прокариотах такие контролирующие последовательности, как правило, включают промотор, сайт связывания рибосомы, а также последовательности терминации транскрипции; в эукариотах, как правило, такие контролирующие последовательности включают промоторы и последовательности терминации транскрипции. Термин «контролирующие последовательности» включает, как минимум, все компоненты, наличие которых имеет важное значение для экспрессии и процессинга, и может также включать дополнительные компоненты, чье присутствие является полезным, например, лидирующие последовательности и последовательности слившихся клеток.The term "expression control sequence" as used herein means polynucleotide sequences that are necessary to affect the expression and processing of the coding sequences to which they are ligated. Expression control sequences include the appropriate transcription initiation, termination, promoter, and enhancer sequences; efficient RNA processing signals such as splicing and polyadenylation signals; sequences that stabilize cytoplasmic mRNA; sequences that increase translation efficiency (ie Kozak consensus sequence); sequences that enhance protein stability; and, optionally, sequences that enhance protein secretion. The nature of such control sequences varies depending on the host organism; in prokaryotes, such control sequences typically include a promoter, a ribosome binding site, and transcription termination sequences; in eukaryotes, such control sequences typically include promoters and transcription termination sequences. The term "control sequences" includes, at a minimum, all components whose presence is essential for expression and processing, and may also include additional components whose presence is beneficial, such as leader sequences and fused cell sequences.
В контексте настоящего описания термин «функционально связанный» относится к связи полинуклеотидных (или полипептидных) элементов в функциональную связь. Нуклеиновая кислота является «функционально связанной», если она находится в условиях функциональной связи с другой последовательностью нуклеиновой кислоты. Например, регуляторная последовательность транскрипции функционально связана с кодирующей последовательностью, если она влияет на транскрипцию указанной кодирующей последовательности. Термин «функционально связанный» означает, что связанные последовательности ДНК являются, как правило, непрерывными, и при необходимости соединения двух участков, кодирующих белок, являются также непрерывными и находятся в рамке считывания. In the context of the present description, the term "operably linked" refers to the connection of polynucleotide (or polypeptide) elements in a functional relationship. A nucleic acid is "operably linked" if it is in operable linkage with another nucleic acid sequence. For example, a transcriptional regulatory sequence is operably linked to a coding sequence if it affects the transcription of said coding sequence. The term "operably linked" means that the linked DNA sequences are generally contiguous and, if necessary, the joins of two protein-coding regions are also contiguous and in reading frame.
В одном из вариантов настоящего изобретения «экспрессионный вектор» относится к вектору, содержащему одну или несколько интересующих полинуклеотидных последовательностей, интересующих генов или «трансгенов», которые фланкированы парвовирусными или инвертированными концевыми повторяющимися последовательностями (ITR).In one embodiment of the present invention, an "expression vector" refers to a vector containing one or more polynucleotide sequences of interest, genes of interest, or "transgenes" that are flanked by parvovirus or inverted terminal repeat sequences (ITRs).
Ни кассета, ни вектор по изобретению не содержит нуклеотидные последовательности генов, кодирующих неструктурные белки (Rep) и структурные белки (Cap) аденоассоциированного вируса.Neither the cassette nor the vector of the invention contains the nucleotide sequences of the genes encoding non-structural proteins (Rep) and structural proteins (Cap) of adeno-associated virus.
Рекомбинантный вирус на основе AAV5 (аденоассоциированный вирус 5 серотипа)Recombinant virus based on AAV5 (adeno-associated virus serotype 5)
В одном из аспектов настоящее изобретение относится к выделенному рекомбинантному вирусу на основе AAV5 (аденоассоциированный вирус 5 серотипа) для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2, который включает капсид и любую из вышеуказанных экспрессионных кассет.In one aspect, the present invention relates to an isolated recombinant virus based on AAV5 (adeno-associated virus serotype 5) for the induction of specific immunity to the SARS-CoV-2 virus and/or the prevention of coronavirus infection caused by SARS-CoV-2, which includes a capsid and any from the above expression cassettes.
Термин «рекомбинантный вирус на основе AAV» (или «вирусоподобная частица на основе AAV», или «рекомбинантный вирусный штамм AAV», или «рекомбинантный вектор AAV», или «вектор rAAV») в контексте настоящего описания относится к вышеуказанной экспрессионной кассете (или вышеуказанному экспрессионному вектору), которая заключена внутри капсида AAV.The term "recombinant AAV virus" (or "virus-like particle based on AAV", or "recombinant AAV viral strain", or "recombinant AAV vector", or "rAAV vector") in the context of the present description refers to the above expression cassette (or expression vector above) that is enclosed within the AAV capsid.
Ген Cap, помимо других альтернативных продуктов, кодирует 3 капсидных белка (VP1, VP2 и VP3). Белки VP1, VP2 и VP3 находятся в соотношении 1:1:10, образуя икосаэдрический капсид (Xie Q. et al. The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy. Proc Natl Acad Sci USA, 2002; 99:10405-10410). Транскрипция этих генов начинается с одного промотора, p40. Молекулярная масса соответствующих белков (VP1, VP2 и VP3) составляет 87, 72 и 62 кДа, соответственно. Все три белка транслируются с одной мРНК. После транскрипции пре-мРНК может подвергаться сплайсингу двумя разными способами, при этом вырезается более длинный или более короткий интрон и образуются мРНК различной нуклеотидной длины.The Cap gene, among other alternative products, encodes 3 capsid proteins (VP1, VP2, and VP3). Proteins VP1, VP2 and VP3 are in a ratio of 1:1:10, forming an icosahedral capsid (Xie Q. et al. The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy. Proc Natl Acad Sci USA, 2002; 99:10405-10410). Transcription of these genes starts from a single promoter, p40. The molecular weights of the respective proteins (VP1, VP2 and VP3) are 87, 72 and 62 kDa, respectively. All three proteins are translated from the same mRNA. After transcription, the pre-mRNA can be spliced in two different ways, whereby a longer or shorter intron is excised and mRNAs of different nucleotide lengths are formed.
При образовании рекомбинантного вируса на основе AAV (rAAV) кассета экспрессии, фланкированная ИКП (ITR), упаковывается в капсид AAV. Гены, необходимые для репликации AAV, как было указано выше, не входят в кассету.In the formation of a recombinant AAV-based virus (rAAV), an ICR-flanked expression cassette (ITR) is packaged into an AAV capsid. The genes required for AAV replication, as mentioned above, are not included in the cassette.
ДНК экспрессионной кассеты упакована в вирусный капсид в виде одноцепочечной молекулы ДНК (оцДНК) длиной приблизительно 3000 нуклеотидов. После инфицирования клетки вирусом, одноцепочечную ДНК конвертируют в форму двухцепочечной ДНК (дцДНК). Только дцДНК могут использовать белки клетки, которые транскрибируют содержащийся ген или гены в РНК.The expression cassette DNA is packaged in the viral capsid as a single-stranded DNA molecule (ssDNA) approximately 3000 nucleotides long. After a cell is infected with a virus, the single-stranded DNA is converted into a double-stranded DNA (dsDNA) form. Only dsDNA can use cell proteins that transcribe the contained gene or genes into RNA.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5.In some embodiments, the recombinant AAV5 virus has a capsid that includes the AAV5 VP1 protein.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5, имеющий аминокислотную последовательность MSFVDHPPDWLEEVGEGLREFLGLEAGPPKPKPNQQHQDQARGLVLPGYNYLGPGNGLDRGEPVNRAD EVAREHDISYNEQLEAGDNPYLKYNHADAEFQEKLADDTSFGGNLGKAVFQAKKRVLEPFGLVEEGAK TAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDN NQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGY FDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQ LPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNF EEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWN LGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLE GNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIP ETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENS KRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL (SEQ ID NO: 4).В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5, имеющий аминокислотную последовательность MSFVDHPPDWLEEVGEGLREFLGLEAGPPKPKPNQQHQDQARGLVLPGYNYLGPGNGLDRGEPVNRAD EVAREHDISYNEQLEAGDNPYLKYNHADAEFQEKLADDTSFGGNLGKAVFQAKKRVLEPFGLVEEGAK TAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDN NQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGY FDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQ LPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNF EEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWN LGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLE GNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIP ETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENS KRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL (SEQ ID NO: 4).
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP2 AAV5.In some embodiments, the recombinant AAV5 virus has a capsid that includes the AAV5 VP2 protein.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP2 AAV5, имеющий следующую аминокислотную последовательность: TAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDN NQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGY FDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQ LPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNF EEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWN LGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLE GNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIP ETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENS KRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL (SEQ ID NO: 14).В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP2 AAV5, имеющий следующую аминокислотную последовательность: TAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDN NQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGY FDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQ LPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNF EEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWN LGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLE GNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIP ETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENS KRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL (SEQ ID NO: 14).
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP3 AAV5.In some embodiments, the recombinant AAV5 virus has a capsid that includes the AAV5 VP3 protein.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP3 AAV5, имеющий следующую аминокислотную последовательность MSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNA NAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLT STVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKML RTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNW FPGPMGRTQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQ PANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERD VYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVT VEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL (SEQ ID NO: 15).В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP3 AAV5, имеющий следующую аминокислотную последовательность MSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNA NAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLT STVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKML RTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNW FPGPMGRTQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQ PANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERD VYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVT VEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL (SEQ ID NO: 15).
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белки VP1, VP2 и VP3 AAV5.In some embodiments, the recombinant AAV5 virus has a capsid that includes the AAV5 VP1, VP2, and VP3 proteins.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белки VP1 c аминокислотной последовательность SEQ ID NO: 4, VP2 c аминокислотной последовательность SEQ ID NO: 14 и VP3 c аминокислотной последовательность SEQ ID NO: 15.In some embodiments, the recombinant AAV5-based virus has a capsid that includes the proteins VP1 with the amino acid sequence of SEQ ID NO: 4, VP2 with the amino acid sequence of SEQ ID NO: 14, and VP3 with the amino acid sequence of SEQ ID NO: 15.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5, имеющий аминокислотную последовательность SEQ ID NO: 4 с одной или несколькими точечными мутациями.In some embodiments, the recombinant AAV5-based virus has a capsid that includes an AAV5 VP1 protein having the amino acid sequence of SEQ ID NO: 4 with one or more point mutations.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5, имеющий аминокислотную последовательность, которая включает аминокислотные замены в положениях S2A и T711S VP1 AAV5 дикого типа (SEQ ID NO: 4), и имеет аминокислотную последовательностьIn some embodiments, the recombinant AAV5-based virus has a capsid that includes an AAV5 VP1 protein having an amino acid sequence that includes amino acid substitutions at positions S2A and T711S of wild-type AAV5 VP1 (SEQ ID NO: 4) and has the amino acid sequence
MAFVDHPPDWLEEVGEGLREFLGLEAGPPKPKPNQQHQDQARGLVLPGYNYLGPGNGLDRGEP VNRADEVAREHDISYNEQLEAGDNPYLKYNHADAEFQEKLADDTSFGGNLGKAVFQAKKRVLEPFGLV EEGAKTAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGG PLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYS TPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFT DDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFE FTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGR TQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTT ATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPI WAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWEL KKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRSTRPIGTRYLTRPL (SEQ ID NO: 5).MAFVDHPPDWLEEVGEGLREFLGLEAGPPKPKPNQQHQDQARGLVLPGYNYLGPGNGLDRGEP VNRADEVAREHDISYNEQLEAGDNPYLKYNHADAEFQEKLADDTSFGGNLGKAVFQAKKRVLEPFGLV EEGAKTAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGG PLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYS TPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFT DDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFE FTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGR TQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTT ATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPI WAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWEL KKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRSTRPIGTRYLTRPL (SEQ ID NO: 5).
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP2 AAV5, имеющий аминокислотную последовательность SEQ ID NO: 14 с одной или несколькими точечными мутациями.In some embodiments, the recombinant AAV5-based virus has a capsid that includes an AAV5 VP2 protein having the amino acid sequence of SEQ ID NO: 14 with one or more point mutations.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP2 AAV5, имеющий аминокислотную последовательность, которая включает аминокислотные замены в положении T575S VP2 AAV5 дикого типа (SEQ ID NO: 14), и имеет аминокислотную последовательностьIn some embodiments, the recombinant AAV5-based virus has a capsid that includes an AAV5 VP2 protein having an amino acid sequence that includes amino acid substitutions at position T575S of wild-type AAV5 VP2 (SEQ ID NO: 14) and has the amino acid sequence
TAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGG PLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYS TPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFT DDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFE FTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGR TQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTT ATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPI WAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWEL KKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRSTRPIGTRYLTRPL (SEQ ID NO: 16).TAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGG PLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYS TPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFT DDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFE FTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGR TQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTT ATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPI WAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWEL KKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRSTRPIGTRYLTRPL (SEQ ID NO: 16).
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP3 AAV5, имеющий аминокислотную последовательность SEQ ID NO: 15 с одной или несколькими точечными мутациями.In some embodiments, the recombinant AAV5-based virus has a capsid that includes the AAV5 VP3 protein having the amino acid sequence of SEQ ID NO: 15 with one or more point mutations.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP3 AAV5, имеющий аминокислотную последовательность, которая включает аминокислотные замены в положении T519S VP3 AAV5 дикого типа (SEQ ID NO: 15), и имеет аминокислотную последовательностьIn some embodiments, the recombinant AAV5-based virus has a capsid that includes an AAV5 VP3 protein having an amino acid sequence that includes amino acid substitutions at position T519S of wild-type AAV5 VP3 (SEQ ID NO: 15) and has the amino acid sequence
MSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSV DGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTI ANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYF PSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYAN TYKNWFPGPMGRTQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTM IFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSV WMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYS TGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRSTRPIGTRYLTRPL (SEQ ID NO: 17).MSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSV DGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTI ANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYF PSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYAN TYKNWFPGPMGRTQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTM IFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSV WMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYS TGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRSTRPIGTRYLTRPL (SEQ ID NO: 17).
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белки VP1 c аминокислотной последовательность SEQ ID NO: 4 с одной или несколькими точечными мутациями, VP2 c аминокислотной последовательность SEQ ID NO: 14 с одной или несколькими точечными мутациями и VP3 c аминокислотной последовательность SEQ ID NO: 15 с одной или несколькими точечными мутациями.In some embodiments, the recombinant AAV5-based virus has a capsid that includes VP1 proteins with the amino acid sequence of SEQ ID NO: 4 with one or more point mutations, VP2 with the amino acid sequence of SEQ ID NO: 14 with one or more point mutations, and VP3 with the amino acid sequence SEQ ID NO: 15 with one or more point mutations.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белки VP1 c аминокислотной последовательность SEQ ID NO: 5, VP2 c аминокислотной последовательность SEQ ID NO: 16 и VP3 c аминокислотной последовательность SEQ ID NO: 17.In some embodiments, the recombinant AAV5-based virus has a capsid that includes the VP1 proteins with the amino acid sequence of SEQ ID NO: 5, VP2 with the amino acid sequence of SEQ ID NO: 16, and VP3 with the amino acid sequence of SEQ ID NO: 17.
Под «несколькими точечными мутациями» подразумеваются две, три, четыре, пять, шесть, семь, восемь, девять или десять точечных замен.By "multiple point mutations" is meant two, three, four, five, six, seven, eight, nine, or ten point substitutions.
Особенно предпочтительные варианты включают замены (мутации), которые являются консервативными по природе, т.е. те замены, которые имеют место в семействе аминокислот, которые объединены по их боковым цепям. В частности, аминокислоты обычно делят на четыре семейства: (1) кислые - аспартат и глутамат; (2) основные - лизин, аргинин, гистидин; (3) неполярные - аланин, валин, лейцин, изолейцин, пролин, фенилаланин, метионин, триптофан; и (4) незаряженные полярные - глицин, аспарагин, глутамин, цистеин, серин треонин, тирозин. Фенилаланин, триптофан и тирозин иногда классифицируют как ароматические аминокислоты. Например, достаточно обосновано предсказание о том, что выделенная замена лейцина на изолейцин или валин, аспартата на глутамат, треонина на серин или схожая консервативная замена аминокислоты на структурно родственную аминокислоту не окажет важного влияния на биологическую активность. Например, полипептид, представляющий интерес, может включать вплоть до приблизительно 5-10 консервативных или неконсервативных аминокислотных замен, при условии, что желаемая функция молекулы остается незатронутой.Particularly preferred options include substitutions (mutations) that are conservative in nature, ie. those substitutions that take place in a family of amino acids that are combined along their side chains. In particular, amino acids are usually divided into four families: (1) acidic - aspartate and glutamate; (2) the main ones are lysine, arginine, histidine; (3) non-polar - alanine, valine, leucine, isoleucine, proline, phenylalanine, methionine, tryptophan; and (4) uncharged polar ones - glycine, asparagine, glutamine, cysteine, serine, threonine, tyrosine. Phenylalanine, tryptophan, and tyrosine are sometimes classified as aromatic amino acids. For example, it is fairly predictable that an isolated substitution of leucine for isoleucine or valine, aspartate for glutamate, threonine for serine, or a similar conservative substitution of an amino acid for a structurally related amino acid will not have an important effect on biological activity. For example, a polypeptide of interest may include up to about 5-10 conservative or non-conservative amino acid substitutions, as long as the desired function of the molecule remains unaffected.
Вариант точечных мутаций в последовательностях белков VP1, VP2 или VP3 AAV5 с помощью аминокислотных замен представляет собой замену, по меньшей мере, одного аминокислотного остатка в белке VP1, VP2 или VP3 AAV5 на другой аминокислотный остаток.A variant of point mutations in the sequences of AAV5 VP1, VP2 or VP3 proteins using amino acid substitutions is the replacement of at least one amino acid residue in the AAV5 VP1, VP2 or VP3 protein with another amino acid residue.
Консервативные замены показаны в таблице А под заголовком «предпочтительные замены».Conservative substitutions are shown in Table A under the heading "preferred substitutions".
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5, имеющий аминокислотную последовательность SEQ ID NO: 4 или аминокислотную последовательность SEQ ID NO: 4 с одной или несколькими точечными мутациями, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the recombinant AAV5-based virus has a capsid that includes the AAV5 VP1 protein having the amino acid sequence of SEQ ID NO: 4 or the amino acid sequence of SEQ ID NO: 4 with one or more point mutations, and the expression cassette includes the following elements in the direction from 5 '-end to 3'-end:
левый (первый) ITR (инвертированные концевые повторы);left (first) ITR (inverted terminal repeats);
CMV (цитомегаловирусный) энхансер;CMV (cytomegalovirus) enhancer;
CMV (цитомегаловирусный) промотер;CMV (cytomegalovirus) promoter;
интрон гена hBG1 (ген субъединицы гемоглобина гамма-1);hBG1 gene intron (gamma-1 hemoglobin subunit gene);
любую из вышеуказанных нуклеиновых кислот, которая кодирует вышеуказанный выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2;any of the above nucleic acids that encodes the above isolated recombinant receptor-binding domain of SARS-CoV-2 glycoprotein S (RBD-S);
сигнал полиаденилирования hGH1 (сигнал полиаденилирования гена гормона роста человека);hGH1 polyadenylation signal (human growth hormone gene polyadenylation signal);
правый (второй) ITR.right (second) ITR.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белки VP1 c аминокислотной последовательность SEQ ID NO: 4, VP2 c аминокислотной последовательность SEQ ID NO: 14 и VP3 c аминокислотной последовательность SEQ ID NO: 15, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the recombinant AAV5-based virus has a capsid that includes the VP1 proteins with the amino acid sequence of SEQ ID NO: 4, VP2 with the amino acid sequence of SEQ ID NO: 14, and VP3 with the amino acid sequence of SEQ ID NO: 15, and the expression cassette includes the following elements in the direction from the 5'-end to the 3'-end:
CMV энхансер;CMV enhancer;
CMV промотер;CMV promoter;
интрон гена hBG1 (ген субъединицы гемоглобина гамма-1);hBG1 gene intron (gamma-1 hemoglobin subunit gene);
любую из вышеуказанных нуклеиновых кислот, которая кодирует вышеуказанный выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2;any of the above nucleic acids that encodes the above isolated recombinant receptor-binding domain of SARS-CoV-2 glycoprotein S (RBD-S);
сигнал полиаденилирования hGH1;hGH1 polyadenylation signal;
правый ITR.right ITR.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белки VP1 c аминокислотной последовательность SEQ ID NO: 4 с одной или несколькими точечными мутациями, VP2 c аминокислотной последовательность SEQ ID NO: 14 с одной или несколькими точечными мутациями и VP3 c аминокислотной последовательность SEQ ID NO: 15 с одной или несколькими точечными мутациями, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the recombinant AAV5-based virus has a capsid that includes VP1 proteins with the amino acid sequence of SEQ ID NO: 4 with one or more point mutations, VP2 with the amino acid sequence of SEQ ID NO: 14 with one or more point mutations, and VP3 with the amino acid sequence SEQ ID NO: 15 with one or more point mutations and the expression cassette includes the following elements in the 5' to 3' direction:
CMV энхансер;CMV enhancer;
CMV промотер;CMV promoter;
интрон гена hBG1;hBG1 gene intron;
любую из вышеуказанных нуклеиновых кислот, которая кодирует вышеуказанный выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2;any of the above nucleic acids that encodes the above isolated recombinant receptor-binding domain of SARS-CoV-2 glycoprotein S (RBD-S);
сигнал полиаденилирования hGH1;hGH1 polyadenylation signal;
правый ITR.right ITR.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белки VP1 c аминокислотной последовательность SEQ ID NO: 5, VP2 c аминокислотной последовательность SEQ ID NO: 16 и VP3 c аминокислотной последовательность SEQ ID NO: 17, а экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the recombinant AAV5-based virus has a capsid that includes the VP1 proteins with the amino acid sequence of SEQ ID NO: 5, VP2 with the amino acid sequence of SEQ ID NO: 16, and VP3 with the amino acid sequence of SEQ ID NO: 17, and the expression cassette includes the following elements in the direction from the 5'-end to the 3'-end:
CMV энхансер;CMV enhancer;
CMV промотер;CMV promoter;
интрон гена hBG1;hBG1 gene intron;
любую из вышеуказанных нуклеиновых кислот, которая кодирует вышеуказанный выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2;any of the above nucleic acids that encodes the above isolated recombinant receptor-binding domain of SARS-CoV-2 glycoprotein S (RBD-S);
сигнал полиаденилирования hGH1;hGH1 polyadenylation signal;
правый ITR.right ITR.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5, имеющий аминокислотную последовательность SEQ ID NO: 4 или аминокислотную последовательность SEQ ID NO: 4 с одной или несколькими точечными мутациями, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 3.In some embodiments, the recombinant AAV5-based virus has a capsid that includes the AAV5 VP1 protein having the amino acid sequence of SEQ ID NO: 4 or the amino acid sequence of SEQ ID NO: 4 with one or more point mutations, and the expression cassette includes the nucleic acid of SEQ ID NO: : 3.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белок VP1 AAV5, имеющий аминокислотную последовательность SEQ ID NO: 4 с одной или несколькими точечными мутациями, представляет собой аминокислотную последовательностью SEQ ID NO: 5 (S2A и T711S).In some embodiments, the recombinant AAV5-based virus has a capsid that includes the AAV5 VP1 protein having the amino acid sequence of SEQ ID NO: 4 with one or more point mutations, is the amino acid sequence of SEQ ID NO: 5 (S2A and T711S).
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белки VP1 c аминокислотной последовательность SEQ ID NO: 4, VP2 c аминокислотной последовательность SEQ ID NO: 14 и VP3 c аминокислотной последовательность SEQ ID NO: 15, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 3.In some embodiments, the recombinant AAV5-based virus has a capsid that includes the VP1 proteins with the amino acid sequence of SEQ ID NO: 4, VP2 with the amino acid sequence of SEQ ID NO: 14, and VP3 with the amino acid sequence of SEQ ID NO: 15, and the expression cassette includes the nucleic acid with SEQ ID NO: 3.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белки VP1 c аминокислотной последовательность SEQ ID NO: 4 с одной или несколькими точечными мутациями, VP2 c аминокислотной последовательность SEQ ID NO: 14 с одной или несколькими точечными мутациями и VP3 c аминокислотной последовательность SEQ ID NO: 15 с одной или несколькими точечными мутациями, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 3.In some embodiments, the recombinant AAV5-based virus has a capsid that includes VP1 proteins with the amino acid sequence of SEQ ID NO: 4 with one or more point mutations, VP2 with the amino acid sequence of SEQ ID NO: 14 with one or more point mutations, and VP3 with the amino acid sequence SEQ ID NO: 15 with one or more point mutations, and the expression cassette includes the nucleic acid of SEQ ID NO: 3.
В некоторых вариантах рекомбинантный вирус на основе AAV5 имеет капсид, который включает белки VP1 c аминокислотной последовательность SEQ ID NO: 5, VP2 c аминокислотной последовательность SEQ ID NO: 16 и VP3 c аминокислотной последовательность SEQ ID NO: 17, а экспрессионная кассета включает нуклеиновую кислоту с SEQ ID NO: 3.In some embodiments, the recombinant AAV5-based virus has a capsid that includes the VP1 proteins with the amino acid sequence of SEQ ID NO: 5, VP2 with the amino acid sequence of SEQ ID NO: 16, and VP3 with the amino acid sequence of SEQ ID NO: 17, and the expression cassette includes the nucleic acid with SEQ ID NO: 3.
Фармацевтическая композиция/вакцинаPharmaceutical composition/vaccine
В одном из аспектов настоящее изобретение относится к фармацевтической композиции для профилактики коронавирусной инфекции, вызванной вирусом SARS-CoV-2, которая включает любой из вышеуказанных рекомбинантных вирусов на основе AAV5 в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.In one aspect, the present invention relates to a pharmaceutical composition for the prevention of coronavirus infection caused by the SARS-CoV-2 virus, which includes any of the above recombinant AAV5-based viruses in combination with one or more pharmaceutically acceptable excipients.
В одном из аспектов настоящее изобретение относится к фармацевтической композиции для индукции специфического иммунитета к вирусу SARS-CoV-2, которая включает любой из вышеуказанных рекомбинантных вирусов на основе AAV5 в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.In one aspect, the present invention relates to a pharmaceutical composition for inducing specific immunity to the SARS-CoV-2 virus, which includes any of the above recombinant AAV5 viruses in combination with one or more pharmaceutically acceptable excipients.
В конкретных вариантах осуществления настоящее изобретение относится к фармацевтической композиции, содержащей рекомбинантный вирус на основе AAV5 по изобретению в фармацевтически приемлемом носителе или в других фармацевтических агентах, адъювантах, разбавителях и т.д. Носитель для инъекций обычно является жидким. Носитель для других способов введения может быть или твердым, или жидким, таким как стерильная апирогенная вода или стерильный апирогенный фосфатно-солевой буферный раствор. Для введения путем ингаляции носитель является вдыхаемым и предпочтительно находится в твердой или жидкой дисперсной форме. В качестве инъекционной среды предпочтительно использовать воду, содержащую добавки, общепринятые для инъекционных растворов, такие как стабилизирующие агенты, соли или солевые растворы и/или буферы.In specific embodiments, the present invention relates to a pharmaceutical composition comprising a recombinant AAV5 virus of the invention in a pharmaceutically acceptable carrier or other pharmaceutical agents, adjuvants, diluents, etc. The injection carrier is usually liquid. The carrier for other routes of administration may be either a solid or a liquid such as sterile pyrogen-free water or sterile pyrogen-free phosphate buffered saline. For administration by inhalation, the carrier is respirable and is preferably in solid or liquid particulate form. As the injection medium, it is preferable to use water containing additives conventional for injection solutions, such as stabilizing agents, salts or saline solutions and/or buffers.
«Фармацевтическая композиция» обозначает композицию, включающую в себя вышеуказанный рекомбинантный вирус на основе AAV5 по изобретению и, по крайней мере, один из компонентов, выбранных из группы, состоящей из фармацевтически приемлемых и фармакологически совместимых эксипиентов, таких как наполнители, растворители, разбавители, носители, вспомогательные, распределяющие, средства доставки, консерванты, стабилизаторы, эмульгаторы, суспендирующие агенты, загустители, регуляторы пролонгированной доставки, выбор и соотношение которых зависит от природы и способа назначения и дозировки. Фармацевтические композиции по настоящему изобретению и способы их изготовления будут бесспорно очевидными для специалистов в этой области. Производство фармацевтических композиций предпочтительно должно соответствовать требованиям GMP (надлежащей производственной практики). Композиция может включать буферную композицию, тонические агенты, стабилизаторы и солюбилизаторы. "Pharmaceutical composition" means a composition comprising the above recombinant AAV5 virus of the invention and at least one of the components selected from the group consisting of pharmaceutically acceptable and pharmacologically compatible excipients such as excipients, diluents, diluents, carriers , auxiliary, distributing, delivery vehicles, preservatives, stabilizers, emulsifiers, suspending agents, thickeners, delayed delivery regulators, the choice and ratio of which depends on the nature and method of administration and dosage. The pharmaceutical compositions of the present invention and methods for their manufacture will be undeniably obvious to those skilled in the art. The production of pharmaceutical compositions should preferably comply with GMP (Good Manufacturing Practice) requirements. The composition may include a buffer composition, tonic agents, stabilizers and solubilizers.
«Фармацевтически приемлемым» считается материал, который не имеет биологических или других противопоказаний, например, материал можно вводить субъекту без каких-либо нежелательных биологических эффектов. Таким образом, такие фармацевтические композиции можно использовать, например, для трансфекции клетки ex vivo или для введения in vivo рекомбинантного вируса на основе AAV5 по изобретению непосредственно субъекту."Pharmaceutical acceptable" means a material that has no biological or other contraindications, for example, the material can be administered to a subject without any undesirable biological effects. Thus, such pharmaceutical compositions can be used, for example, to transfect a cell ex vivo or to administer in vivo a recombinant AAV5 virus of the invention directly to a subject.
Термин «эксципиент» или «вспомогательное вещество» используется в данном документе для описания любого компонента, отличающегося от ранее описанных по данному изобретению. Это вещества неорганического или органического происхождения, используемые в процессе производства, изготовления лекарственных препаратов для придания им необходимых физико-химических свойств.The term "excipient" or "adjuvant" is used herein to describe any component other than those previously described in this invention. These are substances of inorganic or organic origin used in the production process, the manufacture of medicines to give them the necessary physical and chemical properties.
Под «стабилизатором» понимается вспомогательное вещество или смесь двух и более вспомогательных веществ, которые обеспечивают физическую и/или химическую стабильность активного агента.By "stabilizer" is meant an excipient or a mixture of two or more excipients which provide physical and/or chemical stability to the active agent.
Под термином «буфер», «буферная композиция», «буферный агент» понимается раствор, способный сохранять значение pH, благодаря взаимодействию кислотных и щелочных компонентов, входящих в его состав, который дает возможность препарату вектора на основе rAAV5, проявлять устойчивость к изменениям рН. В общем случае, преимущественными являются значения рН фармацевтической композиции от 4,0 до 8,0. В качестве буферных агентов могут быть использованы, например, ацетатный, фосфатный, цитратный, гистидиновый, сукцинатный и т.п. буферные растворы, но, не ограничиваясь ими.The term "buffer", "buffer composition", "buffer agent" refers to a solution capable of maintaining the pH value due to the interaction of the acidic and alkaline components that make up its composition, which enables the rAAV5-based vector preparation to be resistant to changes in pH. In general, pH values of the pharmaceutical composition between 4.0 and 8.0 are preferred. As buffer agents, for example, acetate, phosphate, citrate, histidine, succinate, and the like can be used. buffer solutions, but not limited to.
Фармацевтическая композиция является «стабильной», если активный агент сохраняет свою физическую стабильность и/или химическую стабильность и/или биологическую активность в течение заявленного срока годности при температуре хранения, например, при 2-8 ºС. Предпочтительно, чтобы активный агент сохранял и физическую, и химическую стабильность, а также биологическую активность. Период хранения выбирается на основании результатов исследования стабильности при ускоренном и естественном хранении.A pharmaceutical composition is "stable" if the active agent retains its physical stability and/or chemical stability and/or biological activity during the stated shelf life at a storage temperature, for example, at 2-8°C. Preferably, the active agent retains both physical and chemical stability, as well as biological activity. The storage period is selected based on the results of a stability study with accelerated and natural storage.
Фармацевтическая композиция по данному изобретению может изготавливаться, упаковываться или широко продаваться в виде единичной стандартной дозы или множества единичных стандартных доз в виде готовой лекарственной формы. Используемый в данном документе термин «единичная стандартная доза» означает дискретное количество фармацевтической композиции, содержащей заранее определенное количество активного ингредиента. Количество активного ингредиента обычно равно дозировке активного ингредиента, который будет вводиться субъекту, или удобной части такой дозировки, например, половине или трети такой дозировки.The pharmaceutical composition of the present invention may be formulated, packaged, or widely sold as a single unit dose or multiple unit dose units in the form of a finished dosage form. As used herein, the term "unit dosage unit" means a discrete amount of a pharmaceutical composition containing a predetermined amount of an active ingredient. The amount of active ingredient is usually equal to the dosage of the active ingredient to be administered to the subject, or a convenient fraction of such dosage, for example, half or one third of such dosage.
В одном из аспектов настоящее изобретение относится к вакцине для профилактики коронавирусной инфекции, вызванной вирусом SARS-CoV-2, которая включает любой из вышеуказанных рекомбинантных вирусов на основе AAV5 в эффективном количестве.In one aspect, the present invention relates to a vaccine for the prevention of coronavirus infection caused by the SARS-CoV-2 virus, which includes any of the above recombinant AAV5-based viruses in an effective amount.
В одном из аспектов настоящее изобретение относится к вакцине для индукции специфического иммунитета к вирусу SARS-CoV-2, которая включает любой из вышеуказанных рекомбинантных вирусов на основе AAV5 в эффективном количестве.In one aspect, the present invention relates to a vaccine for inducing specific immunity to the SARS-CoV-2 virus, which comprises any of the above recombinant AAV5-based viruses in an effective amount.
Термин «вакцина» относится к иммуногенной композиции, включающей антиген, полученный от патогена, который используется для индуцирования иммунного ответа против патогена, который обеспечивает защитный иммунитет (например, иммунитет, который защищает субъекта от инфекции, вызываемой патогеном, и/или ослабляет тяжесть заболевания или состояния, вызываемого инфекцией вследствие патогена). Защитный иммунитет может включать формирование антител и/или клеточно-опосредованный ответ.The term "vaccine" refers to an immunogenic composition comprising an antigen derived from a pathogen that is used to induce an immune response against the pathogen that provides protective immunity (e.g., immunity that protects the subject from infection caused by the pathogen and/or attenuates the severity of disease or a condition caused by infection due to a pathogen). Protective immunity may include antibody formation and/or a cell-mediated response.
В зависимости от контекста термин «вакцина» может также относиться к суспензии или раствору антигена, который вводят позвоночному для выработки защитного иммунитета.Depending on the context, the term "vaccine" may also refer to a suspension or solution of an antigen that is administered to a vertebrate to elicit protective immunity.
Вакцина включает рекомбинантный вирус на основе AAV5, который содержится предпочтительно в биологически эффективном количестве. «Биологически эффективное» количество рекомбинантного вируса представляет собой количество, которое достаточно, чтобы вызвать инфекцию (или трансдукцию) и экспрессию гетерологичной последовательности нуклеиновой кислоты в клетке. Если вирус вводят в клетку in vivo (например, вирус вводят субъекту, как описано ниже), «биологически эффективное» количество вирусного вектора представляет собой количество, которое достаточно, чтобы вызвать трансдукцию и экспрессию гетерологичной последовательности нуклеиновой кислоты в клетке-мишени.The vaccine comprises a recombinant AAV5 virus which is preferably contained in a biologically effective amount. A "biologically effective" amount of a recombinant virus is an amount that is sufficient to cause infection (or transduction) and expression of a heterologous nucleic acid sequence in a cell. When a virus is administered to a cell in vivo (e.g., the virus is administered to a subject as described below), a "biologically effective" amount of the viral vector is an amount that is sufficient to cause transduction and expression of the heterologous nucleic acid sequence in the target cell.
Все определения и пояснения, относящиеся к фармацевтической композиции, также относятся и к вакцине.All definitions and explanations relating to a pharmaceutical composition also apply to a vaccine.
ПрименениеApplication
В одном из аспектов настоящее изобретение относится к применению любого из вышеуказанных рекомбинантных вирусов на основе AAV5 или вышеуказанной фармацевтической композиции для профилактики коронавирусной инфекции, вызванной вирусом SARS-CoV-2.In one aspect, the present invention relates to the use of any of the above recombinant AAV5 viruses or the above pharmaceutical composition for the prevention of SARS-CoV-2 coronavirus infection.
В одном из аспектов настоящее изобретение относится к применению любого из вышеуказанных рекомбинантных вирусов на основе AAV5 или вышеуказанной фармацевтической композиции для индукции специфического иммунитета к вирусу SARS-CoV-2.In one aspect, the present invention relates to the use of any of the above recombinant AAV5 viruses or the above pharmaceutical composition to induce specific immunity to the SARS-CoV-2 virus.
В одном из аспектов настоящее изобретение относится к способу индукции специфического иммунитета к вирусу SARS-CoV-2, который включает введение в организм млекопитающих любого из вышеуказанных рекомбинантных вирусов на основе AAV5, вышеуказанной композиции или вышеуказанной вакцины для индукции специфического иммунитета к вирусу SARS-CoV-2, в эффективном количестве.In one aspect, the present invention relates to a method for inducing specific immunity to the SARS-CoV-2 virus, which comprises administering to a mammalian body any of the above AAV5-based recombinant viruses, the above composition, or the above vaccine to induce specific immunity to the SARS-CoV-2 virus. 2 in an effective amount.
В одном из аспектов настоящее изобретение относится к способу для профилактики коронавирусной инфекции, вызванной вирусом SARS-CoV-2, включающий введение в организм млекопитающих любого из вышеуказанных рекомбинантных вирусов на основе AAV5, вышеуказанной композиции или вышеуказанной вакцины для профилактики коронавирусной инфекции, вызванной вирусом SARS-CoV-2, в эффективном количестве.In one aspect, the present invention relates to a method for preventing SARS-CoV-2 coronavirus infection, comprising administering to a mammalian body any of the above AAV5-based recombinant viruses, the above composition, or the above vaccine for preventing SARS-CoV-2 coronavirus infection. CoV-2, in an effective amount.
Любой способ введения рекомбинантного вируса на основе AAV5, принятый в данной области, может соответствующим образом использоваться для вышеуказанного рекомбинантного вируса на основе AAV5 по данному изобретению.Any method of introducing the recombinant AAV5-based virus accepted in the art can be appropriately used for the above recombinant AAV5-based virus of the present invention.
Примеры способов введения включают в себя местное применение, интраназальное, ингаляционное, чресслизистое, трансдермальное, энтеральное (например, пероральное, ректальное), парентеральное (например, внутривенное, подкожное, внутрикожное, внутримышечное) введения, а также инъекции непосредственно в ткань или в орган.Examples of routes of administration include topical, intranasal, inhalation, transmucosal, transdermal, enteral (eg, oral, rectal), parenteral (eg, intravenous, subcutaneous, intradermal, intramuscular) administration, as well as injection directly into a tissue or organ.
Инъекционные препараты могут быть приготовлены в общепринятых лекарственных формах: в виде жидких растворов или суспензий, твердых форм, подходящих для приготовления растворов или суспензий в жидкости перед инъекцией, или в виде эмульсий. Альтернативно, можно вводить вышеуказанный рекомбинантный вирус на основе AAV5 по данному изобретению локально, а не системно, например, в виде депо или в композиции с замедленным высвобождением.Injectable preparations can be prepared in conventional dosage forms: as liquid solutions or suspensions, solid forms suitable for preparation of solutions or suspensions in liquid prior to injection, or as emulsions. Alternatively, the above recombinant AAV5 virus of the present invention may be administered locally rather than systemically, for example as a depot or in sustained release formulations.
Рекомбинантный вирус на основе AAV5 вводят в организм в эффективном количестве. Рекомбинантный вирус на основе AAV5 предпочтительно вводят в организм в биологически эффективном количестве. «Биологически эффективное» количество рекомбинантного вируса представляет собой количество, которое достаточно, чтобы вызвать инфекцию (или трансдукцию) и экспрессию гетерологичной последовательности нуклеиновой кислоты в клетке. Если вирус вводят в клетку in vivo (например, вирус вводят субъекту, как описано ниже), «биологически эффективное» количество вирусного вектора представляет собой количество, которое достаточно, чтобы вызвать трансдукцию и экспрессию гетерологичной последовательности нуклеиновой кислоты в клетке-мишени.The recombinant AAV5 virus is administered to the body in an effective amount. The recombinant AAV5 virus is preferably administered to the body in a biologically effective amount. A "biologically effective" amount of a recombinant virus is an amount that is sufficient to cause infection (or transduction) and expression of a heterologous nucleic acid sequence in a cell. When a virus is administered to a cell in vivo (e.g., the virus is administered to a subject as described below), a "biologically effective" amount of the viral vector is an amount that is sufficient to cause transduction and expression of the heterologous nucleic acid sequence in the target cell.
Дозировки вышеуказанного рекомбинантного вируса на основе AAV5 по данному изобретению будут зависеть от способа введения, конкретного вирусного вектора и их можно определять рутинными способами. Примерными дозами для достижения терапевтического эффекта являются вирусные титры, составляющие по меньшей мере примерно 105, 106, 107, 108, 109, 1010, 1011, 1012, 1013, 1014, 1015, 1016 трансдуцирующих единиц или больше, предпочтительно приблизительно от 108 до 1013 трансдуцирующих единиц, еще более предпочтительно 1012 трансдуцирующих единиц.Dosages of the above recombinant AAV5 virus of the present invention will depend on the route of administration, the particular viral vector, and may be determined by routine methods. Exemplary doses to achieve a therapeutic effect are viral titers of at least about 105 , 106 , 107 , 108 , 109 , 1010 , 1011 , 1012 , 1013 , 1014 , 1015 , 1016 transducing units or more, preferably from about 108 to 1013 transducing units, even more preferably 1012 transducing units.
Клетка для введения вышеуказанного рекомбинантного вируса на основе AAV5 по изобретению может быть клеткой любого типа, включая в себя без ограничения, эпителиальные клетки (например, эпителиальные клетки кожи, дыхательных путей и кишечника), печеночные клетки, мышечные клетки, клетки селезенки, фибробласты, эндотелиальные клетки и тому подобное.The cell for administration of the above recombinant AAV5 virus of the invention may be any type of cell, including, but not limited to, epithelial cells (e.g., skin, respiratory, and intestinal epithelial cells), liver cells, muscle cells, spleen cells, fibroblasts, endothelial cells and the like.
Вышеуказанный рекомбинантный вирус на основе AAV5 не используется для модификации генетической целостности клеток зародышевой линии человека.The above recombinant AAV5 virus is not used to modify the genetic integrity of human germline cells.
ПримерыExamples
Для наилучшего понимания изобретения приводятся следующие примеры. Эти примеры приведены только в иллюстративных целях и не должны толковаться как ограничивающие сферу применения изобретения в любой форме.For a better understanding of the invention, the following examples are given. These examples are provided for illustrative purposes only and should not be construed as limiting the scope of the invention in any form.
Все публикации, патенты и патентные заявки, указанные в этой спецификации включены в данный документ путем отсылки. Хотя вышеупомянутое изобретение было довольно подробно описано путем иллюстрации и примера в целях исключения двусмысленного толкования, специалистам в данной области на основе идей, раскрытых в данном изобретении, будет вполне понятно, что могут быть внесены определенные изменения и модификации без отклонения от сущности и объема прилагаемых вариантов осуществления изобретения.All publications, patents, and patent applications referenced in this specification are incorporated herein by reference. Although the above invention has been described in some detail by way of illustration and example in order to avoid ambiguous interpretation, it will be quite clear to those skilled in the art based on the ideas disclosed in this invention that certain changes and modifications can be made without deviating from the essence and scope of the attached options. implementation of the invention.
Материалы и общие методыMaterials and General Methods
Методы рекомбинантной ДНКRecombinant DNA methods
Для манипуляций с ДНК использовали стандартные методы, описанные у Sambrook J. и др., Molecular cloning: A laboratory manual; Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989. Реагенты для молекулярной биологии использовали согласно инструкциям производителей. Вкратце, плазмидную ДНК нарабатывали для дальнейших манипуляций в клетках E. coli, выращиваемых под селективным давлением с антибиотиками для того, чтобы плазмиды не терялись в клеточной популяции. Плазмидную ДНК выделяли из клеток коммерческими наборами, измеряли концентрацию и использовали для клонирования с помощью обработки эндонуклеазами рестрикции или методами ПЦР-амплификации. Фрагменты ДНК лигировали между собой с помощью лигаз и трансформировали в бактериальные клетки для отбора клонов и дальнейших наработок. Все полученные генетические конструкции подтверждали по паттернам рестрикции и полным секвенированием по Сэнгеру.For DNA manipulation, standard methods were used as described in Sambrook J. et al., Molecular cloning: A laboratory manual; Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989. Molecular biology reagents were used according to the manufacturer's instructions. Briefly, plasmid DNA was generated for further manipulations in E. coli cells grown under selective pressure with antibiotics to ensure that plasmids were not lost in the cell population. Plasmid DNA was isolated from cells with commercial kits, the concentration was measured and used for cloning by restriction endonucleases or PCR amplification methods. The DNA fragments were ligated with each other using ligases and transformed into bacterial cells for selection of clones and further developments. All resulting genetic constructs were confirmed by restriction patterns and complete Sanger sequencing.
Синтез геновGene synthesis
Требуемые сегменты генов получали из олигонуклеотидов, созданных путем химического синтеза. Генные сегменты длиной от 300 до 1000 п. н., которые фланкированы уникальными сайтами рестрикции, собирали путем ренатурации олигонуклеотидов друг на друге с последующей ПЦР-амплификацией с крайних праймеров. В результате получали смесь фрагментов, включая нужный. Фрагменты клонировали по сайтам рестрикции в промежуточные векторы, после чего последовательности ДНК субклонированных фрагментов подтверждали путем секвенирования ДНК.The desired gene segments were obtained from oligonucleotides created by chemical synthesis. Gene segments ranging in length from 300 to 1000 bp, which are flanked by unique restriction sites, were assembled by renaturation of oligonucleotides on top of each other followed by PCR amplification from the outermost primers. The result was a mixture of fragments, including the desired one. The fragments were cloned at the restriction sites into intermediate vectors, after which the DNA sequences of the subcloned fragments were confirmed by DNA sequencing.
Определение последовательностей ДНКDetermination of DNA sequences
Последовательности ДНК определяли путем секвенирования по Сэнгеру. Анализ последовательностей ДНК и белков и обработку данных о последовательностях осуществляли в программе SnapGene 4.2 и выше для создания, картирования, анализа, аннотирования и иллюстрации последовательностей.DNA sequences were determined by Sanger sequencing. DNA and protein sequence analysis and sequence data processing was performed with SnapGene 4.2 and higher software to create, map, analyze, annotate and illustrate sequences.
Культивирование клеточных культурCultivation of cell cultures
В экспериментах были использованы клеточные линии HEK293 (Human Embryonic Kidney clone 293) и CHO-K1-S (Chinese Hamster Ovary Cells). Суспензионные клетки HEK293, используемые для наработки AAV, культивировались в стандартных условиях при 37°С и 5% СO2, на полной питательной среде без FBS и антибиотика. Адгезионные клетки CHO-K1-S, используемые для проверки эффективности препаратов AAV, культивировались в стандартных условиях при 37°С и 5% СO2, на полной питательной среде DMEM/F12 добавлением 5% FBS, антибиотика/антимикотика. Пересев клеток CHO-K1-S осуществлялся при достижении 80-90% конфлюентности. Жизнеспособность клеток оценивалась с помощью окраски Trypan Blue и камеры Горяева либо с помощью окраски PI и проточной цитометрии.The cell lines HEK293 (Human Embryonic Kidney clone 293) and CHO-K1-S (Chinese Hamster Ovary Cells) were used in the experiments. Suspension HEK293 cells used for AAV production were cultured under standard conditions at 37°C and 5% CO2 in complete nutrient medium without FBS and antibiotic. CHO-K1-S adherent cells used to test the effectiveness of AAV preparations were cultured under standard conditions at 37° C. and 5% CO2 in complete DMEM/F12 nutrient medium supplemented with 5% FBS, antibiotic/antimycotic. Reseeding of CHO-K1-S cells was carried out when 80-90% confluence was reached. Cell viability was assessed using Trypan Blue stain and Goryaev camera or using PI stain and flow cytometry.
Определение уровня белка RBD-S и специфических антител к белку RBD-SDetermination of the level of RBD-S protein and specific antibodies to the RBD-S protein
Оценку содержания белка RBD-S после трансдукции клеток и антител к белку RBD-S в плазме крови животных после иммунизации проводили посредством постановки твердофазного иммуноферментного анализа (ИФА) с применением пероксидазы хрена в качестве индикаторного фермента. Вкратце, лунки 96-луночного планшета сенсибилизировали первичными антителами к белку RBD-S, после наслаивали исследуемые образцы. В случае постановки ИФА на выявление антител к белку RBD-S – сенсибилизацию планшета проводили белком RBD-S, после в лунки вносили плазму крови животных. Далее к образцам добавляли вторичные антитела к RBD-S (при анализе на сам белок) или вторичные антитела к иммуноглобулинам экспериментальных животных (при анализе на наличие антител к RBD-S), меченные биотином и конъюгат стрептавидин-HRP. После вносили раствор TMB для визуализации ферментативной реакции и стоп-раствор для остановки развития реакции.The content of the RBD-S protein after transduction of cells and antibodies to the RBD-S protein in the blood plasma of animals after immunization was assessed by staging enzyme-linked immunosorbent assay (ELISA) using horseradish peroxidase as an indicator enzyme. Briefly, the wells of a 96-well plate were sensitized with primary antibodies to the RBD-S protein, after which the test samples were layered. In the case of ELISA for the detection of antibodies to the RBD-S protein, the plate was sensitized with the RBD-S protein, after which the blood plasma of animals was added to the wells. Next, secondary antibodies to RBD-S (when analyzed for the protein itself) or secondary antibodies to immunoglobulins of experimental animals (when analyzed for the presence of antibodies to RBD-S) labeled with biotin and streptavidin-HRP conjugate were added to the samples. After that, a TMB solution was added to visualize the enzymatic reaction and a stop solution to stop the development of the reaction.
Для определения концентрации RBD-S/антител к RBD-S в исследуемых образцах, строили калибровочную кривую зависимости оптической плотности раствора от концентрации RBD-S/ антител к RBD-S в стандартных образцах и по оптической плотности тестируемого образца находили концентрацию.To determine the concentration of RBD-S/anti-RBD-S antibodies in the test samples, a calibration curve of the dependence of the optical density of the solution on the concentration of RBD-S/ antibodies to RBD-S in standard samples was built, and the concentration was found from the optical density of the test sample.
Сборка и очистка вирусных частиц рекомбинантных векторов AAVAssembly and Purification of Viral Particles of Recombinant AAV Vectors
Для сборки вирусных частиц AAV, содержащих ген RBD-S, использовали клетки-продуценты HEK293, которые трансфецировали 3-мя плазмидами:To assemble AAV virus particles containing the RBD-S gene, HEK293 producing cells were used, which were transfected with 3 plasmids:
Плазмида pAAV-RBD-S, содержащая геном AAV с кассетой для экспрессии трансгена RBD-S (Фиг.1);Plasmid pAAV-RBD-S containing the AAV genome with a cassette for the expression of the RBD-S transgene (Figure 1);
Плазмида для экспрессии гена Cap серотипа AAV5 и гена Rep серотипа AAV2. Каждый ген с помощью альтернативных рамок считывания кодирует несколько белковых продуктов;Plasmid for the expression of the Cap gene of the AAV5 serotype and the Rep gene of the AAV2 serotype. Each gene encodes several protein products using alternative reading frames;
Плазмида для экспрессии генов аденовируса Ad5, необходимых для сборки и упаковки капсидов AAV.Plasmid for expression of adenovirus Ad5 genes required for assembly and packaging of AAV capsids.
Через 72 часа клетки лизировали и проводили очистку и концентрирование вирусных частиц с помощью методов фильтрации, хроматографии и ультрацентрифугирования. Титр вирусных частиц определяли с помощью количественной ПЦР с праймерами и пробой, специфичными к участку рекомбинантного вирусного генома и выражали в виде количества копий вирусных геномов на 1 мл.After 72 hours, the cells were lysed and the virus particles were purified and concentrated using filtration, chromatography and ultracentrifugation methods. The titer of viral particles was determined using quantitative PCR with primers and a probe specific to the region of the recombinant viral genome and expressed as the number of copies of viral genomes per 1 ml.
Трансдукция клеточных культурCell culture transduction
Клеточную линию заранее засевали в лунки 6-луночных планшетов с плотностью посадки 10 000 кл/см2, после чего добавляли препарат с вирусными частицами при MOI 100 000 вг/кл и MOI 500 000 вг/кл, на 3 день определяли содержание белка RBD-S методом ИФА, как описано выше. Эффективность трансдукции считали, анализируя процент GFP-положительных клеток.The cell line was seeded in advance in the wells of 6-well plates with a planting densityof 10,000 cells/cm2, after which the drug with viral particles was added at MOI 100,000 vg/cl and MOI 500,000 vg/cl, on the 3rd day the content of RBD-protein was determined. S by ELISA as described above. Transduction efficiency was calculated by analyzing the percentage of GFP-positive cells.
После трансдукции клетки линии CHO-K1-S снимали с культуральных планшетов с помощью TrypLE, отмывали в PBS и анализировали экспрессию белка как описано выше.After transduction, CHO-K1-S cells were removed from culture plates with TrypLE, washed in PBS, and protein expression was analyzed as described above.
Все работы проводились в 3 независимых экспериментах. Для негативного контроля были использованы интактные клетки.All work was carried out in 3 independent experiments. Intact cells were used as a negative control.
Проведение in vivo исследования на лабораторных животныхConducting in vivo research on laboratory animals
Для экспериментов были использованы мыши линии BALB/c (самцы и самки возрастом 6-8 недель). Иммунизацию проводили однократно путем внутримышечного введения препаратов в тазовые конечности. Группе животных отрицательного контроля вводился буферный раствор, положительного контроля – смесь белка RBD-S, полного адъюванта Фрейнда и физиологического раствора. BALB/c mice (males and females aged 6-8 weeks) were used for the experiments. Immunization was carried out once by intramuscular injection of drugs into the pelvic limbs. The group of animals of the negative control was injected with a buffer solution, the positive control - a mixture of RBD-S protein, complete Freund's adjuvant and physiological saline.
Отбор плазмы крови производился в день инъекции до введения препаратов, далее – на 14, 21, 27, 42 и 56 день после проведения иммунизации.Blood plasma sampling was carried out on the day of injection before the administration of drugs, then on the 14th, 21st, 27th, 42nd and 56th days after immunization.
Пример 1. Выбор последовательности RBD-S вируса SARS-CoV-2Example 1 Sequence Selection of RBD-S of the SARS-CoV-2 Virus
При разработке антигена RBD-S вируса SARS-CoV-2 был проведен анализ структуры 5WRG белка Spike Glycoprotein вируса SARS-CoV из статьи Gui M. ET AL., Cryo-electron microscopy structures of the SARS-CoV spike glycoprotein reveal a prerequisite conformational state for receptor binding, 2017, Cell Res. 27, p. 119–129. Проведенный нами анализ структуры белка Spike Glycoprotein вируса SARS-CoV показал, что для иммунизации возможно использовать как консервативный домен RBD-S, так и его удлиненную часть. На основании проведенного нами анализа было установлено, что увеличение длины рассматриваемого участка RBD-S должно способствовать стабилизации структуры белка RBD-S за счет сохранения вторичных структур, которые повышают вероятность сохранения стабильной конфирмации белка без стремления к расплетанию. При этом незначительное увеличение длины домена RBD-S не должно сказываться на результатах иммунизации. Вышеуказанный анализ структуры белка Spike Glycoprotein вируса SARS-CoV был экстраполирован на структуру белка Spike Glycoprotein вируса SARS-CoV-2. Кроме того, в структуру белка RBD-S вируса SARS-CoV-2 была введена замена ближайшего к домену неспаренного цистеина на серин (аминокислотная замена в положении C272S) для обеспечения дополнительной стабильности белка RBD-S вируса SARS-CoV-2.During the development of the RBD-S antigen of the SARS-CoV-2 virus, an analysis was made of the structure of the 5WRG protein Spike Glycoprotein of the SARS-CoV virus from the article Gui M. ET AL., Cryo-electron microscopy structures of the SARS-CoV spike glycoprotein reveal a prerequisite conformational state for receptor binding, 2017, Cell Res. 27, p. 119–129. Our analysis of the structure of the Spike Glycoprotein of the SARS-CoV virus showed that both the conserved RBD-S domain and its extended part can be used for immunization. Based on our analysis, it was found that an increase in the length of the considered RBD-S region should contribute to the stabilization of the RBD-S protein structure due to the preservation of secondary structures, which increase the likelihood of maintaining a stable protein confirmation without a tendency to unwind. At the same time, a slight increase in the length of the RBD-S domain should not affect the results of immunization. The above analysis of the SARS-CoV Spike Glycoprotein protein structure was extrapolated to the structure of the SARS-CoV-2 Spike Glycoprotein protein. In addition, the substitution of the unpaired cysteine closest to the domain for serine (an amino acid substitution at position C272S) was introduced into the structure of the RBD-S protein of the SARS-CoV-2 virus to provide additional stability of the RBD-S protein of the SARS-CoV-2 virus.
Таким образом, в качестве антигена RBD-S вируса SARS-CoV-2 была выбрана следующая аминокислотная последовательность c SEQ ID NO:1.Thus, the following amino acid sequence c SEQ ID NO:1 was chosen as the RBD-S antigen of the SARS-CoV-2 virus.
Данный антиген будет использован для эффективной иммунизации млекопитающих (См. Пример 5).This antigen will be used for effective immunization of mammals (See Example 5).
Пример 2. Сборка генетической конструкции, содержащей экспрессионную кассету AAV с рекомбинантным геном RBD-S.Example 2 Assembly of a genetic construct containing an AAV expression cassette with a recombinant RBD-S gene.
Целевая плазмида pAAV-RBD-S (Фиг. 1), предназначенная для получения вирусных векторов AAV5 с экспрессионной кассетой, включающей ген RBD-S (SEQ ID NO:1.), была получена путем замены последовательности модифицированного зеленого флуоресцентного белка в исходной конструкции pAAV-GFP Control plasmid (VPK-402) от CellBiolab (США), с помощью рестриктазно-лигазного метода клонирования по сайтам ClaI/BamHI, на последовательность RBD-S с сигнальным пептидом, синтезированную de novo из олигонуклеотидов, созданных путем химического синтеза, с добавлением сайтов рестрикции ClaI с 5’-конца и BamHI с 3’-конца.The target plasmid pAAV-RBD-S (Fig. 1) for the production of AAV5 viral vectors with an expression cassette containing the RBD-S gene (SEQ ID NO:1.) was obtained by replacing the sequence of the modified green fluorescent protein in the original pAAV construct -GFP Control plasmid (VPK-402) from CellBiolab (USA), using restriction ligase cloning at the ClaI/BamHI sites, on the RBD-S sequence with a signal peptide synthesized de novo from oligonucleotides created by chemical synthesis, with the addition restriction sites for ClaI at the 5' end and BamHI at the 3' end.
Конечный вектор содержит все необходимые элементы для экспрессии гена и сборки в составе генома рекомбинантного AAV:The final vector contains all the necessary elements for gene expression and assembly in the recombinant AAV genome:
1) Терминальные повторы ITR на концах последовательности, которая инкапсидируется в вирусный капсид;1) Terminal ITR repeats at the ends of the sequence that encapsulates into the viral capsid;
2) Элементы для экспрессии целевого гена (промотор, энхансер, интрон, последовательность Kozak, трансген, сайт полиаденилирования);2) Elements for target gene expression (promoter, enhancer, intron, Kozak sequence, transgene, polyadenylation site);
3) Ориджин бактериальной репликации и ген устойчивости к антибиотику для наработки плазмидной ДНК в бактериальных клетках.3) Origin of bacterial replication and antibiotic resistance gene for production of plasmid DNA in bacterial cells.
Пример 3. Создание вирусных препаратов, экспрессирующих RBD-SExample 3 Design of Viral Preparations Expressing RBD-S
Целевая плазмида pAAV-RBD-S (Фиг 1.) вместе с остальными плазмидами, необходимыми для получения вирусных частиц рекомбинантного AAV (см. выше), были использованы для наработки препарата AAV5-RBD-S. В результате биопроцесса были получены рекомбинантные вирусные частицы AAV5-RBD-S, содержащие экспрессионную кассету с геном RBD-S. Очищенный препарат AAV5-RBD-S, используемый для проведения in vitro и in vivo исследований был подготовлен с применением стандартным буферов и эксципиентов, которые являются безопасными и не изменяют свойств AAV. Концентрация очищенного препарата AAV5-RBD-S составляла 4,6×1011 и 1,8×1012VG/mL.The target plasmid pAAV-RBD-S (Fig. 1) along with the rest of the plasmids required to obtain recombinant AAV virus particles (see above) were used to generate the AAV5-RBD-S preparation. As a result of the bioprocess, recombinant AAV5-RBD-S viral particles containing an expression cassette with the RBD-S gene were obtained. The purified preparation of AAV5-RBD-S used for in vitro and in vivo studies was prepared using standard buffers and excipients that are safe and do not alter the properties of AAV. The concentration of the purified AAV5-RBD-S preparation was 4.6×1011 and 1.8×1012 VG/mL.
Пример 4. Проверка работоспособности препарата AAV5-RBD-S in vitroExample 4 Performance Test of AAV5-RBD-S In Vitro
Перед проведением исследований на животных очищенный препарата AAV5-RBD-S был протестирован in vitro. Данные эксперименты были проведены с использованием адгезионной клеточной линии CHO-K1-S (Фиг. 2). В лунки 6-луночных планшетов были посеяны клетки линии CHO-K1-S. Посев проводили в ростовую среду: ДМЕМ/F12 с глутамином, содержание глюкозы 4,5 г/л, 5% сыворотки эмбриональной телячьей (FBS).The purified AAV5-RBD-S preparation was tested in vitro prior to animal studies. These experiments were carried out using the adherent cell line CHO-K1-S (FIG. 2). The wells of 6-well plates were seeded with CHO-K1-S cells. Seeding was carried out in growth medium: DMEM/F12 with glutamine, glucose content 4.5 g/l, 5% fetal calf serum (FBS).
Плотность посадки клеток составила 10 000 клеток/см2. При постановке трансдукции подготовленные заранее клетки были трансдуцированы при MOI 100 000 вг/клетка и MOI 500 000 вг/клетка. Все образцы были поставлены в трипликатах. Для негативного контроля были использованы интактные клетки. После успешной трансдукции клетки линии CHO-K1-S снимали с подложки, отмывали в фосфатном буфере и анализировали экспрессию белка RBD-S методом иммуноферментного анализа (ИФА), как описано выше. Было показано, что разработанный нами препарат позволяет эффективно доставить трансген RBD-S в клетки и обеспечить продукцию целевого белка, что подтверждается данными проведенного ИФА анализа (Фиг 2.).The cell density was 10,000 cells/cm2 . When setting up the transduction, pre-prepared cells were transduced at an MOI of 100,000 vg/cell and an MOI of 500,000 vg/cell. All samples were delivered in triplicates. Intact cells were used as a negative control. After successful transduction, CHO-K1-S cells were removed from the substrate, washed in phosphate buffer, and RBD-S protein expression was analyzed by enzyme immunoassay (ELISA) as described above. It was shown that the preparation developed by us makes it possible to effectively deliver the RBD-S transgene into cells and ensure the production of the target protein, which is confirmed by the data of the ELISA analysis (Fig. 2.).
Пример 5. Проверка работоспособности препарата AAV5-RBD-S in vivoExample 5 Performance Test of AAV5-RBD-S In Vivo Preparation
Для проведения in vivo исследований препарата AAV5-RBD-S были использованы лабораторные мыши линии BALB/с. В исследовании использовали две различные дозы препарата AAV5-RBD-S: низкую (1×1011 VG/мышь) и высокую (4×1011 VG/мышь). В качестве негативного контроля были использованы контрольный раствор без AAV и препарат AAV5, не содержащий экспрессионную кассету с геном RBD-S (пустые капсиды AAV5). В качестве положительного контроля использовали очищенный рекомбинантный белок RBD-S. Иммунизацию животных проводили однократно посредством внутримышечных инъекций в тазовые конечности. После проведения иммунизации через 0, 14, 21, 27, 42 и 56 дней определяли титр антител к белку RBD-S в плазме крови методом ИФА, как описано выше. В результате проведенных in vivo исследований было показано, что иммунизация препаратами AAV5-RBD-S приводит к выработке специфических антител к RBD-S (Фиг. 3А, 3Б, 4А и 4Б). При этом уровень антител к RBD-S был сопоставим с уровнем антител в группе животных, иммунизированных рекомбинантным белком RBD-S (Фиг. 6А и 6Б). В тоже время, не наблюдалась выработка антител к RBD-S в группах животных, которым вводили контрольный раствор без AAV и препарат AAV5, не содержащий экспрессионную кассету с геном RBD-S (пустые капсиды AAV5) (Фиг. 5, 7).For in vivo studies of the AAV5-RBD-S preparation, laboratory mice of the BALB/c line were used. The study used two different doses of AAV5-RBD-S preparation: low (1x1011 VG/mouse) and high (4x1011 VG/mouse). As a negative control, a control solution without AAV and an AAV5 preparation that did not contain an expression cassette with the RBD-S gene (empty AAV5 capsids) were used. Purified recombinant RBD-S protein was used as a positive control. Animals were immunized once by intramuscular injections into the pelvic limbs. After immunization, after 0, 14, 21, 27, 42, and 56 days, the titer of antibodies to the RBD-S protein in blood plasma was determined by ELISA, as described above. As a result of in vivo studies, it was shown that immunization with AAV5-RBD-S preparations leads to the production of specific antibodies to RBD-S (Fig. 3A, 3B, 4A and 4B). At the same time, the level of antibodies to RBD-S was comparable to the level of antibodies in the group of animals immunized with the recombinant RBD-S protein (Fig. 6A and 6B). At the same time, the production of antibodies to RBD-S was not observed in groups of animals that were injected with a control solution without AAV and an AAV5 preparation that did not contain an expression cassette with the RBD-S gene (AAV5 empty capsids) (Fig. 5, 7).
Таким образом, рекомбинантный вирус на основе AAV5 по изобретению и вакцина на его основе обладают высоким потенциалом для индукции специфического иммунитета к вирусу SARS-CoV-2 и могут использоваться для профилактики коронавирусной инфекции, вызванной вирусом SARS-CoV-2. Кроме того, они имеют преимущество перед классическими системами на основе рекомбинантных белковых антигенов т. к. вектор AAV способен обеспечить долговременную многолетнюю экспрессию антигена.Thus, the recombinant AAV5 virus according to the invention and the vaccine based on it have a high potential for inducing specific immunity to the SARS-CoV-2 virus and can be used to prevent coronavirus infection caused by the SARS-CoV-2 virus. In addition, they have an advantage over classical systems based on recombinant protein antigens, since the AAV vector is able to provide long-term long-term antigen expression.
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST
<110> ЗАО "БИОКАД"<110> CJSC "BIOKAD"
<120> Вакцина на основе AAV5 для индукции сепцифического иммунитета к вирусу<120> AAV5-based vaccine to induce specific immunity to the virus
SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 SARS-CoV-2 and/or prevention of coronavirus infection caused by SARS-CoV-2
<160> 17<160> 17
<170> BiSSAP 1.3.6<170> BiSSAP 1.3.6
<210> 1<210> 1
<211> 278<211> 278
<212> PRT<212> PRT
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> выделенный рекомбинантный рецептор-связывающий домен<223> isolated recombinant receptor-binding domain
гликопротеина S (RBD-S) вируса SARS-CoV-2 c аминокислотной glycoprotein S (RBD-S) of the SARS-CoV-2 virus with amino acid
заменой в 272 положении replacement at position 272
<400> 1<400> 1
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr AsnArg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
1 5 10 151 5 10 15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser ValLeu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
20 25 30 20 25 30
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr SerTyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
35 40 45 35 40 45
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly ValVal Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
50 55 60 50 55 60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala AspSer Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
65 70 75 8065 70 75 80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly GlnSer Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
85 90 95 85 90 95
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe ThrThr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
100 105 110 100 105 110
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val GlyGly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
115 120 125 115 120 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu LysGly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
130 135 140 130 135 140
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser ThrPro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
145 150 155 160145 150 155 160
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln SerPro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
165 170 175 165 170 175
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg ValTyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
180 185 190 180 185 190
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys GlyVal Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
195 200 205 195 200 205
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe AsnPro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn
210 215 220 210 215 220
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys LysPhe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
225 230 235 240225 230 235 240
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr AspPhe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
245 250 255 245 250 255
Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro SerAla Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Ser
260 265 270 260 265 270
Ser Phe Gly Gly Val SerSer Phe Gly Gly Val Ser
275 275
<210> 2<210> 2
<211> 834<211> 834
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Нуклеиновая кислота, кодирующая рекомбинантный<223> Nucleic acid encoding a recombinant
рецептор-связывающий домен гликопротеина S (RBD-S) вируса Virus glycoprotein S (RBD-S) receptor-binding domain
SARS-CoV-2 SARS-CoV-2
<400> 2<400> 2
agagtccaac caacagaatc tattgttaga tttcctaata ttacaaactt gtgccctttt 60agagtccaac caacagaatc tattgttaga tttcctaata ttacaaactt gtgccctttt 60
ggtgaagttt ttaacgccac cagatttgca tctgtttatg cttggaacag gaagagaatc 120ggtgaagttt ttaacgccac cagatttgca tctgtttatg cttggaacag gaagagaatc 120
agcaactgtg ttgctgatta ttctgtccta tataattccg catcattttc cacttttaag 180agcaactgtg ttgctgatta ttctgtccta tataattccg catcattttc cacttttaag 180
tgttatggag tgtctcctac taaattaaat gatctctgct ttactaatgt ctatgcagat 240tgttatggag tgtctcctac taaattaaat gatctctgct ttactaatgt ctatgcagat 240
tcatttgtaa ttagaggtga tgaagtcaga caaatcgctc cagggcaaac tggaaagatt 300tcatttgtaa ttagaggtga tgaagtcaga caaatcgctc cagggcaaac tggaaagatt 300
gctgattata attataaatt accagatgat tttacaggct gcgttatagc ttggaattct 360gctgattata attataaatt accagatgat tttacaggct gcgttatagc ttggaattct 360
aacaatcttg attctaaggt tggtggtaat tataattacc tgtatagatt gtttaggaag 420aacaatcttg attctaaggt tggtggtaat tataattacc tgtatagatt gtttaggaag 420
tctaatctca aaccttttga gagagatatt tcaactgaaa tctatcaggc cggtagcaca 480tctaatctca aaccttttga gagagatatt tcaactgaaa tctatcaggc cggtagcaca 480
ccttgtaatg gtgttgaagg ttttaattgt tactttcctt tacaatcata tggtttccaa 540ccttgtaatg gtgttgaagg ttttaattgt tactttcctt tacaatcata tggtttccaa 540
cccactaatg gtgttggtta ccaaccatac agagtagtag tactttcttt tgaacttcta 600cccactaatg gtgttggtta ccaaccatac agagtagtag tactttcttt tgaacttcta 600
catgcaccag caactgtttg tggacctaaa aagtctacta atttggttaa aaacaaatgt 660catgcaccag caactgtttg tggacctaaa aagtctacta atttggttaa aaacaaatgt 660
gtcaatttca acttcaatgg tttaacaggc acaggtgttc ttactgagtc taacaaaaag 720gtcaatttca acttcaatgg tttaacaggc acaggtgttc ttactgagtc taacaaaaag 720
tttctgcctt tccaacaatt tggcagagac attgctgaca ctactgatgc tgtccgtgat 780tttctgcctt tccaacaatt tggcagagac attgctgaca ctactgatgc tgtccgtgat 780
ccacagacac ttgagattct tgacattaca ccatcttctt ttggtggtgt cagt 834ccatcttctt ttggtggtgt cagt 834
<210> 3<210> 3
<211> 2940<211> 2940
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> экспрессионная кассета с геном рекомбинантного<223> expression cassette with the recombinant gene
рецептор-связывающего домена гликопротеина S (RBD-S) вируса receptor-binding domain glycoprotein S (RBD-S) of the virus
SARS-CoV-2 SARS-CoV-2
<400> 3<400> 3
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 6060
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtctagtt attaatagta atcaattacg gggtcattag 180aggggttcct gcggccgcac gcgtctagtt attaatagta atcaattacg gggtcattag 180
ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc 540tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc 540
gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 600gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 600
gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 660gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 660
tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctcgtttag 720tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctcgtttag 720
tgaaccgtca gatcgcctgg agacgccatc cacgctgttt tgacctccat agaagacacc 780tgaaccgtca gatcgcctgg agacgccatc cacgctgttt tgacctccat agaagacacc 780
gggaccgatc cagcctccgc ggattcgaat cccggccggg aacggtgcat tggaacgcgg 840gggaccgatc cagcctccgc ggattcgaat cccggccggg aacggtgcat tggaacgcgg 840
attccccgtg ccaagagtga cgtaagtacc gcctatagag tctataggcc cacaaaaaat 900attccccgtg ccaagagtga cgtaagtacc gcctatagag tctataggcc cacaaaaaat 900
gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct 960gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct 960
ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa 1020ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa 1020
cagtgataat ttctgggtta aggcaatagc aatatttctg catataaata tttctgcata 10801080
taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca 1140taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat cagctacca 1140
ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct 1200ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct 1200
tttgctaatc atgttcatac ctcttatctt cctcccacag ctcctgggca acgtgctggt 1260tttgctaatc atgttcatac ctcttatctt cctcccacag ctcctgggca acgtgctggt 1260
ctgtgtgctg gcccatcact ttggcaaaga attgggattc gaacatcgcg ataattagcc 1320ctgtgtgctg gcccatcact ttggcaaaga attgggattc gaacatcgcg ataattagcc 1320
gccaccatgg agaccgacac cctgctgctg tgggtgctgc tgctgtgggt gcccgggtcg 13801380
accgggagag tccaaccaac agaatctatt gttagatttc ctaatattac aaacttgtgc 1440accgggag tccaaccaac agaatctatt gttagatttc ctaatattac aaacttgtgc 1440
ccttttggtg aagtttttaa cgccaccaga tttgcatctg tttatgcttg gaacaggaag 1500ccttttggtg aagtttttaa cgccaccaga tttgcatctg tttatgcttg gaacaggaag 1500
agaatcagca actgtgttgc tgattattct gtcctatata attccgcatc attttccact 1560agaatcagca actgtgttgc tgattattct gtcctatata attccgcatc attttccact 1560
tttaagtgtt atggagtgtc tcctactaaa ttaaatgatc tctgctttac taatgtctat 1620tttaagtgtt atggagtgtc tcctactaaa ttaaatgatc tctgctttac taatgtctat 1620
gcagattcat ttgtaattag aggtgatgaa gtcagacaaa tcgctccagg gcaaactgga 1680gcagattcat ttgtaattag aggtgatgaa gtcagacaaa tcgctccagg gcaaactgga 1680
aagattgctg attataatta taaattacca gatgatttta caggctgcgt tatagcttgg 1740aagattgctg attataatta taaattacca gatgatttta caggctgcgt tatagcttgg 1740
aattctaaca atcttgattc taaggttggt ggtaattata attacctgta tagattgttt 1800aattctaaca atcttgattc taaggttggt ggtaattata attacctgta tagattgttt 1800
aggaagtcta atctcaaacc ttttgagaga gatatttcaa ctgaaatcta tcaggccggt 1860aggaagtcta atctcaaacc ttttgagaga gatatttcaa ctgaaatcta tcaggccggt 1860
agcacacctt gtaatggtgt tgaaggtttt aattgttact ttcctttaca atcatatggt 1920agcacacctt gtaatggtgt tgaaggtttt aattgttact ttcctttaca atcatatggt 1920
ttccaaccca ctaatggtgt tggttaccaa ccatacagag tagtagtact ttcttttgaa 1980ttccaaccca ctaatggtgt tggttaccaa ccatacagag tagtagtact ttcttttgaa 1980
cttctacatg caccagcaac tgtttgtgga cctaaaaagt ctactaattt ggttaaaaac 20402040
aaatgtgtca atttcaactt caatggttta acaggcacag gtgttcttac tgagtctaac 2100aaatgtgtca atttcaactt caatggttta acaggcacag gtgttcttac tgagtctaac 2100
aaaaagtttc tgcctttcca acaatttggc agagacattg ctgacactac tgatgctgtc 2160aaaaagtttc tgcctttcca acaatttggc agagacattg ctgacactac tgatgctgtc 2160
cgtgatccac agacacttga gattcttgac attacaccat cttcttttgg tggtgtcagt 22202220
taaggatcct ctagagtcga cctgcagaag cttgcctcga gcagcgctgc tcgagagatc 2280taaggatcct ctagagtcga cctgcagaag cttgcctcga gcagcgctgc tcgagagatc 2280
tacgggtggc atccctgtga cccctcccca gtgcctctcc tggccctgga agttgccact 2340tacgggtggc atccctgtga cccctcccca gtgcctctcc tggccctgga agttgccact 2340
ccagtgccca ccagccttgt cctaataaaa ttaagttgca tcattttgtc tgactaggtg 2400ccagtgccca ccagccttgt cctaataaaa ttaagttgca tcattttgtc tgactaggtg 2400
tccttctata atattatggg gtggaggggg gtggtatgga gcaaggggca agttgggaag 2460tccttctata atattatggg gtggaggggg gtggtatgga gcaaggggca agttgggaag 2460
acaacctgta gggcctgcgg ggtctattgg gaaccaagct ggagtgcagt ggcacaatct 2520acaacctgta gggcctgcgg ggtctattgg gaaccaagct ggagtgcagt ggcacaatct 2520
tggctcactg caatctccgc ctcctgggtt caagcgattc tcctgcctca gcctcccgag 2580tggctcactg caatctccgc ctcctgggtt caagcgattc tcctgcctca gcctcccgag 2580
ttgttgggat tccaggcatg catgaccagg ctcagctaat ttttgttttt ttggtagaga 2640ttgttgggat tccaggcatg catgaccagg ctcagctaat ttttgttttt ttggtagaga 2640
cggggtttca ccatattggc caggctggtc tccaactcct aatctcaggt gatctaccca 2700cggggtttca ccatattggc caggctggtc tccaactcct aatctcaggt gatctaccca 2700
ccttggcctc ccaaattgct gggattacag gcgtgaacca ctgctccctt ccctgtcctt 2760ccttggcctc ccaaattgct gggattacag gcgtgaacca ctgctccctt ccctgtcctt 2760
ctgattttgt aggtaaccac gtgcggaccg agcggccgca ggaaccccta gtgatggagt 2820ctgattttgt aggtaaccac gtgcggaccg agcggccgca ggaaccccta gtgatggagt 2820
tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 2880tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 2880
gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 29402940
<210> 4<210> 4
<211> 724<211> 724
<212> PRT<212> PRT
<213> Природная последовательность<213> Nature sequence
<220><220>
<223> Природная последовательность белка VP1 каспида AAV5 дикого типа<223> Wild-type AAV5 casp VP1 protein sequence
<400> 4<400> 4
Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly GluMet Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 151 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro LysGly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30 20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro GlyPro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45 35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro ValTyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60 50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn GluAsn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 8065 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala AspGln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95 85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly AsnAla Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110 100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro PheLeu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125 115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg IleGly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140 130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp SerAsp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser GlnLys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175 165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp ThrGln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190 180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly AlaMet Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205 195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr TrpAsp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220 210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu ProMet Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val AspSer Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255 245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly TyrGly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270 260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp GlnPhe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285 275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg ValArg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300 290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser ThrLys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr AspThr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335 325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly CysAsp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350 340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly TyrLeu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365 355 360 365
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser SerAla Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
370 375 380 370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly AsnPhe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400385 390 395 400
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser SerAsn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
405 410 415 405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val AspPhe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430 420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val GlnGln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
435 440 445 435 440 445
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn TrpPhe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460 450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser GlyPhe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
465 470 475 480465 470 475 480
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met GluVal Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
485 490 495 485 490 495
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met ThrLeu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
500 505 510 500 505 510
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met IleAsn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
515 520 525 515 520 525
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu GluPhe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
530 535 540 530 535 540
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn ArgGly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
545 550 555 560545 550 555 560
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser SerVal Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
565 570 575 565 570 575
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val ProThr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
580 585 590 580 585 590
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile TrpGly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
595 600 605 595 600 605
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala MetAla Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
610 615 620 610 615 620
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys AsnGly Gly Phe Gly Leu Lys His Pro Pro Met Met Leu Ile Lys Asn
625 630 635 640625 630 635 640
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val SerThr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
645 650 655 645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met GluSer Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
660 665 670 660 665 670
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile GlnTrp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685 675 680 685
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro AspTyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
690 695 700 690 695 700
Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr LeuSer Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720705 710 715 720
Thr Arg Pro LeuThr Arg Pro Leu
<210> 5<210> 5
<211> 724<211> 724
<212> PRT<212> PRT
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> выделенный модифицированный белок VP1 каспида AAV5, который<223> isolated modified AAV5 casp VP1 protein, which
включает замены S2A и T711S includes S2A and T711S replacements
<400> 5<400> 5
Met Ala Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly GluMet Ala Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 151 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro LysGly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30 20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro GlyPro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45 35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro ValTyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60 50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn GluAsn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 8065 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala AspGln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95 85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly AsnAla Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110 100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro PheLeu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125 115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg IleGly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140 130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp SerAsp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser GlnLys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175 165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp ThrGln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190 180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly AlaMet Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205 195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr TrpAsp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220 210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu ProMet Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val AspSer Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255 245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly TyrGly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270 260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp GlnPhe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285 275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg ValArg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300 290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser ThrLys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr AspThr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335 325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly CysAsp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350 340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly TyrLeu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365 355 360 365
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser SerAla Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
370 375 380 370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly AsnPhe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400385 390 395 400
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser SerAsn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
405 410 415 405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val AspPhe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430 420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val GlnGln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
435 440 445 435 440 445
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn TrpPhe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460 450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser GlyPhe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
465 470 475 480465 470 475 480
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met GluVal Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
485 490 495 485 490 495
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met ThrLeu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
500 505 510 500 505 510
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met IleAsn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
515 520 525 515 520 525
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu GluPhe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
530 535 540 530 535 540
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn ArgGly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
545 550 555 560545 550 555 560
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser SerVal Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
565 570 575 565 570 575
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val ProThr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
580 585 590 580 585 590
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile TrpGly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
595 600 605 595 600 605
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala MetAla Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
610 615 620 610 615 620
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys AsnGly Gly Phe Gly Leu Lys His Pro Pro Met Met Leu Ile Lys Asn
625 630 635 640625 630 635 640
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val SerThr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
645 650 655 645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met GluSer Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
660 665 670 660 665 670
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile GlnTrp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685 675 680 685
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro AspTyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
690 695 700 690 695 700
Ser Thr Gly Glu Tyr Arg Ser Thr Arg Pro Ile Gly Thr Arg Tyr LeuSer Thr Gly Glu Tyr Arg Ser Thr Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720705 710 715 720
Thr Arg Pro LeuThr Arg Pro Leu
<210> 6<210> 6
<211> 1273<211> 1273
<212> PRT<212> PRT
<213> Природная последовательность<213> Nature sequence
<220><220>
<223> Природная последовательность полноразмерного гликопротеина S<223> Natural sequence of full-length glycoprotein S
вируса SARS-CoV-2 SARS-CoV-2 virus
<400> 6<400> 6
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys ValMet Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 151 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser PheAsn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30 20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val LeuThr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45 35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr TrpHis Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60 50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe AspPhe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 8065 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr GluAsn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95 85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp SerLys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110 100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val IleLys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125 115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val TyrLys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140 130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val TyrTyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe LeuSer Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175 165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu PheMet Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190 180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His ThrVal Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205 195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu GluPro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220 210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln ThrPro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser SerLeu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255 245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln ProGly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270 260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp AlaArg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285 275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu LysVal Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300 290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg ValSer Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu CysGln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335 325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr AlaPro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350 340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val LeuTrp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365 355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser ProTyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380 370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser PheThr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr GlyVal Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415 405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly CysLys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430 420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly AsnVal Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445 435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro PheTyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460 450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro CysGlu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr GlyAsn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495 485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val ValPhe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510 500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro LysLeu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525 515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe AsnLys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540 530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe LeuGly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala ValPro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575 565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser PheArg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590 580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln ValGly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605 595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala IleAla Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620 610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly SerHis Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His ValAsn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655 645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys AlaAsn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670 660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val AlaSer Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685 675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn SerSer Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700 690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr IleVal Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser ValSer Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735 725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn LeuAsp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750 740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu ThrLeu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765 755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala GlnGly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780 770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly PheVal Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg SerAsn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815 805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala GlyPhe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830 820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg AspPhe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845 835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro LeuLeu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860 850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala GlyLeu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln IleThr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895 885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val ThrPro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910 900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe AsnGln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925 915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser AlaSer Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940 930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu AsnLeu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser ValThr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975 965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val GlnLeu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990 980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr ValIle Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005 995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn LeuThr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020 1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg ValAla Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 10401025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser AlaAsp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055 1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln GluPro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070 1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala HisLys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085 1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe ValPhe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100 1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn ThrThr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 11201105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn ThrPhe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135 1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu LeuVal Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150 1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly AspAsp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165 1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile AspIle Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180 1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp LeuArg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 12001185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr IleGln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215 1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr IleTrp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230 1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys CysMet Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245 1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro ValSer Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260 1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr ThrLeu Lys Gly Val Lys Leu His Tyr Thr
1265 12701265 1270
<210> 7<210> 7
<211> 278<211> 278
<212> PRT<212> PRT
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> выделенный рецептор-связывающий домен гликопротеина S (RBD-S)<223> isolated glycoprotein S receptor-binding domain (RBD-S)
вируса SARS-CoV-2 SARS-CoV-2 virus
<400> 7<400> 7
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr AsnArg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
1 5 10 151 5 10 15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser ValLeu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
20 25 30 20 25 30
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr SerTyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
35 40 45 35 40 45
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly ValVal Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
50 55 60 50 55 60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala AspSer Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
65 70 75 8065 70 75 80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly GlnSer Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
85 90 95 85 90 95
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe ThrThr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
100 105 110 100 105 110
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val GlyGly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
115 120 125 115 120 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu LysGly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
130 135 140 130 135 140
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser ThrPro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
145 150 155 160145 150 155 160
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln SerPro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
165 170 175 165 170 175
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg ValTyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
180 185 190 180 185 190
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys GlyVal Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
195 200 205 195 200 205
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe AsnPro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn
210 215 220 210 215 220
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys LysPhe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
225 230 235 240225 230 235 240
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr AspPhe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
245 250 255 245 250 255
Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro CysAla Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys
260 265 270 260 265 270
Ser Phe Gly Gly Val SerSer Phe Gly Gly Val Ser
275 275
<210> 8<210> 8
<211> 130<211> 130
<212> DNA<212> DNA
<213> Природная последовательность<213> Nature sequence
<220><220>
<223> левый (первый) ITR (инвертированные концевые повторы)<223> Left (First) ITR (Inverted End Repeats)
<400> 8<400> 8
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 6060
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130aggggttcct 130
<210> 9<210> 9
<211> 304<211> 304
<212> DNA<212> DNA
<213> Природная последовательность<213> Nature sequence
<220><220>
<223> CMV (цитомегаловирусный) энхансер<223> CMV (cytomegalovirus) enhancer
<400> 9<400> 9
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300
catg 304catg 304
<210> 10<210> 10
<211> 204<211> 204
<212> DNA<212> DNA
<213> Природная последовательность<213> Nature sequence
<220><220>
<223> CMV (цитомегаловирусный) промотер<223>CMV (cytomegalovirus) promoter
<400> 10<400> 10
gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 60gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 60
ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 120ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 120
tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 180tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 180
tgggaggtct atataagcag agct 204tgggaggtct atataagcag agct 204
<210> 11<210> 11
<211> 493<211> 493
<212> DNA<212> DNA
<213> Природная последовательность<213> Nature sequence
<220><220>
<223> интрон гена hBG1 (ген субъединицы гемоглобина гамма-1)<223> hBG1 gene intron (gamma-1 hemoglobin subunit gene)
<400> 11<400> 11
cgaatcccgg ccgggaacgg tgcattggaa cgcggattcc ccgtgccaag agtgacgtaa 60cgaatcccgg ccgggaacgg tgcattggaa cgcggattcc ccgtgccaag agtgacgtaa 60
gtaccgccta tagagtctat aggcccacaa aaaatgcttt cttcttttaa tatacttttt 120gtaccgccta tagagtctat aggcccacaa aaaatgcttt cttcttttaa tatacttttt 120
tgtttatctt atttctaata ctttccctaa tctctttctt tcagggcaat aatgatacaa 180tgtttatctt atttctaata ctttccctaa tctctttctt tcagggcaat aatgatacaa 180
tgtatcatgc ctctttgcac cattctaaag aataacagtg ataatttctg ggttaaggca 240tgtatcatgc ctctttgcac cattctaaag aataacagtg ataatttctg ggttaaggca 240
atagcaatat ttctgcatat aaatatttct gcatataaat tgtaactgat gtaagaggtt 300atagcaatat ttctgcatat aaatatttct gcatataaat tgtaactgat gtaagaggtt 300
tcatattgct aatagcagct acaatccagc taccattctg cttttatttt atggttggga 360tcatattgct aatagcagct acaatccagc taccattctg cttttatttt atggttggga 360
taaggctgga ttattctgag tccaagctag gcccttttgc taatcatgtt catacctctt 420taaggctgga ttattctgag tccaagctag gcccttttgc taatcatgtt catacctctt 420
atcttcctcc cacagctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc 480atcttcctcc cacagctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc 480
aaagaattgg gat 493aaagaattgg gat 493
<210> 12<210> 12
<211> 479<211> 479
<212> DNA<212> DNA
<213> Природная последовательность<213> Nature sequence
<220><220>
<223> сигнал полиаденилирования hBG1 (сигнал полиаденилирования гена<223> hBG1 polyadenylation signal (polyadenylation signal of gene
гормона роста человека) human growth hormone)
<400> 12<400> 12
acgggtggca tccctgtgac ccctccccag tgcctctcct ggccctggaa gttgccactc 60acgggtggca tccctgtgac ccctccccag tgcctctcct ggccctggaa gttgccactc 60
cagtgcccac cagccttgtc ctaataaaat taagttgcat cattttgtct gactaggtgt 120cagtgcccac cagccttgtc ctaataaaat taagttgcat cattttgtct gactaggtgt 120
ccttctataa tattatgggg tggagggggg tggtatggag caaggggcaa gttgggaaga 180ccttctataa tattatgggg tggagggggg tggtatggag caaggggcaa gttgggaaga 180
caacctgtag ggcctgcggg gtctattggg aaccaagctg gagtgcagtg gcacaatctt 240caacctgtag ggcctgcggg gtctattgggg aaccaagctg gagtgcagtg gcacaatctt 240
ggctcactgc aatctccgcc tcctgggttc aagcgattct cctgcctcag cctcccgagt 300ggctcactgc aatctccgcc tcctgggttc aagcgattct cctgcctcag cctcccgagt 300
tgttgggatt ccaggcatgc atgaccaggc tcagctaatt tttgtttttt tggtagagac 360360
ggggtttcac catattggcc aggctggtct ccaactccta atctcaggtg atctacccac 420ggggtttcac catattggcc aggctggtct ccaactccta atctcaggtg atctacccac 420
cttggcctcc caaattgctg ggattacagg cgtgaaccac tgctcccttc cctgtcctt 479cttggcctcc caaattgctg ggattacagg cgtgaaccac tgctcccttc cctgtcctt 479
<210> 13<210> 13
<211> 141<211> 141
<212> DNA<212> DNA
<213> Природная последовательность<213> Nature sequence
<220><220>
<223> правый (второй) ITR<223> right (second) ITR
<400> 13<400> 13
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag ctgcctgcag g 141gagcgcgcag ctgcctgcag g 141
<210> 14<210> 14
<211> 588<211> 588
<212> PRT<212> PRT
<213> Природная последовательность<213> Nature sequence
<220><220>
<223> Природная последовательность белка VP2 каспида AAV5 дикого типа<223> Wild-type AAV5 casp VP2 protein sequence
<400> 14<400> 14
Thr Ala Pro Thr Gly Lys Arg Ile Asp Asp His Phe Pro Lys Arg LysThr Ala Pro Thr Gly Lys Arg Ile Asp Asp His Phe Pro Lys Arg Lys
1 5 10 151 5 10 15
Lys Ala Arg Thr Glu Glu Asp Ser Lys Pro Ser Thr Ser Ser Asp AlaLys Ala Arg Thr Glu Glu Asp Ser Lys Pro Ser Thr Ser Ser Asp Ala
20 25 30 20 25 30
Glu Ala Gly Pro Ser Gly Ser Gln Gln Leu Gln Ile Pro Ala Gln ProGlu Ala Gly Pro Ser Gly Ser Gln Gln Leu Gln Ile Pro Ala Gln Pro
35 40 45 35 40 45
Ala Ser Ser Leu Gly Ala Asp Thr Met Ser Ala Gly Gly Gly Gly ProAla Ser Ser Leu Gly Ala Asp Thr Met Ser Ala Gly Gly Gly Gly Pro
50 55 60 50 55 60
Leu Gly Asp Asn Asn Gln Gly Ala Asp Gly Val Gly Asn Ala Ser GlyLeu Gly Asp Asn Asn Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly
65 70 75 8065 70 75 80
Asp Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Val Thr LysAsp Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Val Thr Lys
85 90 95 85 90 95
Ser Thr Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Gln Tyr ArgSer Thr Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Gln Tyr Arg
100 105 110 100 105 110
Glu Ile Lys Ser Gly Ser Val Asp Gly Ser Asn Ala Asn Ala Tyr PheGlu Ile Lys Ser Gly Ser Val Asp Gly Ser Asn Ala Asn Ala Tyr Phe
115 120 125 115 120 125
Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His SerGly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Ser
130 135 140 130 135 140
His Trp Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Tyr Trp GlyHis Trp Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Tyr Trp Gly
145 150 155 160145 150 155 160
Phe Arg Pro Arg Ser Leu Arg Val Lys Ile Phe Asn Ile Gln Val LysPhe Arg Pro Arg Ser Leu Arg Val Lys Ile Phe Asn Ile Gln Val Lys
165 170 175 165 170 175
Glu Val Thr Val Gln Asp Ser Thr Thr Thr Ile Ala Asn Asn Leu ThrGlu Val Thr Val Gln Asp Ser Thr Thr Thr Ile Ala Asn Asn Leu Thr
180 185 190 180 185 190
Ser Thr Val Gln Val Phe Thr Asp Asp Asp Tyr Gln Leu Pro Tyr ValSer Thr Val Gln Val Phe Thr Asp Asp Asp Tyr Gln Leu Pro Tyr Val
195 200 205 195 200 205
Val Gly Asn Gly Thr Glu Gly Cys Leu Pro Ala Phe Pro Pro Gln ValVal Gly Asn Gly Thr Glu Gly Cys Leu Pro Ala Phe Pro Pro Gln Val
210 215 220 210 215 220
Phe Thr Leu Pro Gln Tyr Gly Tyr Ala Thr Leu Asn Arg Asp Asn ThrPhe Thr Leu Pro Gln Tyr Gly Tyr Ala Thr Leu Asn Arg Asp Asn Thr
225 230 235 240225 230 235 240
Glu Asn Pro Thr Glu Arg Ser Ser Phe Phe Cys Leu Glu Tyr Phe ProGlu Asn Pro Thr Glu Arg Ser Ser Phe Phe Cys Leu Glu Tyr Phe Pro
245 250 255 245 250 255
Ser Lys Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Thr Tyr Asn PheSer Lys Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Thr Tyr Asn Phe
260 265 270 260 265 270
Glu Glu Val Pro Phe His Ser Ser Phe Ala Pro Ser Gln Asn Leu PheGlu Glu Val Pro Phe His Ser Ser Phe Ala Pro Ser Gln Asn Leu Phe
275 280 285 275 280 285
Lys Leu Ala Asn Pro Leu Val Asp Gln Tyr Leu Tyr Arg Phe Val SerLys Leu Ala Asn Pro Leu Val Asp Gln Tyr Leu Tyr Arg Phe Val Ser
290 295 300 290 295 300
Thr Asn Asn Thr Gly Gly Val Gln Phe Asn Lys Asn Leu Ala Gly ArgThr Asn Asn Thr Gly Gly Val Gln Phe Asn Lys Asn Leu Ala Gly Arg
305 310 315 320305 310 315 320
Tyr Ala Asn Thr Tyr Lys Asn Trp Phe Pro Gly Pro Met Gly Arg ThrTyr Ala Asn Thr Tyr Lys Asn Trp Phe Pro Gly Pro Met Gly Arg Thr
325 330 335 325 330 335
Gln Gly Trp Asn Leu Gly Ser Gly Val Asn Arg Ala Ser Val Ser AlaGln Gly Trp Asn Leu Gly Ser Gly Val Asn Arg Ala Ser Val Ser Ala
340 345 350 340 345 350
Phe Ala Thr Thr Asn Arg Met Glu Leu Glu Gly Ala Ser Tyr Gln ValPhe Ala Thr Thr Asn Arg Met Glu Leu Glu Gly Ala Ser Tyr Gln Val
355 360 365 355 360 365
Pro Pro Gln Pro Asn Gly Met Thr Asn Asn Leu Gln Gly Ser Asn ThrPro Pro Gln Pro Asn Gly Met Thr Asn Asn Leu Gln Gly Ser Asn Thr
370 375 380 370 375 380
Tyr Ala Leu Glu Asn Thr Met Ile Phe Asn Ser Gln Pro Ala Asn ProTyr Ala Leu Glu Asn Thr Met Ile Phe Asn Ser Gln Pro Ala Asn Pro
385 390 395 400385 390 395 400
Gly Thr Thr Ala Thr Tyr Leu Glu Gly Asn Met Leu Ile Thr Ser GluGly Thr Thr Ala Thr Tyr Leu Glu Gly Asn Met Leu Ile Thr Ser Glu
405 410 415 405 410 415
Ser Glu Thr Gln Pro Val Asn Arg Val Ala Tyr Asn Val Gly Gly GlnSer Glu Thr Gln Pro Val Asn Arg Val Ala Tyr Asn Val Gly Gly Gln
420 425 430 420 425 430
Met Ala Thr Asn Asn Gln Ser Ser Thr Thr Ala Pro Ala Thr Gly ThrMet Ala Thr Asn Asn Gln Ser Ser Thr Thr Ala Pro Ala Thr Gly Thr
435 440 445 435 440 445
Tyr Asn Leu Gln Glu Ile Val Pro Gly Ser Val Trp Met Glu Arg AspTyr Asn Leu Gln Glu Ile Val Pro Gly Ser Val Trp Met Glu Arg Asp
450 455 460 450 455 460
Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro Glu Thr Gly AlaVal Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro Glu Thr Gly Ala
465 470 475 480465 470 475 480
His Phe His Pro Ser Pro Ala Met Gly Gly Phe Gly Leu Lys His ProHis Phe His Pro Ser Pro Ala Met Gly Gly Phe Gly Leu Lys His Pro
485 490 495 485 490 495
Pro Pro Met Met Leu Ile Lys Asn Thr Pro Val Pro Gly Asn Ile ThrPro Pro Met Met Leu Ile Lys Asn Thr Pro Val Pro Gly Asn Ile Thr
500 505 510 500 505 510
Ser Phe Ser Asp Val Pro Val Ser Ser Phe Ile Thr Gln Tyr Ser ThrSer Phe Ser Asp Val Pro Val Ser Ser Phe Ile Thr Gln Tyr Ser Thr
515 520 525 515 520 525
Gly Gln Val Thr Val Glu Met Glu Trp Glu Leu Lys Lys Glu Asn SerGly Gln Val Thr Val Glu Met Glu Trp Glu Leu Lys Lys Glu Asn Ser
530 535 540 530 535 540
Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Asn Asn Tyr Asn Asp ProLys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Asn Asn Tyr Asn Asp Pro
545 550 555 560545 550 555 560
Gln Phe Val Asp Phe Ala Pro Asp Ser Thr Gly Glu Tyr Arg Thr ThrGln Phe Val Asp Phe Ala Pro Asp Ser Thr Gly Glu Tyr Arg Thr Thr
565 570 575 565 570 575
Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro LeuArg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
580 585 580 585
<210> 15<210> 15
<211> 532<211> 532
<212> PRT<212> PRT
<213> Природная последовательность<213> Nature sequence
<220><220>
<223> Природная последовательность белка VP3 каспида AAV5 дикого типа<223> Wild-type AAV5 casp VP3 protein sequence
<400> 15<400> 15
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly AlaMet Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
1 5 10 151 5 10 15
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr TrpAsp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
20 25 30 20 25 30
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu ProMet Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
35 40 45 35 40 45
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val AspSer Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
50 55 60 50 55 60
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly TyrGly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
65 70 75 8065 70 75 80
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp GlnPhe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
85 90 95 85 90 95
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg ValArg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
100 105 110 100 105 110
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser ThrLys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
115 120 125 115 120 125
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr AspThr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
130 135 140 130 135 140
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly CysAsp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
145 150 155 160145 150 155 160
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly TyrLeu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
165 170 175 165 170 175
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser SerAla Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
180 185 190 180 185 190
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly AsnPhe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
195 200 205 195 200 205
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser SerAsn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
210 215 220 210 215 220
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val AspPhe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
225 230 235 240225 230 235 240
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val GlnGln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
245 250 255 245 250 255
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn TrpPhe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
260 265 270 260 265 270
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser GlyPhe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
275 280 285 275 280 285
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met GluVal Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
290 295 300 290 295 300
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met ThrLeu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
305 310 315 320305 310 315 320
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met IleAsn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
325 330 335 325 330 335
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu GluPhe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
340 345 350 340 345 350
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn ArgGly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
355 360 365 355 360 365
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser SerVal Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
370 375 380 370 375 380
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val ProThr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
385 390 395 400385 390 395 400
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile TrpGly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
405 410 415 405 410 415
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala MetAla Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
420 425 430 420 425 430
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys AsnGly Gly Phe Gly Leu Lys His Pro Pro Met Met Leu Ile Lys Asn
435 440 445 435 440 445
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val SerThr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
450 455 460 450 455 460
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met GluSer Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
465 470 475 480465 470 475 480
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile GlnTrp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
485 490 495 485 490 495
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro AspTyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
500 505 510 500 505 510
Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr LeuSer Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu
515 520 525 515 520 525
Thr Arg Pro LeuThr Arg Pro Leu
530 530
<210> 16<210> 16
<211> 588<211> 588
<212> PRT<212> PRT
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> выделенный модифицированный белок VP2 каспида AAV5, который<223> isolated modified AAV5 casp VP2 protein, which
включает замену T575S includes T575S replacement
<400> 16<400> 16
Thr Ala Pro Thr Gly Lys Arg Ile Asp Asp His Phe Pro Lys Arg LysThr Ala Pro Thr Gly Lys Arg Ile Asp Asp His Phe Pro Lys Arg Lys
1 5 10 151 5 10 15
Lys Ala Arg Thr Glu Glu Asp Ser Lys Pro Ser Thr Ser Ser Asp AlaLys Ala Arg Thr Glu Glu Asp Ser Lys Pro Ser Thr Ser Ser Asp Ala
20 25 30 20 25 30
Glu Ala Gly Pro Ser Gly Ser Gln Gln Leu Gln Ile Pro Ala Gln ProGlu Ala Gly Pro Ser Gly Ser Gln Gln Leu Gln Ile Pro Ala Gln Pro
35 40 45 35 40 45
Ala Ser Ser Leu Gly Ala Asp Thr Met Ser Ala Gly Gly Gly Gly ProAla Ser Ser Leu Gly Ala Asp Thr Met Ser Ala Gly Gly Gly Gly Pro
50 55 60 50 55 60
Leu Gly Asp Asn Asn Gln Gly Ala Asp Gly Val Gly Asn Ala Ser GlyLeu Gly Asp Asn Asn Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly
65 70 75 8065 70 75 80
Asp Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Val Thr LysAsp Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Val Thr Lys
85 90 95 85 90 95
Ser Thr Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Gln Tyr ArgSer Thr Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Gln Tyr Arg
100 105 110 100 105 110
Glu Ile Lys Ser Gly Ser Val Asp Gly Ser Asn Ala Asn Ala Tyr PheGlu Ile Lys Ser Gly Ser Val Asp Gly Ser Asn Ala Asn Ala Tyr Phe
115 120 125 115 120 125
Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His SerGly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Ser
130 135 140 130 135 140
His Trp Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Tyr Trp GlyHis Trp Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Tyr Trp Gly
145 150 155 160145 150 155 160
Phe Arg Pro Arg Ser Leu Arg Val Lys Ile Phe Asn Ile Gln Val LysPhe Arg Pro Arg Ser Leu Arg Val Lys Ile Phe Asn Ile Gln Val Lys
165 170 175 165 170 175
Glu Val Thr Val Gln Asp Ser Thr Thr Thr Ile Ala Asn Asn Leu ThrGlu Val Thr Val Gln Asp Ser Thr Thr Thr Ile Ala Asn Asn Leu Thr
180 185 190 180 185 190
Ser Thr Val Gln Val Phe Thr Asp Asp Asp Tyr Gln Leu Pro Tyr ValSer Thr Val Gln Val Phe Thr Asp Asp Asp Tyr Gln Leu Pro Tyr Val
195 200 205 195 200 205
Val Gly Asn Gly Thr Glu Gly Cys Leu Pro Ala Phe Pro Pro Gln ValVal Gly Asn Gly Thr Glu Gly Cys Leu Pro Ala Phe Pro Pro Gln Val
210 215 220 210 215 220
Phe Thr Leu Pro Gln Tyr Gly Tyr Ala Thr Leu Asn Arg Asp Asn ThrPhe Thr Leu Pro Gln Tyr Gly Tyr Ala Thr Leu Asn Arg Asp Asn Thr
225 230 235 240225 230 235 240
Glu Asn Pro Thr Glu Arg Ser Ser Phe Phe Cys Leu Glu Tyr Phe ProGlu Asn Pro Thr Glu Arg Ser Ser Phe Phe Cys Leu Glu Tyr Phe Pro
245 250 255 245 250 255
Ser Lys Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Thr Tyr Asn PheSer Lys Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Thr Tyr Asn Phe
260 265 270 260 265 270
Glu Glu Val Pro Phe His Ser Ser Phe Ala Pro Ser Gln Asn Leu PheGlu Glu Val Pro Phe His Ser Ser Phe Ala Pro Ser Gln Asn Leu Phe
275 280 285 275 280 285
Lys Leu Ala Asn Pro Leu Val Asp Gln Tyr Leu Tyr Arg Phe Val SerLys Leu Ala Asn Pro Leu Val Asp Gln Tyr Leu Tyr Arg Phe Val Ser
290 295 300 290 295 300
Thr Asn Asn Thr Gly Gly Val Gln Phe Asn Lys Asn Leu Ala Gly ArgThr Asn Asn Thr Gly Gly Val Gln Phe Asn Lys Asn Leu Ala Gly Arg
305 310 315 320305 310 315 320
Tyr Ala Asn Thr Tyr Lys Asn Trp Phe Pro Gly Pro Met Gly Arg ThrTyr Ala Asn Thr Tyr Lys Asn Trp Phe Pro Gly Pro Met Gly Arg Thr
325 330 335 325 330 335
Gln Gly Trp Asn Leu Gly Ser Gly Val Asn Arg Ala Ser Val Ser AlaGln Gly Trp Asn Leu Gly Ser Gly Val Asn Arg Ala Ser Val Ser Ala
340 345 350 340 345 350
Phe Ala Thr Thr Asn Arg Met Glu Leu Glu Gly Ala Ser Tyr Gln ValPhe Ala Thr Thr Asn Arg Met Glu Leu Glu Gly Ala Ser Tyr Gln Val
355 360 365 355 360 365
Pro Pro Gln Pro Asn Gly Met Thr Asn Asn Leu Gln Gly Ser Asn ThrPro Pro Gln Pro Asn Gly Met Thr Asn Asn Leu Gln Gly Ser Asn Thr
370 375 380 370 375 380
Tyr Ala Leu Glu Asn Thr Met Ile Phe Asn Ser Gln Pro Ala Asn ProTyr Ala Leu Glu Asn Thr Met Ile Phe Asn Ser Gln Pro Ala Asn Pro
385 390 395 400385 390 395 400
Gly Thr Thr Ala Thr Tyr Leu Glu Gly Asn Met Leu Ile Thr Ser GluGly Thr Thr Ala Thr Tyr Leu Glu Gly Asn Met Leu Ile Thr Ser Glu
405 410 415 405 410 415
Ser Glu Thr Gln Pro Val Asn Arg Val Ala Tyr Asn Val Gly Gly GlnSer Glu Thr Gln Pro Val Asn Arg Val Ala Tyr Asn Val Gly Gly Gln
420 425 430 420 425 430
Met Ala Thr Asn Asn Gln Ser Ser Thr Thr Ala Pro Ala Thr Gly ThrMet Ala Thr Asn Asn Gln Ser Ser Thr Thr Ala Pro Ala Thr Gly Thr
435 440 445 435 440 445
Tyr Asn Leu Gln Glu Ile Val Pro Gly Ser Val Trp Met Glu Arg AspTyr Asn Leu Gln Glu Ile Val Pro Gly Ser Val Trp Met Glu Arg Asp
450 455 460 450 455 460
Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro Glu Thr Gly AlaVal Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro Glu Thr Gly Ala
465 470 475 480465 470 475 480
His Phe His Pro Ser Pro Ala Met Gly Gly Phe Gly Leu Lys His ProHis Phe His Pro Ser Pro Ala Met Gly Gly Phe Gly Leu Lys His Pro
485 490 495 485 490 495
Pro Pro Met Met Leu Ile Lys Asn Thr Pro Val Pro Gly Asn Ile ThrPro Pro Met Met Leu Ile Lys Asn Thr Pro Val Pro Gly Asn Ile Thr
500 505 510 500 505 510
Ser Phe Ser Asp Val Pro Val Ser Ser Phe Ile Thr Gln Tyr Ser ThrSer Phe Ser Asp Val Pro Val Ser Ser Phe Ile Thr Gln Tyr Ser Thr
515 520 525 515 520 525
Gly Gln Val Thr Val Glu Met Glu Trp Glu Leu Lys Lys Glu Asn SerGly Gln Val Thr Val Glu Met Glu Trp Glu Leu Lys Lys Glu Asn Ser
530 535 540 530 535 540
Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Asn Asn Tyr Asn Asp ProLys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Asn Asn Tyr Asn Asp Pro
545 550 555 560545 550 555 560
Gln Phe Val Asp Phe Ala Pro Asp Ser Thr Gly Glu Tyr Arg Ser ThrGln Phe Val Asp Phe Ala Pro Asp Ser Thr Gly Glu Tyr Arg Ser Thr
565 570 575 565 570 575
Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro LeuArg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
580 585 580 585
<210> 17<210> 17
<211> 532<211> 532
<212> PRT<212> PRT
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> выделенный модифицированный белок VP3 каспида AAV5, который<223> isolated modified AAV5 casp VP3 protein, which
включает замену T519S includes replacement T519S
<400> 17<400> 17
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly AlaMet Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
1 5 10 151 5 10 15
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr TrpAsp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
20 25 30 20 25 30
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu ProMet Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
35 40 45 35 40 45
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val AspSer Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
50 55 60 50 55 60
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly TyrGly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
65 70 75 8065 70 75 80
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp GlnPhe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
85 90 95 85 90 95
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg ValArg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
100 105 110 100 105 110
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser ThrLys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
115 120 125 115 120 125
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr AspThr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
130 135 140 130 135 140
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly CysAsp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
145 150 155 160145 150 155 160
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly TyrLeu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
165 170 175 165 170 175
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser SerAla Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
180 185 190 180 185 190
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly AsnPhe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
195 200 205 195 200 205
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser SerAsn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
210 215 220 210 215 220
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val AspPhe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
225 230 235 240225 230 235 240
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val GlnGln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
245 250 255 245 250 255
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn TrpPhe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
260 265 270 260 265 270
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser GlyPhe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
275 280 285 275 280 285
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met GluVal Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
290 295 300 290 295 300
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met ThrLeu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
305 310 315 320305 310 315 320
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met IleAsn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
325 330 335 325 330 335
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu GluPhe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
340 345 350 340 345 350
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn ArgGly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
355 360 365 355 360 365
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser SerVal Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
370 375 380 370 375 380
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val ProThr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
385 390 395 400385 390 395 400
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile TrpGly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
405 410 415 405 410 415
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala MetAla Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
420 425 430 420 425 430
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys AsnGly Gly Phe Gly Leu Lys His Pro Pro Met Met Leu Ile Lys Asn
435 440 445 435 440 445
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val SerThr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
450 455 460 450 455 460
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met GluSer Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
465 470 475 480465 470 475 480
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile GlnTrp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
485 490 495 485 490 495
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro AspTyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
500 505 510 500 505 510
Ser Thr Gly Glu Tyr Arg Ser Thr Arg Pro Ile Gly Thr Arg Tyr LeuSer Thr Gly Glu Tyr Arg Ser Thr Arg Pro Ile Gly Thr Arg Tyr Leu
515 520 525 515 520 525
Thr Arg Pro LeuThr Arg Pro Leu
530 530
<---<---
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CA3191194ACA3191194A1 (en) | 2020-08-28 | 2021-08-27 | Aav5-based vaccine against sars-cov-2 |
| ARP210102421AAR123369A1 (en) | 2020-08-28 | 2021-08-27 | AAV5-BASED VACCINE FOR THE INDUCTION OF SPECIFIC IMMUNITY AGAINST SARS-CoV-2 AND/OR THE PREVENTION OF SARS-CoV-2-RELATED CORONAVIRUS INFECTION |
| CN202180053639.4ACN116438192A (en) | 2020-08-28 | 2021-08-27 | AAV 5-based SARS-COV-2 vaccine |
| AU2021331947AAU2021331947A1 (en) | 2020-08-28 | 2021-08-27 | Aav5-based vaccine against sars-cov-2 |
| UY0001039396AUY39396A (en) | 2020-08-28 | 2021-08-27 | VACCINE BASED ON AAV5 FOR THE INDUCTION OF SPECIFIC IMMUNITY AGAINST SARSCOV-2 AND/OR THE PREVENTION OF SARSCOV-2 RELATED CORONAVIRUS INFECTION |
| JP2023514019AJP2023540085A (en) | 2020-08-28 | 2021-08-27 | AAV5-based vaccine against SARS-CoV-2 |
| IL300738AIL300738A (en) | 2020-08-28 | 2021-08-27 | Aav5-based vaccine against sars-cov-2 |
| KR1020237010547AKR20230092880A (en) | 2020-08-28 | 2021-08-27 | AAV5-based SARS-CoV-2 vaccine |
| EP21862185.2AEP4185323A4 (en) | 2020-08-28 | 2021-08-27 | AAV5-BASED VACCINE AGAINST SARS-COV-2 |
| BR112023003614ABR112023003614A2 (en) | 2020-08-28 | 2021-08-27 | BINDING DOMAIN, ISOLATED NUCLEIC ACID, CASSETTE AND EXPRESSION VECTOR, RECOMBINANT VIRUSES AND ITS USE, PHARMACEUTICAL COMPOSITION, AAV5-BASED VACCINE FOR INDUCTION OF SPECIFIC IMMUNITY TO SARS-COV-2 AND/OR PREVENTION OF SARS-RELATED CORONAVIRUS INFECTION COV-2 |
| US18/043,354US20230321220A1 (en) | 2020-08-28 | 2021-08-27 | Aav5-based vaccine against sars-cov-2 |
| PCT/RU2021/050279WO2022045935A1 (en) | 2020-08-28 | 2021-08-27 | Aav5-based vaccine against sars-cov-2 |
| ZA2023/01438AZA202301438B (en) | 2020-08-28 | 2023-02-03 | Aa v5-based vaccine against sars-cov-2 |
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2021122306ADivisionRU2761879C1 (en) | 2021-07-27 | 2021-07-27 | VACCINE BASED ON AAV5 FOR THE INDUCTION OF SPECIFIC IMMUNITY TO THE SARS-CoV-2 VIRUS AND/OR THE PREVENTION OF CORONAVIRUS INFECTION CAUSED BY SARS-CoV-2 |
| RU2022123899ADivisionRU2022123899A (en) | 2022-09-08 | AAV5-based vaccine for inducing specific immunity to the SARS-CoV-2 virus and/or preventing coronavirus infection caused by SARS-CoV-2 |
| Publication Number | Publication Date |
|---|---|
| RU2783313C1true RU2783313C1 (en) | 2022-11-11 |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2723008C1 (en)* | 2020-05-19 | 2020-06-08 | федеральное государственное бюджетное учреждение «Национальный исследовательский центр эпидемиологии и микробиологии имени почетного академика Н.Ф. Гамалеи» Министерства здравоохранения Российской Федерации | Method for producing Chinese hamster ovary cell strain, being a producer of recombinant SARS-CoV-2 virus protein RBD, Chinese hamster ovary cell strain, producer of recombinant SARS-CoV-2 protein RBD, method for producing recombinant SARS-CoV-2 virus protein RBD, test system for enzyme immunoassay of human serum or plasma, and use thereof |
| CN111533809A (en)* | 2020-04-21 | 2020-08-14 | 中国科学院武汉病毒研究所 | Subunit vaccine for novel coronavirus and application |
| CN111560354A (en)* | 2020-05-22 | 2020-08-21 | 中国人民解放军总医院第五医学中心 | Recombinant novel coronavirus and preparation method and application thereof |
| RU2733834C1 (en)* | 2020-07-28 | 2020-10-07 | Федеральное бюджетное учреждение науки Государственный научный центр вирусологии и биотехнологии "Вектор" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ГНЦ ВБ "Вектор" Роспотребнадзора) | Artificial ectos_sc2 gene encoding an ectodomain of the sars-cov-2 coronavirus s glycoprotein with a c-terminal trimerization domain, a recombinant plasmid pstem-rvsv-ectos_sc2, which provides expression of the artificial gene, and a recombinant strain of vesicular stomatitis virus rvsv-ectos_sc2, used to create a vaccine against sars-cov-2 coronavirus |
| RU2733832C1 (en)* | 2020-07-28 | 2020-10-07 | Федеральное бюджетное учреждение науки "Государственный научный центр вирусологии и биотехнологии "Вектор" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ГНЦ ВБ "Вектор" Роспотребнадзора) | Artificial gene stbl_rbd_trm_sc2, coding a bicistronic structure formed by the sars-cov-2 coronavirus glycoprotein s receptor-binding domain sequences, transmembrane region, p2a-peptide and glycoprotein g vsv, recombinant plasmid pstem-rvsv-stbl_rbd_trm_sc2, providing expression of artificial gene, and a recombinant strain of vesicular stomatitis virus rvsv-stbl_rbd_trm_sc2, used to create a vaccine against sars-cov-2 coronavirus |
| RU2733831C1 (en)* | 2020-07-08 | 2020-10-07 | Федеральное государственное учреждение науки "Государственный научный центр вирусологии и биотехнологии "Вектор" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ГНЦ ВБ "Вектор" Роспотребнадзора) | Artificial gene coding a bicistronic structure formed by receptor-binding domain sequences of the glycoprotein s of the sars-cov-2 coronavirus, p2a-peptide and glycoprotein g vsv, recombinant plasmid pstem-rvsv-stbl_rbd_sc2, providing expression of artificial gene, and a recombinant strain of vesicular stomatitis virus rvsv-stbl_rbd_sc2, used to create a vaccine against sars-cov-2 coronavirus |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111533809A (en)* | 2020-04-21 | 2020-08-14 | 中国科学院武汉病毒研究所 | Subunit vaccine for novel coronavirus and application |
| RU2723008C1 (en)* | 2020-05-19 | 2020-06-08 | федеральное государственное бюджетное учреждение «Национальный исследовательский центр эпидемиологии и микробиологии имени почетного академика Н.Ф. Гамалеи» Министерства здравоохранения Российской Федерации | Method for producing Chinese hamster ovary cell strain, being a producer of recombinant SARS-CoV-2 virus protein RBD, Chinese hamster ovary cell strain, producer of recombinant SARS-CoV-2 protein RBD, method for producing recombinant SARS-CoV-2 virus protein RBD, test system for enzyme immunoassay of human serum or plasma, and use thereof |
| CN111560354A (en)* | 2020-05-22 | 2020-08-21 | 中国人民解放军总医院第五医学中心 | Recombinant novel coronavirus and preparation method and application thereof |
| RU2733831C1 (en)* | 2020-07-08 | 2020-10-07 | Федеральное государственное учреждение науки "Государственный научный центр вирусологии и биотехнологии "Вектор" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ГНЦ ВБ "Вектор" Роспотребнадзора) | Artificial gene coding a bicistronic structure formed by receptor-binding domain sequences of the glycoprotein s of the sars-cov-2 coronavirus, p2a-peptide and glycoprotein g vsv, recombinant plasmid pstem-rvsv-stbl_rbd_sc2, providing expression of artificial gene, and a recombinant strain of vesicular stomatitis virus rvsv-stbl_rbd_sc2, used to create a vaccine against sars-cov-2 coronavirus |
| RU2733834C1 (en)* | 2020-07-28 | 2020-10-07 | Федеральное бюджетное учреждение науки Государственный научный центр вирусологии и биотехнологии "Вектор" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ГНЦ ВБ "Вектор" Роспотребнадзора) | Artificial ectos_sc2 gene encoding an ectodomain of the sars-cov-2 coronavirus s glycoprotein with a c-terminal trimerization domain, a recombinant plasmid pstem-rvsv-ectos_sc2, which provides expression of the artificial gene, and a recombinant strain of vesicular stomatitis virus rvsv-ectos_sc2, used to create a vaccine against sars-cov-2 coronavirus |
| RU2733832C1 (en)* | 2020-07-28 | 2020-10-07 | Федеральное бюджетное учреждение науки "Государственный научный центр вирусологии и биотехнологии "Вектор" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ГНЦ ВБ "Вектор" Роспотребнадзора) | Artificial gene stbl_rbd_trm_sc2, coding a bicistronic structure formed by the sars-cov-2 coronavirus glycoprotein s receptor-binding domain sequences, transmembrane region, p2a-peptide and glycoprotein g vsv, recombinant plasmid pstem-rvsv-stbl_rbd_trm_sc2, providing expression of artificial gene, and a recombinant strain of vesicular stomatitis virus rvsv-stbl_rbd_trm_sc2, used to create a vaccine against sars-cov-2 coronavirus |
| Publication | Publication Date | Title |
|---|---|---|
| US20250108093A1 (en) | Factor VIII Sequences | |
| KR102063483B1 (en) | Composition and methods for highly efficient gene transfer using aav capsid variants | |
| RU2761879C1 (en) | VACCINE BASED ON AAV5 FOR THE INDUCTION OF SPECIFIC IMMUNITY TO THE SARS-CoV-2 VIRUS AND/OR THE PREVENTION OF CORONAVIRUS INFECTION CAUSED BY SARS-CoV-2 | |
| RU2760301C1 (en) | Aav5-based vaccine for induction of specific immunity to sars-cov-2 virus and/or prevention of coronavirus infection caused by sars-cov-2 | |
| CA3191194A1 (en) | Aav5-based vaccine against sars-cov-2 | |
| CN116685329B (en) | Nucleic acid constructs and their use in treating spinal muscular atrophy | |
| KR20220140537A (en) | Gene therapy to treat CDKL5 deficiency disorder | |
| CN117545842A (en) | Synergistic effect of SMN1 and miR-23a in treatment of spinal muscular atrophy | |
| JP2003511037A (en) | Production of recombinant AAV using adenovirus containing AAV rep / cap gene | |
| US20210403947A1 (en) | Miniaturized dystrophins and uses thereof | |
| CN112955557A (en) | Gene therapy for treating propionic acidemia | |
| Yamano et al. | Recombinant adeno-associated virus serotype 2 vectors mediate stable interleukin 10 secretion from salivary glands into the bloodstream | |
| AU2021282898A1 (en) | Codon-optimized nucleic acid encoding SMN1 protein | |
| RU2783313C1 (en) | VACCINE BASED ON AAV5 FOR INDUCTION OF SPECIFIC IMMUNITY TO SARS-CoV-2 VIRUS AND/OR PREVENTION OF CORONAVIRUS INFECTION CAUSED BY SARS-CoV-2 | |
| RU2839898C2 (en) | Synergetic action of smn1 and mir-23a in treating spinal muscular atrophy | |
| EA050137B1 (en) | AAV5-BASED VACCINE AGAINST SARS-CoV-2 | |
| US20240076691A1 (en) | Codon-optimized nucleic acid encoding the fix protein | |
| EA047326B1 (en) | SYNERGISTIC EFFECT OF SMN1 AND miR-23a IN THE TREATMENT OF SPINAL MUSCULAR ATROPHY | |
| OA21075A (en) | Codon-optimized nucleic acid that encodes SMN1 protein, and use thereof | |
| EA048549B1 (en) | CODON-OPTIMIZED NUCLEIC ACID THAT ENCODES THE COAGULATION FACTOR IX PROTEIN AND ITS APPLICATIONS |