Movatterモバイル変換


[0]ホーム

URL:


RU2813996C2 - Fusion protein of dctn1 protein with ret protein - Google Patents

Fusion protein of dctn1 protein with ret protein
Download PDF

Info

Publication number
RU2813996C2
RU2813996C2RU2020111214ARU2020111214ARU2813996C2RU 2813996 C2RU2813996 C2RU 2813996C2RU 2020111214 ARU2020111214 ARU 2020111214ARU 2020111214 ARU2020111214 ARU 2020111214ARU 2813996 C2RU2813996 C2RU 2813996C2
Authority
RU
Russia
Prior art keywords
leu
glu
ala
ser
lys
Prior art date
Application number
RU2020111214A
Other languages
Russian (ru)
Other versions
RU2020111214A3 (en
RU2020111214A (en
Inventor
Кохеи ХАЯСИ
Кейдзи ИСИДА
Original Assignee
Тайхо Фармасьютикал Ко., Лтд.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Тайхо Фармасьютикал Ко., Лтд.filedCriticalТайхо Фармасьютикал Ко., Лтд.
Priority claimed from PCT/JP2018/030688external-prioritypatent/WO2019039439A1/en
Publication of RU2020111214ApublicationCriticalpatent/RU2020111214A/en
Publication of RU2020111214A3publicationCriticalpatent/RU2020111214A3/ru
Application grantedgrantedCritical
Publication of RU2813996C2publicationCriticalpatent/RU2813996C2/en

Links

Images

Abstract

FIELD: biotechnology.
SUBSTANCE: invention relates to the identification of abnormalities in the body associated with the development of malignant tumours, and can be used in medicine for the diagnosis and treatment of malignant tumours of the thyroid gland. A DCTN1-RET fusion gene, consisting of the DCTN1 and RET genes, has been identified and is associated with a malignant thyroid tumour. The following is proposed: means and methods of its detection in the body, as well as of screening compounds aimed at inhibiting its expression or the activity of the fusion polypeptide it encodes and therapy of such tumours.
EFFECT: invention makes it possible to identify and treat a malignant thyroid tumour expressing the DCTN1-RET fusion gene.
37 cl, 9 dwg, 7 tbl, 9 ex

Description

Translated fromRussian

Область техникиField of technology

[0001][0001]

Настоящее изобретение относится к полипептиду, представляющему собой слитый белок из белка DCTN1 и белка RET; к полинуклеотиду, кодирующему полипептид; к способу детекции полипептида или полинуклеотида; к соединению, нацеленному на полипептид или полинуклеотид; и к способу скрининга соединения.The present invention relates to a polypeptide that is a fusion protein of the DCTN1 protein and the RET protein; to a polynucleotide encoding a polypeptide; a method for detecting a polypeptide or polynucleotide; to a compound targeting a polypeptide or polynucleotide; and a method for screening the compound.

Уровень техникиState of the art

[0002][0002]

Злокачественная опухоль является основной причиной смерти в Японии, и ее лечение необходимо улучшать. Несмотря на то, что количество индивидуумов, пораженных раком щитовидной железы, увеличивается, соответствующее лечение на начальной стадии приводит к высокому уровню выживаемости, благодаря медленному прогрессированию заболевания в большинстве случаев. Заболевание, однако, почти не имеет субъективных симптомов, и ранняя диагностика является необходимой для адекватного лечения.Malignancy is the leading cause of death in Japan, and its treatment needs to be improved. Although the number of individuals affected by thyroid cancer is increasing, appropriate treatment at the initial stage leads to a high survival rate due to the slow progression of the disease in most cases. The disease, however, has almost no subjective symptoms, and early diagnosis is necessary for adequate treatment.

[0003][0003]

Рак щитовидной железы разделяют по гистологическим типам на папиллярную злокачественную опухоль, фолликулярную злокачественную опухоль, медуллярную злокачественную опухоль, анапластическую злокачественную опухоль и злокачественную лимфому. Папиллярная злокачественная опухоль насчитывает приблизительно 80% рака щитовидной железы, и анапластическая злокачественная опухоль, которая, несмотря на то, что имеет более низкую встречаемость, как известно, имеет очень плохой прогноз (непатентный литературный источник 1).Thyroid cancer is classified according to histological types into papillary malignancy, follicular malignancy, medullary malignancy, anaplastic malignancy and malignant lymphoma. Papillary malignancy accounts for approximately 80% of thyroid cancers, and anaplastic malignancy, which, although having a lower incidence, is known to have a very poor prognosis (Non-Patent Literature 1).

[0004][0004]

Известно, что папиллярная злокачественная опухоль развивается в большой степени из-за активации онкогенов, и выявлены взаимоисключающие генетические аномалии, такие как мутация в гене BRAF (50-60%), мутация в гене RAS (10-20%) и слитый ген RET (5-10%). Опубликованы также исследования, что при немелкоклеточном рак легкого, слитый ген RET присутствует с частотой 1-2%, взаимоисключающим образом с управляющими мутациями в других генах, такими как мутация в гене EGFR (непатентные литературные источники 2-5).Papillary malignancy is known to develop largely due to activation of oncogenes, and mutually exclusive genetic abnormalities have been identified, such as mutation in the BRAF gene (50-60%), mutation in the RAS gene (10-20%), and RET fusion gene ( 5-10%). Studies have also been published that in non-small cell lung cancer, the RET fusion gene is present at a frequency of 1-2%, mutually exclusive with driving mutations in other genes, such as a mutation in the EGFR gene (non-patent literature 2-5).

[0005][0005]

Лечение лекарственными средствами является преобладающим способом лечения рака щитовидной железы на поздних стадиях, и апробировано множество ингибиторов множества киназ. Однако лекарственные средства, проявляющие эффект, специфический для управляющих мутаций в генах, остаются не одобренными. Опубликованы результаты исследований, что для положительных по слитому гену RET пациентов с раком легкого показано преимущество от ингибирования RET (непатентный литературный источник 6); также при раке щитовидной железы необходимо идентифицировать генные аномалии, такие как мутации в генах или слитые гены, которые могут являться показателем эффекта лекарственных средств.Drug treatment is the predominant treatment for advanced thyroid cancer, and a variety of multiple kinase inhibitors have been tested. However, drugs that exhibit effects specific to driver gene mutations remain unapproved. Studies have been published that RET fusion gene positive lung cancer patients benefit from RET inhibition (Non-Patent Literature 6); Also in thyroid cancer, it is necessary to identify gene abnormalities, such as gene mutations or fusion genes, which may be an indicator of the effect of drugs.

[0006][0006]

Очень желательна идентификация мутаций в генах (мутаций в белках), слитых генов (слитых белков) и т.д., которые могут управлять злокачественной опухолью; поскольку такая идентификация может прояснять природу злокачественной опухоли и вносить значительный вклад в разработку новых лекарственных средств для лечения злокачественных опухолей или способов тестирования, направленных на эти мутации в генах или слитые гены. Однако мутации в генах, слитые гены и т.д., которые могут управлять развитием злокачественных опухолей, еще предстоит полностью прояснить, и идентификация генных аномалий, которые могут быть ассоциированы с терапевтическими эффектами лекарственных средств, могут являться очень важными.It is highly desirable to identify mutations in genes (mutations in proteins), fusion genes (fusion proteins), etc., which can drive malignancy; since such identification may clarify the nature of the malignancy and make a significant contribution to the development of new drugs for the treatment of malignancies or testing methods aimed at these gene mutations or fusion genes. However, gene mutations, gene fusions, etc., which may drive the development of malignancies have yet to be fully elucidated, and identification of gene abnormalities that may be associated with the therapeutic effects of drugs may be very important.

Список литературыBibliography

Непатентные литературные источникиNon-patent literature

[0007][0007]

Непатентный литературный источник 1: Cancer, 115 (16), pp. 3801-7 (2009)Non-Patent Literature 1: Cancer, 115(16), pp. 3801-7 (2009)

Непатентный литературный источник 2: Oncogene, 22 (29), pp. 4578-80 (2003)Non-Patent Literature 2: Oncogene, 22(29), pp. 4578-80 (2003)

Непатентный литературный источник 3: Cell, 159 (3), pp. 676-90 (2014)Non-Patent Literature 3: Cell, 159(3), pp. 676-90 (2014)

Непатентный литературный источник 4: Cancer Discov., 3 (6), pp. 630-5 (2013)Non-Patent Literature 4: Cancer Discov., 3(6), pp. 630-5 (2013)

Непатентный литературный источник 5: Nature, 511 (7511), pp. 543-50 (2014)Non-Patent Literature 5: Nature, 511 (7511), pp. 543-50 (2014)

Непатентный литературный источник 6: Lancet Respir Med., 5 (1), pp. 42-50 (2017).Non-Patent Literature 6: Lancet Respir Med., 5(1), pp. 42-50 (2017).

Сущность изобретенияThe essence of the invention

Техническая задачаTechnical challenge

[0008][0008]

Целью настоящего изобретения является разработка нового полипептида, представляющего собой слитый белок, включающий по меньшей мере часть белка RET; полинуклеотида, кодирующего полипептид; способа детекции полипептида или полинуклеотида; соединения, нацеленного на полипептид или полинуклеотид; и способа скрининга соединения.The purpose of the present invention is to develop a new polypeptide that is a fusion protein comprising at least a portion of the RET protein; a polynucleotide encoding a polypeptide; a method for detecting a polypeptide or polynucleotide; a compound targeting a polypeptide or polynucleotide; and a method for screening the compound.

Решение задачиThe solution of the problem

[0009][0009]

Авторы настоящего изобретения провели интенсивное исследование для достижения этой цели и идентифицировали новый полипептид, в котором часть белка DCTN1 слита с частью белка RET, и полинуклеотид, кодирующий полипептид, в клетках, полученных от пациентов с раком щитовидной железы. Авторы изобретения обнаружили также способ детекции полинуклеотида или полипептида по настоящему изобретению в клетках злокачественных опухолей, и способ скрининга соединения, ингибирующего экспрессию полинуклеотида, или экспрессию и/или активность полипептида. Это является новым обнаружением и не может быть предсказано из предшествующего уровня техники, что, среди широкого диапазона белков, слитый белок, содержащий комбинацию N-концевой части белка DCTN1 и C-концевой части белка RET, естественным образом встречается внутри клеток; и что, поскольку слитый ген из DCTN1 и RET функционирует как управляющий злокачественной опухолью, слитый белок можно использовать в диагностике злокачественных опухолей. Они, кроме того, обнаружили фармацевтическую композицию, которая содержит соединение, ингибирующее RET, в качестве активного ингредиента, и которая предназначена для использования в лечении пациентов с злокачественной опухолью, имеющей экспрессию полипептида и/или полинуклеотида, и завершили настоящее изобретение.The inventors of the present invention have conducted intensive research to achieve this goal and have identified a novel polypeptide in which a portion of the DCTN1 protein is fused to a portion of the RET protein and a polynucleotide encoding the polypeptide in cells obtained from thyroid cancer patients. The inventors have also discovered a method for detecting a polynucleotide or polypeptide of the present invention in cancer cells, and a method for screening a compound that inhibits the expression of the polynucleotide or the expression and/or activity of the polypeptide. It is a new finding and cannot be predicted from the prior art that, among a wide range of proteins, a fusion protein containing a combination of the N-terminal portion of the DCTN1 protein and the C-terminal portion of the RET protein occurs naturally within cells; and that since the fusion gene of DCTN1 and RET functions as a tumor driver, the fusion protein can be used in the diagnosis of cancer. They have further discovered a pharmaceutical composition which contains a RET inhibitory compound as an active ingredient, and which is intended for use in the treatment of patients with cancer expressing a polypeptide and/or polynucleotide, and completed the present invention.

[0010][0010]

Конкретно, настоящее изобретение относится к следующему объекту.Specifically, the present invention relates to the following subject.

[0011][0011]

Пункт 1.Paragraph 1.

Полипептид, где N-концевая часть белка DCTN1 слита с C-концевой частью белка RET.A polypeptide where the N-terminal part of the DCTN1 protein is fused to the C-terminal part of the RET protein.

[0012][0012]

Пункт 2.Point 2.

Полипептид по пункту 1, выбранный из следующих (a)-(c):The polypeptide according toclaim 1, selected from the following (a)-(c):

[0013][0013]

(a) полипептид, содержащий аминокислотную последовательность, представленную SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24;(a) a polypeptide containing the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24;

[0014][0014]

(b) полипептид, содержащий аминокислотную последовательность, где одна или несколько аминокислот заменены, делетированы или добавлены в аминокислотной последовательности, представленной SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24; и(b) a polypeptide containing an amino acid sequence wherein one or more amino acids are replaced, deleted or added in the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24; And

[0015][0015]

(c) полипептид, содержащий аминокислотную последовательность, имеющую по меньшей мере 90% идентичность с аминокислотной последовательностью, представленной SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24.(c) a polypeptide containing an amino acid sequence having at least 90% identity with the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 , SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24.

[0016][0016]

Пункт 3.Point 3.

Полинуклеотид, кодирующий полипептид по пункту 1 или 2.A polynucleotide encoding a polypeptide according toclaim 1 or 2.

[0017][0017]

Пункт 4.Point 4.

Полинуклеотид по пункту 3, выбранный из следующих (d) - (f):The polynucleotide according toclaim 3, selected from the following (d) - (f):

[0018][0018]

(d) полинуклеотид, кодирующий полипептид, содержащий аминокислотную последовательность, представленную SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24;(d) a polynucleotide encoding a polypeptide containing the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24;

[0019][0019]

(e) полинуклеотид, кодирующий полипептид, содержащий аминокислотную последовательность, где одна или несколько аминокислот заменены, делетированы или добавлены в аминокислотной последовательности, представленной SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24; и(e) a polynucleotide encoding a polypeptide containing an amino acid sequence wherein one or more amino acids are replaced, deleted or added in the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8 , SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24; And

[0020][0020]

(f) полинуклеотид, кодирующий полипептид, содержащий аминокислотную последовательность, имеющую по меньшей мере 90% идентичность с аминокислотной последовательностью, представленной SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24.(f) a polynucleotide encoding a polypeptide containing an amino acid sequence having at least 90% identity with the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24.

[0021][0021]

Пункт 5.Point 5.

Полинуклеотид по пункту 3, выбранный из следующих (g)-(i):The polynucleotide according toclaim 3, selected from the following (g)-(i):

[0022][0022]

(g) полинуклеотид, содержащий последовательность оснований, представленную SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23;(g) a polynucleotide containing the base sequence represented by SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23;

[0023][0023]

(h) полинуклеотид, гибридизующийся в строгих условиях с полинуклеотидом, содержащим последовательность оснований, комплементарную последовательности оснований, представленной SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23; и(h) a polynucleotide that hybridizes under stringent conditions to a polynucleotide containing a base sequence complementary to the base sequence represented by SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9 , SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23; And

[0024][0024]

(i) полинуклеотид, имеющий по меньшей мере 90% идентичность с последовательностью оснований, представленной SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23.(i) a polynucleotide having at least 90% identity with the base sequence represented by SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO : 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23.

[0025][0025]

Пункт 6.Point 6.

Экспрессирующий вектор, содержащий полинуклеотид по любому из пунктов 3-5.An expression vector containing a polynucleotide according to any of items 3-5.

[0026][0026]

Пункт 7.Point 7.

Клетка, трансфицированная полинуклеотидом по любому из пунктов 3-5.A cell transfected with a polynucleotide according to any of items 3-5.

[0027][0027]

Пункт 8.Point 8.

Антитело, специфически связывающееcя с полипептидом по пункту 1 или 2.An antibody that specifically binds to the polypeptide ofitem 1 or 2.

[0028][0028]

Пункт 9.Point 9.

Способ детекции присутствия полипептида по пункту 1 или 2 в образце.A method for detecting the presence of a polypeptide according toclaim 1 or 2 in a sample.

[0029][0029]

Пункт 10.Point 10.

Праймер или зонд для детекции присутствия полинуклеотида по любому из пунктов 3-5 в образце, представляющий собой полинуклеотид, выбранный из следующих (j) - (l):A primer or probe for detecting the presence of a polynucleotide according to any one of items 3-5 in a sample, which is a polynucleotide selected from the following (j) - (l):

[0030][0030]

(j) полинуклеотид, представляющий собой по меньшей мере один зонд, выбранный из группы, состоящей из зондов, гибридизующихся с полинуклеотидом, кодирующим белок DCTN1, и зондов, гибридизующихся с полинуклеотидом, кодирующим белок RET;(j) a polynucleotide comprising at least one probe selected from the group consisting of probes hybridizing to a polynucleotide encoding a DCTN1 protein and probes hybridizing to a polynucleotide encoding a RET protein;

[0031][0031]

(k) полинуклеотид, представляющий собой зонд, гибридизующийся с точкой слияния между полинуклеотидом, кодирующим белок DCTN1, и полинуклеотидом, кодирующим белок RET; и(k) a polynucleotide that is a probe that hybridizes to a fusion point between a polynucleotide encoding a DCTN1 protein and a polynucleotide encoding a RET protein; And

[0032][0032]

(l) полинуклеотид, представляющий собой набор из смыслового праймера и антисмыслового праймера, разработанных для обрамления точки слияния между полинуклеотидом, кодирующим белок DCTN1, и полинуклеотидом, кодирующим белок RET.(l) a polynucleotide consisting of a sense primer and an antisense primer designed to flank the fusion point between a polynucleotide encoding a DCTN1 protein and a polynucleotide encoding a RET protein.

[0033][0033]

Пункт 11.Point 11.

Способ детекции присутствия полинуклеотида по любому из пунктов 3-5 в образце.A method for detecting the presence of a polynucleotide according to any of items 3-5 in a sample.

[0034][0034]

Пункт 12.Point 12.

Способ диагностики злокачественной опухоли у пациента, когда присутствие полипептида по пункту 1 или 2 или полинуклеотида по любому из пунктов 3-5 детектируют в образце, полученном от пациента, посредством способа детекции по пункту 9 или 11.A method for diagnosing a malignant tumor in a patient, when the presence of a polypeptide according toparagraph 1 or 2 or a polynucleotide according to any of paragraphs 3-5 is detected in a sample obtained from the patient by means of the detection method according toparagraph 9 or 11.

[0035][0035]

Пункт 13.Point 13.

Фармацевтическая композиция для лечения злокачественной опухоли, которая является положительной по гену, слитому из гена DCTN1 и гена RET, и/или положительной по белку, слитому из белка DCTN1 и белка RET, где композиция содержит соединение, ингибирующее RET, в качестве активного ингредиента.A pharmaceutical composition for the treatment of a malignant tumor that is positive for a gene fused from a DCTN1 gene and a RET gene, and/or positive for a protein fused from a DCTN1 protein and a RET protein, where the composition contains a compound that inhibits RET as an active ingredient.

[0036][0036]

Пункт 14.Point 14.

Способ скрининга соединения, ингибирующего экспрессию и/или активность полипептида по пункту 1 или 2, или экспрессию полинуклеотида по любому из пунктов 3-5, включающий следующие стадии (1) и (2):A method for screening a compound that inhibits the expression and/or activity of a polypeptide according toparagraph 1 or 2, or the expression of a polynucleotide according to any of paragraphs 3-5, comprising the following steps (1) and (2):

[0037][0037]

(1) стадию приведения полипептида по пункту 1 или 2, клетки, экспрессирующей полипептид по пункту 1 или 2, или полинуклеотида по любому из пунктов 3-5, или клетки по пункту 7 в контакт с тестируемым соединением; и(1) the step of bringing the polypeptide ofclaim 1 or 2, a cell expressing the polypeptide ofclaim 1 or 2, or the polynucleotide of any ofclaims 3 to 5, or the cell ofclaim 7 into contact with a test compound; And

[0038][0038]

(2) стадию измерения того, ингибирована ли экспрессия и/или активность полипептида по пункту 1 или 2, или экспрессия полинуклеотида по любому из пунктов 3-5 на стадии (1), или стадию измерения того, ингибирован ли рост клетки на стадии (1).(2) the step of measuring whether the expression and/or activity of the polypeptide ofitem 1 or 2, or the expression of the polynucleotide of any ofitems 3 to 5 in step (1), or the step of measuring whether cell growth is inhibited in step (1 ).

[0039][0039]

Пункт 15.Point 15.

Способ с использованием полипептида по пункту 1 или 2 или полинуклеотида по любому из пунктов 3-5 в качестве индикатора для определения того, является ли эффективной химиотерапия с использованием соединения, ингибирующего RET,A method using the polypeptide ofclaim 1 or 2 or the polynucleotide of any ofclaims 3 to 5 as an indicator for determining whether chemotherapy using a RET inhibitory compound is effective,

включающий определение того, что химиотерапия с использованием соединения, ингибирующего RET, является эффективной, когда полипептид по пункту 1 или 2 детектируют в образце посредством способа детекции по пункту 9, и/или когда присутствие полинуклеотида по любому из пунктов 3-5 детектируют в образце посредством способа детекции по пункту 11.comprising determining that chemotherapy using a RET inhibitory compound is effective when the polypeptide ofclaim 1 or 2 is detected in the sample by the detection method ofclaim 9, and/or when the presence of the polynucleotide of any of claims 3-5 is detected in the sample by detection method according toparagraph 11.

[0040][0040]

Пункт 16.Point 16.

Биомаркер для детекции злокачественной опухоли, содержащий по меньшей мере один член, выбранный из группы, состоящей из полипептидов, где N-концевая часть белка DCTN1 слита с C-концевой частью белка RET, и полинуклеотидов, кодирующих полипептиды.A biomarker for detecting a malignant tumor containing at least one member selected from the group consisting of polypeptides where the N-terminal portion of the DCTN1 protein is fused to the C-terminal portion of the RET protein, and polynucleotides encoding the polypeptides.

[0041][0041]

Пункт 17.Point 17.

Способ лечения злокачественной опухоли, включающийA method for treating a malignant tumor, comprising

проведение химиотерапии с использованием соединения, ингибирующего RET, для пациента с злокачественной опухолью, положительного по гену, слитому из гена DCTN1 и гена RET, и/или положительного по белку, слитому из белка DCTN1 и белка RET.administering chemotherapy using a RET inhibitory compound to a cancer patient positive for a DCTN1-RET fusion gene and/or positive for a DCTN1-RET fusion protein.

[0042] Пункт 18.[0042] Item 18.

Способ лечения злокачественной опухоли, включающийA method for treating a malignant tumor, comprising

детекцию присутствия полипептида по пункту 1 или 2, и/или присутствия полинуклеотида по любому из пунктов 3-5 в образце, полученном от тестируемого субъекта, иdetecting the presence of the polypeptide ofclaim 1 or 2, and/or the presence of the polynucleotide of any of claim 3-5 in a sample obtained from the test subject, and

проведение химиотерапии с использованием соединения, ингибирующего RET, для тестируемого субъекта, когда детектировано присутствие полипептида по пункту 1 или 2, и/или детектировано присутствие полинуклеотида по любому из пунктов 3-5.administering chemotherapy using a RET inhibitory compound to a test subject when the presence of a polypeptide ofitem 1 or 2 is detected, and/or the presence of a polynucleotide of any of items 3-5 is detected.

[0043][0043]

Пункт 19.Point 19.

Соединение, ингибирующее RET, для применения в лечении пациента со злокачественной опухолью, положительной по гену, слитому из гена DCTN1 и гена RET, и/или положительной по белку, слитому из белка DCTN1 и белка RET.A RET inhibitory compound for use in the treatment of a patient with a cancer positive for a DCTN1-RET fusion gene and/or positive for a DCTN1-RET fusion protein.

[0044][0044]

Пункт 20.Point 20.

Применение соединения, ингибирующего RET, для получения фармацевтической композиции для лечения злокачественной опухоли для лечения пациента со злокачественной опухолью, положительной по гену, слитому из гена DCTN1 и гена RET, и/или положительной по белку, слитому из белка DCTN1 и белка RET.Use of a RET inhibitory compound for the preparation of a pharmaceutical composition for the treatment of a malignant tumor for the treatment of a patient with a malignant tumor positive for a fusion gene of the DCTN1 gene and a RET gene, and/or positive for a fusion protein of a DCTN1 protein and a RET protein.

[0045][0045]

Пункт 21.Point 21.

Способ получения реагента для определения того, является ли химиотерапия с использованием соединения, ингибирующего RET, эффективной, с использованием средств для детекции присутствия полипептида по пункту 1 или 2 в образце, и/или средств для детекции присутствия полинуклеотида по любому из пунктов 3-5 в образце.A method for producing a reagent for determining whether chemotherapy using a RET inhibitory compound is effective, using means for detecting the presence of a polypeptide ofclaim 1 or 2 in a sample, and/or means for detecting the presence of a polynucleotide of any of claims 3-5 in sample.

[0046][0046]

Пункт 22.Point 22.

Комбинация антитела к DCTN1 и антитела к RET для детекции присутствия полинуклеотида по любому из пунктов 3-5.A combination of an anti-DCTN1 antibody and an anti-RET antibody to detect the presence of a polynucleotide according to any of items 3-5.

[0047][0047]

Пункт 23.Point 23.

Применение антитела по пункту 8, комбинации антител по пункту 22 или праймера или зонда по пункту 10 для получения детектирующего реагента для детекции присутствия полипептида по пункту 1 или 2 или присутствия полинуклеотида по любому из пунктов 3-5.Use of the antibody of claim 8, the combination of antibodies of claim 22, or the primer or probe ofclaim 10 to obtain a detection reagent for detecting the presence of a polypeptide ofclaim 1 or 2 or the presence of a polynucleotide of any of claims 3-5.

Выгодные эффекты изобретенияBeneficial Effects of the Invention

[0048][0048]

В настоящем изобретении показано, что полинуклеотид и/или полипептид по настоящему изобретению специфически экспрессируются в клетке злокачественной опухоли. Полинуклеотид, полипептид и клетку, экспрессирующую полинуклеотид и/или полипептид по настоящему изобретению, можно использовать в способе скрининга соединения, ингибирующего экспрессию полинуклеотида, или экспрессию и/или активность полипептида по настоящему изобретению. Использование присутствия полинуклеотида и/или полипептида по настоящему изобретению в качестве индикатора позволяет детекцию мишени, положительной по гену, слитому из гена DCTN1 и гена RET, и/или мишени, положительной по белку, слитому из белка DCTN1 и белка RET. Соединение, ингибирующее RET, можно использовать в качестве фармацевтической композиции для лечения злокачественной опухоли, которая является положительной по гену, слитому из гена DCTN1 и гена RET, и/или положительной по белку, слитому из белка DCTN1 и белка RET.The present invention shows that the polynucleotide and/or polypeptide of the present invention are specifically expressed in a cancer cell. A polynucleotide, a polypeptide, and a cell expressing a polynucleotide and/or a polypeptide of the present invention can be used in a method for screening a compound that inhibits the expression of a polynucleotide, or the expression and/or activity of a polypeptide of the present invention. Using the presence of a polynucleotide and/or polypeptide of the present invention as an indicator allows detection of a target positive for a gene fused from a DCTN1 gene and a RET gene and/or a target positive for a fusion protein of DCTN1 and a RET protein. The RET inhibitory compound can be used as a pharmaceutical composition for the treatment of a cancer that is positive for a fusion gene of the DCTN1 gene and a RET gene and/or positive for a fusion protein of DCTN1 and a RET protein.

Краткое описание чертежейBrief description of drawings

[0049][0049]

Фиг. 1: Подтверждение экспрессии слитого гена DCTN1-RET и GAPDH в ткани злокачественной опухоли щитовидной железы с использованием цифровой капельной ПЦР (цкПЦР).Fig. 1: Confirmation of DCTN1-RET and GAPDH fusion gene expression in thyroid cancer tissue using digital droplet PCR (dccPCR).

Фиг. 2: Подтверждение экспрессии слитого гена DCTN1-RET и GAPDH в нормальной ткани щитовидной железы с использованием цифровой капельной ПЦР (цкПЦР).Fig. 2: Confirmation of DCTN1-RET and GAPDH fusion gene expression in normal thyroid tissue using digital droplet PCR (dccPCR).

Фиг. 3: Подтверждение экспрессии полноразмерного слитого гена DCTN1-RET в нормальной ткани щитовидной железы и в ткани злокачественной опухоли щитовидной железы.Fig. 3: Confirmation of expression of full-length DCTN1-RET fusion gene in normal thyroid tissue and malignant thyroid tumor tissue.

Фиг. 4: Подтверждение экспрессии слитого белка DCTN1-RET в экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3:Fig. 4: Confirmation of DCTN1-RET fusion protein expression in DCTN1-RET fusion gene-expressing NIH/3T3 cells:

a) Детекция слитого белка DCTN1-RET с использованием антитела к фосфорилированного RET;a) Detection of DCTN1-RET fusion protein using an antibody to phosphorylated RET;

b) Детекция слитого белка DCTN1-RET с использованием антитела к RET; иb) Detection of DCTN1-RET fusion protein using anti-RET antibody; And

c) Детекция слитого белка DCTN1-RET с использованием антитела к DCTN1.c) Detection of DCTN1-RET fusion protein using anti-DCTN1 antibody.

Фиг. 5: Подтверждение роста клеток NIH/3T3, экспрессирующих слитый ген DCTN1-RET, в 3-мерной культуре.Fig. 5: Confirmation of growth of NIH/3T3 cells expressing the DCTN1-RET fusion gene in 3D culture.

N=3, среднее+SD.N=3, mean+SD.

Фиг. 6: Подтверждение онкогенности клеток NIH/3T3, экспрессирующих слитый ген DCTN1-RET,in vivo.Fig. 6: Confirmation of tumorigenicity of NIH/3T3 cells expressing the DCTN1-RET fusion genein vivo .

Фиг. 7: Подтверждение ингибирования экспрессии фосфорилированного RET посредством миРНК RET в клетках NIH/3T3, экспрессирующих слитый ген DCTN1-RET.Fig. 7: Confirmation of inhibition of phosphorylated RET expression by RET siRNA in NIH/3T3 cells expressing the DCTN1-RET fusion gene.

Фиг. 8: Подтверждение эффекта ингибирования роста на клетки NIH/3T3, экспрессирующие слитый ген DCTN1-RET, посредством миРНК RET.Fig. 8: Confirmation of the growth inhibition effect on NIH/3T3 cells expressing the DCTN1-RET fusion gene by RET siRNA.

Фиг. 9: Подтверждение ингибирования экспрессии фосфорилированного RET в клетках NIH/3T3, экспрессирующих слитый ген DCTN1-RET, посредством соединений, ингибирующих RET.Fig. 9: Confirmation of inhibition of phosphorylated RET expression in NIH/3T3 cells expressing the DCTN1-RET fusion gene by RET inhibitory compounds.

Описание вариантов осуществленияDescription of Embodiments

[0050][0050]

Настоящее изобретение относится к новому полинуклеотиду или полипептиду; к способу детекции полинуклеотида или полипептида; к соединению, нацеленному на полинуклеотид или полипептид; и к способу скрининга соединения.The present invention relates to a new polynucleotide or polypeptide; a method for detecting a polynucleotide or polypeptide; to a compound targeting a polynucleotide or polypeptide; and a method for screening the compound.

[0051][0051]

Настоящее изобретение относится к полипептиду, в котором N-концевая часть белка DCTN1 слита с C-концевой частью белка RET (который может быть далее в настоящем описании обозначен как «полипептид по настоящему изобретению»). Настоящее изобретение также относится к полинуклеотиду, кодирующему полипептид (который может быть далее в настоящем описании обозначен как «полинуклеотид по настоящему изобретению»).The present invention provides a polypeptide in which the N-terminal portion of the DCTN1 protein is fused to the C-terminal portion of the RET protein (which may be referred to hereinafter as a "polypeptide of the present invention"). The present invention also relates to a polynucleotide encoding a polypeptide (which may be referred to hereinafter as a “polynucleotide of the present invention”).

[0052][0052]

«Белок DCTN1 (субъединицу 1 динактина)» по настоящему изобретению называют также белком ассоциированного с динеином полипептида 150 кДа или белком DAP-150, и он включает белок DCTN1 человека или не относящегося к человеку млекопитающего, где белок DCTN1 человека является предпочтительным. Белок DCTN1 кодирован геном, локализованным на 2p13.1 у человека. По настоящему изобретению, «белок DCTN1» включает изоформы (его варианты сплайсинга), и примеры белка DCTN1 человеческого происхождения включают полипептиды, содержащие аминокислотную последовательность, представленную номером доступа в GenPept NP_004073, NP_075408, NP_001128512, NP_001128513, NP_001177765 или NP_001177766. Более конкретно, примеры включают полипептиды, содержащие аминокислотную последовательность, представленную SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 29 или SEQ ID NO: 30. Кроме того, «N-концевая часть белка DCTN1» по настоящему изобретению относится к полипептиду, содержащему часть или весь суперспиральный домен, который находится на N-концевой стороне белка DCTN1, и предпочтительно, к полипептиду, содержащему весь суперспиральный домен, который находится на N-концевой стороне белка DCTN1.The “DCTN1 (dynactin subunit 1) protein” of the present invention is also referred to as dynein-associated polypeptide 150 kDa protein or DAP-150 protein, and includes the human or non-human mammal DCTN1 protein, where the human DCTN1 protein is preferred. The DCTN1 protein is encoded by a gene located on 2p13.1 in humans. In the present invention, “DCTN1 protein” includes isoforms (splice variants thereof), and examples of DCTN1 protein of human origin include polypeptides containing the amino acid sequence represented by GenPept accession number NP_004073, NP_075408, NP_001128512, NP_001128513, NP_001177765 or NP_00117776 6. More specifically, examples include polypeptides containing the amino acid sequence represented by SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 29, or SEQ ID NO: 30. Additionally "DCTN1 protein N-terminal portion" of the present invention refers to a polypeptide containing part or all of the coiled-coil domain that is located on the N-terminal side of the DCTN1 protein, and preferably, a polypeptide containing the entire coiled-coil domain that is located on the N-terminal side of the DCTN1 protein. side of the DCTN1 protein.

[0053][0053]

«Белок RET» по настоящему изобретению называют также протоонкогенным белком RET, белком рецепторной тирозинкиназы RET или белком, подвергаемым реаранжировке в ходе трансфекции; и включает белок RET человека или не относящегося к человеку млекопитающего, где белок RET человека является предпочтительным. Белок RET кодирован геном, локализованным на 10q11.2 у человека. По настоящему изобретению, «белок RET» включает изоформы (его варианты сплайсинга), и примеры белка RET человеческого происхождения включают полипептиды, содержащие аминокислотную последовательность, представленную номером доступа в GenPept NP_066124 или NP_065681. Более конкретно, примеры включают полипептиды, содержащие аминокислотную последовательность, представленную SEQ ID NO: 31 или SEQ ID NO: 32. Кроме того, «C-концевая часть белка RET» по настоящему изобретению относится к полипептиду, содержащему киназный домен, который находится на C-концевой стороне белка RET.The “RET protein” of the present invention is also referred to as proto-oncogene RET protein, receptor tyrosine kinase protein RET, or transfection-rearranged protein; and includes a human or non-human mammal RET protein, where the human RET protein is preferred. The RET protein is encoded by a gene located on 10q11.2 in humans. As used herein, “RET protein” includes isoforms (splice variants thereof), and examples of RET protein of human origin include polypeptides containing the amino acid sequence represented by GenPept accession number NP_066124 or NP_065681. More specifically, examples include polypeptides containing the amino acid sequence represented by SEQ ID NO: 31 or SEQ ID NO: 32. Moreover, the “C-terminal portion of the RET protein” of the present invention refers to a polypeptide containing a kinase domain that is located at C -terminal side of the RET protein.

[0054][0054]

«Полипептид, в котором N-концевая часть белка DCTN1 является слитой с C-концевой частью белка RET», по настоящему изобретению, представляет собой полипептид, в котором полипептид, содержащий часть или весь суперспиральный домен, который находится на N-концевой стороне белка DCTN1, является слитым с полипептидом, содержащим киназный домен, который находится на C-концевой стороне белка RET, предпочтительно, полипептид, в котором полипептид, содержащий весь суперспиральный домен, который находится на N-концевой стороне белка DCTN1, является слитым с полипептидом, содержащим киназный домен, который находится на C-концевой стороне белка RET, и более предпочтительно, с полипептидом, выбранным из следующих (a)-(c). Эти полипептиды, предпочтительно, имеют активность киназы и/или эффект вызова пролиферации клеток."A polypeptide in which the N-terminal portion of the DCTN1 protein is fused to the C-terminal portion of the RET protein" of the present invention is a polypeptide in which the polypeptide contains part or all of the coiled-coil domain that is located on the N-terminal side of the DCTN1 protein , is fused to a polypeptide containing a kinase domain that is located on the C-terminal side of the RET protein, preferably a polypeptide in which a polypeptide containing the entire coiled-coil domain that is located on the N-terminal side of the DCTN1 protein is fused to a polypeptide containing a kinase a domain that is located at the C-terminal side of the RET protein, and more preferably, with a polypeptide selected from the following (a)-(c). These polypeptides preferably have kinase activity and/or cell proliferation inducing effect.

[0055][0055]

(a) Полипептид, содержащий аминокислотную последовательность, представленную SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24.(a) A polypeptide containing the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24.

[0056][0056]

(b) Полипептид, содержащий аминокислотную последовательность, где одна или несколько аминокислот заменены, делетированы или добавлены в аминокислотной последовательности, представленной SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24.(b) A polypeptide containing an amino acid sequence wherein one or more amino acids are replaced, deleted or added in the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24.

[0057][0057]

(c) Полипептид, содержащий аминокислотную последовательность, имеющую по меньшей мере 90% идентичность с аминокислотной последовательностью, представленной SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24.(c) A polypeptide containing an amino acid sequence having at least 90% identity with the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 , SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24.

[0058][0058]

Более предпочтительно, полипептид выбран из следующих (a)-(c). Эти полипептиды, предпочтительно, имеют активность киназы или эффект вызова пролиферации клеток.More preferably, the polypeptide is selected from the following (a)-(c). These polypeptides preferably have kinase activity or the effect of inducing cell proliferation.

[0059][0059]

(a) Полипептид, содержащий аминокислотную последовательность, представленную SEQ ID NO: 18.(a) A polypeptide containing the amino acid sequence represented by SEQ ID NO: 18.

[0060][0060]

(b) Полипептид, содержащий аминокислотную последовательность, где одна или несколько аминокислот заменены, делетированы или добавлены в аминокислотной последовательности, представленной SEQ ID NO: 18.(b) A polypeptide comprising an amino acid sequence wherein one or more amino acids are replaced, deleted or added in the amino acid sequence represented by SEQ ID NO: 18.

[0061][0061]

(c) Полипептид, содержащий аминокислотную последовательность, имеющую по меньшей мере 90% идентичность с аминокислотной последовательностью, представленной SEQ ID NO: 18.(c) A polypeptide comprising an amino acid sequence having at least 90% identity with the amino acid sequence represented by SEQ ID NO: 18.

[0062][0062]

«Полипептид, в котором N-концевая часть белка DCTN1 является слитой с C-концевой частью белка RET», по настоящему изобретению включает полипептиды, содержащие аминокислотную последовательность, где одна или несколько аминокислот заменены, делетированы или добавлены в аминокислотной последовательности, представленной SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24 (пункт (b) выше). Примеры полипептидов, содержащих такую аминокислотную последовательность, где N-концевая часть белка DCTN1 является слитой с C-концевой частью белка RET, включают изоформы полипептидов, содержащих аминокислотную последовательность, представленную SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24, где N-концевая часть белка DCTN1 является слитой с C-концевой частью белка RET. Эти полипептиды, предпочтительно, имеют активность киназы или эффект вызова пролиферации клеток. В рамках изобретения, «несколько аминокислот, которые заменены, делетированы или добавлены», обозначает, например, предпочтительно, 1-10 аминокислот, и более предпочтительно, 1-5 аминокислот. «Добавление» включает добавление от одной до нескольких аминокислот к N-концу или C-концу, или добавление от одной до нескольких аминокислот к обоим концам."A polypeptide in which the N-terminal portion of the DCTN1 protein is fused to the C-terminal portion of the RET protein" of the present invention includes polypeptides containing an amino acid sequence wherein one or more amino acids are replaced, deleted, or added in the amino acid sequence represented by SEQ ID NO : 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18 , SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24 (item (b) above). Examples of polypeptides containing such an amino acid sequence wherein the N-terminal portion of the DCTN1 protein is fused to the C-terminal portion of the RET protein include isoforms of polypeptides containing the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24, wherein the N-terminal portion of the DCTN1 protein is fused to the C-terminal portion of the RET protein. These polypeptides preferably have kinase activity or the effect of inducing cell proliferation. For the purposes of the invention, “several amino acids that are replaced, deleted or added” means, for example, preferably 1-10 amino acids, and more preferably 1-5 amino acids. "Adding" includes adding one to more amino acids to the N-terminus or C-terminus, or adding one to more amino acids to both ends.

[0063][0063]

Примеры полипептида, где одна или несколько аминокислот заменены, включают полипептиды, в которых валин в положении 804 (в положении 1325 в SEQ ID NO: 2 и SEQ ID NO: 4, в положении 1191 в SEQ ID NO: 6 и SEQ ID NO: 8, в положении 1300 в SEQ ID NO: 10 и SEQ ID NO: 12, в положении 1186 в SEQ ID NO: 14 и SEQ ID NO: 16, в положении 1283 в SEQ ID NO: 18 и SEQ ID NO: 20, в положении 1318 в SEQ ID NO: 22 и SEQ ID NO: 24), который находится в участке-привратнике белка RET, содержащем аминокислотную последовательность, представленную номером доступа в GenPept: NP_066124 (SEQ ID NO: 31) или NP_065681 (SEQ ID NO: 32), заменен на лейцин, метионин или глутаминовую кислоту; и полипептиды, в которых тирозин в положении 806 (в положении 1327 в SEQ ID NO: 2 и SEQ ID NO: 4, в положении 1193 в SEQ ID NO: 6 и SEQ ID NO: 8, в положении 1302 в SEQ ID NO: 10 и SEQ ID NO: 12, в положении 1188 в SEQ ID NO: 14 и SEQ ID NO: 16, в положении 1285 в SEQ ID NO: 18 и SEQ ID NO: 20, в положении 1320 в SEQ ID NO: 22 и SEQ ID NO: 24) заменен на цистеин, глутаминовую кислоту, серин, гистидин или аспарагин.Examples of a polypeptide where one or more amino acids are substituted include those having a valine at position 804 (at position 1325 in SEQ ID NO: 2 and SEQ ID NO: 4, at position 1191 in SEQ ID NO: 6 and SEQ ID NO: 8, at position 1300 in SEQ ID NO: 10 and SEQ ID NO: 12, at position 1186 in SEQ ID NO: 14 and SEQ ID NO: 16, at position 1283 in SEQ ID NO: 18 and SEQ ID NO: 20, at position 1318 in SEQ ID NO: 22 and SEQ ID NO: 24), which is located in the gatekeeper region of the RET protein containing the amino acid sequence represented by GenPept accession number: NP_066124 (SEQ ID NO: 31) or NP_065681 (SEQ ID NO : 32), replaced by leucine, methionine or glutamic acid; and polypeptides having a tyrosine at position 806 (at position 1327 in SEQ ID NO: 2 and SEQ ID NO: 4, at position 1193 in SEQ ID NO: 6 and SEQ ID NO: 8, at position 1302 in SEQ ID NO: 10 and SEQ ID NO: 12, at position 1188 in SEQ ID NO: 14 and SEQ ID NO: 16, at position 1285 in SEQ ID NO: 18 and SEQ ID NO: 20, at position 1320 in SEQ ID NO: 22 and SEQ ID NO: 24) is replaced by cysteine, glutamic acid, serine, histidine or asparagine.

[0064][0064]

Примеры также включают аминокислоты, локализованные в положении, отличном от участка-привратника, но без ограничения, полипептиды, в которых глутаминовая кислота в положении 768 (в положении 1289 в SEQ ID NO: 2 и SEQ ID NO: 4, в положении 1155 в SEQ ID NO: 6 и SEQ ID NO: 8, в положении 1264 в SEQ ID NO: 10 и SEQ ID NO: 12, в положении 1150 в SEQ ID NO: 14 и SEQ ID NO: 16, в положении 1247 в SEQ ID NO: 18 и SEQ ID NO: 20, в положении 1282 в SEQ ID NO: 22 и SEQ ID NO: 24) заменен на аспарагиновую кислоту; полипептиды, в которых аланин в положении 883 (в положении 1404 в SEQ ID NO: 2 и SEQ ID NO: 4, в положении 1270 в SEQ ID NO: 6 и SEQ ID NO: 8, в положении 1379 в SEQ ID NO: 10 и SEQ ID NO: 12, в положении 1265 в SEQ ID NO: 14 и SEQ ID NO: 16, в положении 1362 в SEQ ID NO: 18 и SEQ ID NO: 20, в положении 1397 в SEQ ID NO: 22 и SEQ ID NO: 24) заменен на фенилаланин или серин; полипептиды, в которых глутаминовая кислота в положении 884 (в положении 1405 в SEQ ID NO: 2 и SEQ ID NO: 4, в положении 1271 в SEQ ID NO: 6 и SEQ ID NO: 8, в положении 1380 в SEQ ID NO: 10 и SEQ ID NO: 12, в положении 1266 в SEQ ID NO: 14 и SEQ ID NO: 16, в положении 1363 в SEQ ID NO: 18 и SEQ ID NO: 20, в положении 1398 в SEQ ID NO: 22 и SEQ ID NO: 24) заменена на валин; полипептиды, в которых серин в положении 891 (в положении 1412 в SEQ ID NO: 2 и SEQ ID NO: 4, в положении 1278 в SEQ ID NO: 6 и SEQ ID NO: 8, в положении 1387 в SEQ ID NO: 10 и SEQ ID NO: 12, в положении 1273 в SEQ ID NO: 14 и SEQ ID NO: 16, в положении 1370 в SEQ ID NO: 18 и SEQ ID NO: 20, в положении 1405 в SEQ ID NO: 22 и SEQ ID NO: 24) заменен на аланин или лейцин; и полипептиды, в которых метионин в положении 918 (в положении 1439 в SEQ ID NO: 2 и SEQ ID NO: 4, в положении 1305 в SEQ ID NO: 6 и SEQ ID NO: 8, в положении 1414 в SEQ ID NO: 10 и SEQ ID NO: 12, в положении 1300 в SEQ ID NO: 14 и SEQ ID NO: 16, в положении 1397 в SEQ ID NO: 18 и SEQ ID NO: 20, в положении 1432 в SEQ ID NO: 22 и SEQ ID NO: 24) заменен на треонин.Examples also include, but are not limited to, amino acids located at a position other than the gatekeeper region, polypeptides having glutamic acid at position 768 (at position 1289 in SEQ ID NO: 2 and SEQ ID NO: 4, at position 1155 in SEQ ID NO: 6 and SEQ ID NO: 8, at position 1264 in SEQ ID NO: 10 and SEQ ID NO: 12, at position 1150 in SEQ ID NO: 14 and SEQ ID NO: 16, at position 1247 in SEQ ID NO : 18 and SEQ ID NO: 20, at position 1282 in SEQ ID NO: 22 and SEQ ID NO: 24) is replaced by aspartic acid; polypeptides having an alanine at position 883 (at position 1404 in SEQ ID NO: 2 and SEQ ID NO: 4, at position 1270 in SEQ ID NO: 6 and SEQ ID NO: 8, at position 1379 in SEQ ID NO: 10 and SEQ ID NO: 12, at position 1265 in SEQ ID NO: 14 and SEQ ID NO: 16, at position 1362 in SEQ ID NO: 18 and SEQ ID NO: 20, at position 1397 in SEQ ID NO: 22 and SEQ ID NO: 24) replaced by phenylalanine or serine; polypeptides having glutamic acid at position 884 (at position 1405 in SEQ ID NO: 2 and SEQ ID NO: 4, at position 1271 in SEQ ID NO: 6 and SEQ ID NO: 8, at position 1380 in SEQ ID NO: 10 and SEQ ID NO: 12, at position 1266 in SEQ ID NO: 14 and SEQ ID NO: 16, at position 1363 in SEQ ID NO: 18 and SEQ ID NO: 20, at position 1398 in SEQ ID NO: 22 and SEQ ID NO: 24) replaced by valine; polypeptides having serine at position 891 (at position 1412 in SEQ ID NO: 2 and SEQ ID NO: 4, at position 1278 in SEQ ID NO: 6 and SEQ ID NO: 8, at position 1387 in SEQ ID NO: 10 and SEQ ID NO: 12, at position 1273 in SEQ ID NO: 14 and SEQ ID NO: 16, at position 1370 in SEQ ID NO: 18 and SEQ ID NO: 20, at position 1405 in SEQ ID NO: 22 and SEQ ID NO: 24) replaced by alanine or leucine; and polypeptides having methionine at position 918 (at position 1439 in SEQ ID NO: 2 and SEQ ID NO: 4, at position 1305 in SEQ ID NO: 6 and SEQ ID NO: 8, at position 1414 in SEQ ID NO: 10 and SEQ ID NO: 12, at position 1300 in SEQ ID NO: 14 and SEQ ID NO: 16, at position 1397 in SEQ ID NO: 18 and SEQ ID NO: 20, at position 1432 in SEQ ID NO: 22 and SEQ ID NO: 24) is replaced by threonine.

[0065][0065]

Полипептид, в котором N-концевая часть белка DCTN1 является слитой с C-концевой частью белка RET, по настоящему изобретению включает полипептиды, содержащие аминокислотную последовательность, имеющую по меньшей мере 90% идентичность с аминокислотной последовательностью, представленной любой из SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24, при их соответствующем выравнивании (пункт (c) выше). Эти полипептиды, предпочтительно, имеют активность киназы или эффект вызова пролиферации клеток.A polypeptide in which the N-terminal portion of the DCTN1 protein is fused to the C-terminal portion of the RET protein of the present invention includes polypeptides containing an amino acid sequence having at least 90% identity with the amino acid sequence represented by any of SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24, when appropriately aligned (item (c) above). These polypeptides preferably have kinase activity or the effect of inducing cell proliferation.

[0066][0066]

Идентичность с аминокислотной последовательностью, представленной SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24, составляет предпочтительно по меньшей мере 90%, более предпочтительно по меньшей мере 95%, и еще более предпочтительно, по меньшей мере 98%. Идентичность аминокислотной последовательности можно рассчитывать общепринятым способом.Identity to the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24 is preferably at least 90%, more preferably at least 95%, and even more preferably at least 98%. The identity of the amino acid sequence can be calculated in a conventional manner.

[0067][0067]

Полипептид по настоящему изобретению может содержать аминокислоты, составляющие белковую метку, в дополнение к аминокислотной последовательности, составляющей полипептид по настоящему изобретению. Примеры полезных меток включают метки, хорошо известные специалисту в данной области; например, полезные метки включают метки для улучшения эффективности экспрессии и метки для улучшения эффективности очистки, такие как метка His, метка Myc и метка FLAG.The polypeptide of the present invention may contain amino acids constituting a protein tag in addition to the amino acid sequence constituting the polypeptide of the present invention. Examples of useful labels include those well known to one skilled in the art; for example, useful tags include tags to improve expression efficiency and tags to improve purification efficiency, such as a His tag, a Myc tag, and a FLAG tag.

[0068][0068]

Полинуклеотид по настоящему изобретению кодирует полипептид, в котором N-концевая часть белка DCTN1 является слитой с C-концевой частью белка RET, и предпочтительно, представляет собой полинуклеотид, выбранный из следующих (d)-(i). Эти полинуклеотиды, предпочтительно, кодируют полипептиды, которые имеют активность киназы или эффект вызова пролиферации клеток.The polynucleotide of the present invention encodes a polypeptide in which the N-terminal portion of the DCTN1 protein is fused to the C-terminal portion of the RET protein, and is preferably a polynucleotide selected from the following (d) to (i). These polynucleotides preferably encode polypeptides that have kinase activity or the effect of inducing cell proliferation.

[0069][0069]

(d) Полинуклеотид, кодирующий полипептид, содержащий аминокислотную последовательность, представленную SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24.(d) A polynucleotide encoding a polypeptide containing the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24.

[0070][0070]

(e) Полинуклеотид, кодирующий полипептид, содержащий аминокислотную последовательность, где одна или несколько аминокислот заменены, делетированы или добавлены в аминокислотной последовательности, представленной SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24.(e) A polynucleotide encoding a polypeptide containing an amino acid sequence wherein one or more amino acids are replaced, deleted or added in the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8 , SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24.

[0071][0071]

(f) Полинуклеотид, кодирующий полипептид, содержащий аминокислотную последовательность, имеющую по меньшей мере 90% идентичность с аминокислотной последовательностью, представленной SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 или SEQ ID NO: 24.(f) A polynucleotide encoding a polypeptide containing an amino acid sequence having at least 90% identity with the amino acid sequence represented by SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22 or SEQ ID NO: 24.

[0072][0072]

(g) Полинуклеотид, содержащий последовательность оснований, представленную SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23.(g) A polynucleotide containing the base sequence represented by SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23.

[0073][0073]

(h) Полинуклеотид, гибридизующийся в строгих условиях с полинуклеотидом, содержащим последовательность оснований, комплементарную последовательности оснований, представленной SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23.(h) A polynucleotide that hybridizes under stringent conditions to a polynucleotide containing a base sequence complementary to the base sequence represented by SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9 , SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23.

[0074][0074]

(i) Полинуклеотид, имеющий по меньшей мере 90% идентичность с последовательностью оснований, представленной SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23.(i) A polynucleotide having at least 90% identity with the base sequence represented by SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO : 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23.

[0075][0075]

Более предпочтительно, полинуклеотид по настоящему изобретению выбран из следующих (d)-(i). Эти полинуклеотиды предпочтительно кодируют полипептиды, которые имеют активность киназы или эффект вызова пролиферации клеток.More preferably, the polynucleotide of the present invention is selected from the following (d) to (i). These polynucleotides preferably encode polypeptides that have kinase activity or the effect of inducing cell proliferation.

[0076][0076]

(d) Полинуклеотид, кодирующий полипептид, содержащий аминокислотную последовательность, представленную SEQ ID NO: 18.(d) A polynucleotide encoding a polypeptide containing the amino acid sequence represented by SEQ ID NO: 18.

[0077][0077]

(e) Полинуклеотид, кодирующий полипептид, содержащий аминокислотную последовательность, где одна или несколько аминокислот заменены, делетированы или добавлены в аминокислотной последовательности, представленной SEQ ID NO: 18.(e) A polynucleotide encoding a polypeptide containing an amino acid sequence wherein one or more amino acids are replaced, deleted or added in the amino acid sequence represented by SEQ ID NO: 18.

[0078][0078]

(f) Полинуклеотид, кодирующий полипептид, содержащий аминокислотную последовательность, имеющую по меньшей мере 90% идентичность с аминокислотной последовательностью, представленной SEQ ID NO: 18.(f) A polynucleotide encoding a polypeptide containing an amino acid sequence having at least 90% identity with the amino acid sequence represented by SEQ ID NO: 18.

[0079][0079]

(g) Полинуклеотид, содержащий последовательность оснований, представленную SEQ ID NO: 17.(g) A polynucleotide containing the base sequence represented by SEQ ID NO: 17.

[0080][0080]

(h) Полинуклеотид, гибридизующийся в строгих условиях с полинуклеотидом, содержащим последовательность оснований, комплементарную последовательности оснований, представленной SEQ ID NO: 17.(h) A polynucleotide that hybridizes under stringent conditions to a polynucleotide containing a base sequence complementary to the base sequence represented by SEQ ID NO: 17.

[0081][0081]

(i) Полинуклеотид, имеющий по меньшей мере 90% идентичность с последовательностью оснований, представленной SEQ ID NO: 17.(i) A polynucleotide having at least 90% identity with the base sequence represented by SEQ ID NO: 17.

[0082][0082]

Полинуклеотид по настоящему изобретению включает не только его двухцепочечную ДНК, но также различные типы одноцепочечной ДНК и РНК, составляющие двухцепочечную ДНК, такие как смысловые цепи и антисмысловые цепи. Антисмысловые цепи можно использовать в качестве зондов и т.п. ДНК включает виды ДНК, полученные посредством клонирования, химического синтеза или их комбинации, такие как кДНК и геномная ДНК. Кроме того, последовательности оснований, такие как последовательности нетранслируемой области (UTR), можно добавлять к полинуклеотиду по настоящему изобретению, в дополнение к последовательности оснований для кодирования полипептида по настоящему изобретению.The polynucleotide of the present invention includes not only its double-stranded DNA, but also various types of single-stranded DNA and RNA constituting double-stranded DNA, such as sense strands and antisense strands. Antisense strands can be used as probes and the like. DNA includes DNA species obtained by cloning, chemical synthesis, or a combination thereof, such as cDNA and genomic DNA. In addition, base sequences, such as untranslated region (UTR) sequences, can be added to the polynucleotide of the present invention, in addition to the base sequence to encode the polypeptide of the present invention.

[0083][0083]

Строгие условия, в рамках изобретения включают, например, условия, описанные в Molecular Cloning: A Laboratory Manual (Second Edition, J. Sambrook et al., 1989). Конкретно, строгие условия включают такие условия, что раствор, содержащий 6×SSC (состав 1×SSC: 0,15 M хлорид натрия, 0,015 M цитрат натрия, pH 7,0), 0,5% SDS, 5×Denhalt и 100 мг/мл ДНК спермы сельди, подвергают изотермической обработке вместе с зондом при 65°C в течение 8-16 часов для проведения гибридизации.Strict conditions within the scope of the invention include, for example, those described in Molecular Cloning: A Laboratory Manual (Second Edition, J. Sambrook et al., 1989). Specifically, stringent conditions include such that a solution containing 6xSSC (1xSSC composition: 0.15 M sodium chloride, 0.015 M sodium citrate, pH 7.0), 0.5% SDS, 5x Denhalt and 100 mg/ml DNA of herring sperm is subjected to isothermal treatment together with the probe at 65°C for 8-16 hours for hybridization.

[0084][0084]

Идентичность с последовательностью оснований, представленной SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 или SEQ ID NO: 23, предпочтительно, составляет по меньшей мере 90%, более предпочтительно по меньшей мере 95%, и еще более предпочтительно, по меньшей мере 98%. Идентичность последовательности оснований можно рассчитывать общепринятым способом.Identity with the base sequence represented by SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 or SEQ ID NO: 23 is preferably at least 90%, more preferably at least 95%, and even more preferably, at least 98%. Base sequence identity can be calculated in a conventional manner.

[0085][0085]

В этом описании, фраза «имеют активность киназы» в «имеют активность киназы или эффект вызова пролиферации клеток» означает наличие ферментной активности для фосфорилирования тирозина. Кроме того, фраза «имеют эффект вызова пролиферации клеток» в «имеют активность киназы или эффект вызова пролиферации клеток» означает, что трансфекция полинуклеотида и/или полипептида по настоящему изобретению в клетку улучшает способность клетки к пролиферации, по сравнению с клеткой, в которую не трансфицируют полинуклеотид и/или полипептид. Этот эффект можно подтверждать, например, следующим образом: полинуклеотидом и/или полипептидом трансфицируют линию клеток, пролиферирующую в зависимости от цитокинов, и если линия клеток пролиферирует независимо от цитокинов, полинуклеотид и/или полипептид имеет эффект вызова пролиферации клеток.In this specification, the phrase “have a kinase activity” in “have a kinase activity or an effect of causing cell proliferation” means having an enzyme activity for tyrosine phosphorylation. In addition, the phrase “have a cell proliferation-inducing effect” in “have a kinase activity or a cell proliferation-inducing effect” means that transfection of a polynucleotide and/or polypeptide of the present invention into a cell improves the ability of the cell to proliferate compared to a cell into which it does not transfect the polynucleotide and/or polypeptide. This effect can be confirmed, for example, as follows: a cell line proliferating in a cytokine-dependent manner is transfected with the polynucleotide and/or polypeptide, and if the cell line proliferates in a cytokine-dependent manner, the polynucleotide and/or polypeptide has the effect of causing cell proliferation.

[0086][0086]

Полинуклеотид по настоящему изобретению можно выделять, например, с использованием библиотеки кДНК или библиотеки геномной ДНК, полученной из злокачественной опухоли щитовидной железы и т.д., сохраняющей ген, слитый из гена DCTN1 и гена RET, с использованием праймера, который специфически гибридизуется с частью последовательности оснований полинуклеотида по настоящему изобретению. Для этого праймера, можно использовать любой праймер любой последовательности и любой длины, при условии, что праймер специфически гибридизуется по меньшей мере с частью полинуклеотида по настоящему изобретению или его антисмысловой цепью. Можно использовать также способ искусственного синтеза полинуклеотидов (Nat. Methods, 11: 499-507, 2014).The polynucleotide of the present invention can be isolated, for example, using a cDNA library or a genomic DNA library obtained from a thyroid cancer, etc., retaining a gene fused from the DCTN1 gene and the RET gene, using a primer that specifically hybridizes to the part the base sequence of the polynucleotide of the present invention. For this primer, any primer of any sequence and any length can be used, provided that the primer specifically hybridizes to at least a portion of the polynucleotide of the present invention or an antisense strand thereof. You can also use the method of artificial synthesis of polynucleotides (Nat. Methods, 11: 499-507, 2014).

[0087][0087]

Экспрессирующий вектор по настоящему изобретению не является конкретно ограниченным, при условии, что экспрессирующий вектор содержит полинуклеотид по настоящему изобретению, и позволяет экспрессию полипептида по настоящему изобретению. Примеры включают экспрессирующие векторы, полученные посредством вставки полинуклеотида по настоящему изобретению в известный экспрессирующий вектор, подходящим образом выбранный в соответствии с хозяином для использования.The expression vector of the present invention is not particularly limited, as long as the expression vector contains the polynucleotide of the present invention and allows expression of the polypeptide of the present invention. Examples include expression vectors obtained by inserting a polynucleotide of the present invention into a known expression vector suitably selected according to the host to be used.

[0088][0088]

Хозяин не является конкретно ограниченным, при условии, что хозяин представляет собой живую клетку, которая может подвергаться трансформации, и примеры включают бактерии, такие какE. coli иBacillus subtilis; настоящие грибы, такие как дрожжи и мицелиальные грибы; клетки насекомых, такие как клетки Sf9; насекомых, таких как шелкопряд; клетки животных; и растения или клетки растительного происхождения.The host is not particularly limited, as long as the host is a living cell that can undergo transformation, and examples include bacteria such asE. coli andBacillus subtilis ; true fungi such as yeast and filamentous fungi; insect cells such as Sf9 cells; insects such as silkworms; animal cells; and plants or cells of plant origin.

[0089][0089]

Вектор для вставки полинуклеотида по настоящему изобретению не является конкретно ограниченным, при условии, что вектор является способным к репликации в хозяине. Вектор можно подходящим образом выбирать в соответствии, например, с типом хозяина, подвергаемого введению, и со способом введения. Примеры включают плазмидную ДНК, фаговую ДНК и вирусные векторы. Для векторной ДНК для использования в конструировании экспрессирующего вектора, можно использовать широко распространенную и легко доступную векторную ДНК. Примеры включают pUC19 (Takara Bio Inc.), pTV118N (Takara Bio Inc.), pMAMneo (Clontech Laboratories, Inc.), pGEX (GE Healthcare), pET160 (Invitrogen), pDEST (Invitrogen), pIEx (Merck Millipore) и pBacPAK (Clontech Laboratories, Inc.). Примеры вирусных векторов включают ДНК-вирусы и РНК-вирусы, такие как бакуловирусные векторы, ретровирусные векторы, лентивирусные векторы (например, вирус иммунодефицита человека или HIV), аденовирусные векторы, аденоассоциированные вирусные векторы (вектор AAV), вирус герпеса, вирус осповакцины, поксвирус, вирус полиомиелита, вирус синдбис, вирус сендай и вирус обезьян-40 (SV-40).The polynucleotide insertion vector of the present invention is not particularly limited as long as the vector is capable of replication in a host. The vector can be suitably selected according to, for example, the type of host to be administered and the route of administration. Examples include plasmid DNA, phage DNA, and viral vectors. For vector DNA for use in constructing an expression vector, commonly available and readily available vector DNA can be used. Examples include pUC19 (Takara Bio Inc.), pTV118N (Takara Bio Inc.), pMAMneo (Clontech Laboratories, Inc.), pGEX (GE Healthcare), pET160 (Invitrogen), pDEST (Invitrogen), pIEx (Merck Millipore), and pBacPAK (Clontech Laboratories, Inc.). Examples of viral vectors include DNA viruses and RNA viruses, such as baculovirus vectors, retroviral vectors, lentiviral vectors (eg, human immunodeficiency virus or HIV), adenoviral vectors, adeno-associated viral vectors (AAV vector), herpes virus, vaccinia virus, poxvirus , polio virus, Sindbis virus, Sendai virus and Simian virus-40 (SV-40).

[0090][0090]

Трансформацию хозяина с использованием экспрессирующего вектора можно проводить, например, способом протопластов, способом компетентных клеток или способом электропорации. Полученный трансформант можно культивировать в подходящих условиях в среде, содержащей источник углерода, источник азота, соли металлов, витамины и т.д., которые может использовать хозяин.Transformation of the host using an expression vector can be carried out, for example, by the protoplast method, the competent cell method or the electroporation method. The resulting transformant can be cultured under suitable conditions in a medium containing a carbon source, nitrogen source, metal salts, vitamins, etc., which can be used by the host.

[0091][0091]

Примеры клетки, трансфицированной полинуклеотидом в соответствии с настоящим изобретением, включают клетки, трансформированные экспрессирующим вектором по настоящему изобретению, и клетки, в которые полинуклеотид по настоящему изобретению введен посредством редактирования генома. Клетка для использования включает клетки-хозяева, перечисленные выше. Примеры способа подтверждения того, была ли клетка трансформирована экспрессирующим вектором, включают способ детекции присутствия полипептида по настоящему изобретению и способ детекции присутствия полинуклеотида по настоящему изобретению.Examples of a cell transfected with a polynucleotide according to the present invention include cells transformed with an expression vector of the present invention and cells into which a polynucleotide of the present invention has been introduced by genome editing. The cell to be used includes the host cells listed above. Examples of a method for confirming whether a cell has been transformed with an expression vector include a method for detecting the presence of a polypeptide of the present invention and a method for detecting the presence of a polynucleotide of the present invention.

[0092][0092]

«Клетки, в которые полинуклеотид по настоящему изобретению введен посредством редактирования генома», предпочтительно, представляют собой клетки, имеющие ген, полученный посредством слияния независимо присутствующего гена DCTN1 и гена RET посредством редактирования генома, и более предпочтительно, клетки, имеющие ген, полученный посредством слияния экзона 27 DCTN1 и экзона 12 RET в соответствующих независимо присутствующих гене DCTN1 и гене RET посредством редактирования генома. Эти клетки можно получать общепринятым способом, и примеры включают способ, описанный в Cell Rep., 9(4), pp. 1219-1227 (2014), Nat. Commun., 5, 3728 (2014). Примеры способа подтверждения того, представляет ли клетка собой клетку, в которую полинуклеотид по настоящему изобретению введен посредством редактирования генома, включают способ детекции присутствия полипептида по настоящему изобретению и способ детекции присутствия полинуклеотида по настоящему изобретению.The “cells into which the polynucleotide of the present invention is introduced by genome editing” are preferably cells having a gene obtained by fusion of an independently present DCTN1 gene and a RET gene by genome editing, and more preferably, cells having a gene obtained by fusion exon 27 of DCTN1 and exon 12 of RET in the corresponding independently present DCTN1 gene and RET gene through genome editing. These cells can be obtained in a conventional manner, and examples include the method described in Cell Rep., 9(4), pp. 1219-1227 (2014), Nat. Commun., 5, 3728 (2014). Examples of a method for confirming whether a cell is a cell into which a polynucleotide of the present invention has been introduced by genome editing include a method for detecting the presence of a polypeptide of the present invention and a method for detecting the presence of a polynucleotide of the present invention.

[0093][0093]

Полипептид по настоящему изобретению можно получать посредством получения культурального раствора и/или клеток посредством культивирования клеток, трансформированных экспрессирующим вектором по настоящему изобретению, в среде, подходящей для культивирования клеток, в подходящих условиях, и затем сбора и очистки белка из культурального раствора и/или клеток типичным способом. Полипептид по настоящему изобретению можно также получать посредством введения экспрессирующего вектора, содержащего полинуклеотид по настоящему изобретению, или РНК-матрицы или ДНК-матрицы, кодирующей полинуклеотид по настоящему изобретению, в бесклеточную систему синтеза белка (например, экстракт, полученный из линии клеток человека, экстракт ретикулоцитов кролика, экстракт зародышей пшеницы и экстрактE. coli); инкубацию полученной смеси в подходящих условиях; и сбор и очистку белка из полученного реакционного раствора типичным способом.The polypeptide of the present invention can be obtained by obtaining a culture solution and/or cells by culturing cells transformed with an expression vector of the present invention in a medium suitable for cell culture under suitable conditions, and then collecting and purifying the protein from the culture solution and/or cells in a typical way. The polypeptide of the present invention can also be produced by introducing an expression vector containing a polynucleotide of the present invention, or an RNA template or DNA template encoding a polynucleotide of the present invention, into a cell-free protein synthesis system (e.g., an extract derived from a human cell line, an extract rabbit reticulocytes, wheat germ extract andE. coli extract); incubating the resulting mixture under suitable conditions; and collecting and purifying the protein from the resulting reaction solution in a typical manner.

[0094][0094]

По настоящему изобретению, антитело, специфически связывающееcя с полипептидом по настоящему изобретению, включает антитело, которое специфически связывается с точкой слияния N-концевой части белка DCTN1 и C-концевой части белка RET. Антитело относится к антителу, которое специфически связывается с точкой слияния N-концевой части белка DCTN1 и C-концевой части белка RET, но которое не связывается ни с одним из белка DCTN1 дикого типа и RET дикого типа.According to the present invention, an antibody that specifically binds to a polypeptide of the present invention includes an antibody that specifically binds to the fusion point of the N-terminal portion of the DCTN1 protein and the C-terminal portion of the RET protein. An antibody refers to an antibody that specifically binds to the fusion point of the N-terminal portion of the DCTN1 protein and the C-terminal portion of the RET protein, but which does not bind to either wild-type DCTN1 protein or wild-type RET protein.

[0095][0095]

По настоящему изобретению, фраза «точка слияния» в «точка слияния N-концевой части белка DCTN1 и C-концевой части белка RET» относится к точке, в которой полипептид, происходящий из N-концевой части белка DCTN1, слит с полипептидом, происходящим из C-концевой части белка RET. Точка слияния в SEQ ID NO: 2 представляет собой точку, в которой полипептид, имеющий аминокислотную последовательность из положений 1-1233 из SEQ ID NO: 2, происходящий из N-концевой части DCTN1, слит с полипептидом, имеющим аминокислотную последовательность из положений 1234-1635 из SEQ ID NO: 2, происходящим из C-концевой части RET. Точка слияния в SEQ ID NO: 4 представляет собой точку, в которой полипептид, имеющий аминокислотную последовательность из положений 1-1233 из SEQ ID NO: 4, происходящий из N-концевой части DCTN 1, слит с полипептидом, имеющим аминокислотную последовательность из положений 1234-1593 из SEQ ID NO: 4, происходящим из C-концевой части RET. Точка слияния в SEQ ID NO: 6 представляет собой точку, в которой полипептид, имеющий аминокислотную последовательность из положений 1-1099 из SEQ ID NO: 6, происходящий из N-концевой части DCTN1, слит с полипептидом, имеющим аминокислотную последовательность из положений 1100-1501 из SEQ ID NO: 6, происходящим из C-концевой части RET. Точка слияния в SEQ ID NO: 8 представляет собой точку, в которой полипептид, имеющий аминокислотную последовательность из положений 1-1099 из SEQ ID NO: 8, происходящий из N-концевой части DCTN1, слит с полипептидом, имеющим аминокислотную последовательность из положений 1100-1459 из SEQ ID NO: 8, происходящим из C-концевой части RET. Точка слияния в SEQ ID NO: 10 представляет собой точку, в которой полипептид, имеющий аминокислотную последовательность из положений 1-1208 из SEQ ID NO: 10, происходящий из N-концевой части of DCTN1, слит с полипептидом, имеющим аминокислотную последовательность из положений 1209-1610 из SEQ ID NO: 10, происходящим из C-концевой части RET. Точка слияния в SEQ ID NO: 12 представляет собой точку, в которой полипептид, имеющий аминокислотную последовательность из положений 1-1208 из SEQ ID NO: 12, происходящий из N-концевой части DCTN1, слит с полипептидом, имеющим аминокислотную последовательность из положений 1209-1568 из SEQ ID NO: 12, происходящим из C-концевой части RET. Точка слияния в SEQ ID NO: 14 представляет собой точку, в которой полипептид, имеющий аминокислотную последовательность из положений 1-1094 из SEQ ID NO: 14, происходящий из N-концевой части DCTN1, слит с полипептидом, имеющим аминокислотную последовательность из положений 1095-1496 из SEQ ID NO: 14, происходящим из C-концевой части RET. Точка слияния в SEQ ID NO: 16 представляет собой точку, в которой полипептид, имеющий аминокислотную последовательность из положений 1-1094 из SEQ ID NO: 16, происходящий из N-концевой части DCTN1, слит с полипептидом, имеющим аминокислотную последовательность из положений 1095-1454 из SEQ ID NO: 16, происходящим из C-концевой части RET. Точка слияния в SEQ ID NO: 18 представляет собой точку, в которой полипептид, имеющий аминокислотную последовательность из положений 1-1191 из SEQ ID NO: 18, происходящий из N-концевой части DCTN1, слит с полипептидом, имеющим аминокислотную последовательность из положений 1192-1593 из SEQ ID NO: 18, происходящим из C-концевой части RET. Точка слияния в SEQ ID NO: 20 представляет собой точку, в которой полипептид, имеющий аминокислотную последовательность из положений 1-1191 из SEQ ID NO: 20, происходящий из N-концевой части DCTN1, слит с полипептидом, имеющим аминокислотную последовательность из положений 1192-1551 из SEQ ID NO: 20, происходящим из C-концевой части RET. Точка слияния в SEQ ID NO: 22 представляет собой точку, в которой полипептид, имеющий аминокислотную последовательность из положений 1-1226 из SEQ ID NO: 22, происходящий из N-концевой части DCTN1, слит с полипептидом, имеющим аминокислотную последовательность из положений 1227-1628 из SEQ ID NO: 22, происходящим из C-концевой части RET. Точка слияния в SEQ ID NO: 24 представляет собой точку, в которой полипептид, имеющий аминокислотную последовательность из положений 1-1226 из SEQ ID NO: 24, происходящий из N-концевой части DCTN1, слит с полипептидом, имеющим аминокислотную последовательность из положений 1227-1586 из SEQ ID NO: 24, происходящим из C-концевой части RET.In the present invention, the phrase "fusion point" in "fusion point of the N-terminal portion of the DCTN1 protein and the C-terminal portion of the RET protein" refers to the point at which a polypeptide derived from the N-terminal portion of the DCTN1 protein is fused to a polypeptide derived from C-terminal part of the RET protein. The fusion point in SEQ ID NO: 2 is the point at which a polypeptide having the amino acid sequence from positions 1-1233 of SEQ ID NO: 2, derived from the N-terminal portion of DCTN1, is fused to a polypeptide having the amino acid sequence from positions 1234- 1635 from SEQ ID NO: 2, derived from the C-terminal part of RET. The fusion point in SEQ ID NO: 4 is the point at which a polypeptide having the amino acid sequence of positions 1-1233 of SEQ ID NO: 4, derived from the N-terminal portion ofDCTN 1, is fused to a polypeptide having the amino acid sequence of positions 1234 -1593 from SEQ ID NO: 4, derived from the C-terminal part of RET. The fusion point in SEQ ID NO: 6 is the point at which a polypeptide having the amino acid sequence of positions 1-1099 of SEQ ID NO: 6, derived from the N-terminal portion of DCTN1, is fused to a polypeptide having the amino acid sequence of positions 1100- 1501 from SEQ ID NO: 6, derived from the C-terminal part of RET. The fusion point in SEQ ID NO: 8 is the point at which a polypeptide having the amino acid sequence from positions 1-1099 of SEQ ID NO: 8, derived from the N-terminal portion of DCTN1, is fused to a polypeptide having the amino acid sequence from positions 1100- 1459 from SEQ ID NO: 8, derived from the C-terminal part of RET. The fusion point in SEQ ID NO: 10 is the point at which a polypeptide having the amino acid sequence of positions 1-1208 of SEQ ID NO: 10, derived from the N-terminal portion of DCTN1, is fused to a polypeptide having the amino acid sequence of positions 1209 -1610 from SEQ ID NO: 10, derived from the C-terminal part of RET. The fusion point in SEQ ID NO: 12 is the point at which a polypeptide having the amino acid sequence of positions 1-1208 of SEQ ID NO: 12, derived from the N-terminal portion of DCTN1, is fused to a polypeptide having the amino acid sequence of positions 1209- 1568 from SEQ ID NO: 12, derived from the C-terminal part of RET. The fusion point in SEQ ID NO: 14 is the point at which a polypeptide having the amino acid sequence of positions 1-1094 of SEQ ID NO: 14, derived from the N-terminal portion of DCTN1, is fused to a polypeptide having the amino acid sequence of positions 1095- 1496 from SEQ ID NO: 14, derived from the C-terminal part of RET. The fusion point in SEQ ID NO: 16 is the point at which a polypeptide having the amino acid sequence of positions 1-1094 of SEQ ID NO: 16, derived from the N-terminal portion of DCTN1, is fused to a polypeptide having the amino acid sequence of positions 1095- 1454 from SEQ ID NO: 16, derived from the C-terminal part of RET. The fusion point in SEQ ID NO: 18 is the point at which a polypeptide having the amino acid sequence of positions 1-1191 of SEQ ID NO: 18, derived from the N-terminal portion of DCTN1, is fused to a polypeptide having the amino acid sequence of positions 1192- 1593 from SEQ ID NO: 18, derived from the C-terminal part of RET. The fusion point in SEQ ID NO: 20 is the point at which a polypeptide having the amino acid sequence of positions 1-1191 of SEQ ID NO: 20, derived from the N-terminal portion of DCTN1, is fused to a polypeptide having the amino acid sequence of positions 1192- 1551 from SEQ ID NO: 20, derived from the C-terminal part of RET. The fusion point in SEQ ID NO: 22 is the point at which a polypeptide having the amino acid sequence of positions 1-1226 of SEQ ID NO: 22, derived from the N-terminal portion of DCTN1, is fused to a polypeptide having the amino acid sequence of positions 1227- 1628 from SEQ ID NO: 22, derived from the C-terminal part of RET. The fusion point in SEQ ID NO: 24 is the point at which a polypeptide having the amino acid sequence of positions 1-1226 of SEQ ID NO: 24, derived from the N-terminal portion of DCTN1, is fused to a polypeptide having the amino acid sequence of positions 1227- 1586 from SEQ ID NO: 24, derived from the C-terminal portion of RET.

[0096][0096]

Примеры антитела включают иммуноглобулины (например, IgA, IgD, IgE, IgG, IgM и IgY), фрагменты Fab, фрагменты F(ab')2, одноцепочечные фрагменты антител (scFv), однодоменные антитела и диатела (Nat. Rev. Immunol., 6: 343-357, 2006). Они включают, но без ограничения, моноклональные антитела и поликлональные антитела, например, из человеческих антител, гуманизированных антител, химерных антител, мышиных антител, антител ламы и антител курицы.Examples of antibodies include immunoglobulins (eg, IgA, IgD, IgE, IgG, IgM and IgY), Fab fragments, F(ab')2 fragments, single chain antibody fragments (scFv), single domain antibodies and diabodies (Nat. Rev. Immunol., 6: 343-357, 2006). These include, but are not limited to, monoclonal antibodies and polyclonal antibodies, for example, from human antibodies, humanized antibodies, chimeric antibodies, mouse antibodies, llama antibodies and chicken antibodies.

[0097][0097]

Антитело можно получать различными известными способами, и способ получения не является конкретно ограниченным. Известные способы включают способ, в котором полипептид по настоящему изобретению, фрагмент полипептида, содержащий точку слияния N-концевой части белка DCTN1 и C-концевой части белка RET, или т.п., инокулируют иммунизированному животному для активации иммунной системы животного, и сыворотку животного собирают для получения поликлонального антитела; и способ получения моноклонального антитела, например, способом гибридомы и способом фагового дисплея.The antibody can be produced by various known methods, and the production method is not particularly limited. Known methods include a method in which a polypeptide of the present invention, a polypeptide fragment containing a fusion point of an N-terminal portion of a DCTN1 protein and a C-terminal portion of a RET protein, or the like, is inoculated into an immunized animal to activate the animal's immune system, and serum of the animal collected to produce a polyclonal antibody; and a method for producing a monoclonal antibody, for example, by a hybridoma method and a phage display method.

[0098][0098]

Способ скрининга соединения, ингибирующего экспрессию и/или активность полипептида по настоящему изобретению, или экспрессию полинуклеотида по настоящему изобретению, можно осуществлять способом, включающим следующие стадии (1) и (2).A method for screening a compound that inhibits the expression and/or activity of a polypeptide of the present invention, or the expression of a polynucleotide of the present invention, can be carried out by a method including the following steps (1) and (2).

[0099][0099]

Конкретно, способ скрининга по настоящему изобретению осуществляют способом, включающим:Specifically, the screening method of the present invention is carried out by a method comprising:

(1) стадию приведения полипептида по настоящему изобретению, или клетки, экспрессирующей полипептид и/или полинуклеотид по настоящему изобретению, в контакт с тестируемым соединением; и(1) the step of contacting a polypeptide of the present invention, or a cell expressing a polypeptide and/or polynucleotide of the present invention, with a test compound; And

[0100][0100]

(2) стадию измерения того, ингибированы ли экспрессия и/или активность полипептида по настоящему изобретению, или экспрессия полинуклеотида по настоящему изобретению на стадии (1), или стадию измерения того, ингибирован ли рост клетки на стадии (1).(2) the step of measuring whether the expression and/or activity of the polypeptide of the present invention, or the expression of the polynucleotide of the present invention is inhibited in step (1), or the step of measuring whether cell growth is inhibited in step (1).

[0101][0101]

Более предпочтительно, способ скрининга по настоящему изобретению представляет собой способ, включающий следующие стадии (1) и (2).More preferably, the screening method of the present invention is a method including the following steps (1) and (2).

[0102][0102]

(1) Стадия приведения клетки, экспрессирующей полипептид и/или полинуклеотид по настоящему изобретению, в контакт с тестируемым соединением.(1) The step of bringing a cell expressing a polypeptide and/or polynucleotide of the present invention into contact with a test compound.

[0103][0103]

(2) Стадия измерения того, ингибирован ли рост клетки на стадии (1).(2) The step of measuring whether cell growth is inhibited in step (1).

[0104][0104]

Способ скрининга соединения, ингибирующего экспрессию и/или активность полипептида по настоящему изобретению или экспрессию полинуклеотида по настоящему изобретению, можно осуществлять способом, включающим следующие стадии (1)-(3).A method for screening a compound that inhibits the expression and/or activity of a polypeptide of the present invention or the expression of a polynucleotide of the present invention can be carried out by a method including the following steps (1) to (3).

[0105][0105]

Конкретно, способ скрининга по настоящему изобретению осуществляют способом, включающим:Specifically, the screening method of the present invention is carried out by a method including:

(1) стадию приведения полипептида по настоящему изобретению или клетки, экспрессирующей полипептид и/или полинуклеотид по настоящему изобретению, в контакт с тестируемым соединением;(1) the step of contacting a polypeptide of the present invention or a cell expressing a polypeptide and/or polynucleotide of the present invention with a test compound;

[0106][0106]

(2) стадию измерения того, ингибирована ли экспрессия и/или активность полипептида по настоящему изобретению, или экспрессия полинуклеотида по настоящему изобретению на стадии (1), или стадию измерения того, ингибирован ли рост клетки на стадии (1); и(2) the step of measuring whether the expression and/or activity of the polypeptide of the present invention, or the expression of the polynucleotide of the present invention in step (1), or the step of measuring whether cell growth is inhibited in step (1); And

[0107][0107]

(3) стадию определения того, что тестируемое соединение ингибирует экспрессию и/или активность полипептида по настоящему изобретению, или экспрессию полинуклеотида по настоящему изобретению, когда экспрессия и/или активность полипептида по настоящему изобретению, или экспрессия полинуклеотида по настоящему изобретению ингибирована на стадии (2), или когда рост клетки на стадии (1) ингибирован на стадии (2).(3) the step of determining that the test compound inhibits the expression and/or activity of the polypeptide of the present invention, or the expression of the polynucleotide of the present invention, when the expression and/or activity of the polypeptide of the present invention, or the expression of the polynucleotide of the present invention is inhibited in step (2 ), or when cell growth at stage (1) is inhibited at stage (2).

[0108][0108]

Более предпочтительно, способ скрининга по настоящему изобретению представляет собой способ, включающий следующие стадии (1) - (3).More preferably, the screening method of the present invention is a method including the following steps (1) to (3).

[0109][0109]

(1) Стадия приведения клетки, экспрессирующей полипептид и/или полинуклеотид по настоящему изобретению, в контакт с тестируемым соединением.(1) The step of bringing a cell expressing a polypeptide and/or polynucleotide of the present invention into contact with a test compound.

[0110][0110]

(2) Стадия измерения того, ингибирован ли рост клетки на стадии (1).(2) The step of measuring whether cell growth is inhibited in step (1).

[0111][0111]

(3) Стадия определения того, что тестируемое соединение ингибирует экспрессию и/или активность полипептида по настоящему изобретению, или экспрессию полинуклеотида по настоящему изобретению, когда рост клетки на стадии (1) ингибирован на стадии (2).(3) The step of determining that the test compound inhibits the expression and/or activity of the polypeptide of the present invention, or the expression of the polynucleotide of the present invention when cell growth in step (1) is inhibited in step (2).

[0112][0112]

«Клетка, экспрессирующая полипептид и/или полинуклеотид по настоящему изобретению», включает клетки, трансформированные экспрессирующим вектором по настоящему изобретению, клетки, в которые введен полинуклеотид по настоящему изобретению посредством редактирования генома, первичную культуру клеток, экспрессирующих полипептид и/или полинуклеотид по настоящему изобретению, линии клеток, экспрессирующие полипептид и/или полинуклеотид по настоящему изобретению, и происходящие от пациента с злокачественной опухолью клетки, экспрессирующие полипептид и/или полинуклеотид по настоящему изобретению. Примеры способа подтверждения того, экспрессирует ли клетка полипептид и/или полинуклеотид по настоящему изобретению, включают способ детекции присутствия полипептида по настоящему изобретению и способ детекции присутствия полинуклеотида по настоящему изобретению.“A cell expressing a polypeptide and/or polynucleotide of the present invention” includes cells transformed with an expression vector of the present invention, cells into which a polynucleotide of the present invention has been introduced by genome editing, a primary culture of cells expressing the polypeptide and/or polynucleotide of the present invention , cell lines expressing the polypeptide and/or polynucleotide of the present invention, and cancer patient-derived cells expressing the polypeptide and/or polynucleotide of the present invention. Examples of a method for confirming whether a cell expresses a polypeptide and/or a polynucleotide of the present invention include a method for detecting the presence of a polypeptide of the present invention and a method for detecting the presence of a polynucleotide of the present invention.

[0113][0113]

По настоящему изобретению, «экспрессия полипептида по настоящему изобретению или экспрессия полинуклеотида по настоящему изобретению ингибирована» в фразе «экспрессия и/или активность полипептида по настоящему изобретению или экспрессия полинуклеотида по настоящему изобретению ингибирована» означает, например, следующее. Клетку, экспрессирующую полипептид и/или полинуклеотид по настоящему изобретению, приводят в контакт с тестируемым соединением, и уровень экспрессии полипептида или полинуклеотида по настоящему изобретению в клетке оценивают с использованием способа детекции присутствия полипептида или полинуклеотида по настоящему изобретению. Когда для клетки, приведенной в контакт с тестируемым соединением, показан статистически значимо уменьшенный уровень экспрессии полипептида или полинуклеотида по настоящему изобретению, по сравнению с клеткой, не приводимой в контакт с тестируемым соединением, определяют, что экспрессия полипептида или полинуклеотида по настоящему изобретению ингибирована.In the present invention, “the expression of the polypeptide of the present invention or the expression of the polynucleotide of the present invention is inhibited” in the phrase “the expression and/or activity of the polypeptide of the present invention or the expression of the polynucleotide of the present invention is inhibited” means, for example, the following. A cell expressing a polypeptide and/or polynucleotide of the present invention is contacted with a test compound, and the expression level of the polypeptide or polynucleotide of the present invention in the cell is assessed using a method for detecting the presence of the polypeptide or polynucleotide of the present invention. When a cell contacted with a test compound shows a statistically significantly reduced level of expression of a polypeptide or polynucleotide of the present invention compared to a cell not contacted with a test compound, expression of the polypeptide or polynucleotide of the present invention is determined to be inhibited.

[0114][0114]

Фраза «активность полипептида по настоящему изобретению ингибирована» в фразе «экспрессия и/или активность полипептида по настоящему изобретению, или экспрессия полинуклеотида по настоящему изобретению ингибирована» означает, например, следующее. Когда для полипептида по настоящему изобретению или клетки, экспрессирующей полипептид по настоящему изобретению, приведенных в контакт с тестируемым соединением, получают статистически значимо меньший процент фосфорилирования тирозина, чем для полипептида или клетки, не приводимых в контакт с тестируемым соединением, определяют, что активность полипептида по настоящему изобретению ингибирована.The phrase “the activity of the polypeptide of the present invention is inhibited” in the phrase “the expression and/or activity of the polypeptide of the present invention, or the expression of the polynucleotide of the present invention is inhibited” means, for example, the following. When a polypeptide of the present invention or a cell expressing a polypeptide of the present invention contacted with a test compound obtains a statistically significantly lower percentage of tyrosine phosphorylation than a polypeptide or cell not contacted with a test compound, the polypeptide's activity is determined to be the present invention is inhibited.

[0115][0115]

Когда для клетки, экспрессирующей полипептид по настоящему изобретению, приведенной в контакт с тестируемым соединением, показан статистически значимо ингибированный рост клетки, по сравнению с клеткой, не приводимой в контакт с тестируемым соединением, определяют, что активность полипептида по настоящему изобретению ингибирована.When a cell expressing a polypeptide of the present invention contacted with a test compound shows statistically significantly inhibited cell growth compared to a cell not contacted with a test compound, the activity of the polypeptide of the present invention is determined to be inhibited.

[0116][0116]

По настоящему изобретению, «фосфорилирование тирозина» включает не только фосфорилирование тирозина в белке RET (включая белок RET, слитый с другим белком), но также фосфорилирование тирозина в белке передачи сигналов ниже RET. Примеры белков передачи сигналов ниже RET включают STAT, AKT и ERK. Фосфорилирование тирозина, предпочтительно, представляет собой фосфорилирование тирозина в белке RET (включая белок RET, слитый с другим белком).In the present invention, "tyrosine phosphorylation" includes not only tyrosine phosphorylation in a RET protein (including a RET protein fused to another protein), but also tyrosine phosphorylation in a signaling protein downstream of RET. Examples of signaling proteins downstream of RET include STAT, AKT, and ERK. Tyrosine phosphorylation is preferably tyrosine phosphorylation of a RET protein (including a RET protein fused to another protein).

[0117][0117]

«Тирозин процент фосфорилирования» можно измерять с использованием, например, специфического для фосфорилированного RET антитела, посредством Вестерн-блоттинга, иммунопреципитации, иммуногистохимии, ELISA или проточной цитометрии."Tyrosine phosphorylation percentage" can be measured using, for example, a phosphorylated RET-specific antibody, Western blotting, immunoprecipitation, immunohistochemistry, ELISA, or flow cytometry.

[0118][0118]

По настоящему изобретению, «образец» включает не только биологические образцы (например, клетки, ткани, органы, жидкости организма (например, кровь и лимфу), желудочный сок и мочу), но также экстракты нуклеиновой кислоты (например, экстракты геномной ДНК, экстракты мРНК и препараты кДНК, и препараты кРНК, полученные из экстрактов мРНК) и экстракты белка, полученные из этих биологических образцов. Образцы могут представлять собой образцы, подвергнутые формалиновой фиксации, спиртовой фиксации, обработке замораживанием или погружению в парафин. Биологический образец для использования может представлять собой образец, собранный из живого организма, и, предпочтительно, представляет собой образец, полученный от пациента с злокачественной опухолью, и более предпочтительно, образец, содержащий клетки опухолей. Способ сбора биологического образца можно подходящим образом выбирать, в зависимости от типа биологического образца.In the present invention, a “sample” includes not only biological samples (eg, cells, tissues, organs, body fluids (eg, blood and lymph), gastric juice and urine), but also nucleic acid extracts (eg, genomic DNA extracts, extracts mRNA and cDNA preparations and cRNA preparations obtained from mRNA extracts) and protein extracts obtained from these biological samples. Specimens may be formalin-fixed, alcohol-fixed, freeze-fixed, or paraffin-embedded specimens. The biological sample to be used may be a sample collected from a living organism, and is preferably a sample obtained from a patient with a cancer, and more preferably a sample containing tumor cells. The method of collecting the biological sample can be suitably selected depending on the type of the biological sample.

[0119][0119]

Настоящее изобретение относится к способу детекции присутствия полипептида по настоящему изобретению в образце.The present invention relates to a method for detecting the presence of a polypeptide of the present invention in a sample.

[0120][0120]

По настоящему изобретению, способ детекции присутствия полипептида по настоящему изобретению в образце включает способы детекции в соответствии с общепринятыми способами, такими как ELISA, Вестерн-блоттинг или иммуногистохимическое окрашивание, с использованием антитела, специфически связывающего полипептид по настоящему изобретению; и FRET (резонансный перенос энергии флуоресценции) с использованием антитела, специфически связывающего белок DCTN1, и антитела, специфически связывающего белок RET. Способ детекции, предпочтительно, представляет собой ELISA, Вестерн-блоттинг или иммуногистохимическое окрашивание с использованием антитела, специфически связывающего полипептид по настоящему изобретению.According to the present invention, a method for detecting the presence of a polypeptide of the present invention in a sample includes detection methods in accordance with conventional methods such as ELISA, Western blotting or immunohistochemical staining using an antibody that specifically binds the polypeptide of the present invention; and FRET (fluorescence resonance energy transfer) using an antibody that specifically binds the DCTN1 protein and an antibody that specifically binds the RET protein. The detection method is preferably ELISA, Western blotting or immunohistochemical staining using an antibody that specifically binds the polypeptide of the present invention.

[0121][0121]

Антитело, специфически связывающее белок DCTN1, и антитело, специфически связывающее белок RET, предпочтительно, представляет собой антитело, которое связывает N-концевую часть от точки слияния в белке DCTN1, и антитело, которое связывает C-концевую часть от точки слияния в белке RET. Эти антитела могут представлять собой коммерчески доступные продукты или могут быть получены типичным известным способом.The antibody that specifically binds the DCTN1 protein and the antibody that specifically binds the RET protein is preferably an antibody that binds the N-terminal portion of the fusion point in the DCTN1 protein and an antibody that binds the C-terminal portion of the fusion point in the RET protein. These antibodies may be commercially available products or may be prepared in a typical known manner.

[0122][0122]

По настоящему изобретению, способ детекции присутствия полипептида по настоящему изобретению в образце предпочтительно включает стадию детекции полипептида по настоящему изобретению с использованием антитела, специфически связывающего полипептид по настоящему изобретению, или антитела, специфически связывающего белок DCTN1, и антитела, специфически связывающего белок RET; и более предпочтительно, включает стадию детекции полипептида по настоящему изобретению с использованием антитела, специфически связывающего полипептид по настоящему изобретению. Средства для детекции присутствия полипептида по настоящему изобретению не являются конкретно ограниченными, и их примеры включают комбинацию антитела, специфически связывающего белок DCTN1, и антитела, специфически связывающего белок RET; и антитела, специфически связывающего полипептид по настоящему изобретению.According to the present invention, a method for detecting the presence of a polypeptide of the present invention in a sample preferably includes the step of detecting a polypeptide of the present invention using an antibody that specifically binds the polypeptide of the present invention, or an antibody that specifically binds the DCTN1 protein, and an antibody that specifically binds the RET protein; and more preferably, includes the step of detecting a polypeptide of the present invention using an antibody that specifically binds the polypeptide of the present invention. The means for detecting the presence of a polypeptide of the present invention are not particularly limited, and examples thereof include a combination of an antibody that specifically binds DCTN1 protein and an antibody that specifically binds RET protein; and an antibody that specifically binds the polypeptide of the present invention.

[0123][0123]

Настоящее изобретение относится к праймеру или зонду для детекции присутствия полинуклеотида по настоящему изобретению в образце. По настоящему изобретению, средства для детекции присутствия полипептида по настоящему изобретению не являются конкретно ограниченными, и их примеры включают праймер или зонд для детекции присутствия полинуклеотида по настоящему изобретению.The present invention relates to a primer or probe for detecting the presence of a polynucleotide of the present invention in a sample. In the present invention, means for detecting the presence of a polypeptide of the present invention are not particularly limited, and examples thereof include a primer or probe for detecting the presence of a polynucleotide of the present invention.

[0124][0124]

Праймер или зонд включает полинуклеотиды, выбранные из следующих (j)-(l):The primer or probe includes polynucleotides selected from the following (j)-(l):

(j) полинуклеотид, представляющий собой по меньшей мере один зонд, выбранный из группы, состоящей из зондов, гибридизующихся с полинуклеотидом, кодирующим белок DCTN1, и зондов, гибридизующихся с полинуклеотидом, кодирующим белок RET;(j) a polynucleotide comprising at least one probe selected from the group consisting of probes hybridizing to a polynucleotide encoding a DCTN1 protein and probes hybridizing to a polynucleotide encoding a RET protein;

[0125][0125]

(k) полинуклеотид, представляющий собой зонд, гибридизующийся с точкой слияния между полинуклеотидом, кодирующим белок DCTN1, и полинуклеотидом, кодирующим белок RET; и(k) a polynucleotide that is a probe that hybridizes to a fusion point between a polynucleotide encoding a DCTN1 protein and a polynucleotide encoding a RET protein; And

[0126][0126]

(l) полинуклеотид, представляющий собой набор из смыслового праймера и антисмыслового праймера, разработанных для обрамления точки слияния между полинуклеотидом, кодирующим белок DCTN1, и полинуклеотидом, кодирующим белок RET.(l) a polynucleotide consisting of a sense primer and an antisense primer designed to flank the fusion point between a polynucleotide encoding a DCTN1 protein and a polynucleotide encoding a RET protein.

[0127][0127]

По настоящему изобретению, «точка слияния» в фразе «точка слияния между полинуклеотидом, кодирующим белок DCTN1, и полинуклеотидом, кодирующим белок RET», относится к точке, в которой полинуклеотид, кодирующий белок DCTN1, слит с полинуклеотидом, кодирующим белок RET. Точка слияния в SEQ ID NO: 1 представляет собой точку, в которой полинуклеотид, имеющий последовательность оснований из положений 1-3699 из SEQ ID NO: 1, происходящую из полинуклеотида, кодирующего DCTN1, слит с полинуклеотидом, имеющим последовательность оснований из положений 3700-4905 из SEQ ID NO: 1, происходящую из полинуклеотида, кодирующего RET. Точка слияния в SEQ ID NO: 3 представляет собой точку, в которой полинуклеотид, имеющий последовательность оснований из положений 1-3699 из SEQ ID NO: 3, происходящую из полинуклеотида, кодирующего DCTN1, слит с полинуклеотидом, имеющим последовательность оснований из положений 3700-4779 из SEQ ID NO: 3, происходящую из полинуклеотида, кодирующего RET. Точка слияния в SEQ ID NO: 5 представляет собой точку, в которой полинуклеотид, имеющий последовательность оснований из положений 1-3297 из SEQ ID NO: 5, происходящую из полинуклеотида, кодирующего DCTN1, слит с полинуклеотидом, имеющим последовательность оснований из положений 3298-4503 из SEQ ID NO: 5, происходящую из полинуклеотида, кодирующего RET. Точка слияния в SEQ ID NO: 7 представляет собой точку, в которой полинуклеотид, имеющий последовательность оснований из положений 1-3297 из SEQ ID NO: 7, происходящую из полинуклеотида, кодирующего DCTN1, слит с полинуклеотидом, имеющим последовательность оснований из положений 3298-4377 из SEQ ID NO: 7, происходящую из полинуклеотида, кодирующего RET. Точка слияния в SEQ ID NO: 9 представляет собой точку, в которой полинуклеотид, имеющий последовательность оснований из положений 1-3624 из SEQ ID NO: 9, происходящую из полинуклеотида, кодирующего DCTN1, слит с полинуклеотидом, имеющим последовательность оснований из положений 3625-4830 из SEQ ID NO: 9, происходящую из полинуклеотида, кодирующего RET. Точка слияния в SEQ ID NO: 11 представляет собой точку, в которой полинуклеотид, имеющий последовательность оснований из положений 1-3624 из SEQ ID NO: 11, происходящую из полинуклеотида, кодирующего DCTN1, слит с полинуклеотидом, имеющим последовательность оснований из положений 3625-4704 из SEQ ID NO: 11, происходящую из полинуклеотида, кодирующего RET. Точка слияния в SEQ ID NO: 13 представляет собой точку, в которой полинуклеотид, имеющий последовательность оснований из положений 1-3282 из SEQ ID NO: 13, происходящую из полинуклеотида, кодирующего DCTN1, слит с полинуклеотидом, имеющим последовательность оснований из положений 3283-4488 из SEQ ID NO: 13, происходящую из полинуклеотида, кодирующего RET. Точка слияния в SEQ ID NO: 15 представляет собой точку, в которой полинуклеотид, имеющий последовательность оснований из положений 1-3282 из SEQ ID NO: 15, происходящую из полинуклеотида, кодирующего DCTN1, слит с полинуклеотидом, имеющим последовательность оснований из положений 3283-4362 из SEQ ID NO: 15, происходящую из полинуклеотида, кодирующего RET. Точка слияния в SEQ ID NO: 17 представляет собой точку, в которой полинуклеотид, имеющий последовательность оснований из положений 1-3573 из SEQ ID NO: 17, происходящую из полинуклеотида, кодирующего DCTN1, слит с полинуклеотидом, имеющим последовательность оснований из положений 3574-4779 из SEQ ID NO: 17, происходящую из полинуклеотида, кодирующего RET. Точка слияния в SEQ ID NO: 19 представляет собой точку, в которой полинуклеотид, имеющий последовательность оснований из положений 1-3573 из SEQ ID NO: 19, происходящую из полинуклеотида, кодирующего DCTN1, слит с полинуклеотидом, имеющим последовательность оснований из положений 3574-4653 из SEQ ID NO: 19, происходящую из полинуклеотида, кодирующего RET. Точка слияния в SEQ ID NO: 21 представляет собой точку, в которой полинуклеотид, имеющий последовательность оснований из положений 1-3678 из SEQ ID NO: 21, происходящую из полинуклеотида, кодирующего DCTN1, слит с полинуклеотидом, имеющим последовательность оснований из положений 3679-4884 из SEQ ID NO: 21, происходящую из полинуклеотида, кодирующего RET. Точка слияния в SEQ ID NO: 23 представляет собой точку, в которой полинуклеотид, имеющий последовательность оснований из положений 1-3678 из SEQ ID NO: 23, происходящую из полинуклеотида, кодирующего DCTN1, слит с полинуклеотидом, имеющим последовательность оснований из положений 3679-4758 из SEQ ID NO: 23, происходящую из полинуклеотида, кодирующего RET.In the present invention, "fusion point" in the phrase "fusion point between a polynucleotide encoding a DCTN1 protein and a polynucleotide encoding a RET protein" refers to the point at which a polynucleotide encoding a DCTN1 protein is fused to a polynucleotide encoding a RET protein. The fusion point in SEQ ID NO: 1 is the point at which a polynucleotide having the base sequence from positions 1-3699 of SEQ ID NO: 1, derived from the polynucleotide encoding DCTN1, is fused to a polynucleotide having the base sequence from positions 3700-4905 from SEQ ID NO: 1, derived from a polynucleotide encoding RET. The fusion point in SEQ ID NO: 3 is the point at which a polynucleotide having the base sequence from positions 1-3699 of SEQ ID NO: 3, derived from the polynucleotide encoding DCTN1, is fused to a polynucleotide having the base sequence from positions 3700-4779 from SEQ ID NO: 3, derived from a polynucleotide encoding RET. The fusion point in SEQ ID NO: 5 is the point at which a polynucleotide having the base sequence from positions 1-3297 of SEQ ID NO: 5, derived from the polynucleotide encoding DCTN1, is fused to a polynucleotide having the base sequence from positions 3298-4503 from SEQ ID NO: 5, derived from a polynucleotide encoding RET. The fusion point in SEQ ID NO: 7 is the point at which a polynucleotide having the base sequence from positions 1-3297 of SEQ ID NO: 7, derived from the polynucleotide encoding DCTN1, is fused to a polynucleotide having the base sequence from positions 3298-4377 from SEQ ID NO: 7, derived from a polynucleotide encoding RET. The fusion point in SEQ ID NO: 9 is the point at which a polynucleotide having the base sequence from positions 1-3624 of SEQ ID NO: 9, derived from the polynucleotide encoding DCTN1, is fused to a polynucleotide having the base sequence from positions 3625-4830 from SEQ ID NO: 9, derived from a polynucleotide encoding RET. The fusion point in SEQ ID NO: 11 is the point at which a polynucleotide having the base sequence from positions 1-3624 of SEQ ID NO: 11 derived from the polynucleotide encoding DCTN1 is fused to a polynucleotide having the base sequence from positions 3625-4704 from SEQ ID NO: 11, derived from a polynucleotide encoding RET. The fusion point in SEQ ID NO: 13 is the point at which a polynucleotide having the base sequence from positions 1-3282 of SEQ ID NO: 13, derived from the polynucleotide encoding DCTN1, is fused to a polynucleotide having the base sequence from positions 3283-4488 from SEQ ID NO: 13, derived from a polynucleotide encoding RET. The fusion point in SEQ ID NO: 15 is the point at which a polynucleotide having the base sequence from positions 1-3282 of SEQ ID NO: 15 derived from the polynucleotide encoding DCTN1 is fused to a polynucleotide having the base sequence from positions 3283-4362 from SEQ ID NO: 15, derived from a polynucleotide encoding RET. The fusion point in SEQ ID NO: 17 is the point at which a polynucleotide having the base sequence from positions 1-3573 of SEQ ID NO: 17 derived from the polynucleotide encoding DCTN1 is fused to a polynucleotide having the base sequence from positions 3574-4779 from SEQ ID NO: 17, derived from a polynucleotide encoding RET. The fusion point in SEQ ID NO: 19 is the point at which a polynucleotide having the base sequence from positions 1-3573 of SEQ ID NO: 19 derived from the polynucleotide encoding DCTN1 is fused to a polynucleotide having the base sequence from positions 3574-4653 from SEQ ID NO: 19, derived from a polynucleotide encoding RET. The fusion point in SEQ ID NO: 21 is the point at which a polynucleotide having the base sequence from positions 1-3678 of SEQ ID NO: 21 derived from the polynucleotide encoding DCTN1 is fused to a polynucleotide having the base sequence from positions 3679-4884 from SEQ ID NO: 21, derived from a polynucleotide encoding RET. The fusion point in SEQ ID NO: 23 is the point at which a polynucleotide having the base sequence from positions 1-3678 of SEQ ID NO: 23 derived from the polynucleotide encoding DCTN1 is fused to a polynucleotide having the base sequence from positions 3679-4758 from SEQ ID NO: 23, derived from a polynucleotide encoding RET.

[0128][0128]

По настоящему изобретению, праймер или зонд получают в форме полинуклеотида, который специфически гибридизуется с полинуклеотидом по настоящему изобретению, на основании информации о последовательности полинуклеотида по настоящему изобретению, в соответствии с типичным известным способом. Количество оснований для праймера или зонда составляет 10-50, предпочтительно, 15-50, и более предпочтительно, 18-35.In the present invention, the primer or probe is prepared in the form of a polynucleotide that specifically hybridizes to the polynucleotide of the present invention based on the sequence information of the polynucleotide of the present invention, in accordance with a typical known method. The number of bases for the primer or probe is 10-50, preferably 15-50, and more preferably 18-35.

[0129][0129]

Праймер или зонд не обязательно должен являться полностью комплементарным, при условии, что праймер или зонд специфически гибридизуется с полинуклеотидом по настоящему изобретению. Праймер или зонд представляет собой полинуклеотид, имеющий по меньшей мере 70% идентичность, предпочтительно, по меньшей мере 80% идентичность, более предпочтительно, по меньшей мере 90% идентичность, более предпочтительно, по меньшей мере 95% идентичность, и более предпочтительно, по меньшей мере 98% идентичность с соответствующей последовательность оснований.The primer or probe need not be completely complementary, as long as the primer or probe specifically hybridizes to the polynucleotide of the present invention. The primer or probe is a polynucleotide having at least 70% identity, preferably at least 80% identity, more preferably at least 90% identity, more preferably at least 95% identity, and more preferably at least at least 98% identity with the corresponding base sequence.

[0130][0130]

Праймер или зонд по настоящему изобретению, предпочтительно, представляет собой полинуклеотид, представленный (i) SEQ ID NO: 69, (ii) SEQ ID NO: 70 или (iii) SEQ ID NO: 71, более предпочтительно, полинуклеотид, представляющий собой набор из смыслового праймера и антисмыслового праймера, представленный (iv) SEQ ID NO: 69 и SEQ ID NO: 70, и более предпочтительно, полинуклеотид, представляющий собой набор из смыслового праймера, антисмыслового праймера и зонда, представленный (v) SEQ ID NO: 69, SEQ ID NO: 70 и SEQ ID NO: 71.The primer or probe of the present invention is preferably a polynucleotide represented by (i) SEQ ID NO: 69, (ii) SEQ ID NO: 70 or (iii) SEQ ID NO: 71, more preferably a polynucleotide consisting of a set of a sense primer and an antisense primer represented by (iv) SEQ ID NO: 69 and SEQ ID NO: 70, and more preferably, a polynucleotide comprising a sense primer, an antisense primer and a probe represented by (v) SEQ ID NO: 69, SEQ ID NO: 70 and SEQ ID NO: 71.

[0131][0131]

Настоящее изобретение относится к способу детекции присутствия полинуклеотида по настоящему изобретению в образце.The present invention relates to a method for detecting the presence of a polynucleotide of the present invention in a sample.

[0132][0132]

По настоящему изобретению, способ детекции присутствия полинуклеотида по настоящему изобретению в образце представляет собой способ детекции в соответствии с общепринятым способом детекции, таким как Нозерн-блоттинг, Саузерн-блоттинг, RT-ПЦР, ПЦР с детекцией в реальном времени, цифровая ПЦР, микромассив ДНК, гибридизацияin situ и анализ последовательности.According to the present invention, the method for detecting the presence of a polynucleotide of the present invention in a sample is a detection method in accordance with a conventional detection method such as Northern blotting, Southern blotting, RT-PCR, real-time detection PCR, digital PCR, DNA microarray ,in situ hybridization and sequence analysis.

[0133][0133]

По настоящему изобретению, способ детекции присутствия полинуклеотида по настоящему изобретению в образце также включает способ детекции присутствия полинуклеотида слитого гена RET, включая полинуклеотид по настоящему изобретению. Способ включает способ, в котором продукт ПЦР, амплифицированный способом 5' RACE с использованием праймера, который гибридизуется с полинуклеотидом, кодирующим белок RET (например, праймера, который гибридизуется с последовательностью с 3'-стороны от киназного домена RET), подвергают анализу последовательности.According to the present invention, a method for detecting the presence of a polynucleotide of the present invention in a sample also includes a method for detecting the presence of a RET fusion gene polynucleotide, including the polynucleotide of the present invention. The method includes a method in which a PCR product amplified by the 5' RACE method using a primer that hybridizes to a polynucleotide encoding a RET protein (eg, a primer that hybridizes to a sequence 3' side of the RET kinase domain) is subjected to sequence analysis.

[0134][0134]

По настоящему изобретению, способ детекции присутствия полинуклеотида по настоящему изобретению в образце, предпочтительно, включает стадию детекции полинуклеотида по настоящему изобретению с использованием праймера или зонда по настоящему изобретению.According to the present invention, a method for detecting the presence of a polynucleotide of the present invention in a sample preferably includes the step of detecting a polynucleotide of the present invention using a primer or probe of the present invention.

[0135][0135]

Настоящее изобретение относится к фармацевтической композиции для лечения злокачественной опухоли, которая является положительной по гену, слитому из гена DCTN1 и гена RET, и/или положительной по белку, слитому из белка DCTN1 и белка RET, где композиция содержит соединение, ингибирующее RET, в качестве активного ингредиента.The present invention relates to a pharmaceutical composition for the treatment of a malignant tumor that is positive for a gene fusion of the DCTN1 gene and the RET gene, and/or positive for the fusion protein of DCTN1 protein and the RET protein, where the composition contains a compound that inhibits RET as active ingredient.

[0136][0136]

Более предпочтительно, настоящее изобретение относится к фармацевтической композиции для лечения злокачественной опухоли, которая является положительной по гену, слитому из гена DCTN1 и гена RET, и/или положительной по белку, слитому из белка DCTN1 и белка RET, где композиция содержит соединение, ингибирующее экспрессию и/или активность полипептида по настоящему изобретению, или экспрессию полинуклеотида по настоящему изобретению, в качестве активного ингредиента.More preferably, the present invention relates to a pharmaceutical composition for the treatment of a malignant tumor that is positive for a gene fusion of the DCTN1 gene and the RET gene, and/or positive for the fusion protein of DCTN1 protein and the RET protein, where the composition contains a compound that inhibits the expression of and/or the activity of the polypeptide of the present invention, or the expression of the polynucleotide of the present invention, as an active ingredient.

[0137][0137]

По настоящему изобретению, «злокачественная опухоль, которая является положительной по гену, слитому из гена DCTN1 и гена RET», в фразе «злокачественная опухоль, которая является положительной по гену, слитому из гена DCTN1 и гена RET, и/или положительной по белку, слитому из белка DCTN1 и белка RET», относится к злокачественной опухоли, которая экспрессирует полинуклеотид по настоящему изобретению, и предпочтительно, к злокачественной опухоли, в которой полинуклеотид по настоящему изобретению детектирован с использованием способа детекции присутствия полинуклеотида по настоящему изобретению.In the present invention, “a cancer that is positive for a gene fused from a DCTN1 gene and a RET gene,” in the phrase “a cancer that is positive for a gene fused from a DCTN1 gene and a RET gene and/or positive for a protein, fusion of DCTN1 protein and RET protein" refers to a cancer that expresses a polynucleotide of the present invention, and preferably, a cancer in which the polynucleotide of the present invention is detected using a method for detecting the presence of a polynucleotide of the present invention.

[0138][0138]

По настоящему изобретению, «злокачественная опухоль, которая является положительной по белку, слитому из белка DCTN1 и белка RET», в фразе «злокачественная опухоль, которая является положительной по гену, слитому из гена DCTN1 и гена RET, и/или положительной по белку, слитому из белка DCTN1 и белка RET», относится к злокачественной опухоли, которая экспрессирует полипептид по настоящему изобретению, и предпочтительно, к злокачественной опухоли, в которой полипептид по настоящему изобретению детектирован с использованием способа детекции присутствия полипептида по настоящему изобретению.In the present invention, “a cancer that is positive for a fusion protein of DCTN1 and a RET protein,” in the phrase “a cancer that is positive for a fusion of a DCTN1 gene and a RET gene and/or positive for a protein, fusion of DCTN1 protein and RET protein" refers to a cancer that expresses a polypeptide of the present invention, and preferably, a cancer in which the polypeptide of the present invention is detected using a method for detecting the presence of a polypeptide of the present invention.

[0139][0139]

Активный ингредиент фармацевтической композиции для лечения злокачественной опухоли в соответствии с настоящим изобретением представляет собой соединение, ингибирующее RET, и более предпочтительно, соединение, ингибирующее экспрессию и/или активность полипептида по настоящему изобретению, или экспрессию полинуклеотида по настоящему изобретению. Соединение, выбранное способом скрининга по настоящему изобретению, можно также использовать в качестве активного ингредиента. Например, соединение, как известно, ингибирующее RET, можно использовать в качестве активного ингредиента фармацевтической композиции по настоящему изобретению. Соединение, ингибирующее RET, может представлять собой соединение, ингибирующее экспрессию и/или активность других тирозинкиназ, при условии, что соединение может ингибировать экспрессию и/или активность RET, и более предпочтительно, соединение, которое может ингибировать активность RET и экспрессию и/или активность других тирозинкиназ. Примеры таких соединений включают вандетаниб, сорафениб, сунитиниб, мотесаниб, кабозантиниб, ленватиниб и соединения, описанные в брошюре WO2016/127074, брошюре WO2017/043550, брошюре WO2017/011776 и брошюре WO2017/146116.The active ingredient of the pharmaceutical composition for treating cancer according to the present invention is a compound that inhibits RET, and more preferably, a compound that inhibits the expression and/or activity of a polypeptide of the present invention, or the expression of a polynucleotide of the present invention. The compound selected by the screening method of the present invention can also be used as an active ingredient. For example, a compound known to inhibit RET can be used as an active ingredient in the pharmaceutical composition of the present invention. The RET inhibitory compound may be a compound that inhibits the expression and/or activity of other tyrosine kinases, provided that the compound can inhibit RET expression and/or activity, and more preferably, a compound that can inhibit RET activity and expression and/or activity other tyrosine kinases. Examples of such compounds include vandetanib, sorafenib, sunitinib, motesanib, cabozantinib, lenvatinib and the compounds described in Brochure WO2016/127074, Brochure WO2017/043550, Brochure WO2017/011776 and Brochure WO2017/146116.

Активный ингредиент для фармацевтической композиции для лечения злокачественной опухоли, положительной по гену, слитому из гена DCTN1 и гена RET, и/или положительной по белку, слитому из белка DCTN1 и белка RET, представляет собой соединение, ингибирующее RET; более предпочтительно, вандетаниб, кабозантиниб, ленватиниб, конденсированное соединение пиримидина, представленное формулой (1), описанное в брошюре WO2017/043550, и конденсированное соединение пиримидина, представленное формулой (1), описанное в брошюре WO2017/146116; более предпочтительно, вандетаниб, кабозантиниб, ленватиниб, примеры соединений 1-90, описанные в брошюре WO2017/043550, и примеры соединений 1-207, описанные в брошюре WO2017/146116; еще более предпочтительно, вандетаниб, кабозантиниб, ленватиниб, 4-амино-1-(трет-бутил)-N-(5-метил-1H-пиразол-3-ил)-1H-пиразолo[3,4-d]пиримидин-3-карбоксамид, 4-амино-7-(трет-бутил)-N-(5-метил-1H-пиразол-3-ил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид, 4-амино-7-(1-фтор-2-метилпропан-2-ил)-N-(5-метил-1H-пиразол-3-ил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид, 4-амино-N-(5-метил-1H-пиразол-3-ил)-7-(1-метилциклопропил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид, 4-амино-7-(2-циклопропилпропан-2-ил)-N-(5-метил-1H-пиразол-3-ил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид, 4-амино-N-[4-(метоксиметил)фенил]-7-(1-метилциклопропил)-6-(3-морфолинопро-1-пин-1-ил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид, 4-амино-N-[4-(метоксиметил)фенил]-7-(1-метилциклопропил)-6-((тетрагидро-2H-пиран-4-ил)этинил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид, (R)-4-амино-N-[4-(метоксиметил)фенил]-7-(1-метилциклопропил)-6-((тетрагидрофуран-2-ил)метокси)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид и 4-амино-N-[4-(метоксиметил)фенил]-6-((1-метил-1H-пиразол-4-ил)этинил)-7-(1-метилциклопропил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид; и особенно предпочтительно, 4-амино-1-(трет-бутил)-N-(5-метил-1H-пиразол-3-ил)-1H-пиразолo[3,4-d]пиримидин-3-карбоксамид, 4-амино-7-(трет-бутил)-N-(5-метил-1H-пиразол-3-ил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид, 4-амино-7-(1-фтор-2-метилпропан-2-ил)-N-(5-метил-1H-пиразол-3-ил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид, 4-амино-N-(5-метил-1H-пиразол-3-ил)-7-(1-метилциклопропил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид, 4-амино-7-(2-циклопропилпропан-2-ил)-N-(5-метил-1H-пиразол-3-ил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид, 4-амино-N-[4-(метоксиметил)фенил]-7-(1-метилциклопропил)-6-(3-морфолинопро-1-пин-1-ил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид, 4-амино-N-[4-(метоксиметил)фенил]-7-(1-метилциклопропил)-6-((тетрагидро-2H-пиран-4-ил)этинил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид, (R)-4-амино-N-[4-(метоксиметил)фенил]-7-(1-метилциклопропил)-6-((тетрагидрофуран-2-ил)метокси)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид и 4-амино-N-[4-(метоксиметил)фенил]-6-((1-метил-1H-пиразол-4-ил)этинил)-7-(1-метилциклопропил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид.The active ingredient for a pharmaceutical composition for treating a cancer positive for a DCTN1 gene-RET fusion gene and/or positive for a DCTN1-RET fusion protein is a RET inhibitory compound; more preferably, vandetanib, cabozantinib, lenvatinib, a fused pyrimidine compound represented by formula (1) described in brochure WO2017/043550, and a fused pyrimidine compound represented by formula (1) described in brochure WO2017/146116; more preferably, vandetanib, cabozantinib, lenvatinib, examples of compounds 1-90 described in brochure WO2017/043550, and examples of compounds 1-207 described in brochure WO2017/146116; even more preferably, vandetanib, cabozantinib, lenvatinib, 4-amino-1-(tert-butyl)-N-(5-methyl-1H-pyrazol-3-yl)-1H-pyrazolo[3,4-d]pyrimidin- 3-carboxamide, 4-amino-7-(tert-butyl)-N-(5-methyl-1H-pyrazol-3-yl)-7H-pyrrolo[2,3-d]pyrimidine-5-carboxamide, 4- amino-7-(1-fluoro-2-methylpropan-2-yl)-N-(5-methyl-1H-pyrazol-3-yl)-7H-pyrrolo[2,3-d]pyrimidin-5-carboxamide, 4-amino-N-(5-methyl-1H-pyrazol-3-yl)-7-(1-methylcyclopropyl)-7H-pyrrolo[2,3-d]pyrimidine-5-carboxamide, 4-amino-7- (2-cyclopropylpropan-2-yl)-N-(5-methyl-1H-pyrazol-3-yl)-7H-pyrrolo[2,3-d]pyrimidin-5-carboxamide, 4-amino-N-[4 -(methoxymethyl)phenyl]-7-(1-methylcyclopropyl)-6-(3-morpholinoprop-1-pin-1-yl)-7H-pyrrolo[2,3-d]pyrimidine-5-carboxamide, 4-amino -N-[4-(methoxymethyl)phenyl]-7-(1-methylcyclopropyl)-6-((tetrahydro-2H-pyran-4-yl)ethynyl)-7H-pyrrolo[2,3-d]pyrimidin-5 -carboxamide, (R)-4-amino-N-[4-(methoxymethyl)phenyl]-7-(1-methylcyclopropyl)-6-((tetrahydrofuran-2-yl)methoxy)-7H-pyrrolo[2,3 -d]pyrimidine-5-carboxamide and 4-amino-N-[4-(methoxymethyl)phenyl]-6-((1-methyl-1H-pyrazol-4-yl)ethynyl)-7-(1-methylcyclopropyl) -7H-pyrrolo[2,3-d]pyrimidine-5-carboxamide; and especially preferably, 4-amino-1-(tert-butyl)-N-(5-methyl-1H-pyrazol-3-yl)-1H-pyrazolo[3,4-d]pyrimidine-3-carboxamide, 4- amino-7-(tert-butyl)-N-(5-methyl-1H-pyrazol-3-yl)-7H-pyrrolo[2,3-d]pyrimidine-5-carboxamide, 4-amino-7-(1 -fluoro-2-methylpropan-2-yl)-N-(5-methyl-1H-pyrazol-3-yl)-7H-pyrrolo[2,3-d]pyrimidin-5-carboxamide, 4-amino-N- (5-methyl-1H-pyrazol-3-yl)-7-(1-methylcyclopropyl)-7H-pyrrolo[2,3-d]pyrimidine-5-carboxamide, 4-amino-7-(2-cyclopropylpropane-2 -yl)-N-(5-methyl-1H-pyrazol-3-yl)-7H-pyrrolo[2,3-d]pyrimidine-5-carboxamide, 4-amino-N-[4-(methoxymethyl)phenyl] -7-(1-methylcyclopropyl)-6-(3-morpholinoprop-1-pin-1-yl)-7H-pyrrolo[2,3-d]pyrimidine-5-carboxamide, 4-amino-N-[4- (methoxymethyl)phenyl]-7-(1-methylcyclopropyl)-6-((tetrahydro-2H-pyran-4-yl)ethynyl)-7H-pyrrolo[2,3-d]pyrimidine-5-carboxamide, (R) -4-amino-N-[4-(methoxymethyl)phenyl]-7-(1-methylcyclopropyl)-6-((tetrahydrofuran-2-yl)methoxy)-7H-pyrrolo[2,3-d]pyrimidine-5 -carboxamide and 4-amino-N-[4-(methoxymethyl)phenyl]-6-((1-methyl-1H-pyrazol-4-yl)ethynyl)-7-(1-methylcyclopropyl)-7H-pyrrolo[2 ,3-d]pyrimidine-5-carboxamide.

[0140][0140]

По настоящему изобретению, «может ингибировать экспрессию RET» в фразе «соединение может ингибировать экспрессию и/или активность RET» означает, например, следующее. Клетку, экспрессирующую полипептид и/или полинуклеотид RET, приводят в контакт с тестируемым соединением, и детектируют уровень экспрессии полипептида или полинуклеотида RET в клетке. Когда для клетки, приведенной в контакт с тестируемым соединением, показывают более низкий уровень экспрессии полипептида или полинуклеотида RET, чем в клетке, которую не приводили в контакт с тестируемым соединением, определяют, что экспрессия RET ингибирована. Такие соединения включают соединения, описанные выше, миРНК, мкРНК и аптамеры нуклеиновой кислоты (ДНК, РНК). Примеры миРНК включают CACAUGUCAUCAAAUUGUATT (SEQ ID NO: 74), GGAUUGAAAACAAACUCUATT (SEQ ID NO: 75) и GCUUGUCCCGAGAUGUUUATT (SEQ ID NO: 76); и миРНК, предпочтительно, представляет собой CACAUGUCAUCAAAUUGUATT (SEQ ID NO: 74) или GGAUUGAAAACAAACUCUATT (SEQ ID NO: 75).In the present invention, “can inhibit the expression of RET” in the phrase “the compound can inhibit the expression and/or activity of RET” means, for example, the following. A cell expressing a RET polypeptide and/or polynucleotide is contacted with a test compound, and the level of expression of the RET polypeptide or polynucleotide in the cell is detected. When a cell contacted with the test compound shows a lower level of expression of the RET polypeptide or polynucleotide than a cell that was not contacted with the test compound, RET expression is determined to be inhibited. Such compounds include those described above, siRNAs, miRNAs and nucleic acid aptamers (DNA, RNA). Examples of siRNAs include CACAUGUCAUCAAAUUGUATT (SEQ ID NO: 74), GGAUUGAAAACAAACUCUATT (SEQ ID NO: 75) and GCUUGUCCCGAGAUGUUUATT (SEQ ID NO: 76); and the siRNA is preferably CACAUGUCAUCAAAUUGUATT (SEQ ID NO: 74) or GGAUUGAAACAAACUCUATT (SEQ ID NO: 75).

[0141][0141]

Может ли соединение «ингибировать активность RET», в фразе «соединение может ингибировать экспрессию и/или активность RET», можно определять с использованием фосфорилирования тирозина в качестве индикатора. Примеры способа измерения фосфорилирования тирозина включают способ, описанный в тестовом примере 1 в брошюре WO2017/043550.Whether a compound can “inhibit RET activity,” in the phrase “the compound can inhibit RET expression and/or activity,” can be determined using tyrosine phosphorylation as an indicator. Examples of the method for measuring tyrosine phosphorylation include the method described in Test Example 1 in brochure WO2017/043550.

[0142][0142]

Кроме того, соединение можно определять как способное ингибировать активность RET с использованием клетки, экспрессирующей полипептид и/или полинуклеотид RET, когда эффект ингибирования роста клетки является индикатором. Примеры способа измерения эффекта ингибирования роста клетки включают способ, описанный в тестовом примере 3 и тестовом примере 4 из брошюры WO2017/043550.In addition, a compound can be determined to be capable of inhibiting RET activity using a cell expressing a RET polypeptide and/or polynucleotide when the effect of cell growth inhibition is indicative. Examples of the method for measuring the cell growth inhibition effect include the method described in Test Example 3 and Test Example 4 of Brochure WO2017/043550.

[0143][0143]

Злокачественная опухоль, на которую нацелена фармацевтическая композиция по настоящему изобретению, не является конкретно ограниченной, при условии, что злокачественная опухоль экспрессирует полинуклеотид и/или полипептид по настоящему изобретению, и примеры включают рак головы и шеи, рак щитовидной железы, злокачественную опухоль желудочно-кишечного тракта (например, рак пищевода, рак желудка, рак двенадцатиперстной кишки, рак печени, рак желчевыводящих путей (например, рак желчного пузыря и рак желчного протока), рак поджелудочной железы, рак тонкого кишечника, рак кишечника (например, колоректальный рак, рак ободочной кишки, рак прямой кишки) и стромальную опухоль желудочно-кишечного тракта), рак легкого (немелкоклеточный рак легкого, мелкоклеточный рак легкого), рак молочной железы, рак яичника, рак матки (например, рак шейки матки, рак эндометрия), рак почки, рак мочевого пузыря, рак предстательной железы и рак кожи. Злокачественная опухоль, предпочтительно, представляет собой рак щитовидной железы или рак легкого (немелкоклеточный рак легкого, мелкоклеточный рак легкого). Злокачественная опухоль, в рамках изобретения, включает не только первичные опухоли, но также злокачественную опухоль, распространившуюся на другие органы (например, печень).The cancer targeted by the pharmaceutical composition of the present invention is not particularly limited as long as the cancer expresses the polynucleotide and/or polypeptide of the present invention, and examples include head and neck cancer, thyroid cancer, gastrointestinal cancer tract (eg, esophageal cancer, stomach cancer, duodenal cancer, liver cancer, biliary tract cancer (eg, gallbladder cancer and bile duct cancer), pancreatic cancer, small intestinal cancer, intestinal cancer (eg, colorectal cancer, colon cancer colon, rectal cancer) and gastrointestinal stromal tumor), lung cancer (non-small cell lung cancer, small cell lung cancer), breast cancer, ovarian cancer, uterine cancer (eg, cervical cancer, endometrial cancer), kidney cancer, bladder cancer, prostate cancer and skin cancer. The malignant tumor is preferably thyroid cancer or lung cancer (non-small cell lung cancer, small cell lung cancer). A malignant tumor, within the scope of the invention, includes not only primary tumors, but also a malignant tumor that has spread to other organs (eg, the liver).

[0144][0144]

Препарат, содержащий соединение, ингибирующее экспрессию и/или активность полипептида по настоящему изобретению, или экспрессию полинуклеотида по настоящему изобретению, в качестве активного ингредиента, можно получать в форме фармацевтической композиции, содержащей фармацевтический носитель, так чтобы она подходила для множества лекарственных форм. Примеры лекарственных форм включают пероральные средства, средства для инъекций, суппозитории, мази и пластыри. Эти лекарственные формы можно получать способами получения, известными и общепринятыми для специалиста в данной области.A preparation containing a compound that inhibits the expression and/or activity of a polypeptide of the present invention, or the expression of a polynucleotide of the present invention, as an active ingredient, can be prepared in the form of a pharmaceutical composition containing a pharmaceutical carrier so that it is suitable for a variety of dosage forms. Examples of dosage forms include oral agents, injectables, suppositories, ointments, and patches. These dosage forms can be prepared by production methods known and generally accepted by one skilled in the art.

[0145][0145]

Фармацевтический носитель для использования включает различные органические или неорганические вещества-носители, общепринятые в качестве материалов для получения препаратов, и их добавляют в качестве наполнителей, связующих веществ, дезинтегрирующих средств, смазывающих средств, покрывающих средств и т.п. для твердых составов; и растворителей, солюбилизирующих средств, суспендирующих средств, средств для придания тоничности, регуляторов pH и буферов, успокаивающих средств и т.п. для жидких составов. Необязательно, полезными являются такие добавки для составов, как консерванты, антиоксиданты, окрашивающие средства, ароматизаторы и стабилизаторы.The pharmaceutical carrier for use includes various organic or inorganic carrier substances conventionally used as preparation materials, and they are added as fillers, binders, disintegrants, lubricants, coating agents and the like. for solid compositions; and solvents, solubilizing agents, suspending agents, tonicizing agents, pH adjusters and buffers, soothing agents, etc. for liquid formulations. Optionally, formulation additives such as preservatives, antioxidants, coloring agents, flavoring agents and stabilizers are useful.

[0146][0146]

При получении перорального твердого состава, наполнитель, необязательно, с наполнителем, связующим, дезинтегрирующим средством, смазывающим средством, окрашивающим средством, ароматизатором и т.д., добавляют к соединению по настоящему изобретению, и затем таблетки, покрытые таблетки, гранулы, порошки, капсулы и т.п. получают в соответствии с обычным способом.When preparing an oral solid composition, an excipient, optionally with a filler, binder, disintegrating agent, lubricant, coloring agent, flavoring agent, etc., is added to the compound of the present invention, and then tablets, coated tablets, granules, powders, capsules and so on. obtained in accordance with the usual method.

[0147][0147]

При получении перорального жидкого состава, регулятор pH и буфер, стабилизатор, ароматизатор и т.п. добавляют к соединению по настоящему изобретению, и жидкое лекарственное средство для внутреннего применения, лекарственное средство в форме сиропа, эликсир и т.п., получают в соответствии с обычным способом.When preparing an oral liquid formulation, a pH adjuster and buffer, stabilizer, flavoring agent, etc. is added to the compound of the present invention, and an internal liquid drug, syrup drug, elixir, etc. is prepared according to a conventional method.

[0148][0148]

При получении составов для инъекций, регулятор pH и буфер, стабилизатор, средство для придания тоничности, местный анестетик, и т.п. добавляют к соединению по настоящему изобретению, и затем средство для подкожной, внутримышечной или внутривенной инъекции получают в соответствии с обычным способом.In the preparation of injection formulations, pH adjuster and buffer, stabilizer, tonicity agent, local anesthetic, etc. is added to the compound of the present invention, and then the agent for subcutaneous, intramuscular or intravenous injection is prepared in accordance with a conventional method.

[0149][0149]

Настоящее изобретение относится к способу диагностики злокачественной опухоли, когда присутствие полипептида по настоящему изобретению или полинуклеотида по настоящему изобретению детектируют в образце способом детекции присутствия полипептида по настоящему изобретению, или способом детекции присутствия полинуклеотида по настоящему изобретению. Злокачественная опухоль, диагностируемая по этому изобретению, включает злокачественные опухоли, перечисленные в качестве мишеней фармацевтической композиции по настоящему изобретению. Как описано выше, использование полипептида или полинуклеотида по настоящему изобретению позволяет диагностику злокачественной опухоли. Таким образом, полипептид и полинуклеотид по настоящему изобретению можно использовать в качестве биомаркера для детекции злокачественной опухоли.The present invention relates to a method for diagnosing a malignant tumor where the presence of a polypeptide of the present invention or a polynucleotide of the present invention is detected in a sample by a method for detecting the presence of a polypeptide of the present invention or a method for detecting the presence of a polynucleotide of the present invention. The cancer diagnosed by this invention includes the cancers listed as targets of the pharmaceutical composition of the present invention. As described above, the use of the polypeptide or polynucleotide of the present invention allows the diagnosis of a malignant tumor. Thus, the polypeptide and polynucleotide of the present invention can be used as a biomarker for detecting cancer.

[0150][0150]

Настоящее изобретение относится к способу применения полипептида по настоящему изобретению или полинуклеотида по настоящему изобретению в качестве индикатора для определения того, эффективна ли химиотерапия с использованием соединения, ингибирующего RET, где способ определяет, что химиотерапия с использованием соединения, ингибирующего RET, является эффективной, когда полипептид по настоящему изобретению детектируют в образце посредством способа детекции по настоящему изобретению, и/или когда присутствие полинуклеотида по настоящему изобретению детектируют в образце посредством способа детекции по настоящему изобретению.The present invention relates to a method of using a polypeptide of the present invention or a polynucleotide of the present invention as an indicator for determining whether chemotherapy using a RET inhibitory compound is effective, wherein the method determines that chemotherapy using a RET inhibitory compound is effective when the polypeptide of the present invention is detected in a sample by a detection method of the present invention, and/or when the presence of a polynucleotide of the present invention is detected in a sample by a detection method of the present invention.

[0151][0151]

Более предпочтительно, настоящее изобретение относится к способу с использованием полипептида по настоящему изобретению или полинуклеотида по настоящему изобретению в качестве индикатора для определения того, эффективна ли химиотерапия с использованием соединения, ингибирующего экспрессию и/или активность полипептида по настоящему изобретению, или экспрессию полинуклеотида по настоящему изобретению, где способ определяет, что химиотерапия с использованием соединения, ингибирующего экспрессию и/или активность полипептида по настоящему изобретению, или экспрессию полинуклеотида по настоящему изобретению, является эффективной, когда полипептид по настоящему изобретению детектируют в образце посредством способа детекции по настоящему изобретению, и/или когда присутствие полинуклеотида по настоящему изобретению детектируют в образце посредством способа детекции по настоящему изобретению.More preferably, the present invention relates to a method using a polypeptide of the present invention or a polynucleotide of the present invention as an indicator for determining whether chemotherapy using a compound that inhibits the expression and/or activity of the polypeptide of the present invention or the expression of the polynucleotide of the present invention is effective wherein the method determines that chemotherapy using a compound that inhibits the expression and/or activity of a polypeptide of the present invention, or the expression of a polynucleotide of the present invention, is effective when the polypeptide of the present invention is detected in a sample by the detection method of the present invention, and/or when the presence of a polynucleotide of the present invention is detected in a sample by the detection method of the present invention.

[0152][0152]

Более предпочтительно, настоящее изобретение относится к способу с использованием полипептида по настоящему изобретению или полинуклеотида по настоящему изобретению в качестве индикатора для определения того, эффективна ли химиотерапия с использованием соединения, полученного в способе скрининга по настоящему изобретению, где способ определяет, что химиотерапия с использованием соединения, полученного в способе скрининга по настоящему изобретению, является эффективной, когда полипептид по настоящему изобретению детектируют в образце посредством способа детекции по настоящему изобретению, и/или когда присутствие полинуклеотида по настоящему изобретению детектируют в образце посредством способа детекции по настоящему изобретению.More preferably, the present invention relates to a method using a polypeptide of the present invention or a polynucleotide of the present invention as an indicator for determining whether chemotherapy using a compound obtained in the screening method of the present invention is effective, wherein the method determines that chemotherapy using the compound obtained in the screening method of the present invention is effective when the polypeptide of the present invention is detected in a sample by the detection method of the present invention, and/or when the presence of the polynucleotide of the present invention is detected in the sample by the detection method of the present invention.

[0153][0153]

Следующие примеры подробно описывают настоящее изобретение. Однако, настоящее изобретение не является ограниченным этими примерами.The following examples describe the present invention in detail. However, the present invention is not limited to these examples.

ПримерыExamples

[0154][0154]

Пример 1: Получение гена, слитого из гена DCTN1 и гена RET (слитого гена DCTN1-RET)Example 1: Preparation of a gene fused from the DCTN1 gene and the RET gene (DCTN1-RET fusion gene)

1-1: Выделение РНК, происходящей из клинического образца1-1: Isolation of RNA derived from a clinical sample

РНК выделяли из ткани злокачественной опухоли щитовидной железы человека, закупленной из Asterand Bioscience, с использованием набора RNeasy Mini (Qiagen) в соответствии со следующим способом. 600 мкл буфера RLT добавляли к ткани злокачественной опухоли щитовидной железы, и наносили на колонку для центрифугирования QIAshredder, с последующим центрифугированием (16000 об/мин, 2 минуты, комнатная температура), таким образом, собирая фильтрат. Эквивалентное количество 70% водного раствора этанола добавляли к собранному фильтрату. После того, как их смешивали, смесь наносили на колонку RNeasy Mini и затем центрифугировали (10000 об/мин, 15 секунд, комнатная температура). 700 мкл буфера RW1 добавляли в колонку RNeasy Mini и центрифугировали (10000 об/мин, 15 секунд, комнатная температура). 500 мкл буфера RPE дополнительно добавляли к этому и центрифугировали (10000 об/мин, 15 секунд, комнатная температура). Таким же способом, 500 мкл буфера RPE добавляли снова, и центрифугировали (10000 об/мин, 2 минуты, комнатная температура). Колонку RNeasy Mini центрифугировали снова (16000 об/мин, 1 минута, комнатная температура), и оставшийся буфер удаляли. 40 мкл свободной от РНКазы воды наносили на колонку RNeasy Mini и центрифугировали (10000 об/мин, 1 минута, комнатная температура), таким образом, собирая фильтрат как тотальную РНК.RNA was isolated from human thyroid cancer tissue purchased from Asterand Bioscience using the RNeasy Mini kit (Qiagen) according to the following method. 600 μl of RLT buffer was added to the thyroid cancer tissue, and applied to a QIAshredder spin column, followed by centrifugation (16,000 rpm, 2 minutes, room temperature), thereby collecting the filtrate. An equivalent amount of 70% aqueous ethanol solution was added to the collected filtrate. Once they were mixed, the mixture was applied to an RNeasy Mini column and then centrifuged (10,000 rpm, 15 seconds, room temperature). 700 μl of buffer RW1 was added to the RNeasy Mini column and centrifuged (10,000 rpm, 15 seconds, room temperature). 500 μl of RPE buffer was further added to this and centrifuged (10,000 rpm, 15 seconds, room temperature). In the same manner, 500 μl of RPE buffer was added again and centrifuged (10,000 rpm, 2 minutes, room temperature). The RNeasy Mini column was centrifuged again (16,000 rpm, 1 minute, room temperature) and the remaining buffer was removed. 40 μl of RNase-free water was applied to an RNeasy Mini column and centrifuged (10,000 rpm, 1 minute, room temperature), thereby collecting the filtrate as total RNA.

[0155][0155]

1-2: Получение кДНК, происходящей из клинического образца1-2: Preparation of cDNA derived from a clinical sample

кДНК синтезировали из тотальной РНК, полученной в разделе 1-1 выше, с использованием набора для синтеза кДНК SuperScript VILO (Invitrogen) в соответствии со следующим способом. 500 нг тотальной РНК доводили свободной от РНКазы водой для получения количества 14 мкл, и к этому добавляли 4 мкл реакционной смеси 5×VILO и 2 мкл смеси ферментов 10×SuperScript Mix, и перемешивали. Смесь поддерживали теплой при 25°C в течение 10 минут, и затем поддерживали теплой при 42°C в течение 60 минут. Для остановки реакции, смесь, наконец, инкубировали при 85°C в течение 5 минут, таким образом, получая кДНК.cDNA was synthesized from the total RNA obtained in section 1-1 above using the SuperScript VILO cDNA Synthesis Kit (Invitrogen) according to the following method. 500 ng of total RNA was diluted with RNase-free water to obtain a quantity of 14 μl, and to this were added 4 μl of 5xVILO reaction mixture and 2 μl of 10x SuperScript Mix enzyme mixture, and mixed. The mixture was kept warm at 25°C for 10 minutes, and then kept warm at 42°C for 60 minutes. To stop the reaction, the mixture was finally incubated at 85°C for 5 minutes, thereby obtaining cDNA.

[0156][0156]

1-3: Получение и очистка клонирующего вектора1-3: Preparation and purification of the cloning vector

Для амплификации слитого гена DCTN1-RET, разработаны праймеры, показанные в таблице 1: праймер 1 (SEQ ID NO: 33) в качестве смыслового праймера и праймер 2 (SEQ ID NO: 34) в качестве антисмыслового праймера, так же, как праймер 3 (SEQ ID NO: 35) в качестве смыслового праймера и праймер 4 (SEQ ID NO: 36) в качестве антисмыслового праймера для использования в гнездовой ПЦР.To amplify the DCTN1-RET fusion gene, primers are designed as shown in Table 1: Primer 1 (SEQ ID NO: 33) as the sense primer and Primer 2 (SEQ ID NO: 34) as the antisense primer, same as Primer 3 (SEQ ID NO: 35) as the sense primer and Primer 4 (SEQ ID NO: 36) as the antisense primer for use in nested PCR.

[0157][0157]

Таблица 1Table 1

Праймер 1Primer 15'-TGTCCAGCTTTGTGCCTGATTGATGT-3'5'-TGTCCAGCTTTGTGCCTGATTGATGT-3'SEQ ID NO: 33SEQ ID NO: 33Праймер 2Primer 25'-GCTGGGCACTGAAGAGAAAGGAATGC-3'5'-GCTGGGCACTGAAGAGAAAGGAATGC-3'SEQ ID NO: 34SEQ ID NO: 34Праймер 3Primer 35'-AGCAGGATGAGTGCGGAGGCAAGC-3'5'-AGCAGGATGAGTGCGGAGGCAAGC-3'SEQ ID NO: 35SEQ ID NO: 35Праймер 4Primer 45'-TTAACTATCAAACGTGTCCATTAATTTTGCCGC-3'5'-TTAACTATCAAACGTGTCCATTAATTTTGCCGC-3'SEQ ID NO: 36SEQ ID NO: 36

[0158][0158]

Слитый ген DCTN1-RET амплифицировали с использованием кДНК, синтезированной в разделе 1-2 выше, в качестве матрицы, с использованием этих праймеров и с использованием KOD-Plus-Neo (Toyobo), в соответствии со следующим способом. 2 мкл кДНК, 5 мкл 10×буфера для ПЦР для KOD-Plus-Neo, 5 мкл 2 мМ dNTP, 3 мкл 25 мМ MgSO4, 1 мкл KOD-Plus-Neo, 1,5 мкл праймера 1 (10 мкМ), 1,5 мкл праймера 2 (10 мкМ) и 31 мкл дважды дистиллированной воды (DDW) смешивали; и проводили ПЦР. Затем полученный продукт ПЦР разводили в 100 раз, и 2 мкл разведенного продукта ПЦР, 5 мкл 10×буфера для ПЦР для KOD-Plus-Neo, 5 мкл 2 мМ dNTP, 3 мкл 25 мМ MgSO4, 1 мкл KOD-Plus-Neo, 1,5 мкл праймера 3 (10 мкМ), 1,5 мкл праймера 4 (10 мкМ) и 31 мкл DDW смешивали; и проводили гнездовую ПЦР.The DCTN1-RET fusion gene was amplified using the cDNA synthesized in section 1-2 above as a template using these primers and using KOD-Plus-Neo (Toyobo) according to the following method. 2 µl cDNA, 5µl 10×PCR buffer for KOD-Plus-Neo, 5µl 2 mM dNTP, 3 µl 25 mMMgSO4 , 1 µl KOD-Plus-Neo, 1.5 µl primer 1 (10 µM), 1.5 μl of primer 2 (10 μM) and 31 μl of double distilled water (DDW) were mixed; and PCR was performed. Then the resulting PCR product was diluted 100 times, and 2 μl of the diluted PCR product, 5 μl of 10×PCR buffer for KOD-Plus-Neo, 5 μl of 2 mM dNTP, 3 μl of 25 mM MgSO4 , 1 μl of KOD-Plus-Neo , 1.5 μL of primer 3 (10 μM), 1.5 μL of primer 4 (10 μM), and 31 μL of DDW were mixed; and performed nested PCR.

[0159][0159]

Продукт гнездовой ПЦР разделяли посредством электрофореза с использованием 1% агарозного геля (Nacalai Tesque), и продукт ПЦР очищали из геля с использованием набора QIAquick Gel Extraction (Qiagen).The nested PCR product was separated by electrophoresis using a 1% agarose gel (Nacalai Tesque), and the PCR product was purified from the gel using the QIAquick Gel Extraction kit (Qiagen).

[0160][0160]

ДНК pUC18 (Takara Bio Inc.), расщепленную рестрикционным ферментом SmaI (NEB), очищенный продукт ПЦР, T4 ДНК-лигазу (NEB) и реакционный буфер для T4 ДНК-лигазы (NEB) смешивали, и смесь инкубировали при 16°C в течение ночи. Продукт лигирования обрабатывали SmaI (NEB), и трансформацию компетентных клеток проводили следующим способом. Продукт лигирования, обработанный SmaI, добавляли к 50 мкл компетентных клетокE. coli DH5α (Takara Bio Inc.), и позволяли стоять на льду в течение 30 минут. Затем клетки подвергали тепловому шоку при 42°C в течение 30 секунд, и позволяли стоять на льду в течение 2 минут. К этому добавляли среду SOC (Takara Bio Inc.), и клетки культивировали с качанием при 37°C в течение 1 час. Затем культуральный раствор наносили на содержащую ампициллин чашку с агаризованной средой LB (Unitech), и позволяли стоять при 37°C в течение ночи. КолонииE. coli суспендировали в содержащей ампициллин среде LB (InvivoGen), и культивировали с качанием при 37°C в течение ночи. Плазмидную ДНК со вставкой слитого гена DCTN1-RET очищали из пролиферирующихE. coliс использованием набора QIAquick Spin Miniprep (Qiagen), в соответствии с протоколом, предоставленным с набором.pUC18 DNA (Takara Bio Inc.) digested with SmaI restriction enzyme (NEB), purified PCR product, T4 DNA ligase (NEB) and T4 DNA ligase reaction buffer (NEB) were mixed, and the mixture was incubated at 16°C for nights. The ligation product was treated with SmaI (NEB), and transformation of competent cells was carried out in the following manner. The SmaI-digested ligation product was added to 50 μl of competentE. coli DH5α cells (Takara Bio Inc.) and allowed to stand on ice for 30 min. Cells were then heat shocked at 42°C for 30 seconds and allowed to stand on ice for 2 minutes. SOC medium (Takara Bio Inc.) was added to this, and the cells were cultured with shaking at 37°C for 1 hour. The culture solution was then applied to an ampicillin-containing LB agar plate (Unitech) and allowed to stand at 37°C overnight.E. coli colonies were suspended in ampicillin-containing LB medium (InvivoGen) and rocked at 37°C overnight. Plasmid DNA containing the DCTN1-RET fusion gene insert was purified from proliferatingE. coli using the QIAquick Spin Miniprep kit (Qiagen) according to the protocol provided with the kit.

[0161][0161]

1-4: Определение последовательности1-4: Sequencing

Реакцию секвенирования проводили с использованием плазмидной ДНК, полученной в разделе 1-3 выше, в качестве матрицы, с использованием праймеров 5-36 для секвенирования, показанных в таблице 2, и с использованием набора для секвенирования BigDye Terminator V3.1 Cycle Sequencing; и анализ последовательности проводили с использованием анализатора ДНК Applied Biosystems 3730xl. Результаты анализа последовательности выявили, что слитый ген DCTN1-RET представлял собой ген (SEQ ID NO: 17), в котором экзоны 12-20 из варианта 2 RET (номер доступа в GenBank: NM_020975) были слиты ниже 3'-конца с экзонами 1-27 из варианта 5 DCTN1 (номер доступа в GenBank: NM_001190836).The sequencing reaction was performed using the plasmid DNA obtained in section 1-3 above as a template, using sequencing primers 5-36 shown in Table 2, and using the BigDye Terminator V3.1 Cycle Sequencing kit; and sequence analysis was performed using an Applied Biosystems 3730xl DNA Analyzer. Sequence analysis results revealed that the DCTN1-RET fusion gene was a gene (SEQ ID NO: 17) in which exons 12-20 of RET variant 2 (GenBank accession number: NM_020975) were fused downstream of exons 1 -27 from DCTN1 variant 5 (GenBank accession number: NM_001190836).

[0162][0162]

Таблица 2table 2

Праймер 5Primer 55'-AGTACTGGGGTGGCTGGG-3'5'-AGTACTGGGGTGGCTGGG-3'SEQ ID NO: 37SEQ ID NO: 37Праймер 6Primer 65'-CACTTTGGACAAGGAGATG-3'5'-CACTTTGGACAAGGAGATG-3'SEQ ID NO: 38SEQ ID NO: 38Праймер 7Primer 75'-ACAGAACTGGAGCTGCGG-3'5'-ACAGAACTGGAGCTGCGG-3'SEQ ID NO: 39SEQ ID NO: 39Праймер 8Primer 85'-GGACTGGTGTACTCGCTG-3'5'-GGACTGGTGTACTCGCTG-3'SEQ ID NO: 40SEQ ID NO: 40Праймер 9Primer 95'-TCCTAGACTGCAGGAAACAC-3'5'-TCCTAGACTGCAGGAAAACAC-3'SEQ ID NO: 41SEQ ID NO: 41Праймер 10Primer 105'-CATCGAGAAAGTCCAGAC-3'5'-CATCGAGAAAGTCCAGAC-3'SEQ ID NO: 42SEQ ID NO: 42Праймер 11Primer 115'-GCTGCTGGAGACATTGAA-3'5'-GCTGCTGGAGACATTGAA-3'SEQ ID NO: 43SEQ ID NO: 43Праймер 12Primer 125'-TCACTGCTGCTCAGCTCA-3'5'-TCACTGCTGCTCAGCTCA-3'SEQ ID NO: 44SEQ ID NO: 44Праймер 13Primer 135'-GAGGATCCAAAGTGGGAATT-3'5'-GAGGATCCAAAGTGGGAATT-3'SEQ ID NO: 45SEQ ID NO: 45Праймер 14Primer 145'-AGTATCTGGCCGAGATGAAG-3'5'-AGTATCTGGCCGAGATGAAG-3'SEQ ID NO: 46SEQ ID NO: 46Праймер 15Primer 155'-GCAAAGACCTGGAGAAGATG-3'5'-GCAAAGACCTGGAGAAGATG-3'SEQ ID NO: 47SEQ ID NO: 47Праймер 16Primer 165'-AGGACGTTGAACTCTGACAG-3'5'-AGGACGTTGAACTCTGACAG-3'SEQ ID NO: 48SEQ ID NO: 48Праймер 17Primer 175'-CCTTTGCTTCATCCAGAATC-3'5'-CCTTTTGCTTCATCCAGAATC-3'SEQ ID NO: 49SEQ ID NO: 49Праймер 18Primer 185'-GATTTTGTGTTTCTCCAGCTCT-3'5'-GATTTTGTGTTTCTCCAGCTCT-3'SEQ ID NO: 50SEQ ID NO: 50Праймер 19Primer 195'-CCTGCTTCTCTGAGGAAGAA-3'5'-CCTGCTTCTCTGAGGAAGAA-3'SEQ ID NO: 51SEQ ID NO: 51Праймер 20Primer 205'-GGGCCTTAGTCTCAGCAAAC-3'5'-GGGCCTTAGTCTCAGCAAAC-3'SEQ ID NO: 52SEQ ID NO: 52Праймер 21Primer 215'-GAGCACTCTGCGTGAACTTA-3'5'-GAGCACTCTGCGTGAACTTA-3'SEQ ID NO: 53SEQ ID NO: 53Праймер 22Primer 225'-CAGCTTGTTCATGGTACTGAT-3'5'-CAGCTTGTTCATGGTACTGAT-3'SEQ ID NO: 54SEQ ID NO: 54Праймер 23Primer 235'-TGGTGAGTCCTTCACCAG-3'5'-TGGTGAGTCCTTCACCAG-3'SEQ ID NO: 55SEQ ID NO: 55Праймер 24Primer 245'-CCTAGAGTTTTTCCAAGAACCA-3'5'-CCTAGAGTTTTTCCAAGAACCA-3'SEQ ID NO: 56SEQ ID NO: 56Праймер 25Primer 255'-CATTTAACTGGAATCCGACC-3'5'-CATTTAACTGGAATCCGACC-3'SEQ ID NO: 57SEQ ID NO: 57Праймер 26Primer 265'-GACTCTCTCCAGGCCAGTTC-3'5'-GACTCTCTCCAGGCCAGTTC-3'SEQ ID NO: 58SEQ ID NO: 58Праймер 27Primer 275'-GGCTATCAGAAGTAAAACCACC-3'5'-GGCTATCAGAAGTAAAACCACC-3'SEQ ID NO: 59SEQ ID NO: 59Праймер 28Primer 285'-CGAGAGCTGATGGCACTA-3'5'-CGAGAGCTGATGGCACTA-3'SEQ ID NO: 60SEQ ID NO: 60Праймер 29Primer 295'-CTTCATCACAAGTGAAGTACTTCC-3'5'-CTTCATCACAAGTGAAGTACTTCC-3'SEQ ID NO: 61SEQ ID NO: 61Праймер 30Primer 305'-CGTACTCCACGATGAGGAG-3'5'-CGTACTCCACGATGAGGAG-3'SEQ ID NO: 62SEQ ID NO: 62Праймер 31Primer 315'-GATTCTGGATGAAGCAAAGG-3'5'-GATTCTGGATGAAGCAAAGG-3'SEQ ID NO: 63SEQ ID NO: 63Праймер 32Primer 325'-GGAAGTACTTCACTTGTGATGAAG-3'5'-GGAAGTACTTCACTTGTGATGAAG-3'SEQ ID NO: 64SEQ ID NO: 64Праймер 33Primer 335'-CCCAGCCACCCCAGTACT-3'5'-CCCAGCCACCCCAGTACT-3'SEQ ID NO: 65SEQ ID NO: 65Праймер 34Primer 345'-GTAAAACGACGGCCAGT-3'5'-GTAAAACGACGGCCAGT-3'SEQ ID NO: 66SEQ ID NO: 66Праймер 35Primer 355'-GTTTTCCCAGTCACGAC-3'5'-GTTTTCCCAGTCACGAC-3'SEQ ID NO: 67SEQ ID NO: 67Праймер 36Primer 365'-CAGGAAACAGCTATGAC-3'5'-CAGGAAACAGCTATGAC-3'SEQ ID NO: 68SEQ ID NO: 68

[0163][0163]

Пример 2: Детекция слитого гена DCTN1-RETExample 2: Detection of DCTN1-RET Fusion Gene

кДНК синтезировали из РНК, происходящей из нормальной ткани щитовидной железы человека, закупленной из Asterand Bioscience, и из РНК, происходящей из ткани злокачественной опухоли щитовидной железы человека, полученной в разделе 1-1, с использованием набора для синтеза кДНК SuperScript VILO (Invitrogen), в соответствии со следующим способом. 280 нг тотальной РНК доводили свободной от РНКазы водой для получения количества 14 мкл, и к этому добавляли, соответственно, 4 мкл реакционной смеси 5×VILO и 2 мкл смеси ферментов 10×SuperScript, и перемешивали. Смесь поддерживали теплой при 25°C в течение 10 минут, и затем поддерживали теплой при 42°C в течение 60 минут. Для окончания реакции, смесь, наконец, инкубировали при 85°C в течение 5 минут.cDNA was synthesized from RNA derived from normal human thyroid tissue purchased from Asterand Bioscience and from RNA derived from human thyroid malignancy tissue obtained in section 1-1 using the SuperScript VILO cDNA Synthesis Kit (Invitrogen), according to the following method. 280 ng of total RNA was diluted with RNase-free water to obtain an amount of 14 μl, and to this were respectively added 4 μl of 5xVILO reaction mixture and 2 μl of 10x SuperScript enzyme mixture and mixed. The mixture was kept warm at 25°C for 10 minutes, and then kept warm at 42°C for 60 minutes. To complete the reaction, the mixture was finally incubated at 85°C for 5 minutes.

[0164][0164]

Для детекции слитого гена DCTN1-RET, разработаны праймеры и зонд, показанные в таблице 3: праймер 37 (SEQ ID NO: 69) в качестве смыслового праймера для детекции слитого гена DCTN1-RET, праймер 38 (SEQ ID NO: 70) в качестве антисмыслового праймера для детекции слитого гена DCTN1-RET, и праймер 39 (SEQ ID NO: 71) в качестве зонда для детекции слитого гена DCTN1-RET (зонд: TaqMan MGB; флуоресцентный краситель: FAM (Thermo Fisher Scientific)).To detect the DCTN1-RET fusion gene, the primers and probe shown in Table 3 are designed: primer 37 (SEQ ID NO: 69) as the sense primer for detection of the DCTN1-RET fusion gene, primer 38 (SEQ ID NO: 70) as an antisense primer for detecting the DCTN1-RET fusion gene, and primer 39 (SEQ ID NO: 71) as a probe for detecting the DCTN1-RET fusion gene (probe: TaqMan MGB; fluorescent dye: FAM (Thermo Fisher Scientific)).

[0165][0165]

Таблица 3Table 3

Праймер 37Primer 375'-CTGGAGCCACAGTACCCACT-3'5'-CTGGAGCCACAGTACCCACT-3'SEQ ID NO: 69SEQ ID NO: 69Праймер 38Primer 385'-TCCAAATTCGCCTTCTCCTA-3'5'-TCCAAAATTCGCCTTCTCCTA-3'SEQ ID NO: 70SEQ ID NO: 70Праймер 39Primer 395'-TTCATCAGCCTTCCTCAGGGAGGAT-3'5'-TTCATCAGCCTTCCTCAGGGAGGAT-3'SEQ ID NO: 71SEQ ID NO: 71

[0166][0166]

Полученную кДНК разводили в 10 раз, и 1,1 мкл этого использовали в качестве матрицы. 11 мкл смеси для цкПЦР для зонда ddPCR Supermix (Bio-Rad), 2 мкл праймера 37 (10 мкМ), 2 мкл праймера 38 (10 мкМ), 0,6 мкл праймера 39 (10 мкМ) и 1,1 мкл смеси для анализа 20×HEX для детекции GAPDH (Prime PCR ddPCR Expression Probe Assay: GAPDH, Human, Bio-Rad) смешивали; и капли получали с использованием автоматизированного генератора капель (Bio-Rad). ПЦР проводили в полученных каплях, и капли, положительные по DCTN1-RET и GAPDH, подсчитывали с использованием считывателя капель (Bio-Rad). На фиг. 1 и 2 показаны результаты.The resulting cDNA was diluted 10-fold, and 1.1 μl of this was used as template. 11 µl ddPCR Probe Mix ddPCR Supermix (Bio-Rad), 2 µl Primer 37 (10 µM), 2 µl Primer 38 (10 µM), 0.6 µl Primer 39 (10 µM) and 1.1 µl 20×HEX assay for GAPDH detection (Prime PCR ddPCR Expression Probe Assay: GAPDH, Human, Bio-Rad) was mixed; and droplets were generated using an automated droplet generator (Bio-Rad). PCR was performed on the resulting droplets, and droplets positive for DCTN1-RET and GAPDH were counted using a droplet reader (Bio-Rad). In fig. 1 and 2 show the results.

[0167][0167]

Слитый ген DCTN1-RET амплифицировали с использованием кДНК, синтезированной выше, в качестве матрицы, с использованием KOD-Plus-Neo (Toyobo) в соответствии со следующим способом. 2 мкл кДНК, 5 мкл 10×буфера для ПЦР для KOD-Plus-Neo, 5 мкл 2 мМ dNTP, 3 мкл 25 мМ MgSO4, 1 мкл KOD-Plus-Neo, 1,5 мкл праймера 1 (10 мкМ), 1,5 мкл праймера 2 (10 мкМ) и 31 мкл DDW смешивали, и проводили ПЦР. Затем, полученный продукт ПЦР разводили в 100 раз, и 2 мкл разведенного продукта ПЦР, 5 мкл 10×буфера для ПЦР для KOD-Plus-Neo, 5 мкл 2 мМ dNTP, 3 мкл 25 мМ MgSO4, 1 мкл KOD-Plus-Neo, 1,5 мкл праймера 3 (10 мкМ), 1,5 мкл праймера 4 (10 мкМ) и 31 мкл of DDW смешивали; и проводили гнездовую ПЦР. Продукт гнездовой ПЦР разделяли посредством электрофореза с использованием 1% агарозного геля (Nacalai Tesque) и фотографировали. На фиг. 3 показаны результаты.The DCTN1-RET fusion gene was amplified using the cDNA synthesized above as a template using KOD-Plus-Neo (Toyobo) according to the following method. 2 µl cDNA, 5µl 10× PCR buffer for KOD-Plus-Neo, 5µl 2 mM dNTP, 3 µl 25 mMMgSO4 , 1 µl KOD-Plus-Neo, 1.5 µl primer 1 (10 µM), 1.5 μl of primer 2 (10 μM) and 31 μl of DDW were mixed and PCR was performed. Then, the resulting PCR product was diluted 100 times, and 2 μl of the diluted PCR product, 5 μl of 10×PCR buffer for KOD-Plus-Neo, 5 μl of 2 mM dNTP, 3 μl of 25 mM MgSO4 , 1 μl of KOD-Plus- Neo, 1.5 µl of primer 3 (10 µM), 1.5 µl of primer 4 (10 µM) and 31 µl of DDW were mixed; and performed nested PCR. The nested PCR product was separated by electrophoresis using 1% agarose gel (Nacalai Tesque) and photographed. In fig. Figure 3 shows the results.

[0168][0168]

Как показано на фиг. 1, фиг. 2 и фиг. 3, в то время как слитый ген DCTN1-RET детектирован в кДНК, синтезированной из РНК, происходящей из ткани злокачественной опухоли щитовидной железы человека, слитый ген DCTN1-RET не детектирован в кДНК, синтезированной из РНК, происходящей из нормальной ткани щитовидной железы человека. Эти результаты показывают, что слитый ген DCTN1-RET можно использовать в качестве биомаркера для злокачественной опухоли.As shown in FIG. 1, fig. 2 and fig. 3, while the DCTN1-RET fusion gene is detected in cDNA synthesized from RNA derived from human thyroid cancer tissue, the DCTN1-RET fusion gene is not detected in cDNA synthesized from RNA derived from normal human thyroid tissue. These results indicate that the DCTN1-RET fusion gene can be used as a biomarker for malignancy.

[0169][0169]

Пример 3: Конструирование экспрессирующего вектора для слитого гена DCTN1-RETExample 3: Construction of an expression vector for the DCTN1-RET fusion gene

Для конструирования экспрессирующего вектора, праймер 40 (SEQ ID NO: 72) в качестве смыслового праймера и праймер 41 (SEQ ID NO: 73) в качестве антисмыслового праймера, сконструированы, как показано в таблице 4.To construct the expression vector, primer 40 (SEQ ID NO: 72) as the sense primer and primer 41 (SEQ ID NO: 73) as the antisense primer were designed as shown in Table 4.

[0170][0170]

Таблица 4Table 4

Праймер 40Primer 405'-GGGGACAAGTTTGTACAAAAAAGCAGGCTTCGCCACCAGCAGGATGAGTGCGGAGGCAAGCGCCCGG-3'5'-GGGGACAAGTTTGTACAAAAAAGCAGGCTTCGCCACCAGCAGGATGAGTGCGGAGGCAAGCGCCCGG-3'SEQ ID NO: 72SEQ ID NO: 72Праймер 41Primer 415'-GGGGACCACTTTGTACAAGAAAGCTGGGTTTTAACTATCAAACGTGTCCATTAATTTTGC-3'5'-GGGGACCACTTTGTACAAGAAAGCTGGGTTTTAACTATCAAACGTGTCCATTAATTTTTGC-3'SEQ ID NO: 73SEQ ID NO: 73

[0171][0171]

Слитый ген DCTN1-RET амплифицировали с использованием этих праймеров, кДНК, синтезированной в разделе 1-2 выше, в качестве матрицы, и ДНК-полимеразы Prime STAR Max (TaKaRa), в соответствии со способом, описанным ниже. 1 мкл кДНК, 25 мкл 2× ДНК-полимеразы Prime STAR Max, 1 мкл праймера 40 (10 мкМ), 1 мкл праймера 41 (10 мкМ) и 22 мкл дважды дистиллированной воды (DDW) смешивали для проведения ПЦР. Полученный продукт ПЦР разделяли посредством электрофореза с использованием 1% агарозного геля (Nacalai Tesque), и продукт ПЦР очищали из геля с использованием набора GFX PCR DNA and Gel Band Purification Kit (GE Healthcare). Затем очищенный продукт ПЦР вставляли в вектор Gateway pDONR221 с использованием смеси ферментов Gateway BP Clonase II (Thermo Fisher) в соответствии со способом, описанным ниже, таким образом, получая входной вектор. Конкретно, 5,0 мкл очищенного продукта ПЦР, 3,5 мкл pDONR221 (85 нг/мкл), 4,0 мкл смеси ферментов BP Clonase II и 7,5 мкл TE смешивали, и инкубировали при 25°C в течение 90 минут. После инкубации, к этому добавляли 1 мкл протеиназы K (2 мг/мл), с последующей инкубацией при 37°C в течение 10 минут, таким образом, получая входной вектор.The DCTN1-RET fusion gene was amplified using these primers, the cDNA synthesized in section 1-2 above as template, and Prime STAR Max DNA polymerase (TaKaRa) according to the method described below. 1 μL of cDNA, 25 μL of 2× Prime STAR Max DNA polymerase, 1 μL of primer 40 (10 μM), 1 μL of primer 41 (10 μM), and 22 μL of double distilled water (DDW) were mixed to perform PCR. The resulting PCR product was separated by electrophoresis using a 1% agarose gel (Nacalai Tesque), and the PCR product was purified from the gel using the GFX PCR DNA and Gel Band Purification Kit (GE Healthcare). The purified PCR product was then inserted into the Gateway vector pDONR221 using Gateway BP Clonase II enzyme mixture (Thermo Fisher) according to the method described below, thereby obtaining the input vector. Specifically, 5.0 μl of purified PCR product, 3.5 μl of pDONR221 (85 ng/μl), 4.0 μl of BP Clonase II enzyme mixture and 7.5 μl of TE were mixed and incubated at 25°C for 90 minutes. After incubation, 1 μl of proteinase K (2 mg/ml) was added to this, followed by incubation at 37°C for 10 minutes, thereby obtaining the input vector.

[0172][0172]

Полученный входной вектор добавляли к 50 мкл компетентных клетокE. coli DH5α (Takara Bio Inc.), и позволяли стоять на льду в течение 30 минут. Затем клетки подвергали тепловому шоку при 37°C в течение 20 секунд и позволяли стоять в течение 2 минут на льду. Затем к этому добавляли среду SOC (Takara Bio Inc.), и клетки подвергали культивированию с качанием при 37°C в течение 1 часа. Затем культуральный раствор наносили на содержащую канамицин чашку с агаризованной средой LB и позволяли стоять при 37°C в течение ночи. КолонииEscherichia coli суспендировали в содержащей канамицин среде LB, и подвергали культивированию с качанием при 37°C в течение ночи. Из выращеннойEscherichia coli, плазмидную ДНК с вставкой слитого гена DCTN1-RET (клон входного вектора) очищали с использованием автоматизированной системы для выделения ДНК GENE PREP STAR PI-480 (Kurabo Industries Ltd.).The resulting input vector was added to 50 μl of competentE. coli DH5α cells (Takara Bio Inc.) and allowed to stand on ice for 30 minutes. Cells were then heat shocked at 37°C for 20 seconds and allowed to stand on ice for 2 minutes. SOC medium (Takara Bio Inc.) was then added to this, and the cells were subjected to rocking culture at 37°C for 1 hour. The culture solution was then applied to a kanamycin-containing LB agar plate and allowed to stand at 37°C overnight.Escherichia coli colonies were suspended in kanamycin-containing LB medium and rocked at 37°C overnight. From culturedEscherichia coli , plasmid DNA with a DCTN1-RET fusion gene insert (entry vector clone) was purified using a GENE PREP STAR PI-480 automated DNA extraction system (Kurabo Industries Ltd.).

[0173][0173]

Слитый ген DCTN1-RET вставляли в вектор pJTI Fast DEST с использованием полученной плазмиды и смеси ферментов Gateway LR Clonase II (Thermo Fisher) в соответствии со способом, описанным ниже, таким образом, получая экспрессирующий вектор.The DCTN1-RET fusion gene was inserted into the pJTI Fast DEST vector using the resulting plasmid and Gateway LR Clonase II enzyme mixture (Thermo Fisher) according to the method described below, thereby obtaining an expression vector.

150 нг клона входного вектора, 1 мкл вектора pJTI Fast DEST (150 нг/мкл), 2 мкл смеси ферментов LR Clonase II и буфер TE смешивали для получения всего 10 мкл, и смесь инкубировали при 25°C в течение 90 минут. После инкубации, к этому добавляли 1 мкл протеиназы K (2 мг/мл), с последующей инкубацией при 37°C в течение 10 минут, таким образом, получая вектор pJTI Fast DEST со вставленным слитым геном DCTN1-RET (вектор, экспрессирующий слитый ген DCTN1-RET). Полученный вектор, экспрессирующий слитый ген DCTN1-RET, добавляли к 50 мкл компетентных клетокE. coli DH5α (Takara Bio Inc.) и позволяли стоять в течение 30 минут на льду. Затем, клетки подвергали тепловому шоку при 37°C в течение 20 секунд, и позволяли стоять в течение 2 минут на льду. Затем к этому добавляли среду SOC (Takara Bio Inc.), и клетки подвергали культивированию с качанием при 37°C в течение 1 часа. Культуральный раствор наносили на содержащую ампициллин чашку с агаризованной средой LB и позволяли стоять при 37°C в течение ночи. КолонииEscherichia coli суспендировали в содержащей ампициллин среде LB, и подвергали культивированию с качанием при 37°C в течение ночи. Из выращеннойEscherichia coli, плазмидную ДНК с вставкой слитого гена DCTN1-RET (вектор, экспрессирующий слитый ген DCTN1-RET) очищали с использованием набора Plasmid Plus Maxi (QIAGEN).150 ng of input vector clone, 1 μl of pJTI Fast DEST vector (150 ng/μl), 2 μl of LR Clonase II enzyme mixture and TE buffer were mixed to make a total of 10 μl, and the mixture was incubated at 25°C for 90 minutes. After incubation, 1 μl of proteinase K (2 mg/ml) was added to this, followed by incubation at 37°C for 10 minutes, thereby obtaining the pJTI Fast DEST vector with inserted DCTN1-RET fusion gene (vector expressing the fusion gene DCTN1-RET). The resulting vector expressing the DCTN1-RET fusion gene was added to 50 μl of competentE. coli DH5α cells (Takara Bio Inc.) and allowed to stand for 30 minutes on ice. Cells were then heat shocked at 37°C for 20 seconds and allowed to stand on ice for 2 minutes. SOC medium (Takara Bio Inc.) was then added to this, and the cells were subjected to rocking culture at 37°C for 1 hour. The culture solution was applied to an ampicillin-containing LB agar plate and allowed to stand at 37°C overnight.Escherichia coli colonies were suspended in ampicillin-containing LB medium and rocked at 37°C overnight. From culturedEscherichia coli , plasmid DNA with a DCTN1-RET fusion gene insert (DCTN1-RET fusion gene expression vector) was purified using the Plasmid Plus Maxi kit (QIAGEN).

[0174][0174]

Пример 4: Получение клетки, экспрессирующей слитый ген DCTN1-RETExample 4: Preparation of a cell expressing the DCTN1-RET fusion gene

4-1: Получение клетки4-1: Receiving the cell

Для клетки-хозяина для получения клетки, экспрессирующей слитый ген DCTN1-RET, выбраны клетки эмбриональные фибробласты мыши NIH/3T3 (Американская коллекция типовых культур), и клетки трансфицировали экспрессирующим вектором с вставленным слитым геном DCTN1-RET, полученным выше, таким образом, получая клетку, экспрессирующую слитый ген DCTN1-RET. Детали способа являются следующими. Клетки NIH/3T3 получали посредством культивирования в среде для типичной культуры (2-мерной культуры клеток) при 37°C в 5% CO2; и среду для использования в 2-мерной культуре клеток получали посредством добавления сыворотки новорожденного теленка (NBCS) (Gibco) в D-MEM (с высоким содержанием глюкозы) (содержащую L-глутамин, фенол красный, пируват натрия, 1500 мг/л гидрокарбоната натрия) (Wako) для получения 10%. За сутки до проведения трансфекции, клетки NIH/3T3 рассевали в 6-луночный планшет (Iwaki) при 1,5×105 клеток/2 мл и инкубировали при 37°C в 5% CO2 в течение ночи. Реагент для трансфекции ViaFect добавляли в смешанный раствор, полученный посредством смешивания 1,5 мкг вектора, экспрессирующего слитый ген DCTN1-RET, и 1,5 мкг вектора pJTI с интегразой phiC31, таким образом, чтобы количество реагента для трансфекции ViaFect в шесть раз превышало количество смешанного раствора; и затем к этому добавляли Opti-MEM для получения общего количества 300 мкл, с последующей инкубацией при комнатной температуре в течение 5 минут, таким образом, получая раствор для трансфекции. Из лунок, в которые рассевали клетки NIH/3T3, отбирали по 300 мкл среды, и 300 мкл полученного раствора для трансфекции добавляли в лунки, с последующей инкубацией при 37°C в 5% CO2 в течение ночи. На следующие сутки, среду заменяли для удаления раствора для трансфекции. При замене среды, гигромицин B (Nacalai Tesque) добавляли в новую среду для получения 500 мкг/мл. Гигромицин B удаляет клетки, не трансфицированные вектором, экспрессирующим вставленный слитый ген DCTN1-RET. После трансфекции, при замене среды приблизительно дважды в неделю, клетки культивировали, пока они не пролиферируют. Через 22 суток после трансфекции, клетки собирали с использованием трипсина, и проводили клонирование отдельных клеток, в соответствии со следующим способом. Измеряли количество собранных клеток, и к ним добавляли среду для получения 1 клетки/200 мкл. Клетки рассевали в 96-луночный планшет (Thermo Fisher) для получения 200 мкл на лунку. После рассева, клетки наблюдали ежесуточно, и отбирали клетки, выращенные из отдельных клеток; эти клетки представляли собой клетки, экспрессирующие слитый ген DCTN1-RET- (экспрессирующие слитый ген DCTN1-RET клетки NIH/3T3).For a host cell to obtain a cell expressing the DCTN1-RET fusion gene, NIH/3T3 mouse embryonic fibroblast cells (American Type Culture Collection) were selected, and the cells were transfected with an expression vector inserted with the DCTN1-RET fusion gene obtained above, thereby obtaining cell expressing the DCTN1-RET fusion gene. The details of the method are as follows. NIH/3T3 cells were obtained by culturing in typical culture medium (2-dimensional cell culture) at 37°C in 5% CO2 ; and medium for use in 2D cell culture was prepared by adding newborn calf serum (NBCS) (Gibco) to D-MEM (high glucose) (containing L-glutamine, phenol red, sodium pyruvate, 1500 mg/L sodium bicarbonate ) (Wako) to receive 10%. The day before transfection, NIH/3T3 cells were seeded into a 6-well plate (Iwaki) at 1.5 x 105 cells/2 ml and incubated at 37°C in 5% CO2 overnight. ViaFect transfection reagent was added to a mixed solution prepared by mixing 1.5 μg of DCTN1-RET fusion gene expression vector and 1.5 μg of pJTI phiC31 integrase vector such that the amount of ViaFect transfection reagent was six times the amount of mixed solution; and then Opti-MEM was added to this to obtain a total amount of 300 μL, followed by incubation at room temperature for 5 minutes, thereby obtaining a transfection solution. From the wells into which NIH/3T3 cells were seeded, 300 μl of medium was removed, and 300 μl of the resulting transfection solution was added to the wells, followed by incubation at 37°C in 5% CO2 overnight. The next day, the medium was replaced to remove the transfection solution. When changing media, hygromycin B (Nacalai Tesque) was added to the new media to obtain 500 μg/ml. Hygromycin B eliminates cells not transfected with a vector expressing the inserted DCTN1-RET fusion gene. After transfection, with medium changes approximately twice a week, cells were cultured until they proliferated. 22 days after transfection, cells were harvested using trypsin, and single cell cloning was performed according to the following method. The number of collected cells was measured and medium was added to obtain 1 cell/200 μl. Cells were seeded into a 96-well plate (Thermo Fisher) to obtain 200 μl per well. After seeding, cells were observed daily, and cells grown from individual cells were selected; these cells were DCTN1-RET-fusion gene expressing cells (DCTN1-RET fusion gene expressing NIH/3T3 cells).

[0175][0175]

4-2: Подтверждение экспрессии белка-мишени4-2: Confirmation of target protein expression

Экспрессию слитого белка DCTN1-RET в полученных экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3 подтверждали посредством Вестерн-блоттинга. Конкретно, среду отбирали из культурального флакона, с последующей однократной промывкой PBS. Концентрат разбавителя 2 для образцов (R&D Systems), содержащий ингибитор фосфатаз (Roche) и ингибитор протеаз (Roche), добавляли в культуральный флакон, и лизат клеток собирали с использованием скребка. Из собранного лизата клеток, образец белка получали посредством центрифугирования. Образец белка подвергали определению белка, и концентрацию белка доводили до предписанной концентрации. Раствор буфера для образцов с восстанавливающим реагентом (6x) для SDS-PAGE (Nacalai Tesque) добавляли к образцу белка предписанной концентрации; и смесь инкубировали при 95°C в течение 5 минут для денатурации белка, таким образом, получая образец для использования в Вестерн-блоттинге. Для отрицательного контроля, образец для Вестерн-блоттинга получали с использованием клеток NIH/3T3 (исходной линии клеток), в соответствии с таким же способом. Экспрессию белка подтверждали с использованием образцов, в соответствии со способом, описанным ниже. Белок разделяли с использованием 4-15% акриламидного геля (Bio-Rad) и 1×буфера Трис/глицин/SDS посредством SDS-PAGE (в течение 30 минут при 200 В). Белок переносили на мембрану PVDF с использованием набора для переноса Trans-Blot Turbo RTA Midi PVDF Transfer Kit (Bio-Rad) и системы для переноса Trans-Blot Turbo (Bio-Rad), и мембрану PVDF погружали в блокирующий раствор Blocking One-P на 1 час. Раствор получали посредством разведения Blocking One-P с TBS-T для получения 10%, и первичное антитело (антитело против фосфо-RET (Tyr905) (CST), mAb кролика против Ret (C31B4) (CST) и антитело против Dctn1 (Atlas Antibodies)) разводили полученным раствором для получения концентрации 1/1000. Мембрану PVDF погружали в полученный раствор и инкубировали при 4°C в течение ночи. После промывки с использованием TBS-T, мембрану PVDF погружали в раствор разведенного вторичного антитела, который получали посредством разведения антитела к IgG кролика, связанного с HRP (CST), с использованием TBS-T для получения концентрации 1/2000; и инкубировали при комнатной температуре в течение 1 час. После промывки мембраны с использованием TBS-T, белок детектировали с использованием субстрата SuperSignal West Dura Extended Duration (Thermo Fisher) с использованием анализатора изображений Amersham Imager 600 lumino (GE Healthcare). Молекулярную массу детектированного белка подтверждали с использованием предварительно окрашенных белковых стандартов Precision Plus Protein Kaleidoscope (Bio-Rad). Как показано на фиг. 4a) и 4b), эндогенный RET (150 и 175 кДа) не детектировали, когда использовали антитело против pRET или антитело против RET. Однако, полосу, по-видимому, являющуюся слитым белком DCTN1-RET, подтверждали при приблизительно 175 кДа только в экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3. Кроме того, как показано на фиг. 4c), эндогенный DCTN1 детектировали при приблизительно 150 кДа при использовании антитела к DCTN1. Детектировали также полосу при приблизительно 175 кДа, выше полосы эндогенного DCTN1 при приблизительно 150 кДа, только в экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3. Конкретно, полосу при приблизительно 175 кДа детектировали при использовании как антитела к RET, так и антитела к DCTN1, только в экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3; это явно показывает, что слитый белок из DCTN1 и RET экспрессировался в полученных экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3.Expression of the DCTN1-RET fusion protein in the resulting DCTN1-RET fusion gene-expressing NIH/3T3 cells was confirmed by Western blotting. Specifically, the medium was removed from the culture flask, followed by a single wash with PBS. Sample Diluent Concentrate 2 (R&D Systems), containing a phosphatase inhibitor (Roche) and a protease inhibitor (Roche), was added to the culture flask, and the cell lysate was collected using a scraper. From the collected cell lysate, a protein sample was obtained by centrifugation. The protein sample was subjected to protein determination and the protein concentration was adjusted to the prescribed concentration. A sample buffer solution with reducing reagent (6x) for SDS-PAGE (Nacalai Tesque) was added to the protein sample at the prescribed concentration; and the mixture was incubated at 95°C for 5 minutes to denature the protein, thereby obtaining a sample for use in Western blotting. For negative control, Western blot sample was prepared using NIH/3T3 cells (parental cell line) according to the same method. Protein expression was confirmed using samples according to the method described below. Protein was separated using 4-15% acrylamide gel (Bio-Rad) and 1× Tris/glycine/SDS buffer by SDS-PAGE (30 min at 200 V). The protein was transferred to a PVDF membrane using the Trans-Blot Turbo RTA Midi PVDF Transfer Kit (Bio-Rad) and the Trans-Blot Turbo Transfer System (Bio-Rad), and the PVDF membrane was immersed in Blocking One-P blocking solution on 1 hour. The solution was prepared by diluting Blocking One-P with TBS-T to make 10%, and the primary antibody (anti-phospho-RET (Tyr905) (CST), rabbit anti-Ret (C31B4) mAb (CST) and anti-Dctn1 antibody (Atlas Antibodies )) were diluted with the resulting solution to obtain a concentration of 1/1000. The PVDF membrane was immersed in the resulting solution and incubated at 4°C overnight. After washing with TBS-T, the PVDF membrane was immersed in a diluted secondary antibody solution, which was prepared by diluting HRP-linked anti-rabbit IgG (CST) using TBS-T to obtain a concentration of 1/2000; and incubated at room temperature for 1 hour. After washing the membrane with TBS-T, protein was detected using SuperSignal West Dura Extended Duration substrate (Thermo Fisher) using an Amersham Imager 600 lumino image analyzer (GE Healthcare). The molecular weight of the detected protein was confirmed using Precision Plus Protein Kaleidoscope prestained protein standards (Bio-Rad). As shown in FIG. 4a) and 4b), endogenous RET (150 and 175 kDa) was not detected when anti-pRET antibody or anti-RET antibody was used. However, a band appearing to be a DCTN1-RET fusion protein was confirmed at approximately 175 kDa only in NIH/3T3 cells expressing the DCTN1-RET fusion gene. Moreover, as shown in FIG. 4c), endogenous DCTN1 was detected at approximately 150 kDa using an anti-DCTN1 antibody. A band at approximately 175 kDa, above the endogenous DCTN1 band at approximately 150 kDa, was also detected only in NIH/3T3 cells expressing the DCTN1-RET fusion gene. Specifically, a band at approximately 175 kDa was detected using both anti-RET and anti-DCTN1 antibodies only in NIH/3T3 cells expressing the DCTN1-RET fusion gene; this clearly shows that the fusion protein of DCTN1 and RET was expressed in the resulting DCTN1-RET fusion gene-expressing NIH/3T3 cells.

[0176][0176]

Пример 5: Подтверждение роста экспрессирующих слитый ген DCTN1-RET клеток NIH/3T3 посредством 3-мерной культуры клетокExample 5: Confirmation of growth of DCTN1-RET fusion gene-expressing NIH/3T3 cells by 3-dimensional cell culture

Клетки NIH/3T3 хорошо росли в условиях 2-мерной культуры клеток, но с трудом росли в условиях 3-мерной культуры клеток. Однако, известно также, что клетки NIH/3T3 растут в условиях 3-мерной культуры клеток, когда онкоген экспрессируется в клетках. Таким образом, является ли слитый ген DCTN1-RET онкогеном, подтверждали с использованием этой характеристики. Экспрессирующие слитый ген DCTN1-RET клетки NIH/3T3 и клетки NIH/3T3 культивировали при 37°C в 5% CO2 в 2-мерной культуре клеток; и собирали с использованием трипсина, с последующим определением количества клеток. Для осуществления 3-мерного культивирования клеток, среду для 3-мерной культуры клеток получали с использованием набора для получения, серий FCeM (Nissan Chemical Industries, Ltd.), D-MEM (с высоким содержанием глюкозы) (содержащей L-глутамин, фенол красный, пируват натрия, и 1500 мг/л гидрокарбоната натрия) (Wako) и сыворотки новорожденного теленка (NBCS) (Gibco). Клетки суспендировали в полученной среде для 3-мерной культуры клеток для получения 1000 клеток/90 мкл и рассевали в 96-луночный прозрачный-черный микропланшет с круглодонными, сферическими лунками (Corning), 90 мкл на лунку, с последующей инкубацией при 37°C в 5% CO2. На сутки после рассева (сутки 1) и через 8 суток после рассева (сутки 8), уровень люминесценции (импульсов в секунду: cps) измеряли с использованием детектирующего реагента для люминесценции внутриклеточного АТФ (реагента CellTiter-Glo 2.0, Promega) с использованием люминометра (EnSpire, PerkinElmer), и определили, что результат является индикатором количества жизнеспособных клеток. Затем скорость роста клеток рассчитывали по результату измерений на сутки 1 и результату измерений на сутки 8 (N=3). В результате, как показано на фиг. 5, в то время как количество клеток для клеток NIH/3T3 на сутки 8 в 2,4 раза превышало количество клеток на сутки 1, количество клеток для экспрессирующих слитый ген DCTN1-RET клеток NIH/3T3 на сутки 8 в 20,9 превышало количество клеток на сутки 1. Кроме того, в то время как не обнаружено агрегатов клеток, сформированных в клетках NIH/3T3 при 3-мерном культивировании клеток, подтвердили, что агрегаты клеток сформированы в экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3 при 3-мерном культивировании клеток. Это явно показывает, что трансфекция слитым геном DCTN1-RET усиливала рост клеток, позволяя предполагать, что слитый ген DCTN1-RET является онкогеном.NIH/3T3 cells grew well in 2D cell culture conditions but had difficulty growing in 3D cell culture conditions. However, NIH/3T3 cells are also known to grow in 3D cell culture conditions when the oncogene is expressed in the cells. Therefore, whether the DCTN1-RET fusion gene is an oncogene was confirmed using this characterization. DCTN1-RET fusion gene-expressing NIH/3T3 cells and NIH/3T3 cells were cultured at 37°C in 5% CO2 in a 2-dimensional cell culture; and collected using trypsin, followed by cell number determination. To perform 3D cell culture, 3D cell culture medium was prepared using a preparation kit, FCeM series (Nissan Chemical Industries, Ltd.), D-MEM (high glucose) (containing L-glutamine, phenol red , sodium pyruvate, and 1500 mg/L sodium bicarbonate) (Wako) and newborn calf serum (NBCS) (Gibco). Cells were suspended in the resulting 3D cell culture medium to obtain 1000 cells/90 μl and seeded into a 96-well clear-black round-bottomed, spherical well microplate (Corning), 90 μl per well, followed by incubation at 37°C in 5% CO2 . On the day after sieving (day 1) and 8 days after sieving (day 8), the luminescence level (cps) was measured using an intracellular ATP luminescence detection reagent (CellTiter-Glo 2.0 reagent, Promega) using a luminometer ( EnSpire, PerkinElmer) and determined that the result is an indicator of the number of viable cells. Then the cell growth rate was calculated from the measurement result onday 1 and the measurement result on day 8 (N=3). As a result, as shown in FIG. 5, while the number of cells for NIH/3T3 cells on day 8 was 2.4 times higher than the number of cells onday 1, the number of cells for NIH/3T3 cells expressing the DCTN1-RET fusion gene on day 8 was 20.9 times higher than the number of cells cells onday 1. Additionally, while no cell aggregates were found to form in NIH/3T3 cells in 3D cell culture, it was confirmed that cell aggregates were formed in DCTN1-RET fusion gene-expressing NIH/3T3 cells in 3D. measured cell culture. This clearly shows that transfection with the DCTN1-RET fusion gene enhanced cell growth, suggesting that the DCTN1-RET fusion gene is an oncogene.

[0177][0177]

Пример 6: Подтверждение онкогенности в экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3in vivoExample 6: Confirmation of tumorigenicity in DCTN1-RET fusion gene-expressing NIH/3T3 cellsin vivo

Для подтверждения онкогенности в экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3in vivo, проводили эксперимент трансплантации с использованием мышей. Общеизвестно, что клетки NIH/3T3, представляющие собой исходную линию клеток, не растут подкожно у мышей nude; и можно подтвердить, вносит ли слитый ген DCTN1-RET вклад в онкогенность, или является ли слитый ген DCTN1-RET онкогеном, посредством подкожной трансплантации мышей nude с использованием экспрессирующих слитый ген DCTN1-RET- клеток NIH/3T3. Мышей nude, BALB/cAJcl-nu/nu (CLEA Japan, Inc.) использовали для трансплантации. Экспрессирующие слитый ген DCTN1-RET клетки NIH/3T3 собирали с использованием трипсина, и суспендировали в PBS, чтобы, наконец, получить 1×108 клеток/мл. К этому добавляли эквивалентное количество матрикса базальной мембраны матригеля (Corning) и доводили для получения 5×107 клеток/мл для получения суспензии клеток для трансплантации. 0,1 мл суспензии клеток для трансплантации подкожно трансплантировали в правую сторону грудной клетки каждой мыши nude (N=10) с использованием иглы для инъекций 25G и 1-мл шприца. На сутки 10, 13 и 17 после трансплантации, длинную ось и короткую ось опухоли каждой мыши измеряли с использованием цифрового штангенциркуля (Mitutoyo Corporation), и объем опухоли рассчитывали на основании следующего уравнения.To confirm tumorigenicity in DCTN1-RET fusion gene-expressing NIH/3T3 cellsin vivo , a transplantation experiment was performed using mice. It is well known that NIH/3T3 cells, which represent the parental cell line, do not grow subcutaneously in nude mice; and whether the DCTN1-RET fusion gene contributes to tumorigenicity, or whether the DCTN1-RET fusion gene is an oncogene, can be confirmed by subcutaneous transplantation of nude mice using DCTN1-RET fusion gene-expressing NIH/3T3 cells. Nude, BALB/cAJcl-nu/nu mice (CLEA Japan, Inc.) were used for transplantation. DCTN1-RET fusion gene-expressing NIH/3T3 cells were harvested using trypsin and suspended in PBS to finally obtain 1×108 cells/ml. To this was added an equivalent amount of Matrigel basement membrane matrix (Corning) and adjusted to obtain 5×107 cells/ml to obtain a cell suspension for transplantation. 0.1 ml of transplantation cell suspension was subcutaneously transplanted into the right side of the chest of each nude mouse (N=10) using a 25G injection needle and a 1-ml syringe. Ondays 10, 13, and 17 after transplantation, the long axis and short axis of the tumor of each mouse were measured using a digital caliper (Mitutoyo Corporation), and the tumor volume was calculated based on the following equation.

Объем опухоли (мм3)=(длинная ось: мм)×(короткая ось: мм)×(короткая ось: мм)/2Tumor volume (mm3 )=(long axis: mm)×(short axis: mm)×(short axis: mm)/2

На фиг. 6 показаны результаты измерения объема опухоли. Подтвердили, что экспрессирующие слитый ген DCTN1-RET клетки NIH/3T3, подкожно трансплантированные мышам nude, вызывали онкогенез и хорошо росли; таким образом, этот экспериментin vivo позволяет также предполагать, что слитый ген DCTN1-RET является онкогеном.In fig. Figure 6 shows the results of measuring the tumor volume. It was confirmed that NIH/3T3 cells expressing the DCTN1-RET fusion gene subcutaneously transplanted into nude mice caused tumorigenesis and grew well; thus, thisin vivo experiment also suggests that the DCTN1-RET fusion gene is an oncogene.

[0178][0178]

Пример 7: Подтверждение ингибирования слитого белка DCTN1-RET и эффекта ингибирования роста клеток посредством миРНК в экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3Example 7: Confirmation of DCTN1-RET Fusion Protein Inhibition and Cell Growth Inhibitory Effect by siRNA in DCTN1-RET Fusion Expressing NIH/3T3 Cells

Проверяли эффект обработки миРНК на экспрессирующие слитый ген DCTN1-RET клетки NIH/3T3. миРНК для использования являлась следующей: три типа миРНК RET, показанные в таблице 5 ниже, и Silencer Select Negative Control #1 siRNA (Ambion) в качестве отрицательного контроля. Мишенью для трех типов миРНК RET является RET человека; и миРНК RET1 и миРНК RET2 содержат последовательность, которая связывается с частью RET слитого гена DCTN1-RET, в то время как миРНК RET3 не содержит последовательности, которая связывается со слитым геном DCTN1-RET. Иными словами, заключили, что миРНК RET1 и миРНК RET2 ингибируют экспрессию слитого гена DCTN1-RET, и миРНК RET3 не ингибирует. Далее описан способ из эксперимента с использованием миРНК.The effect of siRNA treatment on NIH/3T3 cells expressing the DCTN1-RET fusion gene was tested. The siRNA to be used was the following: three types of RET siRNA shown in Table 5 below, and Silencer SelectNegative Control #1 siRNA (Ambion) as a negative control. The three types of RET miRNAs target human RET; both RET1 siRNA and RET2 siRNA contain a sequence that binds to the RET portion of the DCTN1-RET fusion gene, while RET3 siRNA does not contain a sequence that binds to the DCTN1-RET fusion gene. In other words, it was concluded that RET1 siRNA and RET2 siRNA inhibit the expression of the DCTN1-RET fusion gene, and RET3 siRNA does not. The following describes the method from the experiment using siRNA.

[0179][0179]

Таблица 5Table 5

миРНК RET1siRNA RET1CACAUGUCAUCAAAUUGUATTCACAUGUCAUCAAAUUGUATTSEQ ID NO: 74SEQ ID NO: 74миРНК RET2RET2 siRNAGGAUUGAAAACAAACUCUATTGGAUUGAAACAAACUCUATTSEQ ID NO: 75SEQ ID NO: 75миРНК RET3RET3 siRNACCACUGCUACCACAAGUUUTTCCACUGCUACCAAAGUUUTTSEQ ID NO: 77SEQ ID NO: 77

[0180][0180]

Экспрессирующие слитый ген DCTN1-RET клетки NIH/3T3 ДЛЯ использования получали посредством культивирования в среде для 2-мерной культуры клеток при 37°C в 5% CO2. За сутки до обработки миРНК, клетки рассевали в 6-луночный планшет (Iwaki), 3×105 клеток/2 мл, и инкубировали при 37°C в 5% CO2в течение ночи. 12 мкл миРНК каждого типа, заблаговременно доведенной до 20 мкМ с использованием воды, 4 мкл реагента для трансфекции липофектамина RNAiMAX (Thermo Fisher) и 384 мкл Opti-MEM смешивали; и инкубировали при комнатной температуре в течение 15 минут, таким образом, получая растворы миРНК. 400 мкл каждого раствора миРНК добавляли в лунки, в которые рассевали клетки, и инкубацию проводили при 37°C в 5% CO2 в течение ночи. На следующие сутки, часть инкубированных клеток отбирали в качестве образца для использования в анализе экспрессии белка; и другую часть также отбирали и повторно рассевали для использования для подтверждения роста клеток. Отбор образцов для анализа экспрессии белка и анализ экспрессии белка проводили таким же образом, как в 4-2: Подтверждение экспрессии белка-мишени, описанном выше, за исключением использования антитела к фосфо-RET (Tyr905) (CST), mAb кролика против Ret (C31B4) (CST), и mAb кролика против GAPDH (D16H11) XP (CST) в качестве первичных антител. Результаты показали, как показано на фиг. 7, что экспрессия слитого белка DCTN1-RET не была ингибирована в клетках, обработанных отрицательной контрольной миРНК (NC), сравнимо с клетками без обработки миРНК (без обработки). Когда клетки обрабатывали миРНК RET1 или миРНК RET2, подтвердили, что экспрессия слитого белка DCTN1-RET была ингибирована в экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3, и не была ингибирована, когда использовали миРНК RET3.DCTN1-RET fusion gene expressing NIH/3T3 cells FOR use were obtained by culturing in 2D cell culture medium at 37°C in 5% CO2 . One day before siRNA treatment, cells were seeded into a 6-well plate (Iwaki), 3 x 105 cells/2 ml, and incubated at 37°C in 5% CO2 overnight. 12 μl of each siRNA type, pre-adjusted to 20 μM using water, 4 μl of RNAiMAX Lipofectamine transfection reagent (Thermo Fisher), and 384 μl of Opti-MEM were mixed; and incubated at room temperature for 15 minutes, thereby obtaining siRNA solutions. 400 μl of each siRNA solution was added to the wells into which cells were seeded, and incubation was carried out at 37°C in 5% CO2 overnight. The next day, a portion of the incubated cells was selected as a sample for use in protein expression analysis; and another portion was also collected and re-plated for use to confirm cell growth. Sampling for protein expression analysis and protein expression analysis were performed in the same manner as in 4-2: Confirmation of Target Protein Expression described above, except using anti-phospho-RET (Tyr905) antibody (CST), a rabbit anti-Ret mAb ( C31B4) (CST), and rabbit anti-GAPDH mAb (D16H11) XP (CST) as primary antibodies. The results showed as shown in Fig. 7 that the expression of the DCTN1-RET fusion protein was not inhibited in cells treated with negative control siRNA (NC), comparable to cells without siRNA treatment (no treatment). When cells were treated with RET1 siRNA or RET2 siRNA, it was confirmed that the expression of the DCTN1-RET fusion protein was inhibited in DCTN1-RET fusion gene-expressing NIH/3T3 cells, and was not inhibited when RET3 siRNA was used.

Затем, для подтверждения эффекта ингибирования роста клеток, клетки собирали с использованием трипсина из лунок без обработки и из лунок, обработанных миРНК, и подсчитывали количество клеток. Затем проводили 3-мерное культивирование клеток таким же способом, как в примере 5, и на сутки проведения рассева (сутки 0) и через 4 суток после рассева (сутки 4), количество жизнеспособных клеток подсчитывали таким же способом, как в примере 5. Скорость роста клеток рассчитывали по результату измерения на сутки 0 и результату измерения на сутки 4. Результаты показывают, как показано на фиг. 8, что для клеток без обработки миРНК (без обработки) и для клеток, обработанных отрицательной контрольной миРНК (NC), соответственно, показано количество клеток на сутки 4 в 4,9 раз и в 3,6 раз больше, чем на сутки 0; однако, для клеток, обработанных миРНК RET1 и для клеток, обработанных миРНК RET2, показан рост только приблизительно в 2,0 раза и в 2,4 раза, соответственно, в обоих случаях заметно ниже. Для клеток, обработанных миРНК RET3, показан рост в 3,7 раза, который является по существу равным росту клеток, обработанных отрицательной контрольной миРНК, редко показывая уменьшение роста. Эти результаты выявили, что рост экспрессирующих слитый ген DCTN1-RET клеток NIH/3T3 также ингибирован, когда экспрессия RET ингибирована посредством миРНК.Then, to confirm the cell growth inhibition effect, cells were collected using trypsin from untreated and siRNA-treated wells, and the cell number was counted. Then, 3-dimensional cell cultivation was carried out in the same way as in example 5, and on the day of seeding (day 0) and 4 days after seeding (day 4), the number of viable cells was counted in the same way as in example 5. Rate Cell growth was calculated from the measurement result onday 0 and the measurement result on day 4. The results are shown as shown in FIG. 8 that for cells without siRNA treatment (no treatment) and for cells treated with negative control siRNA (NC), respectively, the number of cells on day 4 is 4.9 times and 3.6 times higher than onday 0; however, cells treated with RET1 siRNA and cells treated with RET2 siRNA showed only approximately 2.0-fold and 2.4-fold growth, respectively, both markedly lower. Cells treated with RET3 siRNA showed 3.7-fold growth, which is essentially equal to that of cells treated with negative control siRNA, rarely showing a decrease in growth. These results revealed that the growth of DCTN1-RET fusion gene-expressing NIH/3T3 cells is also inhibited when RET expression is inhibited by siRNA.

[0181][0181]

Пример 8: Эффект ингибирования роста клеток в экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3Example 8: Cell Growth Inhibitory Effect in DCTN1-RET Fusion Expressing NIH/3T3 Cells

Анализ роста клетокin vitro проводили на экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3. 3-мерное культивирование клеток и рассев осуществляли таким же способом, как в примере 5. После рассева, проводили инкубацию при 37°C в 5% CO2 в течение ночи (сутки 0). Кабозантиниб, вандетаниб, алектиниб, ленватиниб и конденсированные соединения пиримидина (соединения 1-9, показанные в таблице 6), которые, как опубликовано, являются способными ингибировать RET, растворяли в диметилсульфоксиде для получения концентрации 10 ммоль/л; и далее разводили с использованием среды для 3-мерной культуры клеток, таким образом, чтобы эти соединения имели конечную концентрацию 1000, 333, 111, 37,0, 12,3, 4,12, 1,37 и 0,457 нмоль/л. Затем эти разведенные соединения индивидуально добавляли в каждую лунку (0,01 мл на лунку) планшета, в который рассевали клетки (сутки 1); и клетки инкубировали при 37°C в 5% CO2 в течение 7 суток. После культивирования (сутки 8), детектирующий реагент для люминесценции внутриклеточного АТФ (реагент CellTiter-Glo 2.0, Promega) добавляли в каждую лунку, и уровень люминесценции (импульсов в секунду: cps) измеряли с использованием люминометра (EnSpire, PerkinElmer). Скорость роста от суток 1 клеток, обработанных соединениями в различных концентрациях, рассчитывали на основании следующего уравнения, в соответствии с значением Tсутки8 и Cсутки1, и определяли концентрацию каждого тестируемого соединения, при которой рост клетки был ингибирован на 50% (GI50(нМ)).In vitro cell growth assays were performed on DCTN1-RET fusion gene-expressing NIH/3T3 cells. 3D cell culture and seeding were carried out in the same way as in example 5. After seeding, incubation was carried out at 37°C in 5% CO2 overnight (day 0). Cabozantinib, vandetanib, alectinib, lenvatinib and fused pyrimidine compounds (compounds 1-9 shown in Table 6), which have been published to inhibit RET, were dissolved in dimethyl sulfoxide to obtain a concentration of 10 mmol/L; and further diluted using 3D cell culture medium such that these compounds had a final concentration of 1000, 333, 111, 37.0, 12.3, 4.12, 1.37 and 0.457 nmol/L. These diluted compounds were then individually added to each well (0.01 ml per well) of the plate into which the cells were seeded (day 1); and the cells were incubated at 37°C in 5% CO2 for 7 days. After culture (day 8), a detection reagent for intracellular ATP luminescence (CellTiter-Glo 2.0 reagent, Promega) was added to each well, and the luminescence level (cps) was measured using a luminometer (EnSpire, PerkinElmer). The growth rate fromday 1 of cells treated with compounds at various concentrations was calculated based on the following equation, according to the value of Tday8 and Cday1 , and the concentration of each test compound at which cell growth was inhibited by 50% (GI50 (nM) )).

1) Когда Tсутки8 ≥ Cсутки11) When Tday8 ≥ Cday1

Скорость роста (%)=(Tсутки8 - Cсутки1)/(Cсутки8 - Cсутки1)×100Growth rate (%)=(Tday8 - Cday1 )/(Cday8 - Cday1 )×100

T: cps для лунки, в которую добавляли тестируемое соединениеT: cps for the well to which the test compound was added

C: cps для лунки, в которую не добавляли тестируемое соединениеC: cps for the well to which no test compound was added

Сутки 1: сутки, на которые добавляли тестируемое соединениеDay 1: day on which the test compound was added

Сутки 8: сутки, на которые проводили оценкуDay 8: day on which the assessment was carried out

2) Когда Tсутки 8 < Cсутки12) When Tday 8 < Cday1

Скорость роста (%)=(Tсутки8 - Cсутки1)/(Cсутки1)×100Growth rate (%)=(Tday8 - Cday1 )/(Cday1 )×100

T: cps для лунки, в которую добавляли тестируемое соединениеT: cps for the well to which the test compound was added

C: cps для лунки, в которую не добавляли тестируемое соединениеC: cps for the well to which no test compound was added

Сутки 1: сутки, на которые добавляли тестируемое соединениеDay 1: day on which the test compound was added

Сутки 8: сутки, на которые проводили оценку[0182]Day 8: day on which the assessment was carried out[0182]

Таблица 6Table 6

No. соединенияNo. connectionsСтруктурная формулаStructural formulaХимическое наименованиеChemical nameNo. Международной публикации и No. примераNo. International publication andno. exampleСоединение 1Connection 14-амино-1-(трет-бутил)-N-(5-метил-1H-пиразол-3-ил)-1H-пиразолo[3,4-d]пиримидин-3-карбоксамид4-amino-1-(tert-butyl)-N-(5-methyl-1H-pyrazol-3-yl)-1H-pyrazolo[3,4-d]pyrimidine-3-carboxamideWO2017/043550, пример соединения 34WO2017/043550 connection example 34Соединение 2Connection 24-амино-7-(трет-бутил)-N-(5-метил-1H-пиразол-3-ил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид4-amino-7-(tert-butyl)-N-(5-methyl-1H-pyrazol-3-yl)-7H-pyrrolo[2,3-d]pyrimidine-5-carboxamideWO2017/043550, пример соединения 48WO2017/043550 connection example 48Соединение 3Connection 34-амино-7-(1-фтор-2-метилпропан-2-ил)-N-(5-метил-1H-пиразол-3-ил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид4-amino-7-(1-fluoro-2-methylpropan-2-yl)-N-(5-methyl-1H-pyrazol-3-yl)-7H-pyrrolo[2,3-d]pyrimidin-5- carboxamideWO2017/043550, пример соединения 50WO2017/043550 connection example 50Соединение 4Connection 44-амино-N-(5-метил-1H-пиразол-3-ил)-7-(1-метилциклопропил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид4-amino-N-(5-methyl-1H-pyrazol-3-yl)-7-(1-methylcyclopropyl)-7H-pyrrolo[2,3-d]pyrimidine-5-carboxamideWO2017/043550, пример соединения 51WO2017/043550 connection example 51(Продолжение таблицы 6)(Continuation of table 6)No. соединенияNo. connectionsСтруктурная формулаStructural formulaХимическое наименованиеChemical nameNo. Международной публикации и No. примераNo. International publication and no. exampleСоединение 5Connection 54-амино-7-(2-циклопропилпропан-2-ил)-N-(5-метил-1H-пиразол-3-ил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид4-amino-7-(2-cyclopropylpropan-2-yl)-N-(5-methyl-1H-pyrazol-3-yl)-7H-pyrrolo[2,3-d]pyrimidin-5-carboxamideWO2017/043550, пример соединения 52WO2017/043550 connection example 52Соединение 6Connection 64-амино-N-[4-(метоксиметил)фенил]-7-(1-метилциклопропил)-6-(3-морфолинопро-1-пин-1-ил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид4-amino-N-[4-(methoxymethyl)phenyl]-7-(1-methylcyclopropyl)-6-(3-morpholinoprop-1-pin-1-yl)-7H-pyrrolo[2,3-d]pyrimidine -5-carboxamideWO2017/146116, пример соединения 85WO2017/146116 connection example 85Соединение 7Connection 74-амино-N-[4-(метоксиметил)фенил]-7-(1-метилциклопропил)-6-((тетрагидро-2H-пиран-4-ил)этинил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид4-amino-N-[4-(methoxymethyl)phenyl]-7-(1-methylcyclopropyl)-6-((tetrahydro-2H-pyran-4-yl)ethynyl)-7H-pyrrolo[2,3-d] pyrimidine-5-carboxamideWO2017/146116, пример соединения 87WO2017/146116 connection example 87(Продолжение таблицы 6)(Continuation of table 6)No. соединенияNo. connectionsСтруктурная формулаStructural formulaХимическое наименованиеChemical nameNo. Международной публикации и No. примераNo. International publication and no. exampleСоединение 8Connection 8(R)-4-амино-N-[4-(метоксиметил)фенил]-7-(1-метилциклопропил)-6-((тетрагидрофуран-2-ил)метокси)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид(R)-4-amino-N-[4-(methoxymethyl)phenyl]-7-(1-methylcyclopropyl)-6-((tetrahydrofuran-2-yl)methoxy)-7H-pyrrolo[2,3-d] pyrimidine-5-carboxamideWO2017/146116, пример соединения 89WO2017/146116 connection example 89Соединение 9Connection 94-амино-N-[4-(метоксиметил)фенил]-6-((1-метил-1H-пиразол-4-ил)этинил)-7-(1-метилциклопропил)-7H-пирроло[2,3-d]пиримидин-5-карбоксамид4-amino-N-[4-(methoxymethyl)phenyl]-6-((1-methyl-1H-pyrazol-4-yl)ethynyl)-7-(1-methylcyclopropyl)-7H-pyrrolo[2,3- d]pyrimidine-5-carboxamideWO2017/146116, пример соединения 90WO2017/146116 connection example 90

[0183][0183]

Результаты показывают, как показано в таблице 7, что кабозантиниб, вандетаниб, ленватиниб и конденсированные соединения пиримидина (соединения 1-9) ингибировали рост экспрессирующих слитый ген DCTN1-RET клеток NIH/3T3.The results show, as shown in Table 7, that cabozantinib, vandetanib, lenvatinib and pyrimidine fused compounds (compounds 1-9) inhibited the growth of DCTN1-RET fusion gene-expressing NIH/3T3 cells.

[0184][0184]

Таблица 7Table 7

СоединениеCompoundGI50 (нмоль/л)GI50 (nmol/l)Соединение 1
Соединение 2
Соединение 3
Соединение 4
Соединение 5
Соединение 6
Соединение 7
Соединение 8
Соединение 9
Кабозантиниб
Вандетаниб
Ленватиниб
Алектиниб
Connection 1
Connection 2
Connection 3
Connection 4
Connection 5
Connection 6
Connection 7
Connection 8
Connection 9
Cabozantinib
Vandetanib
Lenvatinib
Alectinib
8,50
5,80
5,40
5,70
4,20
3,60
11,40
17,90
4,80
91,10
68,70
50,30
>1000
8.50
5.80
5.40
5.70
4.20
3.60
11.40
17.90
4.80
91.10
68.70
50.30
>1000

[0185][0185]

Результаты выше позволяют предполагать потенциальную полезность этих ингибиторов RET в качестве лекарственного средства против злокачественных опухолей, в которых детектирован слитый ген DCTN1-RET. Результаты позволяют предполагать также, что использование экспрессирующих слитый ген DCTN1-RET-клеток NIH/3T3 позволяет скрининг соединения, ингибирующего DCTN1-RET.The results above suggest the potential utility of these RET inhibitors as a drug against malignancies in which the DCTN1-RET fusion gene is detected. The results also suggest that the use of DCTN1-RET fusion gene-expressing NIH/3T3 cells allows screening for a DCTN1-RET inhibitory compound.

[0186][0186]

Пример 9: Ингибирование фосфорилирования RET в экспрессирующих слитый ген DCTN1-RET клеткахExample 9: Inhibition of RET Phosphorylation in DCTN1-RET Fusion Gene-Expressing Cells

Затем проверяли, ингибировано ли фосфорилирование RET в экспрессирующих слитый ген DCTN1-RET клетках посредством существующих лекарственных средств, как опубликовано, ингибирующих RET, в соответствии со способом, описанным ниже. Экспрессирующие слитый ген DCTN1-RET клетки NIH/3T3 для использования получали посредством культивирования в среде для 2-мерной культуры клеток при 37°C в 5% CO2. За сутки до обработки клеток лекарственным средством, клетки рассевали в 6-луночный планшет (Iwaki), 3×105 клеток/2 мл, и инкубировали при 37°C в 5% CO2 в течение ночи. Кабозантиниб, вандетаниб, алектиниб и ленватиниб растворяли в диметилсульфоксиде для получения концентрации 10 ммоль/л, и далее разводили с использованием PBS, таким образом, чтобы эти соединения имели конечную концентрацию 1000, 100 и 10 нмоль/л. Разведенные соединения индивидуально добавляли в каждую лунку, в которую предварительно рассевали клетки, 20 мкл на лунку (сутки 1), и инкубировали при 37°C в 5% CO2 в течение 1 час. После инкубации, образец клеток для анализа экспрессии белка отбирали таким же способом, как в примере 7, и анализировали экспрессию белка. Результаты показывают, как показано на фиг. 9, что уровни фосфорилированного RET в экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3 были заметно уменьшены посредством кабозантиниба и ленватиниба. Кроме того, ингибирование фосфорилирования RET посредством конденсированных соединений пиримидина также оценивали таким же способом, как выше, и подтвердили также, что фосфорилирование RET было заметно уменьшено посредством конденсированных соединений пиримидина. Эти результаты позволяют предполагать, что лекарственное средство, способное заметно уменьшать уровни фосфорилированного RET, может представлять собой соединение, которое может ингибировать рост экспрессирующих слитый ген DCTN1-RET клеток NIH/3T3, и что соединение является потенциально полезным в качестве лекарственного средства против злокачественных опухолей, в которых детектирован слитый ген DCTN1-RET. Результаты также позволяют предполагать, что использование уровней фосфорилированного RET в экспрессирующих слитый ген DCTN1-RET клетках NIH/3T3 позволяет скрининг ингибитора RET.It was then tested whether RET phosphorylation in DCTN1-RET fusion gene expressing cells was inhibited by existing drugs published to inhibit RET, according to the method described below. DCTN1-RET fusion gene-expressing NIH/3T3 cells for use were obtained by culturing in 2D cell culture medium at 37°C in 5% CO2 . The day before drug treatment of cells, cells were seeded into a 6-well plate (Iwaki), 3 x 105 cells/2 ml, and incubated at 37°C in 5% CO2 overnight. Cabozantinib, vandetanib, alectinib and lenvatinib were dissolved in dimethyl sulfoxide to obtain a concentration of 10 mmol/L, and further diluted using PBS such that these compounds had final concentrations of 1000, 100 and 10 nmol/L. The diluted compounds were individually added to each well in which cells were pre-seeded, 20 μl per well (day 1), and incubated at 37°C in 5% CO2 for 1 hour. After incubation, a cell sample for protein expression analysis was collected in the same manner as in Example 7, and protein expression was analyzed. The results show as shown in Fig. 9 that levels of phosphorylated RET in DCTN1-RET fusion gene-expressing NIH/3T3 cells were markedly reduced by cabozantinib and lenvatinib. In addition, the inhibition of RET phosphorylation by pyrimidine fused compounds was also evaluated in the same manner as above, and it was further confirmed that RET phosphorylation was markedly reduced by pyrimidine fused compounds. These results suggest that a drug capable of markedly reducing phosphorylated RET levels may be a compound that can inhibit the growth of DCTN1-RET fusion gene-expressing NIH/3T3 cells, and that the compound is potentially useful as a drug against cancer. in which the DCTN1-RET fusion gene was detected. The results also suggest that using phosphorylated RET levels in DCTN1-RET fusion gene-expressing NIH/3T3 cells allows for RET inhibitor screening.

Список последовательностей в произвольном текстовом форматеList of sequences in free text format

[0187][0187]

SEQ ID NO: 1 показывает последовательность оснований полинуклеотида, кодирующего слитый пептид из варианта 1 (v1) DCTN1 (часть из SEQ ID NO: 25) и варианта 2 (v2) RET (часть из SEQ ID NO: 31).SEQ ID NO: 1 shows the base sequence of a polynucleotide encoding a fusion peptide of DCTN1 variant 1 (v1) (portion of SEQ ID NO: 25) and RET variant 2 (v2) (portion of SEQ ID NO: 31).

SEQ ID NO: 2 показывает аминокислотную последовательность слитого пептида из DCTN1 v1 и RET v2.SEQ ID NO: 2 shows the amino acid sequence of the fusion peptide from DCTN1 v1 and RET v2.

SEQ ID NO: 3 показывает последовательность оснований полинуклеотида, кодирующего слитый пептид из DCTN1 v1 и варианта 4 (v4) RET (часть из SEQ ID NO: 32).SEQ ID NO: 3 shows the base sequence of the polynucleotide encoding the fusion peptide from DCTN1 v1 and RET variant 4 (v4) (portion of SEQ ID NO: 32).

SEQ ID NO: 4 показывает аминокислотную последовательность слитого пептида из DCTN1 v1 и RET v4.SEQ ID NO: 4 shows the amino acid sequence of the fusion peptide from DCTN1 v1 and RET v4.

SEQ ID NO: 5 показывает последовательность оснований полинуклеотида, кодирующего слитый пептид из варианта 2 (v2) DCTN1 (часть из SEQ ID NO: 26) и RET v2.SEQ ID NO: 5 shows the base sequence of the polynucleotide encoding the fusion peptide of DCTN1 variant 2 (v2) (part of SEQ ID NO: 26) and RET v2.

SEQ ID NO: 6 показывает аминокислотную последовательность слитого пептида из DCTN1 v2 и RET v2.SEQ ID NO: 6 shows the amino acid sequence of the fusion peptide from DCTN1 v2 and RET v2.

SEQ ID NO: 7 показывает последовательность оснований полинуклеотида, кодирующего слитый пептид из DCTN1 v2 и RET v4.SEQ ID NO: 7 shows the base sequence of the polynucleotide encoding the fusion peptide of DCTN1 v2 and RET v4.

SEQ ID NO: 8 показывает аминокислотную последовательность слитого пептида из DCTN1 v2 и RET v4.SEQ ID NO: 8 shows the amino acid sequence of the fusion peptide from DCTN1 v2 and RET v4.

SEQ ID NO: 9 показывает последовательность оснований полинуклеотида, кодирующего слитый пептид из варианта 3 (v3) DCTN1 (часть из SEQ ID NO: 27) и RET v2.SEQ ID NO: 9 shows the base sequence of the polynucleotide encoding the fusion peptide of DCTN1 variant 3 (v3) (part of SEQ ID NO: 27) and RET v2.

SEQ ID NO: 10 показывает аминокислотную последовательность слитого пептида из DCTN1 v3 и RET v2.SEQ ID NO: 10 shows the amino acid sequence of the fusion peptide from DCTN1 v3 and RET v2.

SEQ ID NO: 11 показывает последовательность оснований полинуклеотида, кодирующего слитый пептид из DCTN1 v3 и RET v4.SEQ ID NO: 11 shows the base sequence of the polynucleotide encoding the fusion peptide of DCTN1 v3 and RET v4.

SEQ ID NO: 12 показывает аминокислотную последовательность слитого пептида из DCTN1 v3 и RET v4.SEQ ID NO: 12 shows the amino acid sequence of the fusion peptide from DCTN1 v3 and RET v4.

SEQ ID NO: 13 показывает последовательность оснований полинуклеотида, кодирующего слитый пептид из варианта 4 (v4) DCTN1 (часть из SEQ ID NO: 28) и RET v2.SEQ ID NO: 13 shows the base sequence of the polynucleotide encoding the fusion peptide of DCTN1 variant 4 (v4) (part of SEQ ID NO: 28) and RET v2.

SEQ ID NO: 14 показывает аминокислотную последовательность слитого пептида из DCTN1 v4 и RET v2.SEQ ID NO: 14 shows the amino acid sequence of the fusion peptide from DCTN1 v4 and RET v2.

SEQ ID NO: 15 показывает последовательность оснований полинуклеотида, кодирующего слитый пептид из DCTN1 v4 и RET v4.SEQ ID NO: 15 shows the base sequence of the polynucleotide encoding the fusion peptide of DCTN1 v4 and RET v4.

SEQ ID NO: 16 показывает аминокислотную последовательность слитого пептида из DCTN1 v4 и RET v4.SEQ ID NO: 16 shows the amino acid sequence of the fusion peptide from DCTN1 v4 and RET v4.

SEQ ID NO: 17 показывает последовательность оснований полинуклеотида, кодирующего слитый пептид из варианта 5 (v5) DCTN1 (часть из SEQ ID NO: 29) и RET v2.SEQ ID NO: 17 shows the base sequence of the polynucleotide encoding the fusion peptide of DCTN1 variant 5 (v5) (part of SEQ ID NO: 29) and RET v2.

SEQ ID NO: 18 показывает аминокислотную последовательность слитого пептида из DCTN1 v5 и RET v2.SEQ ID NO: 18 shows the amino acid sequence of the fusion peptide from DCTN1 v5 and RET v2.

SEQ ID NO: 19 показывает последовательность оснований полинуклеотида, кодирующего слитый пептид из DCTN1 v5 и RET v4.SEQ ID NO: 19 shows the base sequence of the polynucleotide encoding the fusion peptide of DCTN1 v5 and RET v4.

SEQ ID NO: 20 показывает аминокислотную последовательность слитого пептида из DCTN1 v5 и RET v4.SEQ ID NO: 20 shows the amino acid sequence of the fusion peptide from DCTN1 v5 and RET v4.

SEQ ID NO: 21 показывает последовательность оснований полинуклеотида, кодирующего слитый пептид из DCTN1 v6 и RET v2.SEQ ID NO: 21 shows the base sequence of the polynucleotide encoding the fusion peptide of DCTN1 v6 and RET v2.

SEQ ID NO: 22 показывает аминокислотную последовательность слитого пептида из DCTN1 v6 и RET v2.SEQ ID NO: 22 shows the amino acid sequence of the fusion peptide from DCTN1 v6 and RET v2.

SEQ ID NO: 23 показывает последовательность оснований полинуклеотида, кодирующего слитый пептид из DCTN1 v6 и RET v4.SEQ ID NO: 23 shows the base sequence of the polynucleotide encoding the fusion peptide of DCTN1 v6 and RET v4.

SEQ ID NO: 24 показывает аминокислотную последовательность слитого пептида из DCTN1 v6 и RET v4.SEQ ID NO: 24 shows the amino acid sequence of the fusion peptide from DCTN1 v6 and RET v4.

SEQ ID NO: 33 показывает последовательность оснований праймера.SEQ ID NO: 33 shows the base sequence of the primer.

SEQ ID NO: 34 показывает последовательность оснований праймера.SEQ ID NO: 34 shows the base sequence of the primer.

SEQ ID NO: 35 показывает последовательность оснований праймера.SEQ ID NO: 35 shows the base sequence of the primer.

SEQ ID NO: 36 показывает последовательность оснований праймера.SEQ ID NO: 36 shows the base sequence of the primer.

SEQ ID NO: 37 показывает последовательность оснований праймера.SEQ ID NO: 37 shows the base sequence of the primer.

SEQ ID NO: 38 показывает последовательность оснований праймера.SEQ ID NO: 38 shows the base sequence of the primer.

SEQ ID NO: 39 показывает последовательность оснований праймера.SEQ ID NO: 39 shows the base sequence of the primer.

SEQ ID NO: 40 показывает последовательность оснований праймера.SEQ ID NO: 40 shows the base sequence of the primer.

SEQ ID NO: 41 показывает последовательность оснований праймера.SEQ ID NO: 41 shows the base sequence of the primer.

SEQ ID NO: 42 показывает последовательность оснований праймера.SEQ ID NO: 42 shows the base sequence of the primer.

SEQ ID NO: 43 показывает последовательность оснований праймера.SEQ ID NO: 43 shows the base sequence of the primer.

SEQ ID NO: 44 показывает последовательность оснований праймера.SEQ ID NO: 44 shows the base sequence of the primer.

SEQ ID NO: 45 показывает последовательность оснований праймера.SEQ ID NO: 45 shows the base sequence of the primer.

SEQ ID NO: 46 показывает последовательность оснований праймера.SEQ ID NO: 46 shows the base sequence of the primer.

SEQ ID NO: 47 показывает последовательность оснований праймера.SEQ ID NO: 47 shows the base sequence of the primer.

SEQ ID NO: 48 показывает последовательность оснований праймера.SEQ ID NO: 48 shows the base sequence of the primer.

SEQ ID NO: 49 показывает последовательность оснований праймера.SEQ ID NO: 49 shows the base sequence of the primer.

SEQ ID NO: 50 показывает последовательность оснований праймера.SEQ ID NO: 50 shows the base sequence of the primer.

SEQ ID NO: 51 показывает последовательность оснований праймера.SEQ ID NO: 51 shows the base sequence of the primer.

SEQ ID NO: 52 показывает последовательность оснований праймера.SEQ ID NO: 52 shows the base sequence of the primer.

SEQ ID NO: 53 показывает последовательность оснований праймера.SEQ ID NO: 53 shows the base sequence of the primer.

SEQ ID NO: 54 показывает последовательность оснований праймера.SEQ ID NO: 54 shows the base sequence of the primer.

SEQ ID NO: 55 показывает последовательность оснований праймера.SEQ ID NO: 55 shows the base sequence of the primer.

SEQ ID NO: 56 показывает последовательность оснований праймера.SEQ ID NO: 56 shows the base sequence of the primer.

SEQ ID NO: 57 показывает последовательность оснований праймера.SEQ ID NO: 57 shows the base sequence of the primer.

SEQ ID NO: 58 показывает последовательность оснований праймера.SEQ ID NO: 58 shows the base sequence of the primer.

SEQ ID NO: 59 показывает последовательность оснований праймера.SEQ ID NO: 59 shows the base sequence of the primer.

SEQ ID NO: 60 показывает последовательность оснований праймера.SEQ ID NO: 60 shows the base sequence of the primer.

SEQ ID NO: 61 показывает последовательность оснований праймера.SEQ ID NO: 61 shows the base sequence of the primer.

SEQ ID NO: 62 показывает последовательность оснований праймера.SEQ ID NO: 62 shows the base sequence of the primer.

SEQ ID NO: 63 показывает последовательность оснований праймера.SEQ ID NO: 63 shows the base sequence of the primer.

SEQ ID NO: 64 показывает последовательность оснований праймера.SEQ ID NO: 64 shows the base sequence of the primer.

SEQ ID NO: 65 показывает последовательность оснований праймера.SEQ ID NO: 65 shows the base sequence of the primer.

SEQ ID NO: 66 показывает последовательность оснований праймера.SEQ ID NO: 66 shows the base sequence of the primer.

SEQ ID NO: 67 показывает последовательность оснований праймера.SEQ ID NO: 67 shows the base sequence of the primer.

SEQ ID NO: 68 показывает последовательность оснований праймера.SEQ ID NO: 68 shows the base sequence of the primer.

SEQ ID NO: 69 показывает последовательность оснований праймера.SEQ ID NO: 69 shows the base sequence of the primer.

SEQ ID NO: 70 показывает последовательность оснований праймера.SEQ ID NO: 70 shows the base sequence of the primer.

SEQ ID NO: 71 показывает последовательность оснований праймера.SEQ ID NO: 71 shows the base sequence of the primer.

SEQ ID NO: 72 показывает последовательность оснований праймера.SEQ ID NO: 72 shows the base sequence of the primer.

SEQ ID NO: 73 показывает последовательность оснований праймера.SEQ ID NO: 73 shows the base sequence of the primer.

SEQ ID NO: 74 показывает последовательность оснований миРНК RET.SEQ ID NO: 74 shows the base sequence of RET siRNA.

SEQ ID NO: 75 показывает последовательность оснований миРНК RET.SEQ ID NO: 75 shows the base sequence of RET siRNA.

SEQ ID NO: 76 показывает последовательность оснований миРНК RET.SEQ ID NO: 76 shows the base sequence of RET siRNA.

SEQ ID NO: 77 показывает последовательность оснований миРНК RET.SEQ ID NO: 77 shows the base sequence of RET siRNA.

Таблица последовательностейSequence table

P17-158WOPCT_DCTN1 PROTEIN_20180820_115457_8.txtP17-158WOPCT_DCTN1 PROTEIN_20180820_115457_8.txt

--->--->

SEQUENCE LISTINGSEQUENCE LISTING

<110> ТАЙХО ФАРМАСЬЮТИКАЛ КО., ЛТД.<110> TAIHO PHARMACEUTICAL CO., LTD.

<120> СЛИТЫЙ БЕЛОК ИЗ БЕЛКА DCTN1 С БЕЛКОМ RET<120> FUSION PROTEIN OF DCTN1 PROTEIN WITH RET PROTEIN

<130> P17-158WO<130> P17-158WO

<150> JP 2017-158796<150> JP 2017-158796

<151> 2017-08-21<151> 2017-08-21

<160> 77<160> 77

<170> PatentIn version 3.5<170> Patent In version 3.5

<210> 1<210> 1

<211> 4908<211> 4908

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кодирующая последовательность слитого пептида<223> fusion peptide coding sequence

<400> 1<400> 1

atggcacaga gcaagaggca cgtgtacagc cggacgccca gcggcagcag gatgagtgcg 60atggcacaga gcaagaggca cgtgtacagc cggacgccca gcggcagcag gatgagtgcg 60

gaggcaagcg cccggcctct gcgggtgggc tcccgtgtag aggtgattgg aaaaggccac 120gaggcaagcg cccggcctct gcgggtgggc tcccgtgtag aggtgattgg aaaaggccac 120

cgaggcactg tggcctatgt tggagccaca ctgtttgcca ctggcaaatg ggtaggcgtg 180cgaggcactg tggcctatgt tggagccaca ctgtttgcca ctggcaaatg ggtaggcgtg 180

attctggatg aagcaaaggg caaaaatgat ggaactgttc aaggcaggaa gtacttcact 240attctggatg aagcaaaggg caaaaatgat ggaactgttc aaggcaggaa gtacttcact 240

tgtgatgaag ggcatggcat ctttgtgcgc cagtcccaga tccaggtatt tgaagatgga 300tgtgatgaag ggcatggcat ctttgtgcgc cagtcccaga tccaggtatt tgaagatgga 300

gcagatacta cttccccaga gacacctgat tcttctgctt caaaagtcct caaaagagag 360gcagatacta cttccccaga gacacctgat tcttctgctt caaaagtcct caaaagagag 360

ggaactgata caactgcaaa gactagcaaa ctgcggggac tgaagcctaa gaaggcaccg 420ggaactgata caactgcaaa gactagcaaa ctgcggggac tgaagcctaa gaaggcaccg 420

acagcccgaa agaccacaac tcggcgaccc aagcccacgc gcccagccag tactggggtg 480acagcccgaa agaccacaac tcggcgaccc aagcccacgc gcccagccag tactggggtg 480

gctggggcca gtagctccct gggcccctct ggctcagcgt cagcaggtga gctgagcagc 540gctggggcca gtagctccct gggcccctct ggctcagcgt cagcaggtga gctgagcagc 540

agtgagccca gcaccccggc tcagactccg ctggcagcac ccatcatccc cacgccggtc 600agtgagccca gcaccccggc tcagactccg ctggcagcac ccatcatccc cacgccggtc 600

ctcacctctc ctggagcagt ccccccgctt ccttccccat ccaaggagga ggagggacta 660ctcacctctc ctggagcagt ccccccgctt ccttccccat ccaaggagga ggagggacta 660

agggctcagg tgcgggacct ggaggagaaa ctagagaccc tgagactgaa acgggcagaa 720agggctcagg tgcgggacct ggaggagaaa ctagagaaccc tgagactgaa acgggcagaa 720

gacaaagcaa agctaaaaga gctggagaaa cacaaaatcc agctggagca ggtgcaggaa 780gacaaagcaa agctaaaaga gctggagaaa cacaaaatcc agctggagca ggtgcaggaa 780

tggaagagca aaatgcagga gcagcaggcc gacctgcagc ggcgcctcaa ggaggcgaga 840tggaagagca aaatgcagga gcagcaggcc gacctgcagc ggcgcctcaa ggaggcgaga 840

aaggaagcca aggaggcgct ggaggcaaag gaacgctata tggaggagat ggctgatact 900aaggaagcca aggaggcgct ggaggcaaag gaacgctata tggaggat ggctgatact 900

gctgatgcca ttgagatggc cactttggac aaggagatgg ctgaagagcg ggctgagtcc 960gctgatgcca ttgagatggc cactttggac aaggatgg ctgaagagcg ggctgagtcc 960

ctgcagcagg aggtggaggc actgaaggag cgggtggacg agctcactac tgacttagag 1020ctgcagcagg aggtggaggc actgaaggag cgggtggacg agctcactac tgacttagag 1020

atcctcaagg ctgagattga agagaagggc tcagatggcg ctgcatccag ttatcagctc 1080atcctcaagg ctgagattga agagaagggc tcagatggcg ctgcatccag ttatcagctc 1080

aagcagcttg aggagcagaa tgcccgcctg aaggatgccc tggtgaggat gcgggatctt 1140aagcagcttg aggagcagaa tgcccgcctg aaggatgccc tggtgaggat gcgggatctt 1140

tcttcctcag agaagcagga gcatgtgaag ctccagaagc tcatggaaaa gaagaaccaa 1200tcttcctcag agaagcagga gcatgtgaag ctccagaagc tcatggaaaa gaagaaccaa 1200

gagctggaag ttgtgaggca acagcgggag cgtctgcagg aggagctaag ccaggcagag 1260gagctggaag ttgtgaggca acagcgggag cgtctgcagg aggagctaag ccaggcagag 1260

agcaccattg atgagctcaa ggagcaggtg gatgctgctc tgggtgctga ggagatggtg 1320agcaccattg atgagctcaa ggagcaggtg gatgctgctc tgggtgctga ggagatggtg 1320

gagatgctga cagatcggaa cctgaatctg gaagagaaag tgcgcgagtt gagggagact 1380gagatgctga cagatcggaa cctgaatctg gaagagaaag tgcgcgagtt gagggagact 1380

gtgggagact tggaagcgat gaatgagatg aacgatgagc tgcaggagaa tgcacgtgag 1440gtgggagact tggaagcgat gaatgagatg aacgatgagc tgcaggagaa tgcacgtgag 1440

acagaactgg agctgcggga gcagctggac atggcaggcg cgcgggttcg tgaggcccag 1500acagaactgg agctgcggga gcagctggac atggcaggcg cgcgggttcg tgaggcccag 1500

aagcgtgtgg aggcagccca ggagacggtt gcagactacc agcagaccat caagaagtac 1560aagcgtgtgg aggcagccca ggagacggtt gcagactacc agcagaccat caagaagtac 1560

cgccagctga ccgcccatct acaggatgtg aatcgggaac tgacaaacca gcaggaagca 1620cgccagctga ccgcccatct acaggatgtg aatcgggaac tgacaaacca gcaggaagca 1620

tctgtggaga ggcaacagca gccacctcca gagacctttg acttcaaaat caagtttgct 1680tctgtggaga ggcaacagca gccacctcca gagacctttg acttcaaaat caagtttgct 1680

gagactaagg cccatgccaa ggcaattgag atggaattga ggcagatgga ggtggcccag 1740gagactaagg cccatgccaa ggcaattgag atggaattga ggcagatgga ggtggcccag 1740

gccaatcgac acatgtccct gctgacagcc ttcatgcctg acagcttcct tcggccaggt 1800gccaatcgac acatgtccct gctgacagcc ttcatgcctg acagcttcct tcggccaggt 1800

ggggaccatg actgcgttct ggtgctgttg ctcatgcctc gtctcatttg caaggcagag 1860ggggaccatg actgcgttct ggtgctgttg ctcatgcctc gtctcatttg caaggcagag 1860

ctgatccgga agcaggccca ggagaagttt gaactaagtg agaactgttc agagcggcct 1920ctgatccgga agcaggccca ggagaagttt gaactaagtg agaactgttc agagcggcct 1920

gggctgcgag gagctgctgg ggagcaactc agctttgctg ctggactggt gtactcgctg 1980gggctgcgag gagctgctgg ggagcaactc agctttgctg ctggactggt gtactcgctg 1980

agcctgctgc aggccacgct acaccgctat gagcatgccc tctctcagtg cagtgtggat 2040agcctgctgc aggccacgct acaccgctat gagcatgccc tctctcagtg cagtgtggat 2040

gtgtataaga aagtgggcag cctgtaccct gagatgagtg cccatgagcg ctccttggat 2100gtgtataaga aagtgggcag cctgtaccct gagatgagtg cccatgagcg ctccttggat 2100

ttcctcattg aactgctgca caaggatcag ctggatgaga ctgtcaatgt ggagcctctc 2160ttcctcattg aactgctgca caaggatcag ctggatgaga ctgtcaatgt ggagcctctc 2160

accaaggcca tcaagtacta tcagcatctg tacagcatcc accttgccga acagcctgag 2220accaaggcca tcaagtacta tcagcatctg tacagcatcc accttgccga acagcctgag 2220

gactgtacta tgcagctggc tgaccacatt aagttcacgc agagtgctct ggactgcatg 2280gactgtacta tgcagctggc tgaccacatt aagttcacgc agagtgctct ggactgcatg 2280

agtgtggagg taggacggct gcgtgccttc ttgcagggtg ggcaggaggc tacagatatt 2340agtgtggagg taggacggct gcgtgccttc ttgcagggtg ggcaggaggc tacagatatt 2340

gccctcctgc tccgggatct ggaaacttca tgcagtgaca tccgccagtt ctgcaagaag 2400gccctcctgc tccgggatct ggaaacttca tgcagtgaca tccgccagtt ctgcaagaag 2400

atccgaaggc gaatgccagg gacagatgct cctgggatcc cagctgcact ggcctttgga 2460atccgaaggc gaatgccagg gacagatgct cctgggatcc cagctgcact ggcctttgga 2460

ccacaggtat ctgacacgct cctagactgc aggaaacact tgacgtgggt cgtggctgtg 2520ccacaggtat ctgacacgct cctagactgc aggaaacact tgacgtgggt cgtggctgtg 2520

ctgcaggagg tggcagctgc tgctgcccag ctcattgccc cactggcaga gaatgagggg 2580ctgcaggagg tggcagctgc tgctgcccag ctcattgccc cactggcaga gaatgagggg 2580

ctacttgtgg ctgctctgga ggaactggct ttcaaagcaa gcgagcagat ctatgggacc 2640ctacttgtgg ctgctctgga ggaactggct ttcaaagcaa gcgagcagat ctatgggacc 2640

ccctccagca gcccctatga gtgtctgcgc cagtcatgca acatcctcat cagtaccatg 2700ccctccagca gcccctatga gtgtctgcgc cagtcatgca acatcctcat cagtaccatg 2700

aacaagctgg ccacagccat gcaggagggg gagtatgatg cagagcggcc ccccagcaag 2760aacaagctgg ccacagccat gcaggagggg gagtatgatg cagagcggcc ccccagcaag 2760

cctccaccgg ttgaactgcg ggctgctgcc cttcgtgcag agatcacaga tgctgaaggc 2820cctccaccgg ttgaactgcg ggctgctgcc cttcgtgcag agatcacaga tgctgaaggc 2820

ctgggtttga agctcgaaga tcgagagaca gttattaagg agttgaagaa gtcactcaag 2880ctgggtttga agctcgaaga tcgagagaca gttattaagg agttgaagaa gtcactcaag 2880

attaagggag aggagctaag tgaggccaat gtgcggctga gcctcctgga gaagaagttg 2940attaagggag aggagctaag tgaggccaat gtgcggctga gcctcctgga gaagaagttg 2940

gacagtgctg ccaaggatgc agatgagcgc atcgagaaag tccagactcg gctggaggag 3000gacagtgctg ccaaggatgc agatgagcgc atcgagaaag tccagactcg gctggaggag 3000

acccaggcac tgctgcgaaa gaaggagaaa gagtttgagg agacaatgga tgcactccag 3060acccaggcac tgctgcgaaa gaaggagaaa gagtttgagg agacaatgga tgcactccag 3060

gctgacatcg accagctgga ggcagagaag gcagaactaa agcagcgtct gaacagccag 3120gctgacatcg accagctgga ggcagagaag gcagaactaa agcagcgtct gaacagccag 3120

tccaaacgca cgattgaggg actccggggc cctcctcctt caggcattgc tactctggtc 3180tccaaacgca cgattgaggg actccggggc cctcctcctt caggcattgc tactctggtc 3180

tctggcattg ctggtgaaga acagcagcga ggagccatcc ctgggcaggc tccagggtct 3240tctggcattg ctggtgaaga acagcagcga ggagccatcc ctgggcaggc tccagggtct 3240

gtgccaggcc cagggctggt gaaggactca ccactgctgc ttcagcagat ctctgccatg 3300gtgccaggcc cagggctggt gaaggactca ccactgctgc ttcagcagat ctctgccatg 3300

aggctgcaca tctcccagct ccagcatgag aacagcatcc tcaagggagc ccagatgaag 3360aggctgcaca tctcccagct ccagcatgag aacagcatcc tcaagggagc ccagatgaag 3360

gcatccttgg catccctgcc ccctctgcat gttgcaaagc tatcccatga gggccctggc 3420gcatccttgg catccctgcc ccctctgcat gttgcaaagc tatcccatga gggccctggc 3420

agtgagttac cagctggagc gctgtatcgt aagaccagcc agctgctgga gacattgaat 3480agtgagttac cagctggagc gctgtatcgt aagaccagcc agctgctgga gacattgaat 3480

caattgagca cacacacgca cgtagtagac atcactcgca ccagccctgc tgccaagagc 3540caattgagca cacacacgca cgtagtagac atcactcgca ccagccctgc tgccaagagc 3540

ccgtcggccc aacttatgga gcaagtggct cagcttaagt ccctgagtga caccgtcgag 3600ccgtcggccc aacttatgga gcaagtggct cagcttaagt ccctgagtga caccgtcgag 3600

aagctcaagg atgaggtcct caaggagaca gtatctcagc gccctggagc cacagtaccc 3660aagctcaagg atgaggtcct caaggagaca gtatctcagc gccctggagc cacagtaccc 3660

actgactttg ccaccttccc ttcatcagcc ttcctcaggg aggatccaaa gtgggaattc 3720actgactttg ccaccttccc ttcatcagcc ttcctcaggg aggatccaaa gtgggaattc 3720

cctcggaaga acttggttct tggaaaaact ctaggagaag gcgaatttgg aaaagtggtc 3780cctcggaaga acttggttct tggaaaaact ctaggagaag gcgaatttgg aaaagtggtc 3780

aaggcaacgg ccttccatct gaaaggcaga gcagggtaca ccacggtggc cgtgaagatg 3840aaggcaacgg ccttccatct gaaaggcaga gcagggtaca ccacggtggc cgtgaagatg 3840

ctgaaagaga acgcctcccc gagtgagctt cgagacctgc tgtcagagtt caacgtcctg 3900ctgaaagaga acgcctcccc gagtgagctt cgagacctgc tgtcagagtt caacgtcctg 3900

aagcaggtca accacccaca tgtcatcaaa ttgtatgggg cctgcagcca ggatggcccg 3960aagcaggtca accacccaca tgtcatcaaa ttgtatgggg cctgcagcca ggatggcccg 3960

ctcctcctca tcgtggagta cgccaaatac ggctccctgc ggggcttcct ccgcgagagc 4020ctcctcctca tcgtggagta cgccaaatac ggctccctgc ggggcttcct ccgcgagagc 4020

cgcaaagtgg ggcctggcta cctgggcagt ggaggcagcc gcaactccag ctccctggac 4080cgcaaagtgg ggcctggcta cctgggcagt ggaggcagcc gcaactccag ctccctggac 4080

cacccggatg agcgggccct caccatgggc gacctcatct catttgcctg gcagatctca 4140cacccggatg agcgggccct caccatgggc gacctcatct catttgcctg gcagatctca 4140

caggggatgc agtatctggc cgagatgaag ctcgttcatc gggacttggc agccagaaac 4200caggggatgc agtatctggc cgagatgaag ctcgttcatc gggacttggc agccagaaac 4200

atcctggtag ctgaggggcg gaagatgaag atttcggatt tcggcttgtc ccgagatgtt 4260atcctggtag ctgaggggcg gaagatgaag atttcggatt tcggcttgtc ccgagatgtt 4260

tatgaagagg attcctacgt gaagaggagc cagggtcgga ttccagttaa atggatggca 4320tatgaagagg attcctacgt gaagaggagc cagggtcgga ttccagttaa atggatggca 4320

attgaatccc tttttgatca tatctacacc acgcaaagtg atgtatggtc ttttggtgtc 4380attgaatccc tttttgatca tatctacacc acgcaaagtg atgtatggtc ttttggtgtc 4380

ctgctgtggg agatcgtgac cctaggggga aacccctatc ctgggattcc tcctgagcgg 4440ctgctgtggg agatcgtgac cctaggggga aacccctatc ctgggattcc tcctgagcgg 4440

ctcttcaacc ttctgaagac cggccaccgg atggagaggc cagacaactg cagcgaggag 4500ctcttcaacc ttctgaagac cggccaccgg atggagaggc cagacaactg cagcgaggag 4500

atgtaccgcc tgatgctgca atgctggaag caggagccgg acaaaaggcc ggtgtttgcg 4560atgtaccgcc tgatgctgca atgctggaag caggagccgg acaaaaggcc ggtgtttgcg 4560

gacatcagca aagacctgga gaagatgatg gttaagagga gagactactt ggaccttgcg 4620gacatcagca aagacctgga gaagatgatg gttaagagga gagactactt ggaccttgcg 4620

gcgtccactc catctgactc cctgatttat gacgacggcc tctcagagga ggagacaccg 4680gcgtccactc catctgactc cctgatttat gacgacggcc tctcagagga ggagacaccg 4680

ctggtggact gtaataatgc ccccctccct cgagccctcc cttccacatg gattgaaaac 4740ctggtggact gtaataatgc ccccctccct cgagccctcc cttccacatg gattgaaaac 4740

aaactctatg gcatgtcaga cccgaactgg cctggagaga gtcctgtacc actcacgaga 4800aaactctatg gcatgtcaga cccgaactgg cctggagaga gtcctgtacc actcacgaga 4800

gctgatggca ctaacactgg gtttccaaga tatccaaatg atagtgtata tgctaactgg 4860gctgatggca ctaacactgg gtttccaaga tatccaaatg atagtgtata tgctaactgg 4860

atgctttcac cctcagcggc aaaattaatg gacacgtttg atagttaa 4908atgctttcac cctcagcggc aaaattaatg gacacgtttg atagttaa 4908

<210> 2<210> 2

<211> 1635<211> 1635

<212> белок<212> protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> слитый пептид<223> fusion peptide

<400> 2<400> 2

Met Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly SerMet Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly Ser

1. 5 10 151. 5 10 15

Arg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser ArgArg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg

20 25 3020 25 30

Val Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val GlyVal Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly

35 40 4535 40 45

Ala Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp GluAla Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu

50 55 6050 55 60

Ala Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe ThrAla Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr

65 70 75 8065 70 75 80

Cys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln ValCys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val

85 90 9585 90 95

Phe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser SerPhe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser

100 105 110100 105 110

Ala Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys ThrAla Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr

115 120 125115 120 125

Ser Lys Leu Arg Gly Leu Lys Pro Lys Lys Ala Pro Thr Ala Arg LysSer Lys Leu Arg Gly Leu Lys Pro Lys Lys Ala Pro Thr Ala Arg Lys

130 135 140130 135 140

Thr Thr Thr Arg Arg Pro Lys Pro Thr Arg Pro Ala Ser Thr Gly ValThr Thr Thr Arg Arg Pro Lys Pro Thr Arg Pro Ala Ser Thr Gly Val

145 150 155 160145 150 155 160

Ala Gly Ala Ser Ser Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala GlyAla Gly Ala Ser Ser Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly

165 170 175165 170 175

Glu Leu Ser Ser Ser Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu AlaGlu Leu Ser Ser Ser Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala

180 185 190180 185 190

Ala Pro Ile Ile Pro Thr Pro Val Leu Thr Ser Pro Gly Ala Val ProAla Pro Ile Ile Pro Thr Pro Val Leu Thr Ser Pro Gly Ala Val Pro

195 200 205195 200 205

Pro Leu Pro Ser Pro Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln ValPro Leu Pro Ser Pro Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln Val

210 215 220210 215 220

Arg Asp Leu Glu Glu Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala GluArg Asp Leu Glu Glu Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu

225 230 235 240225 230 235 240

Asp Lys Ala Lys Leu Lys Glu Leu Glu Lys His Lys Ile Gln Leu GluAsp Lys Ala Lys Leu Lys Glu Leu Glu Lys His Lys Ile Gln Leu Glu

245 250 255245 250 255

Gln Val Gln Glu Trp Lys Ser Lys Met Gln Glu Gln Gln Ala Asp LeuGln Val Gln Glu Trp Lys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu

260 265 270260 265 270

Gln Arg Arg Leu Lys Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu GluGln Arg Arg Leu Lys Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu

275 280 285275 280 285

Ala Lys Glu Arg Tyr Met Glu Glu Met Ala Asp Thr Ala Asp Ala IleAla Lys Glu Arg Tyr Met Glu Glu Met Ala Asp Thr Ala Asp Ala Ile

290 295 300290 295 300

Glu Met Ala Thr Leu Asp Lys Glu Met Ala Glu Glu Arg Ala Glu SerGlu Met Ala Thr Leu Asp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser

305 310 315 320305 310 315 320

Leu Gln Gln Glu Val Glu Ala Leu Lys Glu Arg Val Asp Glu Leu ThrLeu Gln Gln Glu Val Glu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr

325 330 335325 330 335

Thr Asp Leu Glu Ile Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser AspThr Asp Leu Glu Ile Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp

340 345 350340 345 350

Gly Ala Ala Ser Ser Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn AlaGly Ala Ala Ser Ser Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala

355 360 365355 360 365

Arg Leu Lys Asp Ala Leu Val Arg Met Arg Asp Leu Ser Ser Ser GluArg Leu Lys Asp Ala Leu Val Arg Met Arg Asp Leu Ser Ser Ser Glu

370 375 380370 375 380

Lys Gln Glu His Val Lys Leu Gln Lys Leu Met Glu Lys Lys Asn GlnLys Gln Glu His Val Lys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln

385 390 395 400385 390 395 400

Glu Leu Glu Val Val Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu LeuGlu Leu Glu Val Val Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu

405 410 415405 410 415

Ser Gln Ala Glu Ser Thr Ile Asp Glu Leu Lys Glu Gln Val Asp AlaSer Gln Ala Glu Ser Thr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala

420 425 430420 425 430

Ala Leu Gly Ala Glu Glu Met Val Glu Met Leu Thr Asp Arg Asn LeuAla Leu Gly Ala Glu Glu Met Val Glu Met Leu Thr Asp Arg Asn Leu

435 440 445435 440 445

Asn Leu Glu Glu Lys Val Arg Glu Leu Arg Glu Thr Val Gly Asp LeuAsn Leu Glu Glu Lys Val Arg Glu Leu Arg Glu Thr Val Gly Asp Leu

450 455 460450 455 460

Glu Ala Met Asn Glu Met Asn Asp Glu Leu Gln Glu Asn Ala Arg GluGlu Ala Met Asn Glu Met Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu

465 470 475 480465 470 475 480

Thr Glu Leu Glu Leu Arg Glu Gln Leu Asp Met Ala Gly Ala Arg ValThr Glu Leu Glu Leu Arg Glu Gln Leu Asp Met Ala Gly Ala Arg Val

485 490 495485 490 495

Arg Glu Ala Gln Lys Arg Val Glu Ala Ala Gln Glu Thr Val Ala AspArg Glu Ala Gln Lys Arg Val Glu Ala Ala Gln Glu Thr Val Ala Asp

500 505 510500 505 510

Tyr Gln Gln Thr Ile Lys Lys Tyr Arg Gln Leu Thr Ala His Leu GlnTyr Gln Gln Thr Ile Lys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln

515 520 525515 520 525

Asp Val Asn Arg Glu Leu Thr Asn Gln Gln Glu Ala Ser Val Glu ArgAsp Val Asn Arg Glu Leu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg

530 535 540530 535 540

Gln Gln Gln Pro Pro Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe AlaGln Gln Gln Pro Pro Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala

545 550 555 560545 550 555 560

Glu Thr Lys Ala His Ala Lys Ala Ile Glu Met Glu Leu Arg Gln MetGlu Thr Lys Ala His Ala Lys Ala Ile Glu Met Glu Leu Arg Gln Met

565 570 575565 570 575

Glu Val Ala Gln Ala Asn Arg His Met Ser Leu Leu Thr Ala Phe MetGlu Val Ala Gln Ala Asn Arg His Met Ser Leu Leu Thr Ala Phe Met

580 585 590580 585 590

Pro Asp Ser Phe Leu Arg Pro Gly Gly Asp His Asp Cys Val Leu ValPro Asp Ser Phe Leu Arg Pro Gly Gly Asp His Asp Cys Val Leu Val

595 600 605595 600 605

Leu Leu Leu Met Pro Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg LysLeu Leu Leu Met Pro Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys

610 615 620610 615 620

Gln Ala Gln Glu Lys Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg ProGln Ala Gln Glu Lys Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro

625 630 635 640625 630 635 640

Gly Leu Arg Gly Ala Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly LeuGly Leu Arg Gly Ala Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu

645 650 655645 650 655

Val Tyr Ser Leu Ser Leu Leu Gln Ala Thr Leu His Arg Tyr Glu HisVal Tyr Ser Leu Ser Leu Leu Gln Ala Thr Leu His Arg Tyr Glu His

660 665 670660 665 670

Ala Leu Ser Gln Cys Ser Val Asp Val Tyr Lys Lys Val Gly Ser LeuAla Leu Ser Gln Cys Ser Val Asp Val Tyr Lys Lys Val Gly Ser Leu

675 680 685675 680 685

Tyr Pro Glu Met Ser Ala His Glu Arg Ser Leu Asp Phe Leu Ile GluTyr Pro Glu Met Ser Ala His Glu Arg Ser Leu Asp Phe Leu Ile Glu

690 695 700690 695 700

Leu Leu His Lys Asp Gln Leu Asp Glu Thr Val Asn Val Glu Pro LeuLeu Leu His Lys Asp Gln Leu Asp Glu Thr Val Asn Val Glu Pro Leu

705 710 715 720705 710 715 720

Thr Lys Ala Ile Lys Tyr Tyr Gln His Leu Tyr Ser Ile His Leu AlaThr Lys Ala Ile Lys Tyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala

725 730 735725 730 735

Glu Gln Pro Glu Asp Cys Thr Met Gln Leu Ala Asp His Ile Lys PheGlu Gln Pro Glu Asp Cys Thr Met Gln Leu Ala Asp His Ile Lys Phe

740 745 750740 745 750

Thr Gln Ser Ala Leu Asp Cys Met Ser Val Glu Val Gly Arg Leu ArgThr Gln Ser Ala Leu Asp Cys Met Ser Val Glu Val Gly Arg Leu Arg

755 760 765755 760 765

Ala Phe Leu Gln Gly Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu LeuAla Phe Leu Gln Gly Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu

770 775 780770 775 780

Arg Asp Leu Glu Thr Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys LysArg Asp Leu Glu Thr Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys

785 790 795 800785 790 795 800

Ile Arg Arg Arg Met Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala AlaIle Arg Arg Arg Met Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala

805 810 815805 810 815

Leu Ala Phe Gly Pro Gln Val Ser Asp Thr Leu Leu Asp Cys Arg LysLeu Ala Phe Gly Pro Gln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys

820 825 830820 825 830

His Leu Thr Trp Val Val Ala Val Leu Gln Glu Val Ala Ala Ala AlaHis Leu Thr Trp Val Val Ala Val Leu Gln Glu Val Ala Ala Ala Ala

835 840 845835 840 845

Ala Gln Leu Ile Ala Pro Leu Ala Glu Asn Glu Gly Leu Leu Val AlaAla Gln Leu Ile Ala Pro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala

850 855 860850 855 860

Ala Leu Glu Glu Leu Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly ThrAla Leu Glu Glu Leu Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr

865 870 875 880865 870 875 880

Pro Ser Ser Ser Pro Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile LeuPro Ser Ser Ser Pro Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu

885 890 895885 890 895

Ile Ser Thr Met Asn Lys Leu Ala Thr Ala Met Gln Glu Gly Glu TyrIle Ser Thr Met Asn Lys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr

900 905 910900 905 910

Asp Ala Glu Arg Pro Pro Ser Lys Pro Pro Pro Val Glu Leu Arg AlaAsp Ala Glu Arg Pro Pro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala

915 920 925915 920 925

Ala Ala Leu Arg Ala Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu LysAla Ala Leu Arg Ala Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys

930 935 940930 935 940

Leu Glu Asp Arg Glu Thr Val Ile Lys Glu Leu Lys Lys Ser Leu LysLeu Glu Asp Arg Glu Thr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys

945 950 955 960945 950 955 960

Ile Lys Gly Glu Glu Leu Ser Glu Ala Asn Val Arg Leu Ser Leu LeuIle Lys Gly Glu Glu Leu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu

965 970 975965 970 975

Glu Lys Lys Leu Asp Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile GluGlu Lys Lys Leu Asp Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu

980 985 990980 985 990

Lys Val Gln Thr Arg Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys LysLys Val Gln Thr Arg Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys

995 1000 1005995 1000 1005

Glu Lys Glu Phe Glu Glu Thr Met Asp Ala Leu Gln Ala Asp IleGlu Lys Glu Phe Glu Glu Thr Met Asp Ala Leu Gln Ala Asp Ile

1010 1015 10201010 1015 1020

Asp Gln Leu Glu Ala Glu Lys Ala Glu Leu Lys Gln Arg Leu AsnAsp Gln Leu Glu Ala Glu Lys Ala Glu Leu Lys Gln Arg Leu Asn

1025 1030 10351025 1030 1035

Ser Gln Ser Lys Arg Thr Ile Glu Gly Leu Arg Gly Pro Pro ProSer Gln Ser Lys Arg Thr Ile Glu Gly Leu Arg Gly Pro Pro Pro

1040 1045 10501040 1045 1050

Ser Gly Ile Ala Thr Leu Val Ser Gly Ile Ala Gly Glu Glu GlnSer Gly Ile Ala Thr Leu Val Ser Gly Ile Ala Gly Glu Glu Gln

1055 1060 10651055 1060 1065

Gln Arg Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser Val Pro GlyGln Arg Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser Val Pro Gly

1070 1075 10801070 1075 1080

Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln Gln Ile SerPro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln Gln Ile Ser

1085 1090 10951085 1090 1095

Ala Met Arg Leu His Ile Ser Gln Leu Gln His Glu Asn Ser IleAla Met Arg Leu His Ile Ser Gln Leu Gln His Glu Asn Ser Ile

1100 1105 11101100 1105 1110

Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu Pro ProLeu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu Pro Pro

1115 1120 11251115 1120 1125

Leu His Val Ala Lys Leu Ser His Glu Gly Pro Gly Ser Glu LeuLeu His Val Ala Lys Leu Ser His Glu Gly Pro Gly Ser Glu Leu

1130 1135 11401130 1135 1140

Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu Leu Glu ThrPro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu Leu Glu Thr

1145 1150 11551145 1150 1155

Leu Asn Gln Leu Ser Thr His Thr His Val Val Asp Ile Thr ArgLeu Asn Gln Leu Ser Thr His Thr His Val Val Asp Ile Thr Arg

1160 1165 11701160 1165 1170

Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu Met Glu GlnThr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu Met Glu Gln

1175 1180 11851175 1180 1185

Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu Lys Leu LysVal Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu Lys Leu Lys

1190 1195 12001190 1195 1200

Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro Gly Ala ThrAsp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro Gly Ala Thr

1205 1210 12151205 1210 1215

Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala Phe Leu ArgVal Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala Phe Leu Arg

1220 1225 12301220 1225 1230

Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu GlyGlu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly

1235 1240 12451235 1240 1245

Lys Thr Leu Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala ThrLys Thr Leu Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala Thr

1250 1255 12601250 1255 1260

Ala Phe His Leu Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala ValAla Phe His Leu Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val

1265 1270 12751265 1270 1275

Lys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu Leu Arg Asp LeuLys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu

1280 1285 12901280 1285 1290

Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn His Pro His ValLeu Ser Glu Phe Asn Val Leu Lys Gln Val Asn His Pro His Val

1295 1300 13051295 1300 1305

Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro Leu Leu LeuIle Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro Leu Leu Leu

1310 1315 13201310 1315 1320

Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly Phe Leu ArgIle Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly Phe Leu Arg

1325 1330 13351325 1330 1335

Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser Gly Gly SerGlu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser Gly Gly Ser

1340 1345 13501340 1345 1350

Arg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg Ala Leu ThrArg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg Ala Leu Thr

1355 1360 13651355 1360 1365

Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser Gln Gly MetMet Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser Gln Gly Met

1370 1375 13801370 1375 1380

Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp Leu Ala AlaGln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp Leu Ala Ala

1385 1390 13951385 1390 1395

Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys Ile Ser AspArg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys Ile Ser Asp

1400 1405 14101400 1405 1410

Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val LysPhe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val Lys

1415 1420 14251415 1420 1425

Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile Glu SerArg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile Glu Ser

1430 1435 14401430 1435 1440

Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser PheLeu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser Phe

1445 1450 14551445 1450 1455

Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro TyrGly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr

1460 1465 14701460 1465 1470

Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr GlyPro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly

1475 1480 14851475 1480 1485

His Arg Met Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr ArgHis Arg Met Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg

1490 1495 15001490 1495 1500

Leu Met Leu Gln Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro ValLeu Met Leu Gln Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val

1505 1510 15151505 1510 1515

Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met Met Val Lys ArgPhe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met Met Val Lys Arg

1520 1525 15301520 1525 1530

Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro Ser Asp Ser LeuArg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro Ser Asp Ser Leu

1535 1540 15451535 1540 1545

Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr Pro Leu Val AspIle Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr Pro Leu Val Asp

1550 1555 15601550 1555 1560

Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro Ser Thr Trp IleCys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro Ser Thr Trp Ile

1565 1570 15751565 1570 1575

Glu Asn Lys Leu Tyr Gly Met Ser Asp Pro Asn Trp Pro Gly GluGlu Asn Lys Leu Tyr Gly Met Ser Asp Pro Asn Trp Pro Gly Glu

1580 1585 15901580 1585 1590

Ser Pro Val Pro Leu Thr Arg Ala Asp Gly Thr Asn Thr Gly PheSer Pro Val Pro Leu Thr Arg Ala Asp Gly Thr Asn Thr Gly Phe

1595 1600 16051595 1600 1605

Pro Arg Tyr Pro Asn Asp Ser Val Tyr Ala Asn Trp Met Leu SerPro Arg Tyr Pro Asn Asp Ser Val Tyr Ala Asn Trp Met Leu Ser

1610 1615 16201610 1615 1620

Pro Ser Ala Ala Lys Leu Met Asp Thr Phe Asp SerPro Ser Ala Ala Lys Leu Met Asp Thr Phe Asp Ser

1625 1630 16351625 1630 1635

<210> 3<210> 3

<211> 4782<211> 4782

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кодирующая последовательность слитого пептида<223> fusion peptide coding sequence

<400> 3<400> 3

atggcacaga gcaagaggca cgtgtacagc cggacgccca gcggcagcag gatgagtgcg 60atggcacaga gcaagaggca cgtgtacagc cggacgccca gcggcagcag gatgagtgcg 60

gaggcaagcg cccggcctct gcgggtgggc tcccgtgtag aggtgattgg aaaaggccac 120gaggcaagcg cccggcctct gcgggtgggc tcccgtgtag aggtgattgg aaaaggccac 120

cgaggcactg tggcctatgt tggagccaca ctgtttgcca ctggcaaatg ggtaggcgtg 180cgaggcactg tggcctatgt tggagccaca ctgtttgcca ctggcaaatg ggtaggcgtg 180

attctggatg aagcaaaggg caaaaatgat ggaactgttc aaggcaggaa gtacttcact 240attctggatg aagcaaaggg caaaaatgat ggaactgttc aaggcaggaa gtacttcact 240

tgtgatgaag ggcatggcat ctttgtgcgc cagtcccaga tccaggtatt tgaagatgga 300tgtgatgaag ggcatggcat ctttgtgcgc cagtcccaga tccaggtatt tgaagatgga 300

gcagatacta cttccccaga gacacctgat tcttctgctt caaaagtcct caaaagagag 360gcagatacta cttccccaga gacacctgat tcttctgctt caaaagtcct caaaagagag 360

ggaactgata caactgcaaa gactagcaaa ctgcggggac tgaagcctaa gaaggcaccg 420ggaactgata caactgcaaa gactagcaaa ctgcggggac tgaagcctaa gaaggcaccg 420

acagcccgaa agaccacaac tcggcgaccc aagcccacgc gcccagccag tactggggtg 480acagcccgaa agaccacaac tcggcgaccc aagcccacgc gcccagccag tactggggtg 480

gctggggcca gtagctccct gggcccctct ggctcagcgt cagcaggtga gctgagcagc 540gctggggcca gtagctccct gggcccctct ggctcagcgt cagcaggtga gctgagcagc 540

agtgagccca gcaccccggc tcagactccg ctggcagcac ccatcatccc cacgccggtc 600agtgagccca gcaccccggc tcagactccg ctggcagcac ccatcatccc cacgccggtc 600

ctcacctctc ctggagcagt ccccccgctt ccttccccat ccaaggagga ggagggacta 660ctcacctctc ctggagcagt ccccccgctt ccttccccat ccaaggagga ggagggacta 660

agggctcagg tgcgggacct ggaggagaaa ctagagaccc tgagactgaa acgggcagaa 720agggctcagg tgcgggacct ggaggagaaa ctagagaaccc tgagactgaa acgggcagaa 720

gacaaagcaa agctaaaaga gctggagaaa cacaaaatcc agctggagca ggtgcaggaa 780gacaaagcaa agctaaaaga gctggagaaa cacaaaatcc agctggagca ggtgcaggaa 780

tggaagagca aaatgcagga gcagcaggcc gacctgcagc ggcgcctcaa ggaggcgaga 840tggaagagca aaatgcagga gcagcaggcc gacctgcagc ggcgcctcaa ggaggcgaga 840

aaggaagcca aggaggcgct ggaggcaaag gaacgctata tggaggagat ggctgatact 900aaggaagcca aggaggcgct ggaggcaaag gaacgctata tggaggat ggctgatact 900

gctgatgcca ttgagatggc cactttggac aaggagatgg ctgaagagcg ggctgagtcc 960gctgatgcca ttgagatggc cactttggac aaggatgg ctgaagagcg ggctgagtcc 960

ctgcagcagg aggtggaggc actgaaggag cgggtggacg agctcactac tgacttagag 1020ctgcagcagg aggtggaggc actgaaggag cgggtggacg agctcactac tgacttagag 1020

atcctcaagg ctgagattga agagaagggc tcagatggcg ctgcatccag ttatcagctc 1080atcctcaagg ctgagattga agagaagggc tcagatggcg ctgcatccag ttatcagctc 1080

aagcagcttg aggagcagaa tgcccgcctg aaggatgccc tggtgaggat gcgggatctt 1140aagcagcttg aggagcagaa tgcccgcctg aaggatgccc tggtgaggat gcgggatctt 1140

tcttcctcag agaagcagga gcatgtgaag ctccagaagc tcatggaaaa gaagaaccaa 1200tcttcctcag agaagcagga gcatgtgaag ctccagaagc tcatggaaaa gaagaaccaa 1200

gagctggaag ttgtgaggca acagcgggag cgtctgcagg aggagctaag ccaggcagag 1260gagctggaag ttgtgaggca acagcgggag cgtctgcagg aggagctaag ccaggcagag 1260

agcaccattg atgagctcaa ggagcaggtg gatgctgctc tgggtgctga ggagatggtg 1320agcaccattg atgagctcaa ggagcaggtg gatgctgctc tgggtgctga ggagatggtg 1320

gagatgctga cagatcggaa cctgaatctg gaagagaaag tgcgcgagtt gagggagact 1380gagatgctga cagatcggaa cctgaatctg gaagagaaag tgcgcgagtt gagggagact 1380

gtgggagact tggaagcgat gaatgagatg aacgatgagc tgcaggagaa tgcacgtgag 1440gtgggagact tggaagcgat gaatgagatg aacgatgagc tgcaggagaa tgcacgtgag 1440

acagaactgg agctgcggga gcagctggac atggcaggcg cgcgggttcg tgaggcccag 1500acagaactgg agctgcggga gcagctggac atggcaggcg cgcgggttcg tgaggcccag 1500

aagcgtgtgg aggcagccca ggagacggtt gcagactacc agcagaccat caagaagtac 1560aagcgtgtgg aggcagccca ggagacggtt gcagactacc agcagaccat caagaagtac 1560

cgccagctga ccgcccatct acaggatgtg aatcgggaac tgacaaacca gcaggaagca 1620cgccagctga ccgcccatct acaggatgtg aatcgggaac tgacaaacca gcaggaagca 1620

tctgtggaga ggcaacagca gccacctcca gagacctttg acttcaaaat caagtttgct 1680tctgtggaga ggcaacagca gccacctcca gagacctttg acttcaaaat caagtttgct 1680

gagactaagg cccatgccaa ggcaattgag atggaattga ggcagatgga ggtggcccag 1740gagactaagg cccatgccaa ggcaattgag atggaattga ggcagatgga ggtggcccag 1740

gccaatcgac acatgtccct gctgacagcc ttcatgcctg acagcttcct tcggccaggt 1800gccaatcgac acatgtccct gctgacagcc ttcatgcctg acagcttcct tcggccaggt 1800

ggggaccatg actgcgttct ggtgctgttg ctcatgcctc gtctcatttg caaggcagag 1860ggggaccatg actgcgttct ggtgctgttg ctcatgcctc gtctcatttg caaggcagag 1860

ctgatccgga agcaggccca ggagaagttt gaactaagtg agaactgttc agagcggcct 1920ctgatccgga agcaggccca ggagaagttt gaactaagtg agaactgttc agagcggcct 1920

gggctgcgag gagctgctgg ggagcaactc agctttgctg ctggactggt gtactcgctg 1980gggctgcgag gagctgctgg ggagcaactc agctttgctg ctggactggt gtactcgctg 1980

agcctgctgc aggccacgct acaccgctat gagcatgccc tctctcagtg cagtgtggat 2040agcctgctgc aggccacgct acaccgctat gagcatgccc tctctcagtg cagtgtggat 2040

gtgtataaga aagtgggcag cctgtaccct gagatgagtg cccatgagcg ctccttggat 2100gtgtataaga aagtgggcag cctgtaccct gagatgagtg cccatgagcg ctccttggat 2100

ttcctcattg aactgctgca caaggatcag ctggatgaga ctgtcaatgt ggagcctctc 2160ttcctcattg aactgctgca caaggatcag ctggatgaga ctgtcaatgt ggagcctctc 2160

accaaggcca tcaagtacta tcagcatctg tacagcatcc accttgccga acagcctgag 2220accaaggcca tcaagtacta tcagcatctg tacagcatcc accttgccga acagcctgag 2220

gactgtacta tgcagctggc tgaccacatt aagttcacgc agagtgctct ggactgcatg 2280gactgtacta tgcagctggc tgaccacatt aagttcacgc agagtgctct ggactgcatg 2280

agtgtggagg taggacggct gcgtgccttc ttgcagggtg ggcaggaggc tacagatatt 2340agtgtggagg taggacggct gcgtgccttc ttgcagggtg ggcaggaggc tacagatatt 2340

gccctcctgc tccgggatct ggaaacttca tgcagtgaca tccgccagtt ctgcaagaag 2400gccctcctgc tccgggatct ggaaacttca tgcagtgaca tccgccagtt ctgcaagaag 2400

atccgaaggc gaatgccagg gacagatgct cctgggatcc cagctgcact ggcctttgga 2460atccgaaggc gaatgccagg gacagatgct cctgggatcc cagctgcact ggcctttgga 2460

ccacaggtat ctgacacgct cctagactgc aggaaacact tgacgtgggt cgtggctgtg 2520ccacaggtat ctgacacgct cctagactgc aggaaacact tgacgtgggt cgtggctgtg 2520

ctgcaggagg tggcagctgc tgctgcccag ctcattgccc cactggcaga gaatgagggg 2580ctgcaggagg tggcagctgc tgctgcccag ctcattgccc cactggcaga gaatgagggg 2580

ctacttgtgg ctgctctgga ggaactggct ttcaaagcaa gcgagcagat ctatgggacc 2640ctacttgtgg ctgctctgga ggaactggct ttcaaagcaa gcgagcagat ctatgggacc 2640

ccctccagca gcccctatga gtgtctgcgc cagtcatgca acatcctcat cagtaccatg 2700ccctccagca gcccctatga gtgtctgcgc cagtcatgca acatcctcat cagtaccatg 2700

aacaagctgg ccacagccat gcaggagggg gagtatgatg cagagcggcc ccccagcaag 2760aacaagctgg ccacagccat gcaggagggg gagtatgatg cagagcggcc ccccagcaag 2760

cctccaccgg ttgaactgcg ggctgctgcc cttcgtgcag agatcacaga tgctgaaggc 2820cctccaccgg ttgaactgcg ggctgctgcc cttcgtgcag agatcacaga tgctgaaggc 2820

ctgggtttga agctcgaaga tcgagagaca gttattaagg agttgaagaa gtcactcaag 2880ctgggtttga agctcgaaga tcgagagaca gttattaagg agttgaagaa gtcactcaag 2880

attaagggag aggagctaag tgaggccaat gtgcggctga gcctcctgga gaagaagttg 2940attaagggag aggagctaag tgaggccaat gtgcggctga gcctcctgga gaagaagttg 2940

gacagtgctg ccaaggatgc agatgagcgc atcgagaaag tccagactcg gctggaggag 3000gacagtgctg ccaaggatgc agatgagcgc atcgagaaag tccagactcg gctggaggag 3000

acccaggcac tgctgcgaaa gaaggagaaa gagtttgagg agacaatgga tgcactccag 3060acccaggcac tgctgcgaaa gaaggagaaa gagtttgagg agacaatgga tgcactccag 3060

gctgacatcg accagctgga ggcagagaag gcagaactaa agcagcgtct gaacagccag 3120gctgacatcg accagctgga ggcagagaag gcagaactaa agcagcgtct gaacagccag 3120

tccaaacgca cgattgaggg actccggggc cctcctcctt caggcattgc tactctggtc 3180tccaaacgca cgattgaggg actccggggc cctcctcctt caggcattgc tactctggtc 3180

tctggcattg ctggtgaaga acagcagcga ggagccatcc ctgggcaggc tccagggtct 3240tctggcattg ctggtgaaga acagcagcga ggagccatcc ctgggcaggc tccagggtct 3240

gtgccaggcc cagggctggt gaaggactca ccactgctgc ttcagcagat ctctgccatg 3300gtgccaggcc cagggctggt gaaggactca ccactgctgc ttcagcagat ctctgccatg 3300

aggctgcaca tctcccagct ccagcatgag aacagcatcc tcaagggagc ccagatgaag 3360aggctgcaca tctcccagct ccagcatgag aacagcatcc tcaagggagc ccagatgaag 3360

gcatccttgg catccctgcc ccctctgcat gttgcaaagc tatcccatga gggccctggc 3420gcatccttgg catccctgcc ccctctgcat gttgcaaagc tatcccatga gggccctggc 3420

agtgagttac cagctggagc gctgtatcgt aagaccagcc agctgctgga gacattgaat 3480agtgagttac cagctggagc gctgtatcgt aagaccagcc agctgctgga gacattgaat 3480

caattgagca cacacacgca cgtagtagac atcactcgca ccagccctgc tgccaagagc 3540caattgagca cacacacgca cgtagtagac atcactcgca ccagccctgc tgccaagagc 3540

ccgtcggccc aacttatgga gcaagtggct cagcttaagt ccctgagtga caccgtcgag 3600ccgtcggccc aacttatgga gcaagtggct cagcttaagt ccctgagtga caccgtcgag 3600

aagctcaagg atgaggtcct caaggagaca gtatctcagc gccctggagc cacagtaccc 3660aagctcaagg atgaggtcct caaggagaca gtatctcagc gccctggagc cacagtaccc 3660

actgactttg ccaccttccc ttcatcagcc ttcctcaggg aggatccaaa gtgggaattc 3720actgactttg ccaccttccc ttcatcagcc ttcctcaggg aggatccaaa gtgggaattc 3720

cctcggaaga acttggttct tggaaaaact ctaggagaag gcgaatttgg aaaagtggtc 3780cctcggaaga acttggttct tggaaaaact ctaggagaag gcgaatttgg aaaagtggtc 3780

aaggcaacgg ccttccatct gaaaggcaga gcagggtaca ccacggtggc cgtgaagatg 3840aaggcaacgg ccttccatct gaaaggcaga gcagggtaca ccacggtggc cgtgaagatg 3840

ctgaaagaga acgcctcccc gagtgagctt cgagacctgc tgtcagagtt caacgtcctg 3900ctgaaagaga acgcctcccc gagtgagctt cgagacctgc tgtcagagtt caacgtcctg 3900

aagcaggtca accacccaca tgtcatcaaa ttgtatgggg cctgcagcca ggatggcccg 3960aagcaggtca accacccaca tgtcatcaaa ttgtatgggg cctgcagcca ggatggcccg 3960

ctcctcctca tcgtggagta cgccaaatac ggctccctgc ggggcttcct ccgcgagagc 4020ctcctcctca tcgtggagta cgccaaatac ggctccctgc ggggcttcct ccgcgagagc 4020

cgcaaagtgg ggcctggcta cctgggcagt ggaggcagcc gcaactccag ctccctggac 4080cgcaaagtgg ggcctggcta cctgggcagt ggaggcagcc gcaactccag ctccctggac 4080

cacccggatg agcgggccct caccatgggc gacctcatct catttgcctg gcagatctca 4140cacccggatg agcgggccct caccatgggc gacctcatct catttgcctg gcagatctca 4140

caggggatgc agtatctggc cgagatgaag ctcgttcatc gggacttggc agccagaaac 4200caggggatgc agtatctggc cgagatgaag ctcgttcatc gggacttggc agccagaaac 4200

atcctggtag ctgaggggcg gaagatgaag atttcggatt tcggcttgtc ccgagatgtt 4260atcctggtag ctgaggggcg gaagatgaag atttcggatt tcggcttgtc ccgagatgtt 4260

tatgaagagg attcctacgt gaagaggagc cagggtcgga ttccagttaa atggatggca 4320tatgaagagg attcctacgt gaagaggagc cagggtcgga ttccagttaa atggatggca 4320

attgaatccc tttttgatca tatctacacc acgcaaagtg atgtatggtc ttttggtgtc 4380attgaatccc tttttgatca tatctacacc acgcaaagtg atgtatggtc ttttggtgtc 4380

ctgctgtggg agatcgtgac cctaggggga aacccctatc ctgggattcc tcctgagcgg 4440ctgctgtggg agatcgtgac cctaggggga aacccctatc ctgggattcc tcctgagcgg 4440

ctcttcaacc ttctgaagac cggccaccgg atggagaggc cagacaactg cagcgaggag 4500ctcttcaacc ttctgaagac cggccaccgg atggagaggc cagacaactg cagcgaggag 4500

atgtaccgcc tgatgctgca atgctggaag caggagccgg acaaaaggcc ggtgtttgcg 4560atgtaccgcc tgatgctgca atgctggaag caggagccgg acaaaaggcc ggtgtttgcg 4560

gacatcagca aagacctgga gaagatgatg gttaagagga gagactactt ggaccttgcg 4620gacatcagca aagacctgga gaagatgatg gttaagagga gagactactt ggaccttgcg 4620

gcgtccactc catctgactc cctgatttat gacgacggcc tctcagagga ggagacaccg 4680gcgtccactc catctgactc cctgatttat gacgacggcc tctcagagga ggagacaccg 4680

ctggtggact gtaataatgc ccccctccct cgagccctcc cttccacatg gattgaaaac 4740ctggtggact gtaataatgc ccccctccct cgagccctcc cttccacatg gattgaaaac 4740

aaactctatg gtagaatttc ccatgcattt actagattct ag 4782aaactctatg gtagaatttc ccatgcattt actagattct ag 4782

<210> 4<210> 4

<211> 1593<211> 1593

<212> белок<212> protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> слитый пептид<223> fusion peptide

<400> 4<400> 4

Met Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly SerMet Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly Ser

1. 5 10 151. 5 10 15

Arg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser ArgArg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg

20 25 3020 25 30

Val Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val GlyVal Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly

35 40 4535 40 45

Ala Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp GluAla Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu

50 55 6050 55 60

Ala Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe ThrAla Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr

65 70 75 8065 70 75 80

Cys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln ValCys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val

85 90 9585 90 95

Phe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser SerPhe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser

100 105 110100 105 110

Ala Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys ThrAla Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr

115 120 125115 120 125

Ser Lys Leu Arg Gly Leu Lys Pro Lys Lys Ala Pro Thr Ala Arg LysSer Lys Leu Arg Gly Leu Lys Pro Lys Lys Ala Pro Thr Ala Arg Lys

130 135 140130 135 140

Thr Thr Thr Arg Arg Pro Lys Pro Thr Arg Pro Ala Ser Thr Gly ValThr Thr Thr Arg Arg Pro Lys Pro Thr Arg Pro Ala Ser Thr Gly Val

145 150 155 160145 150 155 160

Ala Gly Ala Ser Ser Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala GlyAla Gly Ala Ser Ser Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly

165 170 175165 170 175

Glu Leu Ser Ser Ser Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu AlaGlu Leu Ser Ser Ser Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala

180 185 190180 185 190

Ala Pro Ile Ile Pro Thr Pro Val Leu Thr Ser Pro Gly Ala Val ProAla Pro Ile Ile Pro Thr Pro Val Leu Thr Ser Pro Gly Ala Val Pro

195 200 205195 200 205

Pro Leu Pro Ser Pro Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln ValPro Leu Pro Ser Pro Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln Val

210 215 220210 215 220

Arg Asp Leu Glu Glu Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala GluArg Asp Leu Glu Glu Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu

225 230 235 240225 230 235 240

Asp Lys Ala Lys Leu Lys Glu Leu Glu Lys His Lys Ile Gln Leu GluAsp Lys Ala Lys Leu Lys Glu Leu Glu Lys His Lys Ile Gln Leu Glu

245 250 255245 250 255

Gln Val Gln Glu Trp Lys Ser Lys Met Gln Glu Gln Gln Ala Asp LeuGln Val Gln Glu Trp Lys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu

260 265 270260 265 270

Gln Arg Arg Leu Lys Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu GluGln Arg Arg Leu Lys Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu

275 280 285275 280 285

Ala Lys Glu Arg Tyr Met Glu Glu Met Ala Asp Thr Ala Asp Ala IleAla Lys Glu Arg Tyr Met Glu Glu Met Ala Asp Thr Ala Asp Ala Ile

290 295 300290 295 300

Glu Met Ala Thr Leu Asp Lys Glu Met Ala Glu Glu Arg Ala Glu SerGlu Met Ala Thr Leu Asp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser

305 310 315 320305 310 315 320

Leu Gln Gln Glu Val Glu Ala Leu Lys Glu Arg Val Asp Glu Leu ThrLeu Gln Gln Glu Val Glu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr

325 330 335325 330 335

Thr Asp Leu Glu Ile Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser AspThr Asp Leu Glu Ile Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp

340 345 350340 345 350

Gly Ala Ala Ser Ser Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn AlaGly Ala Ala Ser Ser Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala

355 360 365355 360 365

Arg Leu Lys Asp Ala Leu Val Arg Met Arg Asp Leu Ser Ser Ser GluArg Leu Lys Asp Ala Leu Val Arg Met Arg Asp Leu Ser Ser Ser Glu

370 375 380370 375 380

Lys Gln Glu His Val Lys Leu Gln Lys Leu Met Glu Lys Lys Asn GlnLys Gln Glu His Val Lys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln

385 390 395 400385 390 395 400

Glu Leu Glu Val Val Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu LeuGlu Leu Glu Val Val Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu

405 410 415405 410 415

Ser Gln Ala Glu Ser Thr Ile Asp Glu Leu Lys Glu Gln Val Asp AlaSer Gln Ala Glu Ser Thr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala

420 425 430420 425 430

Ala Leu Gly Ala Glu Glu Met Val Glu Met Leu Thr Asp Arg Asn LeuAla Leu Gly Ala Glu Glu Met Val Glu Met Leu Thr Asp Arg Asn Leu

435 440 445435 440 445

Asn Leu Glu Glu Lys Val Arg Glu Leu Arg Glu Thr Val Gly Asp LeuAsn Leu Glu Glu Lys Val Arg Glu Leu Arg Glu Thr Val Gly Asp Leu

450 455 460450 455 460

Glu Ala Met Asn Glu Met Asn Asp Glu Leu Gln Glu Asn Ala Arg GluGlu Ala Met Asn Glu Met Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu

465 470 475 480465 470 475 480

Thr Glu Leu Glu Leu Arg Glu Gln Leu Asp Met Ala Gly Ala Arg ValThr Glu Leu Glu Leu Arg Glu Gln Leu Asp Met Ala Gly Ala Arg Val

485 490 495485 490 495

Arg Glu Ala Gln Lys Arg Val Glu Ala Ala Gln Glu Thr Val Ala AspArg Glu Ala Gln Lys Arg Val Glu Ala Ala Gln Glu Thr Val Ala Asp

500 505 510500 505 510

Tyr Gln Gln Thr Ile Lys Lys Tyr Arg Gln Leu Thr Ala His Leu GlnTyr Gln Gln Thr Ile Lys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln

515 520 525515 520 525

Asp Val Asn Arg Glu Leu Thr Asn Gln Gln Glu Ala Ser Val Glu ArgAsp Val Asn Arg Glu Leu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg

530 535 540530 535 540

Gln Gln Gln Pro Pro Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe AlaGln Gln Gln Pro Pro Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala

545 550 555 560545 550 555 560

Glu Thr Lys Ala His Ala Lys Ala Ile Glu Met Glu Leu Arg Gln MetGlu Thr Lys Ala His Ala Lys Ala Ile Glu Met Glu Leu Arg Gln Met

565 570 575565 570 575

Glu Val Ala Gln Ala Asn Arg His Met Ser Leu Leu Thr Ala Phe MetGlu Val Ala Gln Ala Asn Arg His Met Ser Leu Leu Thr Ala Phe Met

580 585 590580 585 590

Pro Asp Ser Phe Leu Arg Pro Gly Gly Asp His Asp Cys Val Leu ValPro Asp Ser Phe Leu Arg Pro Gly Gly Asp His Asp Cys Val Leu Val

595 600 605595 600 605

Leu Leu Leu Met Pro Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg LysLeu Leu Leu Met Pro Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys

610 615 620610 615 620

Gln Ala Gln Glu Lys Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg ProGln Ala Gln Glu Lys Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro

625 630 635 640625 630 635 640

Gly Leu Arg Gly Ala Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly LeuGly Leu Arg Gly Ala Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu

645 650 655645 650 655

Val Tyr Ser Leu Ser Leu Leu Gln Ala Thr Leu His Arg Tyr Glu HisVal Tyr Ser Leu Ser Leu Leu Gln Ala Thr Leu His Arg Tyr Glu His

660 665 670660 665 670

Ala Leu Ser Gln Cys Ser Val Asp Val Tyr Lys Lys Val Gly Ser LeuAla Leu Ser Gln Cys Ser Val Asp Val Tyr Lys Lys Val Gly Ser Leu

675 680 685675 680 685

Tyr Pro Glu Met Ser Ala His Glu Arg Ser Leu Asp Phe Leu Ile GluTyr Pro Glu Met Ser Ala His Glu Arg Ser Leu Asp Phe Leu Ile Glu

690 695 700690 695 700

Leu Leu His Lys Asp Gln Leu Asp Glu Thr Val Asn Val Glu Pro LeuLeu Leu His Lys Asp Gln Leu Asp Glu Thr Val Asn Val Glu Pro Leu

705 710 715 720705 710 715 720

Thr Lys Ala Ile Lys Tyr Tyr Gln His Leu Tyr Ser Ile His Leu AlaThr Lys Ala Ile Lys Tyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala

725 730 735725 730 735

Glu Gln Pro Glu Asp Cys Thr Met Gln Leu Ala Asp His Ile Lys PheGlu Gln Pro Glu Asp Cys Thr Met Gln Leu Ala Asp His Ile Lys Phe

740 745 750740 745 750

Thr Gln Ser Ala Leu Asp Cys Met Ser Val Glu Val Gly Arg Leu ArgThr Gln Ser Ala Leu Asp Cys Met Ser Val Glu Val Gly Arg Leu Arg

755 760 765755 760 765

Ala Phe Leu Gln Gly Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu LeuAla Phe Leu Gln Gly Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu

770 775 780770 775 780

Arg Asp Leu Glu Thr Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys LysArg Asp Leu Glu Thr Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys

785 790 795 800785 790 795 800

Ile Arg Arg Arg Met Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala AlaIle Arg Arg Arg Met Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala

805 810 815805 810 815

Leu Ala Phe Gly Pro Gln Val Ser Asp Thr Leu Leu Asp Cys Arg LysLeu Ala Phe Gly Pro Gln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys

820 825 830820 825 830

His Leu Thr Trp Val Val Ala Val Leu Gln Glu Val Ala Ala Ala AlaHis Leu Thr Trp Val Val Ala Val Leu Gln Glu Val Ala Ala Ala Ala

835 840 845835 840 845

Ala Gln Leu Ile Ala Pro Leu Ala Glu Asn Glu Gly Leu Leu Val AlaAla Gln Leu Ile Ala Pro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala

850 855 860850 855 860

Ala Leu Glu Glu Leu Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly ThrAla Leu Glu Glu Leu Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr

865 870 875 880865 870 875 880

Pro Ser Ser Ser Pro Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile LeuPro Ser Ser Ser Pro Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu

885 890 895885 890 895

Ile Ser Thr Met Asn Lys Leu Ala Thr Ala Met Gln Glu Gly Glu TyrIle Ser Thr Met Asn Lys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr

900 905 910900 905 910

Asp Ala Glu Arg Pro Pro Ser Lys Pro Pro Pro Val Glu Leu Arg AlaAsp Ala Glu Arg Pro Pro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala

915 920 925915 920 925

Ala Ala Leu Arg Ala Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu LysAla Ala Leu Arg Ala Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys

930 935 940930 935 940

Leu Glu Asp Arg Glu Thr Val Ile Lys Glu Leu Lys Lys Ser Leu LysLeu Glu Asp Arg Glu Thr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys

945 950 955 960945 950 955 960

Ile Lys Gly Glu Glu Leu Ser Glu Ala Asn Val Arg Leu Ser Leu LeuIle Lys Gly Glu Glu Leu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu

965 970 975965 970 975

Glu Lys Lys Leu Asp Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile GluGlu Lys Lys Leu Asp Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu

980 985 990980 985 990

Lys Val Gln Thr Arg Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys LysLys Val Gln Thr Arg Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys

995 1000 1005995 1000 1005

Glu Lys Glu Phe Glu Glu Thr Met Asp Ala Leu Gln Ala Asp IleGlu Lys Glu Phe Glu Glu Thr Met Asp Ala Leu Gln Ala Asp Ile

1010 1015 10201010 1015 1020

Asp Gln Leu Glu Ala Glu Lys Ala Glu Leu Lys Gln Arg Leu AsnAsp Gln Leu Glu Ala Glu Lys Ala Glu Leu Lys Gln Arg Leu Asn

1025 1030 10351025 1030 1035

Ser Gln Ser Lys Arg Thr Ile Glu Gly Leu Arg Gly Pro Pro ProSer Gln Ser Lys Arg Thr Ile Glu Gly Leu Arg Gly Pro Pro Pro

1040 1045 10501040 1045 1050

Ser Gly Ile Ala Thr Leu Val Ser Gly Ile Ala Gly Glu Glu GlnSer Gly Ile Ala Thr Leu Val Ser Gly Ile Ala Gly Glu Glu Gln

1055 1060 10651055 1060 1065

Gln Arg Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser Val Pro GlyGln Arg Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser Val Pro Gly

1070 1075 10801070 1075 1080

Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln Gln Ile SerPro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln Gln Ile Ser

1085 1090 10951085 1090 1095

Ala Met Arg Leu His Ile Ser Gln Leu Gln His Glu Asn Ser IleAla Met Arg Leu His Ile Ser Gln Leu Gln His Glu Asn Ser Ile

1100 1105 11101100 1105 1110

Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu Pro ProLeu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu Pro Pro

1115 1120 11251115 1120 1125

Leu His Val Ala Lys Leu Ser His Glu Gly Pro Gly Ser Glu LeuLeu His Val Ala Lys Leu Ser His Glu Gly Pro Gly Ser Glu Leu

1130 1135 11401130 1135 1140

Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu Leu Glu ThrPro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu Leu Glu Thr

1145 1150 11551145 1150 1155

Leu Asn Gln Leu Ser Thr His Thr His Val Val Asp Ile Thr ArgLeu Asn Gln Leu Ser Thr His Thr His Val Val Asp Ile Thr Arg

1160 1165 11701160 1165 1170

Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu Met Glu GlnThr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu Met Glu Gln

1175 1180 11851175 1180 1185

Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu Lys Leu LysVal Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu Lys Leu Lys

1190 1195 12001190 1195 1200

Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro Gly Ala ThrAsp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro Gly Ala Thr

1205 1210 12151205 1210 1215

Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala Phe Leu ArgVal Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala Phe Leu Arg

1220 1225 12301220 1225 1230

Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu GlyGlu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly

1235 1240 12451235 1240 1245

Lys Thr Leu Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala ThrLys Thr Leu Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala Thr

1250 1255 12601250 1255 1260

Ala Phe His Leu Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala ValAla Phe His Leu Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val

1265 1270 12751265 1270 1275

Lys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu Leu Arg Asp LeuLys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu

1280 1285 12901280 1285 1290

Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn His Pro His ValLeu Ser Glu Phe Asn Val Leu Lys Gln Val Asn His Pro His Val

1295 1300 13051295 1300 1305

Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro Leu Leu LeuIle Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro Leu Leu Leu

1310 1315 13201310 1315 1320

Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly Phe Leu ArgIle Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly Phe Leu Arg

1325 1330 13351325 1330 1335

Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser Gly Gly SerGlu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser Gly Gly Ser

1340 1345 13501340 1345 1350

Arg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg Ala Leu ThrArg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg Ala Leu Thr

1355 1360 13651355 1360 1365

Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser Gln Gly MetMet Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser Gln Gly Met

1370 1375 13801370 1375 1380

Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp Leu Ala AlaGln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp Leu Ala Ala

1385 1390 13951385 1390 1395

Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys Ile Ser AspArg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys Ile Ser Asp

1400 1405 14101400 1405 1410

Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val LysPhe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val Lys

1415 1420 14251415 1420 1425

Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile Glu SerArg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile Glu Ser

1430 1435 14401430 1435 1440

Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser PheLeu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser Phe

1445 1450 14551445 1450 1455

Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro TyrGly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr

1460 1465 14701460 1465 1470

Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr GlyPro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly

1475 1480 14851475 1480 1485

His Arg Met Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr ArgHis Arg Met Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg

1490 1495 15001490 1495 1500

Leu Met Leu Gln Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro ValLeu Met Leu Gln Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val

1505 1510 15151505 1510 1515

Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met Met Val Lys ArgPhe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met Met Val Lys Arg

1520 1525 15301520 1525 1530

Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro Ser Asp Ser LeuArg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro Ser Asp Ser Leu

1535 1540 15451535 1540 1545

Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr Pro Leu Val AspIle Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr Pro Leu Val Asp

1550 1555 15601550 1555 1560

Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro Ser Thr Trp IleCys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro Ser Thr Trp Ile

1565 1570 15751565 1570 1575

Glu Asn Lys Leu Tyr Gly Arg Ile Ser His Ala Phe Thr Arg PheGlu Asn Lys Leu Tyr Gly Arg Ile Ser His Ala Phe Thr Arg Phe

1580 1585 15901580 1585 1590

<210> 5<210> 5

<211> 4506<211> 4506

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кодирующая последовательность слитого пептида<223> fusion peptide coding sequence

<400> 5<400> 5

atgatgagac aggcaccgac agcccgaaag accacaactc ggcgacccaa gcccacgcgc 60atgatgagac aggcaccgac agcccgaaag accacaactc ggcgacccaa gcccacgcgc 60

ccagccagta ctggggtggc tggggccagt agctccctgg gcccctctgg ctcagcgtca 120ccagccagta ctggggtggc tggggccagt agctccctgg gcccctctgg ctcagcgtca 120

gcaggtgagc tgagcagcag tgagcccagc accccggctc agactccgct ggcagcaccc 180gcaggtgagc tgagcagcag tgagcccagc accccggctc agactccgct ggcagcaccc 180

atcatcccca cgccggtcct cacctctcct ggagcagtcc ccccgcttcc ttccccatcc 240atcatcccca cgccggtcct cacctctcct ggagcagtcc ccccgcttcc ttccccatcc 240

aaggaggagg agggactaag ggctcaggtg cgggacctgg aggagaaact agagaccctg 300aaggaggagg agggactaag ggctcaggtg cgggacctgg aggagaaact agagaccctg 300

agactgaaac gggcagaaga caaagcaaag ctaaaagagc tggagaaaca caaaatccag 360agactgaaac gggcagaaga caaagcaaag ctaaaagagc tggagaaaca caaaatccag 360

ctggagcagg tgcaggaatg gaagagcaaa atgcaggagc agcaggccga cctgcagcgg 420ctggagcagg tgcaggaatg gaagagcaaa atgcaggagc agcaggccga cctgcagcgg 420

cgcctcaagg aggcgagaaa ggaagccaag gaggcgctgg aggcaaagga acgctatatg 480cgcctcaagg aggcgagaaa ggaagccaag gaggcgctgg aggcaaagga acgctatatg 480

gaggagatgg ctgatactgc tgatgccatt gagatggcca ctttggacaa ggagatggct 540gaggagatgg ctgatactgc tgatgccatt gagatggcca ctttggacaa ggagatggct 540

gaagagcggg ctgagtccct gcagcaggag gtggaggcac tgaaggagcg ggtggacgag 600gaagagcggg ctgagtccct gcagcaggag gtggaggcac tgaaggagcg ggtggacgag 600

ctcactactg acttagagat cctcaaggct gagattgaag agaagggctc agatggcgct 660ctcactactg acttagagat cctcaaggct gagattgaag agaagggctc agatggcgct 660

gcatccagtt atcagctcaa gcagcttgag gagcagaatg cccgcctgaa ggatgccctg 720gcatccagtt atcagctcaa gcagcttgag gagcagaatg cccgcctgaa ggatgccctg 720

gtgaggatgc gggatctttc ttcctcagag aagcaggagc atgtgaagct ccagaagctc 780gtgaggatgc gggatctttc ttcctcagag aagcaggagc atgtgaagct ccagaagctc 780

atggaaaaga agaaccaaga gctggaagtt gtgaggcaac agcgggagcg tctgcaggag 840atggaaaaga agaaccaaga gctggaagtt gtgaggcaac agcgggagcg tctgcaggag 840

gagctaagcc aggcagagag caccattgat gagctcaagg agcaggtgga tgctgctctg 900gagctaagcc aggcagagag caccattgat gagctcaagg agcaggtgga tgctgctctg 900

ggtgctgagg agatggtgga gatgctgaca gatcggaacc tgaatctgga agagaaagtg 960ggtgctgagg agatggtgga gatgctgaca gatcggaacc tgaatctgga agagaaagtg 960

cgcgagttga gggagactgt gggagacttg gaagcgatga atgagatgaa cgatgagctg 1020cgcgagttga gggagactgt gggagacttg gaagcgatga atgagatgaa cgatgagctg 1020

caggagaatg cacgtgagac agaactggag ctgcgggagc agctggacat ggcaggcgcg 1080caggagaatg cacgtgagac agaactggag ctgcgggagc agctggacat ggcaggcgcg 1080

cgggttcgtg aggcccagaa gcgtgtggag gcagcccagg agacggttgc agactaccag 1140cgggttcgtg aggcccagaa gcgtgtggag gcagcccagg agacggttgc agactaccag 1140

cagaccatca agaagtaccg ccagctgacc gcccatctac aggatgtgaa tcgggaactg 1200cagaccatca agaagtaccg ccagctgacc gcccatctac aggatgtgaa tcgggaactg 1200

acaaaccagc aggaagcatc tgtggagagg caacagcagc cacctccaga gacctttgac 1260acaaaccagc aggaagcatc tgtggagagg caacagcagc cacctccaga gacctttgac 1260

ttcaaaatca agtttgctga gactaaggcc catgccaagg caattgagat ggaattgagg 1320ttcaaaatca agtttgctga gactaaggcc catgccaagg caattgagat ggaattgagg 1320

cagatggagg tggcccaggc caatcgacac atgtccctgc tgacagcctt catgcctgac 1380cagatggagg tggcccaggc caatcgacac atgtccctgc tgacagcctt catgcctgac 1380

agcttccttc ggccaggtgg ggaccatgac tgcgttctgg tgctgttgct catgcctcgt 1440agcttccttc ggccaggtgg ggaccatgac tgcgttctgg tgctgttgct catgcctcgt 1440

ctcatttgca aggcagagct gatccggaag caggcccagg agaagtttga actaagtgag 1500ctcatttgca aggcagagct gatccggaag caggcccagg agaagtttga actaagtgag 1500

aactgttcag agcggcctgg gctgcgagga gctgctgggg agcaactcag ctttgctgct 1560aactgttcag agcggcctgg gctgcgagga gctgctgggg agcaactcag ctttgctgct 1560

ggactggtgt actcgctgag cctgctgcag gccacgctac accgctatga gcatgccctc 1620ggactggtgt actcgctgag cctgctgcag gccacgctac accgctatga gcatgccctc 1620

tctcagtgca gtgtggatgt gtataagaaa gtgggcagcc tgtaccctga gatgagtgcc 1680tctcagtgca gtgtggatgt gtataagaaa gtgggcagcc tgtaccctga gatgagtgcc 1680

catgagcgct ccttggattt cctcattgaa ctgctgcaca aggatcagct ggatgagact 1740catgagcgct ccttggattt cctcattgaa ctgctgcaca aggatcagct ggatgagact 1740

gtcaatgtgg agcctctcac caaggccatc aagtactatc agcatctgta cagcatccac 1800gtcaatgtgg agcctctcac caaggccatc aagtactatc agcatctgta cagcatccac 1800

cttgccgaac agcctgagga ctgtactatg cagctggctg accacattaa gttcacgcag 1860cttgccgaac agcctgagga ctgtactatg cagctggctg accacattaa gttcacgcag 1860

agtgctctgg actgcatgag tgtggaggta ggacggctgc gtgccttctt gcagggtggg 1920agtgctctgg actgcatgag tgtggaggta ggacggctgc gtgccttctt gcagggtggg 1920

caggaggcta cagatattgc cctcctgctc cgggatctgg aaacttcatg cagtgacatc 1980caggaggcta cagatattgc cctcctgctc cgggatctgg aaacttcatg cagtgacatc 1980

cgccagttct gcaagaagat ccgaaggcga atgccaggga cagatgctcc tgggatccca 2040cgccagttct gcaagaagat ccgaaggcga atgccaggga cagatgctcc tgggatccca 2040

gctgcactgg cctttggacc acaggtatct gacacgctcc tagactgcag gaaacacttg 2100gctgcactgg cctttggacc acaggtatct gacacgctcc tagactgcag gaaacacttg 2100

acgtgggtcg tggctgtgct gcaggaggtg gcagctgctg ctgcccagct cattgcccca 2160acgtgggtcg tggctgtgct gcaggaggtg gcagctgctg ctgcccagct cattgcccca 2160

ctggcagaga atgaggggct acttgtggct gctctggagg aactggcttt caaagcaagc 2220ctggcagaga atgaggggct acttgtggct gctctggagg aactggcttt caaagcaagc 2220

gagcagatct atgggacccc ctccagcagc ccctatgagt gtctgcgcca gtcatgcaac 2280gagcagatct atgggacccc ctccagcagc ccctatgagt gtctgcgcca gtcatgcaac 2280

atcctcatca gtaccatgaa caagctggcc acagccatgc aggaggggga gtatgatgca 2340atcctcatca gtaccatgaa caagctggcc acagccatgc aggaggggga gtatgatgca 2340

gagcggcccc ccagcaagcc tccaccggtt gaactgcggg ctgctgccct tcgtgcagag 2400gagcggcccc ccagcaagcc tccaccggtt gaactgcggg ctgctgccct tcgtgcagag 2400

atcacagatg ctgaaggcct gggtttgaag ctcgaagatc gagagacagt tattaaggag 2460atcacagatg ctgaaggcct gggtttgaag ctcgaagatc gagagacagt tattaaggag 2460

ttgaagaagt cactcaagat taagggagag gagctaagtg aggccaatgt gcggctgagc 2520ttgaagaagt cactcaagat taagggagag gagctaagtg aggccaatgt gcggctgagc 2520

ctcctggaga agaagttgga cagtgctgcc aaggatgcag atgagcgcat cgagaaagtc 2580ctcctggaga agaagttgga cagtgctgcc aaggatgcag atgagcgcat cgagaaagtc 2580

cagactcggc tggaggagac ccaggcactg ctgcgaaaga aggagaaaga gtttgaggag 2640cagactcggc tggagaggagac ccaggcactg ctgcgaaaga aggagaaaga gtttgaggag 2640

acaatggatg cactccaggc tgacatcgac cagctggagg cagagaaggc agaactaaag 2700acaatggatg cactccaggc tgacatcgac cagctggagg cagagaaggc agaactaaag 2700

cagcgtctga acagccagtc caaacgcacg attgagggac tccggggccc tcctccttca 2760cagcgtctga acagccagtc caaacgcacg attgagggac tccggggccc tcctccttca 2760

ggcattgcta ctctggtctc tggcattgct ggtgaagaac agcagcgagg agccatccct 2820ggcattgcta ctctggtctc tggcattgct ggtgaagaac agcagcgagg agccatccct 2820

gggcaggctc cagggtctgt gccaggccca gggctggtga aggactcacc actgctgctt 2880gggcaggctc cagggtctgt gccaggccca gggctggtga aggactcacc actgctgctt 2880

cagcagatct ctgccatgag gctgcacatc tcccagctcc agcatgagaa cagcatcctc 2940cagcagatct ctgccatgag gctgcacatc tcccagctcc agcatgagaa cagcatcctc 2940

aagggagccc agatgaaggc atccttggca tccctgcccc ctctgcatgt tgcaaagcta 3000aagggagccc agatgaaggc atccttggca tccctgcccc ctctgcatgt tgcaaagcta 3000

tcccatgagg gccctggcag tgagttacca gctggagcgc tgtatcgtaa gaccagccag 3060tcccatgagg gccctggcag tgagttacca gctggagcgc tgtatcgtaa gaccagccag 3060

ctgctggaga cattgaatca attgagcaca cacacgcacg tagtagacat cactcgcacc 3120ctgctggaga cattgaatca attgagcaca cacacgcacg tagtagacat cactcgcacc 3120

agccctgctg ccaagagccc gtcggcccaa cttatggagc aagtggctca gcttaagtcc 3180agccctgctg ccaagagccc gtcggcccaa cttatggagc aagtggctca gcttaagtcc 3180

ctgagtgaca ccgtcgagaa gctcaaggat gaggtcctca aggagacagt atctcagcgc 3240ctgagtgaca ccgtcgagaa gctcaaggat gaggtcctca aggagacagt atctcagcgc 3240

cctggagcca cagtacccac tgactttgcc accttccctt catcagcctt cctcagggag 3300cctggagcca cagtacccac tgactttgcc accttccctt catcagcctt cctcagggag 3300

gatccaaagt gggaattccc tcggaagaac ttggttcttg gaaaaactct aggagaaggc 3360gatccaaagt gggaattccc tcggaagaac ttggttcttg gaaaaactct aggagaaggc 3360

gaatttggaa aagtggtcaa ggcaacggcc ttccatctga aaggcagagc agggtacacc 3420gaatttggaa aagtggtcaa ggcaacggcc ttccatctga aaggcagagc agggtacacc 3420

acggtggccg tgaagatgct gaaagagaac gcctccccga gtgagcttcg agacctgctg 3480acggtggccg tgaagatgct gaaagagaac gcctccccga gtgagcttcg agacctgctg 3480

tcagagttca acgtcctgaa gcaggtcaac cacccacatg tcatcaaatt gtatggggcc 3540tcagagttca acgtcctgaa gcaggtcaac cacccacatg tcatcaaatt gtatggggcc 3540

tgcagccagg atggcccgct cctcctcatc gtggagtacg ccaaatacgg ctccctgcgg 3600tgcagccagg atggcccgct cctcctcatc gtggagtacg ccaaatacgg ctccctgcgg 3600

ggcttcctcc gcgagagccg caaagtgggg cctggctacc tgggcagtgg aggcagccgc 3660ggcttcctcc gcgagagccg caaagtgggg cctggctacc tgggcagtgg aggcagccgc 3660

aactccagct ccctggacca cccggatgag cgggccctca ccatgggcga cctcatctca 3720aactccagct ccctggacca cccggatgag cgggccctca ccatgggcga cctcatctca 3720

tttgcctggc agatctcaca ggggatgcag tatctggccg agatgaagct cgttcatcgg 3780tttgcctggc agatctcaca ggggatgcag tatctggccg agatgaagct cgttcatcgg 3780

gacttggcag ccagaaacat cctggtagct gaggggcgga agatgaagat ttcggatttc 3840gacttggcag ccagaaacat cctggtagct gaggggcgga agatgaagat ttcggatttc 3840

ggcttgtccc gagatgttta tgaagaggat tcctacgtga agaggagcca gggtcggatt 3900ggcttgtccc gagatgttta tgaagaggat tcctacgtga agaggagcca gggtcggatt 3900

ccagttaaat ggatggcaat tgaatccctt tttgatcata tctacaccac gcaaagtgat 3960ccagttaaat ggatggcaat tgaatccctt tttgatcata tctacaccac gcaaagtgat 3960

gtatggtctt ttggtgtcct gctgtgggag atcgtgaccc tagggggaaa cccctatcct 4020gtatggtctt ttggtgtcct gctgtgggag atcgtgaccc tagggggaaa cccctatcct 4020

gggattcctc ctgagcggct cttcaacctt ctgaagaccg gccaccggat ggagaggcca 4080gggattcctc ctgagcggct cttcaacctt ctgaagaccg gccaccggat ggagaggcca 4080

gacaactgca gcgaggagat gtaccgcctg atgctgcaat gctggaagca ggagccggac 4140gacaactgca gcgaggagat gtaccgcctg atgctgcaat gctggaagca ggagccggac 4140

aaaaggccgg tgtttgcgga catcagcaaa gacctggaga agatgatggt taagaggaga 4200aaaaggccgg tgtttgcgga catcagcaaa gacctggaga agatgatggt taagaggaga 4200

gactacttgg accttgcggc gtccactcca tctgactccc tgatttatga cgacggcctc 4260gactacttgg accttgcggc gtccactcca tctgactccc tgatttatga cgacggcctc 4260

tcagaggagg agacaccgct ggtggactgt aataatgccc ccctccctcg agccctccct 4320tcagaggagg agacaccgct ggtggactgt aataatgccc ccctccctcg agccctccct 4320

tccacatgga ttgaaaacaa actctatggc atgtcagacc cgaactggcc tggagagagt 4380tccacatgga ttgaaaacaa actctatggc atgtcagacc cgaactggcc tggagagagt 4380

cctgtaccac tcacgagagc tgatggcact aacactgggt ttccaagata tccaaatgat 4440cctgtaccac tcacgagagc tgatggcact aacactgggt ttccaagata tccaaatgat 4440

agtgtatatg ctaactggat gctttcaccc tcagcggcaa aattaatgga cacgtttgat 4500agtgtatatg ctaactggat gctttcaccc tcagcggcaa aattaatgga cacgtttgat 4500

agttaa 4506agtaa 4506

<210> 6<210> 6

<211> 1501<211> 1501

<212> белок<212> protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> слитый пептид<223> fusion peptide

<400> 6<400> 6

Met Met Arg Gln Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg ProMet Met Arg Gln Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg Pro

1. 5 10 151. 5 10 15

Lys Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser SerLys Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser Ser

20 25 3020 25 30

Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser GluLeu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser Glu

35 40 4535 40 45

Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro ThrPro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro Thr

50 55 6050 55 60

Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro SerPro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro Ser

65 70 75 8065 70 75 80

Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu LysLys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu Lys

85 90 9585 90 95

Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu LysLeu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu Lys

100 105 110100 105 110

Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp LysGlu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp Lys

115 120 125115 120 125

Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys GluSer Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys Glu

130 135 140130 135 140

Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr MetAla Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr Met

145 150 155 160145 150 155 160

Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu AspGlu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu Asp

165 170 175165 170 175

Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val GluLys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val Glu

180 185 190180 185 190

Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile LeuAla Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile Leu

195 200 205195 200 205

Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser TyrLys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser Tyr

210 215 220210 215 220

Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala LeuGln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala Leu

225 230 235 240225 230 235 240

Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val LysVal Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val Lys

245 250 255245 250 255

Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val ArgLeu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val Arg

260 265 270260 265 270

Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser ThrGln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser Thr

275 280 285275 280 285

Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu GluIle Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu Glu

290 295 300290 295 300

Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys ValMet Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys Val

305 310 315 320305 310 315 320

Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu MetArg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu Met

325 330 335325 330 335

Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu ArgAsn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu Arg

340 345 350340 345 350

Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys ArgGlu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys Arg

355 360 365355 360 365

Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile LysVal Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile Lys

370 375 380370 375 380

Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu LeuLys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu Leu

385 390 395 400385 390 395 400

Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro ProThr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro Pro

405 410 415405 410 415

Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His AlaGlu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His Ala

420 425 430420 425 430

Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala AsnLys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala Asn

435 440 445435 440 445

Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu ArgArg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu Arg

450 455 460450 455 460

Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro ArgPro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro Arg

465 470 475 480465 470 475 480

Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys PheLeu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys Phe

485 490 495485 490 495

Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala AlaGlu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala Ala

500 505 510500 505 510

Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser LeuGly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser Leu

515 520 525515 520 525

Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys SerLeu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys Ser

530 535 540530 535 540

Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser AlaVal Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser Ala

545 550 555 560545 550 555 560

His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp GlnHis Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp Gln

565 570 575565 570 575

Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys TyrLeu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys Tyr

580 585 590580 585 590

Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp CysTyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp Cys

595 600 605595 600 605

Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu AspThr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu Asp

610 615 620610 615 620

Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly GlyCys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly Gly

625 630 635 640625 630 635 640

Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr SerGln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr Ser

645 650 655645 650 655

Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met ProCys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met Pro

660 665 670660 665 670

Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro GlnGly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro Gln

675 680 685675 680 685

Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val ValVal Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val Val

690 695 700690 695 700

Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala ProAla Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala Pro

705 710 715 720705 710 715 720

Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu AlaLeu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu Ala

725 730 735725 730 735

Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro TyrPhe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro Tyr

740 745 750740 745 750

Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn LysGlu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn Lys

755 760 765755 760 765

Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro ProLeu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro Pro

770 775 780770 775 780

Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala GluSer Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala Glu

785 790 795 800785 790 795 800

Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu ThrIle Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu Thr

805 810 815805 810 815

Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu LeuVal Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu Leu

820 825 830820 825 830

Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp SerSer Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp Ser

835 840 845835 840 845

Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg LeuAla Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg Leu

850 855 860850 855 860

Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu GluGlu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu Glu

865 870 875 880865 870 875 880

Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu LysThr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu Lys

885 890 895885 890 895

Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile GluAla Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile Glu

900 905 910900 905 910

Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val Ser GlyGly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val Ser Gly

915 920 925915 920 925

Ile Ala Gly Glu Glu Gln Gln Arg Gly Ala Ile Pro Gly Gln Ala ProIle Ala Gly Glu Glu Gln Gln Arg Gly Ala Ile Pro Gly Gln Ala Pro

930 935 940930 935 940

Gly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu LeuGly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu

945 950 955 960945 950 955 960

Gln Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln His GluGln Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln His Glu

965 970 975965 970 975

Asn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser LeuAsn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu

980 985 990980 985 990

Pro Pro Leu His Val Ala Lys Leu Ser His Glu Gly Pro Gly Ser GluPro Pro Leu His Val Ala Lys Leu Ser His Glu Gly Pro Gly Ser Glu

995 1000 1005995 1000 1005

Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu Leu GluLeu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu Leu Glu

1010 1015 10201010 1015 1020

Thr Leu Asn Gln Leu Ser Thr His Thr His Val Val Asp Ile ThrThr Leu Asn Gln Leu Ser Thr His Thr His Val Val Asp Ile Thr

1025 1030 10351025 1030 1035

Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu Met GluArg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu Met Glu

1040 1045 10501040 1045 1050

Gln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu Lys LeuGln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu Lys Leu

1055 1060 10651055 1060 1065

Lys Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro Gly AlaLys Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro Gly Ala

1070 1075 10801070 1075 1080

Thr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala Phe LeuThr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala Phe Leu

1085 1090 10951085 1090 1095

Arg Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val LeuArg Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu

1100 1105 11101100 1105 1110

Gly Lys Thr Leu Gly Glu Gly Glu Phe Gly Lys Val Val Lys AlaGly Lys Thr Leu Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala

1115 1120 11251115 1120 1125

Thr Ala Phe His Leu Lys Gly Arg Ala Gly Tyr Thr Thr Val AlaThr Ala Phe His Leu Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala

1130 1135 11401130 1135 1140

Val Lys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu Leu Arg AspVal Lys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu Leu Arg Asp

1145 1150 11551145 1150 1155

Leu Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn His Pro HisLeu Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn His Pro His

1160 1165 11701160 1165 1170

Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro Leu LeuVal Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro Leu Leu

1175 1180 11851175 1180 1185

Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly Phe LeuLeu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly Phe Leu

1190 1195 12001190 1195 1200

Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser Gly GlyArg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser Gly Gly

1205 1210 12151205 1210 1215

Ser Arg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg Ala LeuSer Arg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg Ala Leu

1220 1225 12301220 1225 1230

Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser Gln GlyThr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser Gln Gly

1235 1240 12451235 1240 1245

Met Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp Leu AlaMet Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp Leu Ala

1250 1255 12601250 1255 1260

Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys Ile SerAla Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys Ile Ser

1265 1270 12751265 1270 1275

Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr ValAsp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val

1280 1285 12901280 1285 1290

Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile GluLys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile Glu

1295 1300 13051295 1300 1305

Ser Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp SerSer Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser

1310 1315 13201310 1315 1320

Phe Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn ProPhe Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro

1325 1330 13351325 1330 1335

Tyr Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys ThrTyr Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr

1340 1345 13501340 1345 1350

Gly His Arg Met Glu Arg Pro Asp Asn Cys Ser Glu Glu Met TyrGly His Arg Met Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr

1355 1360 13651355 1360 1365

Arg Leu Met Leu Gln Cys Trp Lys Gln Glu Pro Asp Lys Arg ProArg Leu Met Leu Gln Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro

1370 1375 13801370 1375 1380

Val Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met Met Val LysVal Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met Met Val Lys

1385 1390 13951385 1390 1395

Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro Ser Asp SerArg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro Ser Asp Ser

1400 1405 14101400 1405 1410

Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr Pro Leu ValLeu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr Pro Leu Val

1415 1420 14251415 1420 1425

Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro Ser Thr TrpAsp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro Ser Thr Trp

1430 1435 14401430 1435 1440

Ile Glu Asn Lys Leu Tyr Gly Met Ser Asp Pro Asn Trp Pro GlyIle Glu Asn Lys Leu Tyr Gly Met Ser Asp Pro Asn Trp Pro Gly

1445 1450 14551445 1450 1455

Glu Ser Pro Val Pro Leu Thr Arg Ala Asp Gly Thr Asn Thr GlyGlu Ser Pro Val Pro Leu Thr Arg Ala Asp Gly Thr Asn Thr Gly

1460 1465 14701460 1465 1470

Phe Pro Arg Tyr Pro Asn Asp Ser Val Tyr Ala Asn Trp Met LeuPhe Pro Arg Tyr Pro Asn Asp Ser Val Tyr Ala Asn Trp Met Leu

1475 1480 14851475 1480 1485

Ser Pro Ser Ala Ala Lys Leu Met Asp Thr Phe Asp SerSer Pro Ser Ala Ala Lys Leu Met Asp Thr Phe Asp Ser

1490 1495 15001490 1495 1500

<210> 7<210> 7

<211> 4380<211> 4380

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кодирующая последовательность слитого пептида<223> fusion peptide coding sequence

<400> 7<400> 7

atgatgagac aggcaccgac agcccgaaag accacaactc ggcgacccaa gcccacgcgc 60atgatgagac aggcaccgac agcccgaaag accacaactc ggcgacccaa gcccacgcgc 60

ccagccagta ctggggtggc tggggccagt agctccctgg gcccctctgg ctcagcgtca 120ccagccagta ctggggtggc tggggccagt agctccctgg gcccctctgg ctcagcgtca 120

gcaggtgagc tgagcagcag tgagcccagc accccggctc agactccgct ggcagcaccc 180gcaggtgagc tgagcagcag tgagcccagc accccggctc agactccgct ggcagcaccc 180

atcatcccca cgccggtcct cacctctcct ggagcagtcc ccccgcttcc ttccccatcc 240atcatcccca cgccggtcct cacctctcct ggagcagtcc ccccgcttcc ttccccatcc 240

aaggaggagg agggactaag ggctcaggtg cgggacctgg aggagaaact agagaccctg 300aaggaggagg agggactaag ggctcaggtg cgggacctgg aggagaaact agagaccctg 300

agactgaaac gggcagaaga caaagcaaag ctaaaagagc tggagaaaca caaaatccag 360agactgaaac gggcagaaga caaagcaaag ctaaaagagc tggagaaaca caaaatccag 360

ctggagcagg tgcaggaatg gaagagcaaa atgcaggagc agcaggccga cctgcagcgg 420ctggagcagg tgcaggaatg gaagagcaaa atgcaggagc agcaggccga cctgcagcgg 420

cgcctcaagg aggcgagaaa ggaagccaag gaggcgctgg aggcaaagga acgctatatg 480cgcctcaagg aggcgagaaa ggaagccaag gaggcgctgg aggcaaagga acgctatatg 480

gaggagatgg ctgatactgc tgatgccatt gagatggcca ctttggacaa ggagatggct 540gaggagatgg ctgatactgc tgatgccatt gagatggcca ctttggacaa ggagatggct 540

gaagagcggg ctgagtccct gcagcaggag gtggaggcac tgaaggagcg ggtggacgag 600gaagagcggg ctgagtccct gcagcaggag gtggaggcac tgaaggagcg ggtggacgag 600

ctcactactg acttagagat cctcaaggct gagattgaag agaagggctc agatggcgct 660ctcactactg acttagagat cctcaaggct gagattgaag agaagggctc agatggcgct 660

gcatccagtt atcagctcaa gcagcttgag gagcagaatg cccgcctgaa ggatgccctg 720gcatccagtt atcagctcaa gcagcttgag gagcagaatg cccgcctgaa ggatgccctg 720

gtgaggatgc gggatctttc ttcctcagag aagcaggagc atgtgaagct ccagaagctc 780gtgaggatgc gggatctttc ttcctcagag aagcaggagc atgtgaagct ccagaagctc 780

atggaaaaga agaaccaaga gctggaagtt gtgaggcaac agcgggagcg tctgcaggag 840atggaaaaga agaaccaaga gctggaagtt gtgaggcaac agcgggagcg tctgcaggag 840

gagctaagcc aggcagagag caccattgat gagctcaagg agcaggtgga tgctgctctg 900gagctaagcc aggcagagag caccattgat gagctcaagg agcaggtgga tgctgctctg 900

ggtgctgagg agatggtgga gatgctgaca gatcggaacc tgaatctgga agagaaagtg 960ggtgctgagg agatggtgga gatgctgaca gatcggaacc tgaatctgga agagaaagtg 960

cgcgagttga gggagactgt gggagacttg gaagcgatga atgagatgaa cgatgagctg 1020cgcgagttga gggagactgt gggagacttg gaagcgatga atgagatgaa cgatgagctg 1020

caggagaatg cacgtgagac agaactggag ctgcgggagc agctggacat ggcaggcgcg 1080caggagaatg cacgtgagac agaactggag ctgcgggagc agctggacat ggcaggcgcg 1080

cgggttcgtg aggcccagaa gcgtgtggag gcagcccagg agacggttgc agactaccag 1140cgggttcgtg aggcccagaa gcgtgtggag gcagcccagg agacggttgc agactaccag 1140

cagaccatca agaagtaccg ccagctgacc gcccatctac aggatgtgaa tcgggaactg 1200cagaccatca agaagtaccg ccagctgacc gcccatctac aggatgtgaa tcgggaactg 1200

acaaaccagc aggaagcatc tgtggagagg caacagcagc cacctccaga gacctttgac 1260acaaaccagc aggaagcatc tgtggagagg caacagcagc cacctccaga gacctttgac 1260

ttcaaaatca agtttgctga gactaaggcc catgccaagg caattgagat ggaattgagg 1320ttcaaaatca agtttgctga gactaaggcc catgccaagg caattgagat ggaattgagg 1320

cagatggagg tggcccaggc caatcgacac atgtccctgc tgacagcctt catgcctgac 1380cagatggagg tggcccaggc caatcgacac atgtccctgc tgacagcctt catgcctgac 1380

agcttccttc ggccaggtgg ggaccatgac tgcgttctgg tgctgttgct catgcctcgt 1440agcttccttc ggccaggtgg ggaccatgac tgcgttctgg tgctgttgct catgcctcgt 1440

ctcatttgca aggcagagct gatccggaag caggcccagg agaagtttga actaagtgag 1500ctcatttgca aggcagagct gatccggaag caggcccagg agaagtttga actaagtgag 1500

aactgttcag agcggcctgg gctgcgagga gctgctgggg agcaactcag ctttgctgct 1560aactgttcag agcggcctgg gctgcgagga gctgctgggg agcaactcag ctttgctgct 1560

ggactggtgt actcgctgag cctgctgcag gccacgctac accgctatga gcatgccctc 1620ggactggtgt actcgctgag cctgctgcag gccacgctac accgctatga gcatgccctc 1620

tctcagtgca gtgtggatgt gtataagaaa gtgggcagcc tgtaccctga gatgagtgcc 1680tctcagtgca gtgtggatgt gtataagaaa gtgggcagcc tgtaccctga gatgagtgcc 1680

catgagcgct ccttggattt cctcattgaa ctgctgcaca aggatcagct ggatgagact 1740catgagcgct ccttggattt cctcattgaa ctgctgcaca aggatcagct ggatgagact 1740

gtcaatgtgg agcctctcac caaggccatc aagtactatc agcatctgta cagcatccac 1800gtcaatgtgg agcctctcac caaggccatc aagtactatc agcatctgta cagcatccac 1800

cttgccgaac agcctgagga ctgtactatg cagctggctg accacattaa gttcacgcag 1860cttgccgaac agcctgagga ctgtactatg cagctggctg accacattaa gttcacgcag 1860

agtgctctgg actgcatgag tgtggaggta ggacggctgc gtgccttctt gcagggtggg 1920agtgctctgg actgcatgag tgtggaggta ggacggctgc gtgccttctt gcagggtggg 1920

caggaggcta cagatattgc cctcctgctc cgggatctgg aaacttcatg cagtgacatc 1980caggaggcta cagatattgc cctcctgctc cgggatctgg aaacttcatg cagtgacatc 1980

cgccagttct gcaagaagat ccgaaggcga atgccaggga cagatgctcc tgggatccca 2040cgccagttct gcaagaagat ccgaaggcga atgccaggga cagatgctcc tgggatccca 2040

gctgcactgg cctttggacc acaggtatct gacacgctcc tagactgcag gaaacacttg 2100gctgcactgg cctttggacc acaggtatct gacacgctcc tagactgcag gaaacacttg 2100

acgtgggtcg tggctgtgct gcaggaggtg gcagctgctg ctgcccagct cattgcccca 2160acgtgggtcg tggctgtgct gcaggaggtg gcagctgctg ctgcccagct cattgcccca 2160

ctggcagaga atgaggggct acttgtggct gctctggagg aactggcttt caaagcaagc 2220ctggcagaga atgaggggct acttgtggct gctctggagg aactggcttt caaagcaagc 2220

gagcagatct atgggacccc ctccagcagc ccctatgagt gtctgcgcca gtcatgcaac 2280gagcagatct atgggacccc ctccagcagc ccctatgagt gtctgcgcca gtcatgcaac 2280

atcctcatca gtaccatgaa caagctggcc acagccatgc aggaggggga gtatgatgca 2340atcctcatca gtaccatgaa caagctggcc acagccatgc aggaggggga gtatgatgca 2340

gagcggcccc ccagcaagcc tccaccggtt gaactgcggg ctgctgccct tcgtgcagag 2400gagcggcccc ccagcaagcc tccaccggtt gaactgcggg ctgctgccct tcgtgcagag 2400

atcacagatg ctgaaggcct gggtttgaag ctcgaagatc gagagacagt tattaaggag 2460atcacagatg ctgaaggcct gggtttgaag ctcgaagatc gagagacagt tattaaggag 2460

ttgaagaagt cactcaagat taagggagag gagctaagtg aggccaatgt gcggctgagc 2520ttgaagaagt cactcaagat taagggagag gagctaagtg aggccaatgt gcggctgagc 2520

ctcctggaga agaagttgga cagtgctgcc aaggatgcag atgagcgcat cgagaaagtc 2580ctcctggaga agaagttgga cagtgctgcc aaggatgcag atgagcgcat cgagaaagtc 2580

cagactcggc tggaggagac ccaggcactg ctgcgaaaga aggagaaaga gtttgaggag 2640cagactcggc tggagaggagac ccaggcactg ctgcgaaaga aggagaaaga gtttgaggag 2640

acaatggatg cactccaggc tgacatcgac cagctggagg cagagaaggc agaactaaag 2700acaatggatg cactccaggc tgacatcgac cagctggagg cagagaaggc agaactaaag 2700

cagcgtctga acagccagtc caaacgcacg attgagggac tccggggccc tcctccttca 2760cagcgtctga acagccagtc caaacgcacg attgagggac tccggggccc tcctccttca 2760

ggcattgcta ctctggtctc tggcattgct ggtgaagaac agcagcgagg agccatccct 2820ggcattgcta ctctggtctc tggcattgct ggtgaagaac agcagcgagg agccatccct 2820

gggcaggctc cagggtctgt gccaggccca gggctggtga aggactcacc actgctgctt 2880gggcaggctc cagggtctgt gccaggccca gggctggtga aggactcacc actgctgctt 2880

cagcagatct ctgccatgag gctgcacatc tcccagctcc agcatgagaa cagcatcctc 2940cagcagatct ctgccatgag gctgcacatc tcccagctcc agcatgagaa cagcatcctc 2940

aagggagccc agatgaaggc atccttggca tccctgcccc ctctgcatgt tgcaaagcta 3000aagggagccc agatgaaggc atccttggca tccctgcccc ctctgcatgt tgcaaagcta 3000

tcccatgagg gccctggcag tgagttacca gctggagcgc tgtatcgtaa gaccagccag 3060tcccatgagg gccctggcag tgagttacca gctggagcgc tgtatcgtaa gaccagccag 3060

ctgctggaga cattgaatca attgagcaca cacacgcacg tagtagacat cactcgcacc 3120ctgctggaga cattgaatca attgagcaca cacacgcacg tagtagacat cactcgcacc 3120

agccctgctg ccaagagccc gtcggcccaa cttatggagc aagtggctca gcttaagtcc 3180agccctgctg ccaagagccc gtcggcccaa cttatggagc aagtggctca gcttaagtcc 3180

ctgagtgaca ccgtcgagaa gctcaaggat gaggtcctca aggagacagt atctcagcgc 3240ctgagtgaca ccgtcgagaa gctcaaggat gaggtcctca aggagacagt atctcagcgc 3240

cctggagcca cagtacccac tgactttgcc accttccctt catcagcctt cctcagggag 3300cctggagcca cagtacccac tgactttgcc accttccctt catcagcctt cctcagggag 3300

gatccaaagt gggaattccc tcggaagaac ttggttcttg gaaaaactct aggagaaggc 3360gatccaaagt gggaattccc tcggaagaac ttggttcttg gaaaaactct aggagaaggc 3360

gaatttggaa aagtggtcaa ggcaacggcc ttccatctga aaggcagagc agggtacacc 3420gaatttggaa aagtggtcaa ggcaacggcc ttccatctga aaggcagagc agggtacacc 3420

acggtggccg tgaagatgct gaaagagaac gcctccccga gtgagcttcg agacctgctg 3480acggtggccg tgaagatgct gaaagagaac gcctccccga gtgagcttcg agacctgctg 3480

tcagagttca acgtcctgaa gcaggtcaac cacccacatg tcatcaaatt gtatggggcc 3540tcagagttca acgtcctgaa gcaggtcaac cacccacatg tcatcaaatt gtatggggcc 3540

tgcagccagg atggcccgct cctcctcatc gtggagtacg ccaaatacgg ctccctgcgg 3600tgcagccagg atggcccgct cctcctcatc gtggagtacg ccaaatacgg ctccctgcgg 3600

ggcttcctcc gcgagagccg caaagtgggg cctggctacc tgggcagtgg aggcagccgc 3660ggcttcctcc gcgagagccg caaagtgggg cctggctacc tgggcagtgg aggcagccgc 3660

aactccagct ccctggacca cccggatgag cgggccctca ccatgggcga cctcatctca 3720aactccagct ccctggacca cccggatgag cgggccctca ccatgggcga cctcatctca 3720

tttgcctggc agatctcaca ggggatgcag tatctggccg agatgaagct cgttcatcgg 3780tttgcctggc agatctcaca ggggatgcag tatctggccg agatgaagct cgttcatcgg 3780

gacttggcag ccagaaacat cctggtagct gaggggcgga agatgaagat ttcggatttc 3840gacttggcag ccagaaacat cctggtagct gaggggcgga agatgaagat ttcggatttc 3840

ggcttgtccc gagatgttta tgaagaggat tcctacgtga agaggagcca gggtcggatt 3900ggcttgtccc gagatgttta tgaagaggat tcctacgtga agaggagcca gggtcggatt 3900

ccagttaaat ggatggcaat tgaatccctt tttgatcata tctacaccac gcaaagtgat 3960ccagttaaat ggatggcaat tgaatccctt tttgatcata tctacaccac gcaaagtgat 3960

gtatggtctt ttggtgtcct gctgtgggag atcgtgaccc tagggggaaa cccctatcct 4020gtatggtctt ttggtgtcct gctgtgggag atcgtgaccc tagggggaaa cccctatcct 4020

gggattcctc ctgagcggct cttcaacctt ctgaagaccg gccaccggat ggagaggcca 4080gggattcctc ctgagcggct cttcaacctt ctgaagaccg gccaccggat ggagaggcca 4080

gacaactgca gcgaggagat gtaccgcctg atgctgcaat gctggaagca ggagccggac 4140gacaactgca gcgaggagat gtaccgcctg atgctgcaat gctggaagca ggagccggac 4140

aaaaggccgg tgtttgcgga catcagcaaa gacctggaga agatgatggt taagaggaga 4200aaaaggccgg tgtttgcgga catcagcaaa gacctggaga agatgatggt taagaggaga 4200

gactacttgg accttgcggc gtccactcca tctgactccc tgatttatga cgacggcctc 4260gactacttgg accttgcggc gtccactcca tctgactccc tgatttatga cgacggcctc 4260

tcagaggagg agacaccgct ggtggactgt aataatgccc ccctccctcg agccctccct 4320tcagaggagg agacaccgct ggtggactgt aataatgccc ccctccctcg agccctccct 4320

tccacatgga ttgaaaacaa actctatggt agaatttccc atgcatttac tagattctag 4380tccacatgga ttgaaaacaa actctatggt agaatttccc atgcatttac tagattctag 4380

<210> 8<210> 8

<211> 1459<211> 1459

<212> белок<212> protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> слитый пептид<223> fusion peptide

<400> 8<400> 8

Met Met Arg Gln Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg ProMet Met Arg Gln Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg Pro

1. 5 10 151. 5 10 15

Lys Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser SerLys Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser Ser

20 25 3020 25 30

Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser GluLeu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser Glu

35 40 4535 40 45

Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro ThrPro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro Thr

50 55 6050 55 60

Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro SerPro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro Ser

65 70 75 8065 70 75 80

Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu LysLys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu Lys

85 90 9585 90 95

Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu LysLeu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu Lys

100 105 110100 105 110

Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp LysGlu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp Lys

115 120 125115 120 125

Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys GluSer Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys Glu

130 135 140130 135 140

Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr MetAla Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr Met

145 150 155 160145 150 155 160

Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu AspGlu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu Asp

165 170 175165 170 175

Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val GluLys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val Glu

180 185 190180 185 190

Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile LeuAla Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile Leu

195 200 205195 200 205

Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser TyrLys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser Tyr

210 215 220210 215 220

Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala LeuGln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala Leu

225 230 235 240225 230 235 240

Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val LysVal Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val Lys

245 250 255245 250 255

Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val ArgLeu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val Arg

260 265 270260 265 270

Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser ThrGln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser Thr

275 280 285275 280 285

Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu GluIle Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu Glu

290 295 300290 295 300

Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys ValMet Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys Val

305 310 315 320305 310 315 320

Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu MetArg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu Met

325 330 335325 330 335

Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu ArgAsn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu Arg

340 345 350340 345 350

Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys ArgGlu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys Arg

355 360 365355 360 365

Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile LysVal Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile Lys

370 375 380370 375 380

Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu LeuLys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu Leu

385 390 395 400385 390 395 400

Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro ProThr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro Pro

405 410 415405 410 415

Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His AlaGlu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His Ala

420 425 430420 425 430

Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala AsnLys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala Asn

435 440 445435 440 445

Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu ArgArg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu Arg

450 455 460450 455 460

Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro ArgPro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro Arg

465 470 475 480465 470 475 480

Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys PheLeu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys Phe

485 490 495485 490 495

Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala AlaGlu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala Ala

500 505 510500 505 510

Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser LeuGly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser Leu

515 520 525515 520 525

Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys SerLeu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys Ser

530 535 540530 535 540

Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser AlaVal Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser Ala

545 550 555 560545 550 555 560

His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp GlnHis Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp Gln

565 570 575565 570 575

Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys TyrLeu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys Tyr

580 585 590580 585 590

Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp CysTyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp Cys

595 600 605595 600 605

Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu AspThr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu Asp

610 615 620610 615 620

Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly GlyCys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly Gly

625 630 635 640625 630 635 640

Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr SerGln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr Ser

645 650 655645 650 655

Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met ProCys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met Pro

660 665 670660 665 670

Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro GlnGly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro Gln

675 680 685675 680 685

Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val ValVal Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val Val

690 695 700690 695 700

Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala ProAla Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala Pro

705 710 715 720705 710 715 720

Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu AlaLeu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu Ala

725 730 735725 730 735

Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro TyrPhe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro Tyr

740 745 750740 745 750

Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn LysGlu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn Lys

755 760 765755 760 765

Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro ProLeu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro Pro

770 775 780770 775 780

Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala GluSer Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala Glu

785 790 795 800785 790 795 800

Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu ThrIle Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu Thr

805 810 815805 810 815

Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu LeuVal Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu Leu

820 825 830820 825 830

Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp SerSer Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp Ser

835 840 845835 840 845

Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg LeuAla Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg Leu

850 855 860850 855 860

Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu GluGlu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu Glu

865 870 875 880865 870 875 880

Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu LysThr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu Lys

885 890 895885 890 895

Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile GluAla Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile Glu

900 905 910900 905 910

Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val Ser GlyGly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val Ser Gly

915 920 925915 920 925

Ile Ala Gly Glu Glu Gln Gln Arg Gly Ala Ile Pro Gly Gln Ala ProIle Ala Gly Glu Glu Gln Gln Arg Gly Ala Ile Pro Gly Gln Ala Pro

930 935 940930 935 940

Gly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu LeuGly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu

945 950 955 960945 950 955 960

Gln Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln His GluGln Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln His Glu

965 970 975965 970 975

Asn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser LeuAsn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu

980 985 990980 985 990

Pro Pro Leu His Val Ala Lys Leu Ser His Glu Gly Pro Gly Ser GluPro Pro Leu His Val Ala Lys Leu Ser His Glu Gly Pro Gly Ser Glu

995 1000 1005995 1000 1005

Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu Leu GluLeu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu Leu Glu

1010 1015 10201010 1015 1020

Thr Leu Asn Gln Leu Ser Thr His Thr His Val Val Asp Ile ThrThr Leu Asn Gln Leu Ser Thr His Thr His Val Val Asp Ile Thr

1025 1030 10351025 1030 1035

Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu Met GluArg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu Met Glu

1040 1045 10501040 1045 1050

Gln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu Lys LeuGln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu Lys Leu

1055 1060 10651055 1060 1065

Lys Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro Gly AlaLys Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro Gly Ala

1070 1075 10801070 1075 1080

Thr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala Phe LeuThr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala Phe Leu

1085 1090 10951085 1090 1095

Arg Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val LeuArg Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu

1100 1105 11101100 1105 1110

Gly Lys Thr Leu Gly Glu Gly Glu Phe Gly Lys Val Val Lys AlaGly Lys Thr Leu Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala

1115 1120 11251115 1120 1125

Thr Ala Phe His Leu Lys Gly Arg Ala Gly Tyr Thr Thr Val AlaThr Ala Phe His Leu Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala

1130 1135 11401130 1135 1140

Val Lys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu Leu Arg AspVal Lys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu Leu Arg Asp

1145 1150 11551145 1150 1155

Leu Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn His Pro HisLeu Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn His Pro His

1160 1165 11701160 1165 1170

Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro Leu LeuVal Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro Leu Leu

1175 1180 11851175 1180 1185

Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly Phe LeuLeu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly Phe Leu

1190 1195 12001190 1195 1200

Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser Gly GlyArg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser Gly Gly

1205 1210 12151205 1210 1215

Ser Arg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg Ala LeuSer Arg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg Ala Leu

1220 1225 12301220 1225 1230

Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser Gln GlyThr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser Gln Gly

1235 1240 12451235 1240 1245

Met Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp Leu AlaMet Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp Leu Ala

1250 1255 12601250 1255 1260

Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys Ile SerAla Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys Ile Ser

1265 1270 12751265 1270 1275

Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr ValAsp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val

1280 1285 12901280 1285 1290

Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile GluLys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile Glu

1295 1300 13051295 1300 1305

Ser Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp SerSer Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser

1310 1315 13201310 1315 1320

Phe Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn ProPhe Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro

1325 1330 13351325 1330 1335

Tyr Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys ThrTyr Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr

1340 1345 13501340 1345 1350

Gly His Arg Met Glu Arg Pro Asp Asn Cys Ser Glu Glu Met TyrGly His Arg Met Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr

1355 1360 13651355 1360 1365

Arg Leu Met Leu Gln Cys Trp Lys Gln Glu Pro Asp Lys Arg ProArg Leu Met Leu Gln Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro

1370 1375 13801370 1375 1380

Val Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met Met Val LysVal Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met Met Val Lys

1385 1390 13951385 1390 1395

Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro Ser Asp SerArg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro Ser Asp Ser

1400 1405 14101400 1405 1410

Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr Pro Leu ValLeu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr Pro Leu Val

1415 1420 14251415 1420 1425

Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro Ser Thr TrpAsp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro Ser Thr Trp

1430 1435 14401430 1435 1440

Ile Glu Asn Lys Leu Tyr Gly Arg Ile Ser His Ala Phe Thr ArgIle Glu Asn Lys Leu Tyr Gly Arg Ile Ser His Ala Phe Thr Arg

1445 1450 14551445 1450 1455

PhePhe

<210> 9<210> 9

<211> 4833<211> 4833

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кодирующая последовательность слитого пептида<223> fusion peptide coding sequence

<400> 9<400> 9

atggcacaga gcaagaggca cgtgtacagc cggacgccca gcggcagcag gatgagtgcg 60atggcacaga gcaagaggca cgtgtacagc cggacgccca gcggcagcag gatgagtgcg 60

gaggcaagcg cccggcctct gcgggtgggc tcccgtgtag aggtgattgg aaaaggccac 120gaggcaagcg cccggcctct gcgggtgggc tcccgtgtag aggtgattgg aaaaggccac 120

cgaggcactg tggcctatgt tggagccaca ctgtttgcca ctggcaaatg ggtaggcgtg 180cgaggcactg tggcctatgt tggagccaca ctgtttgcca ctggcaaatg ggtaggcgtg 180

attctggatg aagcaaaggg caaaaatgat ggaactgttc aaggcaggaa gtacttcact 240attctggatg aagcaaaggg caaaaatgat ggaactgttc aaggcaggaa gtacttcact 240

tgtgatgaag ggcatggcat ctttgtgcgc cagtcccaga tccaggtatt tgaagatgga 300tgtgatgaag ggcatggcat ctttgtgcgc cagtcccaga tccaggtatt tgaagatgga 300

gcagatacta cttccccaga gacacctgat tcttctgctt caaaagtcct caaaagagag 360gcagatacta cttccccaga gacacctgat tcttctgctt caaaagtcct caaaagagag 360

ggaactgata caactgcaaa gactagcaaa ctgcccacgc gcccagccag tactggggtg 420ggaactgata caactgcaaa gactagcaaa ctgcccacgc gcccagccag tactggggtg 420

gctggggcca gtagctccct gggcccctct ggctcagcgt cagcaggtga gctgagcagc 480gctggggcca gtagctccct gggcccctct ggctcagcgt cagcaggtga gctgagcagc 480

agtgagccca gcaccccggc tcagactccg ctggcagcac ccatcatccc cacgccggtc 540agtgagccca gcaccccggc tcagactccg ctggcagcac ccatcatccc cacgccggtc 540

ctcacctctc ctggagcagt ccccccgctt ccttccccat ccaaggagga ggagggacta 600ctcacctctc ctggagcagt ccccccgctt ccttccccat ccaaggagga ggagggacta 600

agggctcagg tgcgggacct ggaggagaaa ctagagaccc tgagactgaa acgggcagaa 660agggctcagg tgcgggacct ggaggagaaa ctagagaaccc tgagactgaa acgggcagaa 660

gacaaagcaa agctaaaaga gctggagaaa cacaaaatcc agctggagca ggtgcaggaa 720gacaaagcaa agctaaaaga gctggagaaa cacaaaatcc agctggagca ggtgcaggaa 720

tggaagagca aaatgcagga gcagcaggcc gacctgcagc ggcgcctcaa ggaggcgaga 780tggaagagca aaatgcagga gcagcaggcc gacctgcagc ggcgcctcaa ggaggcgaga 780

aaggaagcca aggaggcgct ggaggcaaag gaacgctata tggaggagat ggctgatact 840aaggaagcca aggaggcgct ggaggcaaag gaacgctata tggaggat ggctgatact 840

gctgatgcca ttgagatggc cactttggac aaggagatgg ctgaagagcg ggctgagtcc 900gctgatgcca ttgagatggc cactttggac aaggatgg ctgaagagcg ggctgagtcc 900

ctgcagcagg aggtggaggc actgaaggag cgggtggacg agctcactac tgacttagag 960ctgcagcagg aggtggaggc actgaaggag cgggtggacg agctcactac tgacttagag 960

atcctcaagg ctgagattga agagaagggc tcagatggcg ctgcatccag ttatcagctc 1020atcctcaagg ctgagattga agagaagggc tcagatggcg ctgcatccag ttatcagctc 1020

aagcagcttg aggagcagaa tgcccgcctg aaggatgccc tggtgaggat gcgggatctt 1080aagcagcttg aggagcagaa tgcccgcctg aaggatgccc tggtgaggat gcgggatctt 1080

tcttcctcag agaagcagga gcatgtgaag ctccagaagc tcatggaaaa gaagaaccaa 1140tcttcctcag agaagcagga gcatgtgaag ctccagaagc tcatggaaaa gaagaaccaa 1140

gagctggaag ttgtgaggca acagcgggag cgtctgcagg aggagctaag ccaggcagag 1200gagctggaag ttgtgaggca acagcgggag cgtctgcagg aggagctaag ccaggcagag 1200

agcaccattg atgagctcaa ggagcaggtg gatgctgctc tgggtgctga ggagatggtg 1260agcaccattg atgagctcaa ggagcaggtg gatgctgctc tgggtgctga ggagatggtg 1260

gagatgctga cagatcggaa cctgaatctg gaagagaaag tgcgcgagtt gagggagact 1320gagatgctga cagatcggaa cctgaatctg gaagagaaag tgcgcgagtt gagggagact 1320

gtgggagact tggaagcgat gaatgagatg aacgatgagc tgcaggagaa tgcacgtgag 1380gtgggagact tggaagcgat gaatgagatg aacgatgagc tgcaggagaa tgcacgtgag 1380

acagaactgg agctgcggga gcagctggac atggcaggcg cgcgggttcg tgaggcccag 1440acagaactgg agctgcggga gcagctggac atggcaggcg cgcgggttcg tgaggcccag 1440

aagcgtgtgg aggcagccca ggagacggtt gcagactacc agcagaccat caagaagtac 1500aagcgtgtgg aggcagccca ggagacggtt gcagactacc agcagaccat caagaagtac 1500

cgccagctga ccgcccatct acaggatgtg aatcgggaac tgacaaacca gcaggaagca 1560cgccagctga ccgcccatct acaggatgtg aatcgggaac tgacaaacca gcaggaagca 1560

tctgtggaga ggcaacagca gccacctcca gagacctttg acttcaaaat caagtttgct 1620tctgtggaga ggcaacagca gccacctcca gagacctttg acttcaaaat caagtttgct 1620

gagactaagg cccatgccaa ggcaattgag atggaattga ggcagatgga ggtggcccag 1680gagactaagg cccatgccaa ggcaattgag atggaattga ggcagatgga ggtggcccag 1680

gccaatcgac acatgtccct gctgacagcc ttcatgcctg acagcttcct tcggccaggt 1740gccaatcgac acatgtccct gctgacagcc ttcatgcctg acagcttcct tcggccaggt 1740

ggggaccatg actgcgttct ggtgctgttg ctcatgcctc gtctcatttg caaggcagag 1800ggggaccatg actgcgttct ggtgctgttg ctcatgcctc gtctcatttg caaggcagag 1800

ctgatccgga agcaggccca ggagaagttt gaactaagtg agaactgttc agagcggcct 1860ctgatccgga agcaggccca ggagaagttt gaactaagtg agaactgttc agagcggcct 1860

gggctgcgag gagctgctgg ggagcaactc agctttgctg ctggactggt gtactcgctg 1920gggctgcgag gagctgctgg ggagcaactc agctttgctg ctggactggt gtactcgctg 1920

agcctgctgc aggccacgct acaccgctat gagcatgccc tctctcagtg cagtgtggat 1980agcctgctgc aggccacgct acaccgctat gagcatgccc tctctcagtg cagtgtggat 1980

gtgtataaga aagtgggcag cctgtaccct gagatgagtg cccatgagcg ctccttggat 2040gtgtataaga aagtgggcag cctgtaccct gagatgagtg cccatgagcg ctccttggat 2040

ttcctcattg aactgctgca caaggatcag ctggatgaga ctgtcaatgt ggagcctctc 2100ttcctcattg aactgctgca caaggatcag ctggatgaga ctgtcaatgt ggagcctctc 2100

accaaggcca tcaagtacta tcagcatctg tacagcatcc accttgccga acagcctgag 2160accaaggcca tcaagtacta tcagcatctg tacagcatcc accttgccga acagcctgag 2160

gactgtacta tgcagctggc tgaccacatt aagttcacgc agagtgctct ggactgcatg 2220gactgtacta tgcagctggc tgaccacatt aagttcacgc agagtgctct ggactgcatg 2220

agtgtggagg taggacggct gcgtgccttc ttgcagggtg ggcaggaggc tacagatatt 2280agtgtggagg taggacggct gcgtgccttc ttgcagggtg ggcaggaggc tacagatatt 2280

gccctcctgc tccgggatct ggaaacttca tgcagtgaca tccgccagtt ctgcaagaag 2340gccctcctgc tccgggatct ggaaacttca tgcagtgaca tccgccagtt ctgcaagaag 2340

atccgaaggc gaatgccagg gacagatgct cctgggatcc cagctgcact ggcctttgga 2400atccgaaggc gaatgccagg gacagatgct cctgggatcc cagctgcact ggcctttgga 2400

ccacaggtat ctgacacgct cctagactgc aggaaacact tgacgtgggt cgtggctgtg 2460ccacaggtat ctgacacgct cctagactgc aggaaacact tgacgtgggt cgtggctgtg 2460

ctgcaggagg tggcagctgc tgctgcccag ctcattgccc cactggcaga gaatgagggg 2520ctgcaggagg tggcagctgc tgctgcccag ctcattgccc cactggcaga gaatgagggg 2520

ctacttgtgg ctgctctgga ggaactggct ttcaaagcaa gcgagcagat ctatgggacc 2580ctacttgtgg ctgctctgga ggaactggct ttcaaagcaa gcgagcagat ctatgggacc 2580

ccctccagca gcccctatga gtgtctgcgc cagtcatgca acatcctcat cagtaccatg 2640ccctccagca gcccctatga gtgtctgcgc cagtcatgca acatcctcat cagtaccatg 2640

aacaagctgg ccacagccat gcaggagggg gagtatgatg cagagcggcc ccccagcaag 2700aacaagctgg ccacagccat gcaggagggg gagtatgatg cagagcggcc ccccagcaag 2700

cctccaccgg ttgaactgcg ggctgctgcc cttcgtgcag agatcacaga tgctgaaggc 2760cctccaccgg ttgaactgcg ggctgctgcc cttcgtgcag agatcacaga tgctgaaggc 2760

ctgggtttga agctcgaaga tcgagagaca gttattaagg agttgaagaa gtcactcaag 2820ctgggtttga agctcgaaga tcgagagaca gttattaagg agttgaagaa gtcactcaag 2820

attaagggag aggagctaag tgaggccaat gtgcggctga gcctcctgga gaagaagttg 2880attaagggag aggagctaag tgaggccaat gtgcggctga gcctcctgga gaagaagttg 2880

gacagtgctg ccaaggatgc agatgagcgc atcgagaaag tccagactcg gctggaggag 2940gacagtgctg ccaaggatgc agatgagcgc atcgagaaag tccagactcg gctggaggag 2940

acccaggcac tgctgcgaaa gaaggagaaa gagtttgagg agacaatgga tgcactccag 3000acccaggcac tgctgcgaaa gaaggagaaa gagtttgagg agacaatgga tgcactccag 3000

gctgacatcg accagctgga ggcagagaag gcagaactaa agcagcgtct gaacagccag 3060gctgacatcg accagctgga ggcagagaag gcagaactaa agcagcgtct gaacagccag 3060

tccaaacgca cgattgaggg actccggggc cctcctcctt caggcattgc tactctggtc 3120tccaaacgca cgattgaggg actccggggc cctcctcctt caggcattgc tactctggtc 3120

tctggcattg ctggtggagc catccctggg caggctccag ggtctgtgcc aggcccaggg 3180tctggcattg ctggtggagc catccctggg caggctccag ggtctgtgcc aggcccaggg 3180

ctggtgaagg actcaccact gctgcttcag cagatctctg ccatgaggct gcacatctcc 3240ctggtgaagg actcaccact gctgcttcag cagatctctg ccatgaggct gcacatctcc 3240

cagctccagc atgagaacag catcctcaag ggagcccaga tgaaggcatc cttggcatcc 3300cagctccagc atgagaacag catcctcaag ggagcccaga tgaaggcatc cttggcatcc 3300

ctgccccctc tgcatgttgc aaagctatcc catgagggcc ctggcagtga gttaccagct 3360ctgccccctc tgcatgttgc aaagctatcc catgaggcc ctggcagtga gttaccagct 3360

ggagcgctgt atcgtaagac cagccagctg ctggagacat tgaatcaatt gagcacacac 3420ggagcgctgt atcgtaagac cagccagctg ctggagacat tgaatcaatt gagcacacac 3420

acgcacgtag tagacatcac tcgcaccagc cctgctgcca agagcccgtc ggcccaactt 3480acgcacgtag tagacatcac tcgcaccagc cctgctgcca agagcccgtc ggcccaactt 3480

atggagcaag tggctcagct taagtccctg agtgacaccg tcgagaagct caaggatgag 3540atggagcaag tggctcagct taagtccctg agtgacaccg tcgagaagct caaggatgag 3540

gtcctcaagg agacagtatc tcagcgccct ggagccacag tacccactga ctttgccacc 3600gtcctcaagg agacagtatc tcagcgccct ggagccacag tacccactga ctttgccacc 3600

ttcccttcat cagccttcct cagggaggat ccaaagtggg aattccctcg gaagaacttg 3660ttcccttcat cagccttcct cagggaggat ccaaagtggg aattccctcg gaagaacttg 3660

gttcttggaa aaactctagg agaaggcgaa tttggaaaag tggtcaaggc aacggccttc 3720gttcttggaa aaactctagg agaaggcgaa tttggaaaag tggtcaaggc aacggccttc 3720

catctgaaag gcagagcagg gtacaccacg gtggccgtga agatgctgaa agagaacgcc 3780catctgaaag gcagagcagg gtacaccacg gtggccgtga agatgctgaa agagaacgcc 3780

tccccgagtg agcttcgaga cctgctgtca gagttcaacg tcctgaagca ggtcaaccac 3840tccccgagtg agcttcgaga cctgctgtca gagttcaacg tcctgaagca ggtcaaccac 3840

ccacatgtca tcaaattgta tggggcctgc agccaggatg gcccgctcct cctcatcgtg 3900ccacatgtca tcaaattgta tggggcctgc agccaggatg gcccgctcct cctcatcgtg 3900

gagtacgcca aatacggctc cctgcggggc ttcctccgcg agagccgcaa agtggggcct 3960gagtacgcca aatacggctc cctgcggggc ttcctccgcg agagccgcaa agtggggcct 3960

ggctacctgg gcagtggagg cagccgcaac tccagctccc tggaccaccc ggatgagcgg 4020ggctacctgg gcagtggagg cagccgcaac tccagctccc tggaccaccc ggatgagcgg 4020

gccctcacca tgggcgacct catctcattt gcctggcaga tctcacaggg gatgcagtat 4080gccctcacca tgggcgacct catctcattt gcctggcaga tctcacaggg gatgcagtat 4080

ctggccgaga tgaagctcgt tcatcgggac ttggcagcca gaaacatcct ggtagctgag 4140ctggccgaga tgaagctcgt tcatcgggac ttggcagcca gaaacatcct ggtagctgag 4140

gggcggaaga tgaagatttc ggatttcggc ttgtcccgag atgtttatga agaggattcc 4200gggcggaaga tgaagatttc ggatttcggc ttgtcccgag atgtttatga agaggattcc 4200

tacgtgaaga ggagccaggg tcggattcca gttaaatgga tggcaattga atcccttttt 4260tacgtgaaga ggagccaggg tcggattcca gttaaatgga tggcaattga atcccttttt 4260

gatcatatct acaccacgca aagtgatgta tggtcttttg gtgtcctgct gtgggagatc 4320gatcatatct acaccacgca aagtgatgta tggtcttttg gtgtcctgct gtggggagatc 4320

gtgaccctag ggggaaaccc ctatcctggg attcctcctg agcggctctt caaccttctg 4380gtgaccctag ggggaaaccc ctatcctggg attcctcctg agcggctctt caaccttctg 4380

aagaccggcc accggatgga gaggccagac aactgcagcg aggagatgta ccgcctgatg 4440aagaccggcc accggatgga gaggccagac aactgcagcg aggagatgta ccgcctgatg 4440

ctgcaatgct ggaagcagga gccggacaaa aggccggtgt ttgcggacat cagcaaagac 4500ctgcaatgct ggaagcagga gccggacaaa aggccggtgt ttgcggacat cagcaaagac 4500

ctggagaaga tgatggttaa gaggagagac tacttggacc ttgcggcgtc cactccatct 4560ctggagaaga tgatggttaa gaggagagac tacttggacc ttgcggcgtc cactccatct 4560

gactccctga tttatgacga cggcctctca gaggaggaga caccgctggt ggactgtaat 4620gactccctga tttatgacga cggcctctca gaggaggaga caccgctggt ggactgtaat 4620

aatgcccccc tccctcgagc cctcccttcc acatggattg aaaacaaact ctatggcatg 4680aatgcccccc tccctcgagc cctcccttcc acatggattg aaaacaaact ctatggcatg 4680

tcagacccga actggcctgg agagagtcct gtaccactca cgagagctga tggcactaac 4740tcagacccga actggcctgg agagagtcct gtaccactca cgagagctga tggcactaac 4740

actgggtttc caagatatcc aaatgatagt gtatatgcta actggatgct ttcaccctca 4800actgggtttc caagatatcc aaatgatagt gtatatgcta actggatgct ttcaccctca 4800

gcggcaaaat taatggacac gtttgatagt taa 4833gcggcaaaat taatggacac gtttgatagt taa 4833

<210> 10<210> 10

<211> 1610<211> 1610

<212> белок<212> protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> слитый пептид<223> fusion peptide

<400> 10<400> 10

Met Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly SerMet Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly Ser

1. 5 10 151. 5 10 15

Arg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser ArgArg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg

20 25 3020 25 30

Val Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val GlyVal Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly

35 40 4535 40 45

Ala Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp GluAla Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu

50 55 6050 55 60

Ala Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe ThrAla Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr

65 70 75 8065 70 75 80

Cys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln ValCys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val

85 90 9585 90 95

Phe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser SerPhe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser

100 105 110100 105 110

Ala Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys ThrAla Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr

115 120 125115 120 125

Ser Lys Leu Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala SerSer Lys Leu Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser

130 135 140130 135 140

Ser Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser SerSer Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser

145 150 155 160145 150 155 160

Ser Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile IleSer Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile

165 170 175165 170 175

Pro Thr Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro SerPro Thr Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser

180 185 190180 185 190

Pro Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu GluPro Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu

195 200 205195 200 205

Glu Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala LysGlu Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys

210 215 220210 215 220

Leu Lys Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln GluLeu Lys Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu

225 230 235 240225 230 235 240

Trp Lys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg LeuTrp Lys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu

245 250 255245 250 255

Lys Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu ArgLys Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg

260 265 270260 265 270

Tyr Met Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala ThrTyr Met Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr

275 280 285275 280 285

Leu Asp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln GluLeu Asp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu

290 295 300290 295 300

Val Glu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu GluVal Glu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu

305 310 315 320305 310 315 320

Ile Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala SerIle Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser

325 330 335325 330 335

Ser Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys AspSer Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp

340 345 350340 345 350

Ala Leu Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu HisAla Leu Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His

355 360 365355 360 365

Val Lys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu ValVal Lys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val

370 375 380370 375 380

Val Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala GluVal Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu

385 390 395 400385 390 395 400

Ser Thr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly AlaSer Thr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala

405 410 415405 410 415

Glu Glu Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu GluGlu Glu Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu

420 425 430420 425 430

Lys Val Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met AsnLys Val Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn

435 440 445435 440 445

Glu Met Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu GluGlu Met Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu

450 455 460450 455 460

Leu Arg Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala GlnLeu Arg Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln

465 470 475 480465 470 475 480

Lys Arg Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln ThrLys Arg Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr

485 490 495485 490 495

Ile Lys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn ArgIle Lys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg

500 505 510500 505 510

Glu Leu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln ProGlu Leu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro

515 520 525515 520 525

Pro Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys AlaPro Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala

530 535 540530 535 540

His Ala Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala GlnHis Ala Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln

545 550 555 560545 550 555 560

Ala Asn Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser PheAla Asn Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe

565 570 575565 570 575

Leu Arg Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu MetLeu Arg Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met

580 585 590580 585 590

Pro Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln GluPro Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu

595 600 605595 600 605

Lys Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg GlyLys Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly

610 615 620610 615 620

Ala Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser LeuAla Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu

625 630 635 640625 630 635 640

Ser Leu Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser GlnSer Leu Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln

645 650 655645 650 655

Cys Ser Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu MetCys Ser Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met

660 665 670660 665 670

Ser Ala His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His LysSer Ala His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys

675 680 685675 680 685

Asp Gln Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala IleAsp Gln Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile

690 695 700690 695 700

Lys Tyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro GluLys Tyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu

705 710 715 720705 710 715 720

Asp Cys Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser AlaAsp Cys Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala

725 730 735725 730 735

Leu Asp Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu GlnLeu Asp Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln

740 745 750740 745 750

Gly Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu GluGly Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu

755 760 765755 760 765

Thr Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg ArgThr Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg

770 775 780770 775 780

Met Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe GlyMet Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly

785 790 795 800785 790 795 800

Pro Gln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr TrpPro Gln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp

805 810 815805 810 815

Val Val Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu IleVal Val Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile

820 825 830820 825 830

Ala Pro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu GluAla Pro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu

835 840 845835 840 845

Leu Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser SerLeu Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser

850 855 860850 855 860

Pro Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr MetPro Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met

865 870 875 880865 870 875 880

Asn Lys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu ArgAsn Lys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg

885 890 895885 890 895

Pro Pro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu ArgPro Pro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg

900 905 910900 905 910

Ala Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp ArgAla Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg

915 920 925915 920 925

Glu Thr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly GluGlu Thr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu

930 935 940930 935 940

Glu Leu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys LeuGlu Leu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu

945 950 955 960945 950 955 960

Asp Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln ThrAsp Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr

965 970 975965 970 975

Arg Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu PheArg Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe

980 985 990980 985 990

Glu Glu Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu AlaGlu Glu Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala

995 1000 1005995 1000 1005

Glu Lys Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys ArgGlu Lys Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg

1010 1015 10201010 1015 1020

Thr Ile Glu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala ThrThr Ile Glu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr

1025 1030 10351025 1030 1035

Leu Val Ser Gly Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala ProLeu Val Ser Gly Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro

1040 1045 10501040 1045 1050

Gly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu LeuGly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu

1055 1060 10651055 1060 1065

Leu Gln Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu GlnLeu Gln Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln

1070 1075 10801070 1075 1080

His Glu Asn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser LeuHis Glu Asn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu

1085 1090 10951085 1090 1095

Ala Ser Leu Pro Pro Leu His Val Ala Lys Leu Ser His Glu GlyAla Ser Leu Pro Pro Leu His Val Ala Lys Leu Ser His Glu Gly

1100 1105 11101100 1105 1110

Pro Gly Ser Glu Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr SerPro Gly Ser Glu Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser

1115 1120 11251115 1120 1125

Gln Leu Leu Glu Thr Leu Asn Gln Leu Ser Thr His Thr His ValGln Leu Leu Glu Thr Leu Asn Gln Leu Ser Thr His Thr His Val

1130 1135 11401130 1135 1140

Val Asp Ile Thr Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser AlaVal Asp Ile Thr Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala

1145 1150 11551145 1150 1155

Gln Leu Met Glu Gln Val Ala Gln Leu Lys Ser Leu Ser Asp ThrGln Leu Met Glu Gln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr

1160 1165 11701160 1165 1170

Val Glu Lys Leu Lys Asp Glu Val Leu Lys Glu Thr Val Ser GlnVal Glu Lys Leu Lys Asp Glu Val Leu Lys Glu Thr Val Ser Gln

1175 1180 11851175 1180 1185

Arg Pro Gly Ala Thr Val Pro Thr Asp Phe Ala Thr Phe Pro SerArg Pro Gly Ala Thr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser

1190 1195 12001190 1195 1200

Ser Ala Phe Leu Arg Glu Asp Pro Lys Trp Glu Phe Pro Arg LysSer Ala Phe Leu Arg Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys

1205 1210 12151205 1210 1215

Asn Leu Val Leu Gly Lys Thr Leu Gly Glu Gly Glu Phe Gly LysAsn Leu Val Leu Gly Lys Thr Leu Gly Glu Gly Glu Phe Gly Lys

1220 1225 12301220 1225 1230

Val Val Lys Ala Thr Ala Phe His Leu Lys Gly Arg Ala Gly TyrVal Val Lys Ala Thr Ala Phe His Leu Lys Gly Arg Ala Gly Tyr

1235 1240 12451235 1240 1245

Thr Thr Val Ala Val Lys Met Leu Lys Glu Asn Ala Ser Pro SerThr Thr Val Ala Val Lys Met Leu Lys Glu Asn Ala Ser Pro Ser

1250 1255 12601250 1255 1260

Glu Leu Arg Asp Leu Leu Ser Glu Phe Asn Val Leu Lys Gln ValGlu Leu Arg Asp Leu Leu Ser Glu Phe Asn Val Leu Lys Gln Val

1265 1270 12751265 1270 1275

Asn His Pro His Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln AspAsn His Pro His Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp

1280 1285 12901280 1285 1290

Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser LeuGly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu

1295 1300 13051295 1300 1305

Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr LeuArg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu

1310 1315 13201310 1315 1320

Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro AspGly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro Asp

1325 1330 13351325 1330 1335

Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp GlnGlu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln

1340 1345 13501340 1345 1350

Ile Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val HisIle Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His

1355 1360 13651355 1360 1365

Arg Asp Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg LysArg Asp Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys

1370 1375 13801370 1375 1380

Met Lys Ile Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu GluMet Lys Ile Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu

1385 1390 13951385 1390 1395

Asp Ser Tyr Val Lys Arg Ser Gln Gly Arg Ile Pro Val Lys TrpAsp Ser Tyr Val Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp

1400 1405 14101400 1405 1410

Met Ala Ile Glu Ser Leu Phe Asp His Ile Tyr Thr Thr Gln SerMet Ala Ile Glu Ser Leu Phe Asp His Ile Tyr Thr Thr Gln Ser

1415 1420 14251415 1420 1425

Asp Val Trp Ser Phe Gly Val Leu Leu Trp Glu Ile Val Thr LeuAsp Val Trp Ser Phe Gly Val Leu Leu Trp Glu Ile Val Thr Leu

1430 1435 14401430 1435 1440

Gly Gly Asn Pro Tyr Pro Gly Ile Pro Pro Glu Arg Leu Phe AsnGly Gly Asn Pro Tyr Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn

1445 1450 14551445 1450 1455

Leu Leu Lys Thr Gly His Arg Met Glu Arg Pro Asp Asn Cys SerLeu Leu Lys Thr Gly His Arg Met Glu Arg Pro Asp Asn Cys Ser

1460 1465 14701460 1465 1470

Glu Glu Met Tyr Arg Leu Met Leu Gln Cys Trp Lys Gln Glu ProGlu Glu Met Tyr Arg Leu Met Leu Gln Cys Trp Lys Gln Glu Pro

1475 1480 14851475 1480 1485

Asp Lys Arg Pro Val Phe Ala Asp Ile Ser Lys Asp Leu Glu LysAsp Lys Arg Pro Val Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys

1490 1495 15001490 1495 1500

Met Met Val Lys Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser ThrMet Met Val Lys Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr

1505 1510 15151505 1510 1515

Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu GluPro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu

1520 1525 15301520 1525 1530

Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala LeuThr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu

1535 1540 15451535 1540 1545

Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Met Ser Asp ProPro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Met Ser Asp Pro

1550 1555 15601550 1555 1560

Asn Trp Pro Gly Glu Ser Pro Val Pro Leu Thr Arg Ala Asp GlyAsn Trp Pro Gly Glu Ser Pro Val Pro Leu Thr Arg Ala Asp Gly

1565 1570 15751565 1570 1575

Thr Asn Thr Gly Phe Pro Arg Tyr Pro Asn Asp Ser Val Tyr AlaThr Asn Thr Gly Phe Pro Arg Tyr Pro Asn Asp Ser Val Tyr Ala

1580 1585 15901580 1585 1590

Asn Trp Met Leu Ser Pro Ser Ala Ala Lys Leu Met Asp Thr PheAsn Trp Met Leu Ser Pro Ser Ala Ala Lys Leu Met Asp Thr Phe

1595 1600 16051595 1600 1605

Asp SerAsp Ser

16101610

<210> 11<210> 11

<211> 4707<211> 4707

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кодирующая последовательность слитого пептида<223> fusion peptide coding sequence

<400> 11<400> 11

atggcacaga gcaagaggca cgtgtacagc cggacgccca gcggcagcag gatgagtgcg 60atggcacaga gcaagaggca cgtgtacagc cggacgccca gcggcagcag gatgagtgcg 60

gaggcaagcg cccggcctct gcgggtgggc tcccgtgtag aggtgattgg aaaaggccac 120gaggcaagcg cccggcctct gcgggtgggc tcccgtgtag aggtgattgg aaaaggccac 120

cgaggcactg tggcctatgt tggagccaca ctgtttgcca ctggcaaatg ggtaggcgtg 180cgaggcactg tggcctatgt tggagccaca ctgtttgcca ctggcaaatg ggtaggcgtg 180

attctggatg aagcaaaggg caaaaatgat ggaactgttc aaggcaggaa gtacttcact 240attctggatg aagcaaaggg caaaaatgat ggaactgttc aaggcaggaa gtacttcact 240

tgtgatgaag ggcatggcat ctttgtgcgc cagtcccaga tccaggtatt tgaagatgga 300tgtgatgaag ggcatggcat ctttgtgcgc cagtcccaga tccaggtatt tgaagatgga 300

gcagatacta cttccccaga gacacctgat tcttctgctt caaaagtcct caaaagagag 360gcagatacta cttccccaga gacacctgat tcttctgctt caaaagtcct caaaagagag 360

ggaactgata caactgcaaa gactagcaaa ctgcccacgc gcccagccag tactggggtg 420ggaactgata caactgcaaa gactagcaaa ctgcccacgc gcccagccag tactggggtg 420

gctggggcca gtagctccct gggcccctct ggctcagcgt cagcaggtga gctgagcagc 480gctggggcca gtagctccct gggcccctct ggctcagcgt cagcaggtga gctgagcagc 480

agtgagccca gcaccccggc tcagactccg ctggcagcac ccatcatccc cacgccggtc 540agtgagccca gcaccccggc tcagactccg ctggcagcac ccatcatccc cacgccggtc 540

ctcacctctc ctggagcagt ccccccgctt ccttccccat ccaaggagga ggagggacta 600ctcacctctc ctggagcagt ccccccgctt ccttccccat ccaaggagga ggagggacta 600

agggctcagg tgcgggacct ggaggagaaa ctagagaccc tgagactgaa acgggcagaa 660agggctcagg tgcgggacct ggaggagaaa ctagagaaccc tgagactgaa acgggcagaa 660

gacaaagcaa agctaaaaga gctggagaaa cacaaaatcc agctggagca ggtgcaggaa 720gacaaagcaa agctaaaaga gctggagaaa cacaaaatcc agctggagca ggtgcaggaa 720

tggaagagca aaatgcagga gcagcaggcc gacctgcagc ggcgcctcaa ggaggcgaga 780tggaagagca aaatgcagga gcagcaggcc gacctgcagc ggcgcctcaa ggaggcgaga 780

aaggaagcca aggaggcgct ggaggcaaag gaacgctata tggaggagat ggctgatact 840aaggaagcca aggaggcgct ggaggcaaag gaacgctata tggaggat ggctgatact 840

gctgatgcca ttgagatggc cactttggac aaggagatgg ctgaagagcg ggctgagtcc 900gctgatgcca ttgagatggc cactttggac aaggatgg ctgaagagcg ggctgagtcc 900

ctgcagcagg aggtggaggc actgaaggag cgggtggacg agctcactac tgacttagag 960ctgcagcagg aggtggaggc actgaaggag cgggtggacg agctcactac tgacttagag 960

atcctcaagg ctgagattga agagaagggc tcagatggcg ctgcatccag ttatcagctc 1020atcctcaagg ctgagattga agagaagggc tcagatggcg ctgcatccag ttatcagctc 1020

aagcagcttg aggagcagaa tgcccgcctg aaggatgccc tggtgaggat gcgggatctt 1080aagcagcttg aggagcagaa tgcccgcctg aaggatgccc tggtgaggat gcgggatctt 1080

tcttcctcag agaagcagga gcatgtgaag ctccagaagc tcatggaaaa gaagaaccaa 1140tcttcctcag agaagcagga gcatgtgaag ctccagaagc tcatggaaaa gaagaaccaa 1140

gagctggaag ttgtgaggca acagcgggag cgtctgcagg aggagctaag ccaggcagag 1200gagctggaag ttgtgaggca acagcgggag cgtctgcagg aggagctaag ccaggcagag 1200

agcaccattg atgagctcaa ggagcaggtg gatgctgctc tgggtgctga ggagatggtg 1260agcaccattg atgagctcaa ggagcaggtg gatgctgctc tgggtgctga ggagatggtg 1260

gagatgctga cagatcggaa cctgaatctg gaagagaaag tgcgcgagtt gagggagact 1320gagatgctga cagatcggaa cctgaatctg gaagagaaag tgcgcgagtt gagggagact 1320

gtgggagact tggaagcgat gaatgagatg aacgatgagc tgcaggagaa tgcacgtgag 1380gtgggagact tggaagcgat gaatgagatg aacgatgagc tgcaggagaa tgcacgtgag 1380

acagaactgg agctgcggga gcagctggac atggcaggcg cgcgggttcg tgaggcccag 1440acagaactgg agctgcggga gcagctggac atggcaggcg cgcgggttcg tgaggcccag 1440

aagcgtgtgg aggcagccca ggagacggtt gcagactacc agcagaccat caagaagtac 1500aagcgtgtgg aggcagccca ggagacggtt gcagactacc agcagaccat caagaagtac 1500

cgccagctga ccgcccatct acaggatgtg aatcgggaac tgacaaacca gcaggaagca 1560cgccagctga ccgcccatct acaggatgtg aatcgggaac tgacaaacca gcaggaagca 1560

tctgtggaga ggcaacagca gccacctcca gagacctttg acttcaaaat caagtttgct 1620tctgtggaga ggcaacagca gccacctcca gagacctttg acttcaaaat caagtttgct 1620

gagactaagg cccatgccaa ggcaattgag atggaattga ggcagatgga ggtggcccag 1680gagactaagg cccatgccaa ggcaattgag atggaattga ggcagatgga ggtggcccag 1680

gccaatcgac acatgtccct gctgacagcc ttcatgcctg acagcttcct tcggccaggt 1740gccaatcgac acatgtccct gctgacagcc ttcatgcctg acagcttcct tcggccaggt 1740

ggggaccatg actgcgttct ggtgctgttg ctcatgcctc gtctcatttg caaggcagag 1800ggggaccatg actgcgttct ggtgctgttg ctcatgcctc gtctcatttg caaggcagag 1800

ctgatccgga agcaggccca ggagaagttt gaactaagtg agaactgttc agagcggcct 1860ctgatccgga agcaggccca ggagaagttt gaactaagtg agaactgttc agagcggcct 1860

gggctgcgag gagctgctgg ggagcaactc agctttgctg ctggactggt gtactcgctg 1920gggctgcgag gagctgctgg ggagcaactc agctttgctg ctggactggt gtactcgctg 1920

agcctgctgc aggccacgct acaccgctat gagcatgccc tctctcagtg cagtgtggat 1980agcctgctgc aggccacgct acaccgctat gagcatgccc tctctcagtg cagtgtggat 1980

gtgtataaga aagtgggcag cctgtaccct gagatgagtg cccatgagcg ctccttggat 2040gtgtataaga aagtgggcag cctgtaccct gagatgagtg cccatgagcg ctccttggat 2040

ttcctcattg aactgctgca caaggatcag ctggatgaga ctgtcaatgt ggagcctctc 2100ttcctcattg aactgctgca caaggatcag ctggatgaga ctgtcaatgt ggagcctctc 2100

accaaggcca tcaagtacta tcagcatctg tacagcatcc accttgccga acagcctgag 2160accaaggcca tcaagtacta tcagcatctg tacagcatcc accttgccga acagcctgag 2160

gactgtacta tgcagctggc tgaccacatt aagttcacgc agagtgctct ggactgcatg 2220gactgtacta tgcagctggc tgaccacatt aagttcacgc agagtgctct ggactgcatg 2220

agtgtggagg taggacggct gcgtgccttc ttgcagggtg ggcaggaggc tacagatatt 2280agtgtggagg taggacggct gcgtgccttc ttgcagggtg ggcaggaggc tacagatatt 2280

gccctcctgc tccgggatct ggaaacttca tgcagtgaca tccgccagtt ctgcaagaag 2340gccctcctgc tccgggatct ggaaacttca tgcagtgaca tccgccagtt ctgcaagaag 2340

atccgaaggc gaatgccagg gacagatgct cctgggatcc cagctgcact ggcctttgga 2400atccgaaggc gaatgccagg gacagatgct cctgggatcc cagctgcact ggcctttgga 2400

ccacaggtat ctgacacgct cctagactgc aggaaacact tgacgtgggt cgtggctgtg 2460ccacaggtat ctgacacgct cctagactgc aggaaacact tgacgtgggt cgtggctgtg 2460

ctgcaggagg tggcagctgc tgctgcccag ctcattgccc cactggcaga gaatgagggg 2520ctgcaggagg tggcagctgc tgctgcccag ctcattgccc cactggcaga gaatgagggg 2520

ctacttgtgg ctgctctgga ggaactggct ttcaaagcaa gcgagcagat ctatgggacc 2580ctacttgtgg ctgctctgga ggaactggct ttcaaagcaa gcgagcagat ctatgggacc 2580

ccctccagca gcccctatga gtgtctgcgc cagtcatgca acatcctcat cagtaccatg 2640ccctccagca gcccctatga gtgtctgcgc cagtcatgca acatcctcat cagtaccatg 2640

aacaagctgg ccacagccat gcaggagggg gagtatgatg cagagcggcc ccccagcaag 2700aacaagctgg ccacagccat gcaggagggg gagtatgatg cagagcggcc ccccagcaag 2700

cctccaccgg ttgaactgcg ggctgctgcc cttcgtgcag agatcacaga tgctgaaggc 2760cctccaccgg ttgaactgcg ggctgctgcc cttcgtgcag agatcacaga tgctgaaggc 2760

ctgggtttga agctcgaaga tcgagagaca gttattaagg agttgaagaa gtcactcaag 2820ctgggtttga agctcgaaga tcgagagaca gttattaagg agttgaagaa gtcactcaag 2820

attaagggag aggagctaag tgaggccaat gtgcggctga gcctcctgga gaagaagttg 2880attaagggag aggagctaag tgaggccaat gtgcggctga gcctcctgga gaagaagttg 2880

gacagtgctg ccaaggatgc agatgagcgc atcgagaaag tccagactcg gctggaggag 2940gacagtgctg ccaaggatgc agatgagcgc atcgagaaag tccagactcg gctggaggag 2940

acccaggcac tgctgcgaaa gaaggagaaa gagtttgagg agacaatgga tgcactccag 3000acccaggcac tgctgcgaaa gaaggagaaa gagtttgagg agacaatgga tgcactccag 3000

gctgacatcg accagctgga ggcagagaag gcagaactaa agcagcgtct gaacagccag 3060gctgacatcg accagctgga ggcagagaag gcagaactaa agcagcgtct gaacagccag 3060

tccaaacgca cgattgaggg actccggggc cctcctcctt caggcattgc tactctggtc 3120tccaaacgca cgattgaggg actccggggc cctcctcctt caggcattgc tactctggtc 3120

tctggcattg ctggtggagc catccctggg caggctccag ggtctgtgcc aggcccaggg 3180tctggcattg ctggtggagc catccctggg caggctccag ggtctgtgcc aggcccaggg 3180

ctggtgaagg actcaccact gctgcttcag cagatctctg ccatgaggct gcacatctcc 3240ctggtgaagg actcaccact gctgcttcag cagatctctg ccatgaggct gcacatctcc 3240

cagctccagc atgagaacag catcctcaag ggagcccaga tgaaggcatc cttggcatcc 3300cagctccagc atgagaacag catcctcaag ggagcccaga tgaaggcatc cttggcatcc 3300

ctgccccctc tgcatgttgc aaagctatcc catgagggcc ctggcagtga gttaccagct 3360ctgccccctc tgcatgttgc aaagctatcc catgaggcc ctggcagtga gttaccagct 3360

ggagcgctgt atcgtaagac cagccagctg ctggagacat tgaatcaatt gagcacacac 3420ggagcgctgt atcgtaagac cagccagctg ctggagacat tgaatcaatt gagcacacac 3420

acgcacgtag tagacatcac tcgcaccagc cctgctgcca agagcccgtc ggcccaactt 3480acgcacgtag tagacatcac tcgcaccagc cctgctgcca agagcccgtc ggcccaactt 3480

atggagcaag tggctcagct taagtccctg agtgacaccg tcgagaagct caaggatgag 3540atggagcaag tggctcagct taagtccctg agtgacaccg tcgagaagct caaggatgag 3540

gtcctcaagg agacagtatc tcagcgccct ggagccacag tacccactga ctttgccacc 3600gtcctcaagg agacagtatc tcagcgccct ggagccacag tacccactga ctttgccacc 3600

ttcccttcat cagccttcct cagggaggat ccaaagtggg aattccctcg gaagaacttg 3660ttcccttcat cagccttcct cagggaggat ccaaagtggg aattccctcg gaagaacttg 3660

gttcttggaa aaactctagg agaaggcgaa tttggaaaag tggtcaaggc aacggccttc 3720gttcttggaa aaactctagg agaaggcgaa tttggaaaag tggtcaaggc aacggccttc 3720

catctgaaag gcagagcagg gtacaccacg gtggccgtga agatgctgaa agagaacgcc 3780catctgaaag gcagagcagg gtacaccacg gtggccgtga agatgctgaa agagaacgcc 3780

tccccgagtg agcttcgaga cctgctgtca gagttcaacg tcctgaagca ggtcaaccac 3840tccccgagtg agcttcgaga cctgctgtca gagttcaacg tcctgaagca ggtcaaccac 3840

ccacatgtca tcaaattgta tggggcctgc agccaggatg gcccgctcct cctcatcgtg 3900ccacatgtca tcaaattgta tggggcctgc agccaggatg gcccgctcct cctcatcgtg 3900

gagtacgcca aatacggctc cctgcggggc ttcctccgcg agagccgcaa agtggggcct 3960gagtacgcca aatacggctc cctgcggggc ttcctccgcg agagccgcaa agtggggcct 3960

ggctacctgg gcagtggagg cagccgcaac tccagctccc tggaccaccc ggatgagcgg 4020ggctacctgg gcagtggagg cagccgcaac tccagctccc tggaccaccc ggatgagcgg 4020

gccctcacca tgggcgacct catctcattt gcctggcaga tctcacaggg gatgcagtat 4080gccctcacca tgggcgacct catctcattt gcctggcaga tctcacaggg gatgcagtat 4080

ctggccgaga tgaagctcgt tcatcgggac ttggcagcca gaaacatcct ggtagctgag 4140ctggccgaga tgaagctcgt tcatcgggac ttggcagcca gaaacatcct ggtagctgag 4140

gggcggaaga tgaagatttc ggatttcggc ttgtcccgag atgtttatga agaggattcc 4200gggcggaaga tgaagatttc ggatttcggc ttgtcccgag atgtttatga agaggattcc 4200

tacgtgaaga ggagccaggg tcggattcca gttaaatgga tggcaattga atcccttttt 4260tacgtgaaga ggagccaggg tcggattcca gttaaatgga tggcaattga atcccttttt 4260

gatcatatct acaccacgca aagtgatgta tggtcttttg gtgtcctgct gtgggagatc 4320gatcatatct acaccacgca aagtgatgta tggtcttttg gtgtcctgct gtggggagatc 4320

gtgaccctag ggggaaaccc ctatcctggg attcctcctg agcggctctt caaccttctg 4380gtgaccctag ggggaaaccc ctatcctggg attcctcctg agcggctctt caaccttctg 4380

aagaccggcc accggatgga gaggccagac aactgcagcg aggagatgta ccgcctgatg 4440aagaccggcc accggatgga gaggccagac aactgcagcg aggagatgta ccgcctgatg 4440

ctgcaatgct ggaagcagga gccggacaaa aggccggtgt ttgcggacat cagcaaagac 4500ctgcaatgct ggaagcagga gccggacaaa aggccggtgt ttgcggacat cagcaaagac 4500

ctggagaaga tgatggttaa gaggagagac tacttggacc ttgcggcgtc cactccatct 4560ctggagaaga tgatggttaa gaggagagac tacttggacc ttgcggcgtc cactccatct 4560

gactccctga tttatgacga cggcctctca gaggaggaga caccgctggt ggactgtaat 4620gactccctga tttatgacga cggcctctca gaggaggaga caccgctggt ggactgtaat 4620

aatgcccccc tccctcgagc cctcccttcc acatggattg aaaacaaact ctatggtaga 4680aatgcccccc tccctcgagc cctcccttcc acatggattg aaaacaaact ctatggtaga 4680

atttcccatg catttactag attctag 4707atttcccatg catttactag attctag 4707

<210> 12<210> 12

<211> 1568<211> 1568

<212> белок<212> protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> слитый пептид<223> fusion peptide

<400> 12<400> 12

Met Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly SerMet Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly Ser

1. 5 10 151. 5 10 15

Arg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser ArgArg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg

20 25 3020 25 30

Val Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val GlyVal Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly

35 40 4535 40 45

Ala Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp GluAla Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu

50 55 6050 55 60

Ala Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe ThrAla Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr

65 70 75 8065 70 75 80

Cys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln ValCys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val

85 90 9585 90 95

Phe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser SerPhe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser

100 105 110100 105 110

Ala Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys ThrAla Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr

115 120 125115 120 125

Ser Lys Leu Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala SerSer Lys Leu Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser

130 135 140130 135 140

Ser Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser SerSer Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser

145 150 155 160145 150 155 160

Ser Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile IleSer Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile

165 170 175165 170 175

Pro Thr Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro SerPro Thr Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser

180 185 190180 185 190

Pro Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu GluPro Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu

195 200 205195 200 205

Glu Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala LysGlu Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys

210 215 220210 215 220

Leu Lys Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln GluLeu Lys Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu

225 230 235 240225 230 235 240

Trp Lys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg LeuTrp Lys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu

245 250 255245 250 255

Lys Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu ArgLys Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg

260 265 270260 265 270

Tyr Met Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala ThrTyr Met Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr

275 280 285275 280 285

Leu Asp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln GluLeu Asp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu

290 295 300290 295 300

Val Glu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu GluVal Glu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu

305 310 315 320305 310 315 320

Ile Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala SerIle Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser

325 330 335325 330 335

Ser Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys AspSer Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp

340 345 350340 345 350

Ala Leu Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu HisAla Leu Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His

355 360 365355 360 365

Val Lys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu ValVal Lys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val

370 375 380370 375 380

Val Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala GluVal Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu

385 390 395 400385 390 395 400

Ser Thr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly AlaSer Thr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala

405 410 415405 410 415

Glu Glu Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu GluGlu Glu Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu

420 425 430420 425 430

Lys Val Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met AsnLys Val Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn

435 440 445435 440 445

Glu Met Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu GluGlu Met Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu

450 455 460450 455 460

Leu Arg Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala GlnLeu Arg Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln

465 470 475 480465 470 475 480

Lys Arg Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln ThrLys Arg Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr

485 490 495485 490 495

Ile Lys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn ArgIle Lys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg

500 505 510500 505 510

Glu Leu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln ProGlu Leu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro

515 520 525515 520 525

Pro Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys AlaPro Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala

530 535 540530 535 540

His Ala Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala GlnHis Ala Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln

545 550 555 560545 550 555 560

Ala Asn Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser PheAla Asn Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe

565 570 575565 570 575

Leu Arg Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu MetLeu Arg Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met

580 585 590580 585 590

Pro Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln GluPro Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu

595 600 605595 600 605

Lys Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg GlyLys Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly

610 615 620610 615 620

Ala Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser LeuAla Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu

625 630 635 640625 630 635 640

Ser Leu Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser GlnSer Leu Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln

645 650 655645 650 655

Cys Ser Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu MetCys Ser Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met

660 665 670660 665 670

Ser Ala His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His LysSer Ala His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys

675 680 685675 680 685

Asp Gln Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala IleAsp Gln Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile

690 695 700690 695 700

Lys Tyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro GluLys Tyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu

705 710 715 720705 710 715 720

Asp Cys Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser AlaAsp Cys Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala

725 730 735725 730 735

Leu Asp Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu GlnLeu Asp Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln

740 745 750740 745 750

Gly Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu GluGly Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu

755 760 765755 760 765

Thr Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg ArgThr Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg

770 775 780770 775 780

Met Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe GlyMet Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly

785 790 795 800785 790 795 800

Pro Gln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr TrpPro Gln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp

805 810 815805 810 815

Val Val Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu IleVal Val Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile

820 825 830820 825 830

Ala Pro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu GluAla Pro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu

835 840 845835 840 845

Leu Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser SerLeu Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser

850 855 860850 855 860

Pro Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr MetPro Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met

865 870 875 880865 870 875 880

Asn Lys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu ArgAsn Lys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg

885 890 895885 890 895

Pro Pro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu ArgPro Pro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg

900 905 910900 905 910

Ala Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp ArgAla Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg

915 920 925915 920 925

Glu Thr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly GluGlu Thr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu

930 935 940930 935 940

Glu Leu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys LeuGlu Leu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu

945 950 955 960945 950 955 960

Asp Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln ThrAsp Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr

965 970 975965 970 975

Arg Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu PheArg Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe

980 985 990980 985 990

Glu Glu Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu AlaGlu Glu Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala

995 1000 1005995 1000 1005

Glu Lys Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys ArgGlu Lys Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg

1010 1015 10201010 1015 1020

Thr Ile Glu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala ThrThr Ile Glu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr

1025 1030 10351025 1030 1035

Leu Val Ser Gly Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala ProLeu Val Ser Gly Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro

1040 1045 10501040 1045 1050

Gly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu LeuGly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu

1055 1060 10651055 1060 1065

Leu Gln Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu GlnLeu Gln Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln

1070 1075 10801070 1075 1080

His Glu Asn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser LeuHis Glu Asn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu

1085 1090 10951085 1090 1095

Ala Ser Leu Pro Pro Leu His Val Ala Lys Leu Ser His Glu GlyAla Ser Leu Pro Pro Leu His Val Ala Lys Leu Ser His Glu Gly

1100 1105 11101100 1105 1110

Pro Gly Ser Glu Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr SerPro Gly Ser Glu Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser

1115 1120 11251115 1120 1125

Gln Leu Leu Glu Thr Leu Asn Gln Leu Ser Thr His Thr His ValGln Leu Leu Glu Thr Leu Asn Gln Leu Ser Thr His Thr His Val

1130 1135 11401130 1135 1140

Val Asp Ile Thr Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser AlaVal Asp Ile Thr Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala

1145 1150 11551145 1150 1155

Gln Leu Met Glu Gln Val Ala Gln Leu Lys Ser Leu Ser Asp ThrGln Leu Met Glu Gln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr

1160 1165 11701160 1165 1170

Val Glu Lys Leu Lys Asp Glu Val Leu Lys Glu Thr Val Ser GlnVal Glu Lys Leu Lys Asp Glu Val Leu Lys Glu Thr Val Ser Gln

1175 1180 11851175 1180 1185

Arg Pro Gly Ala Thr Val Pro Thr Asp Phe Ala Thr Phe Pro SerArg Pro Gly Ala Thr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser

1190 1195 12001190 1195 1200

Ser Ala Phe Leu Arg Glu Asp Pro Lys Trp Glu Phe Pro Arg LysSer Ala Phe Leu Arg Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys

1205 1210 12151205 1210 1215

Asn Leu Val Leu Gly Lys Thr Leu Gly Glu Gly Glu Phe Gly LysAsn Leu Val Leu Gly Lys Thr Leu Gly Glu Gly Glu Phe Gly Lys

1220 1225 12301220 1225 1230

Val Val Lys Ala Thr Ala Phe His Leu Lys Gly Arg Ala Gly TyrVal Val Lys Ala Thr Ala Phe His Leu Lys Gly Arg Ala Gly Tyr

1235 1240 12451235 1240 1245

Thr Thr Val Ala Val Lys Met Leu Lys Glu Asn Ala Ser Pro SerThr Thr Val Ala Val Lys Met Leu Lys Glu Asn Ala Ser Pro Ser

1250 1255 12601250 1255 1260

Glu Leu Arg Asp Leu Leu Ser Glu Phe Asn Val Leu Lys Gln ValGlu Leu Arg Asp Leu Leu Ser Glu Phe Asn Val Leu Lys Gln Val

1265 1270 12751265 1270 1275

Asn His Pro His Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln AspAsn His Pro His Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp

1280 1285 12901280 1285 1290

Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser LeuGly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu

1295 1300 13051295 1300 1305

Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr LeuArg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu

1310 1315 13201310 1315 1320

Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro AspGly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro Asp

1325 1330 13351325 1330 1335

Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp GlnGlu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln

1340 1345 13501340 1345 1350

Ile Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val HisIle Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His

1355 1360 13651355 1360 1365

Arg Asp Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg LysArg Asp Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys

1370 1375 13801370 1375 1380

Met Lys Ile Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu GluMet Lys Ile Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu

1385 1390 13951385 1390 1395

Asp Ser Tyr Val Lys Arg Ser Gln Gly Arg Ile Pro Val Lys TrpAsp Ser Tyr Val Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp

1400 1405 14101400 1405 1410

Met Ala Ile Glu Ser Leu Phe Asp His Ile Tyr Thr Thr Gln SerMet Ala Ile Glu Ser Leu Phe Asp His Ile Tyr Thr Thr Gln Ser

1415 1420 14251415 1420 1425

Asp Val Trp Ser Phe Gly Val Leu Leu Trp Glu Ile Val Thr LeuAsp Val Trp Ser Phe Gly Val Leu Leu Trp Glu Ile Val Thr Leu

1430 1435 14401430 1435 1440

Gly Gly Asn Pro Tyr Pro Gly Ile Pro Pro Glu Arg Leu Phe AsnGly Gly Asn Pro Tyr Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn

1445 1450 14551445 1450 1455

Leu Leu Lys Thr Gly His Arg Met Glu Arg Pro Asp Asn Cys SerLeu Leu Lys Thr Gly His Arg Met Glu Arg Pro Asp Asn Cys Ser

1460 1465 14701460 1465 1470

Glu Glu Met Tyr Arg Leu Met Leu Gln Cys Trp Lys Gln Glu ProGlu Glu Met Tyr Arg Leu Met Leu Gln Cys Trp Lys Gln Glu Pro

1475 1480 14851475 1480 1485

Asp Lys Arg Pro Val Phe Ala Asp Ile Ser Lys Asp Leu Glu LysAsp Lys Arg Pro Val Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys

1490 1495 15001490 1495 1500

Met Met Val Lys Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser ThrMet Met Val Lys Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr

1505 1510 15151505 1510 1515

Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu GluPro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu

1520 1525 15301520 1525 1530

Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala LeuThr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu

1535 1540 15451535 1540 1545

Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Arg Ile Ser HisPro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Arg Ile Ser His

1550 1555 15601550 1555 1560

Ala Phe Thr Arg PheAla Phe Thr Arg Phe

15651565

<210> 13<210> 13

<211> 4491<211> 4491

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кодирующая последовательность слитого пептида<223> fusion peptide coding sequence

<400> 13<400> 13

atgatgagac aggcaccgac agcccgaaag accacaactc ggcgacccaa gcccacgcgc 60atgatgagac aggcaccgac agcccgaaag accacaactc ggcgacccaa gcccacgcgc 60

ccagccagta ctggggtggc tggggccagt agctccctgg gcccctctgg ctcagcgtca 120ccagccagta ctggggtggc tggggccagt agctccctgg gcccctctgg ctcagcgtca 120

gcaggtgagc tgagcagcag tgagcccagc accccggctc agactccgct ggcagcaccc 180gcaggtgagc tgagcagcag tgagcccagc accccggctc agactccgct ggcagcaccc 180

atcatcccca cgccggtcct cacctctcct ggagcagtcc ccccgcttcc ttccccatcc 240atcatcccca cgccggtcct cacctctcct ggagcagtcc ccccgcttcc ttccccatcc 240

aaggaggagg agggactaag ggctcaggtg cgggacctgg aggagaaact agagaccctg 300aaggaggagg agggactaag ggctcaggtg cgggacctgg aggagaaact agagaccctg 300

agactgaaac gggcagaaga caaagcaaag ctaaaagagc tggagaaaca caaaatccag 360agactgaaac gggcagaaga caaagcaaag ctaaaagagc tggagaaaca caaaatccag 360

ctggagcagg tgcaggaatg gaagagcaaa atgcaggagc agcaggccga cctgcagcgg 420ctggagcagg tgcaggaatg gaagagcaaa atgcaggagc agcaggccga cctgcagcgg 420

cgcctcaagg aggcgagaaa ggaagccaag gaggcgctgg aggcaaagga acgctatatg 480cgcctcaagg aggcgagaaa ggaagccaag gaggcgctgg aggcaaagga acgctatatg 480

gaggagatgg ctgatactgc tgatgccatt gagatggcca ctttggacaa ggagatggct 540gaggagatgg ctgatactgc tgatgccatt gagatggcca ctttggacaa ggagatggct 540

gaagagcggg ctgagtccct gcagcaggag gtggaggcac tgaaggagcg ggtggacgag 600gaagagcggg ctgagtccct gcagcaggag gtggaggcac tgaaggagcg ggtggacgag 600

ctcactactg acttagagat cctcaaggct gagattgaag agaagggctc agatggcgct 660ctcactactg acttagagat cctcaaggct gagattgaag agaagggctc agatggcgct 660

gcatccagtt atcagctcaa gcagcttgag gagcagaatg cccgcctgaa ggatgccctg 720gcatccagtt atcagctcaa gcagcttgag gagcagaatg cccgcctgaa ggatgccctg 720

gtgaggatgc gggatctttc ttcctcagag aagcaggagc atgtgaagct ccagaagctc 780gtgaggatgc gggatctttc ttcctcagag aagcaggagc atgtgaagct ccagaagctc 780

atggaaaaga agaaccaaga gctggaagtt gtgaggcaac agcgggagcg tctgcaggag 840atggaaaaga agaaccaaga gctggaagtt gtgaggcaac agcgggagcg tctgcaggag 840

gagctaagcc aggcagagag caccattgat gagctcaagg agcaggtgga tgctgctctg 900gagctaagcc aggcagagag caccattgat gagctcaagg agcaggtgga tgctgctctg 900

ggtgctgagg agatggtgga gatgctgaca gatcggaacc tgaatctgga agagaaagtg 960ggtgctgagg agatggtgga gatgctgaca gatcggaacc tgaatctgga agagaaagtg 960

cgcgagttga gggagactgt gggagacttg gaagcgatga atgagatgaa cgatgagctg 1020cgcgagttga gggagactgt gggagacttg gaagcgatga atgagatgaa cgatgagctg 1020

caggagaatg cacgtgagac agaactggag ctgcgggagc agctggacat ggcaggcgcg 1080caggagaatg cacgtgagac agaactggag ctgcgggagc agctggacat ggcaggcgcg 1080

cgggttcgtg aggcccagaa gcgtgtggag gcagcccagg agacggttgc agactaccag 1140cgggttcgtg aggcccagaa gcgtgtggag gcagcccagg agacggttgc agactaccag 1140

cagaccatca agaagtaccg ccagctgacc gcccatctac aggatgtgaa tcgggaactg 1200cagaccatca agaagtaccg ccagctgacc gcccatctac aggatgtgaa tcgggaactg 1200

acaaaccagc aggaagcatc tgtggagagg caacagcagc cacctccaga gacctttgac 1260acaaaccagc aggaagcatc tgtggagagg caacagcagc cacctccaga gacctttgac 1260

ttcaaaatca agtttgctga gactaaggcc catgccaagg caattgagat ggaattgagg 1320ttcaaaatca agtttgctga gactaaggcc catgccaagg caattgagat ggaattgagg 1320

cagatggagg tggcccaggc caatcgacac atgtccctgc tgacagcctt catgcctgac 1380cagatggagg tggcccaggc caatcgacac atgtccctgc tgacagcctt catgcctgac 1380

agcttccttc ggccaggtgg ggaccatgac tgcgttctgg tgctgttgct catgcctcgt 1440agcttccttc ggccaggtgg ggaccatgac tgcgttctgg tgctgttgct catgcctcgt 1440

ctcatttgca aggcagagct gatccggaag caggcccagg agaagtttga actaagtgag 1500ctcatttgca aggcagagct gatccggaag caggcccagg agaagtttga actaagtgag 1500

aactgttcag agcggcctgg gctgcgagga gctgctgggg agcaactcag ctttgctgct 1560aactgttcag agcggcctgg gctgcgagga gctgctgggg agcaactcag ctttgctgct 1560

ggactggtgt actcgctgag cctgctgcag gccacgctac accgctatga gcatgccctc 1620ggactggtgt actcgctgag cctgctgcag gccacgctac accgctatga gcatgccctc 1620

tctcagtgca gtgtggatgt gtataagaaa gtgggcagcc tgtaccctga gatgagtgcc 1680tctcagtgca gtgtggatgt gtataagaaa gtgggcagcc tgtaccctga gatgagtgcc 1680

catgagcgct ccttggattt cctcattgaa ctgctgcaca aggatcagct ggatgagact 1740catgagcgct ccttggattt cctcattgaa ctgctgcaca aggatcagct ggatgagact 1740

gtcaatgtgg agcctctcac caaggccatc aagtactatc agcatctgta cagcatccac 1800gtcaatgtgg agcctctcac caaggccatc aagtactatc agcatctgta cagcatccac 1800

cttgccgaac agcctgagga ctgtactatg cagctggctg accacattaa gttcacgcag 1860cttgccgaac agcctgagga ctgtactatg cagctggctg accacattaa gttcacgcag 1860

agtgctctgg actgcatgag tgtggaggta ggacggctgc gtgccttctt gcagggtggg 1920agtgctctgg actgcatgag tgtggaggta ggacggctgc gtgccttctt gcagggtggg 1920

caggaggcta cagatattgc cctcctgctc cgggatctgg aaacttcatg cagtgacatc 1980caggaggcta cagatattgc cctcctgctc cgggatctgg aaacttcatg cagtgacatc 1980

cgccagttct gcaagaagat ccgaaggcga atgccaggga cagatgctcc tgggatccca 2040cgccagttct gcaagaagat ccgaaggcga atgccaggga cagatgctcc tgggatccca 2040

gctgcactgg cctttggacc acaggtatct gacacgctcc tagactgcag gaaacacttg 2100gctgcactgg cctttggacc acaggtatct gacacgctcc tagactgcag gaaacacttg 2100

acgtgggtcg tggctgtgct gcaggaggtg gcagctgctg ctgcccagct cattgcccca 2160acgtgggtcg tggctgtgct gcaggaggtg gcagctgctg ctgcccagct cattgcccca 2160

ctggcagaga atgaggggct acttgtggct gctctggagg aactggcttt caaagcaagc 2220ctggcagaga atgaggggct acttgtggct gctctggagg aactggcttt caaagcaagc 2220

gagcagatct atgggacccc ctccagcagc ccctatgagt gtctgcgcca gtcatgcaac 2280gagcagatct atgggacccc ctccagcagc ccctatgagt gtctgcgcca gtcatgcaac 2280

atcctcatca gtaccatgaa caagctggcc acagccatgc aggaggggga gtatgatgca 2340atcctcatca gtaccatgaa caagctggcc acagccatgc aggaggggga gtatgatgca 2340

gagcggcccc ccagcaagcc tccaccggtt gaactgcggg ctgctgccct tcgtgcagag 2400gagcggcccc ccagcaagcc tccaccggtt gaactgcggg ctgctgccct tcgtgcagag 2400

atcacagatg ctgaaggcct gggtttgaag ctcgaagatc gagagacagt tattaaggag 2460atcacagatg ctgaaggcct gggtttgaag ctcgaagatc gagagacagt tattaaggag 2460

ttgaagaagt cactcaagat taagggagag gagctaagtg aggccaatgt gcggctgagc 2520ttgaagaagt cactcaagat taagggagag gagctaagtg aggccaatgt gcggctgagc 2520

ctcctggaga agaagttgga cagtgctgcc aaggatgcag atgagcgcat cgagaaagtc 2580ctcctggaga agaagttgga cagtgctgcc aaggatgcag atgagcgcat cgagaaagtc 2580

cagactcggc tggaggagac ccaggcactg ctgcgaaaga aggagaaaga gtttgaggag 2640cagactcggc tggagaggagac ccaggcactg ctgcgaaaga aggagaaaga gtttgaggag 2640

acaatggatg cactccaggc tgacatcgac cagctggagg cagagaaggc agaactaaag 2700acaatggatg cactccaggc tgacatcgac cagctggagg cagagaaggc agaactaaag 2700

cagcgtctga acagccagtc caaacgcacg attgagggac tccggggccc tcctccttca 2760cagcgtctga acagccagtc caaacgcacg attgagggac tccggggccc tcctccttca 2760

ggcattgcta ctctggtctc tggcattgct ggtggagcca tccctgggca ggctccaggg 2820ggcattgcta ctctggtctc tggcattgct ggtggagcca tccctgggca ggctccaggg 2820

tctgtgccag gcccagggct ggtgaaggac tcaccactgc tgcttcagca gatctctgcc 2880tctgtgccag gcccagggct ggtgaaggac tcaccactgc tgcttcagca gatctctgcc 2880

atgaggctgc acatctccca gctccagcat gagaacagca tcctcaaggg agcccagatg 2940atgaggctgc acatctccca gctccagcat gagaacagca tcctcaaggg agccgatg 2940

aaggcatcct tggcatccct gccccctctg catgttgcaa agctatccca tgagggccct 3000aaggcatcct tggcatccct gccccctctg catgttgcaa agctatccca tgagggccct 3000

ggcagtgagt taccagctgg agcgctgtat cgtaagacca gccagctgct ggagacattg 3060ggcagtgagt taccagctgg agcgctgtat cgtaagacca gccagctgct ggagacattg 3060

aatcaattga gcacacacac gcacgtagta gacatcactc gcaccagccc tgctgccaag 3120aatcaattga gcacacacac gcacgtagta gacatcactc gcaccagccc tgctgccaag 3120

agcccgtcgg cccaacttat ggagcaagtg gctcagctta agtccctgag tgacaccgtc 3180agcccgtcgg cccaacttat ggagcaagtg gctcagctta agtccctgag tgacaccgtc 3180

gagaagctca aggatgaggt cctcaaggag acagtatctc agcgccctgg agccacagta 3240gagaagctca aggatgaggt cctcaaggag acagtatctc agcgccctgg agccacagta 3240

cccactgact ttgccacctt cccttcatca gccttcctca gggaggatcc aaagtgggaa 3300cccactgact ttgccacctt cccttcatca gccttcctca gggaggatcc aaagtgggaa 3300

ttccctcgga agaacttggt tcttggaaaa actctaggag aaggcgaatt tggaaaagtg 3360ttccctcgga agaacttggt tcttggaaaa actctaggag aaggcgaatt tggaaaagtg 3360

gtcaaggcaa cggccttcca tctgaaaggc agagcagggt acaccacggt ggccgtgaag 3420gtcaaggcaa cggccttcca tctgaaaggc agagcagggt acaccacggt ggccgtgaag 3420

atgctgaaag agaacgcctc cccgagtgag cttcgagacc tgctgtcaga gttcaacgtc 3480atgctgaaag agaacgcctc cccgagtgag cttcgagacc tgctgtcaga gttcaacgtc 3480

ctgaagcagg tcaaccaccc acatgtcatc aaattgtatg gggcctgcag ccaggatggc 3540ctgaagcagg tcaaccaccc acatgtcatc aaattgtatg gggcctgcag ccaggatggc 3540

ccgctcctcc tcatcgtgga gtacgccaaa tacggctccc tgcggggctt cctccgcgag 3600ccgctcctcc tcatcgtgga gtacgccaaa tacggctccc tgcggggctt cctccgcgag 3600

agccgcaaag tggggcctgg ctacctgggc agtggaggca gccgcaactc cagctccctg 3660agccgcaaag tggggcctgg ctacctgggc agtggaggca gccgcaactc cagctccctg 3660

gaccacccgg atgagcgggc cctcaccatg ggcgacctca tctcatttgc ctggcagatc 3720gaccacccgg atgagcgggc cctcaccatg ggcgacctca tctcatttgc ctggcagatc 3720

tcacagggga tgcagtatct ggccgagatg aagctcgttc atcgggactt ggcagccaga 3780tcacagggga tgcagtatct ggccgagatg aagctcgttc atcgggactt ggcagccaga 3780

aacatcctgg tagctgaggg gcggaagatg aagatttcgg atttcggctt gtcccgagat 3840aacatcctgg tagctgaggg gcggaagatg aagatttcgg atttcggctt gtcccgagat 3840

gtttatgaag aggattccta cgtgaagagg agccagggtc ggattccagt taaatggatg 3900gtttatgaag aggattccta cgtgaagagg agccagggtc ggattccagt taaatggatg 3900

gcaattgaat ccctttttga tcatatctac accacgcaaa gtgatgtatg gtcttttggt 3960gcaattgaat ccctttttga tcatatctac accacgcaaa gtgatgtatg gtcttttggt 3960

gtcctgctgt gggagatcgt gaccctaggg ggaaacccct atcctgggat tcctcctgag 4020gtcctgctgt gggagatcgt gaccctaggg ggaaacccct atcctgggat tcctcctgag 4020

cggctcttca accttctgaa gaccggccac cggatggaga ggccagacaa ctgcagcgag 4080cggctcttca accttctgaa gaccggccac cggatggaga ggccagacaa ctgcagcgag 4080

gagatgtacc gcctgatgct gcaatgctgg aagcaggagc cggacaaaag gccggtgttt 4140gagatgtacc gcctgatgct gcaatgctgg aagcaggagc cggacaaaag gccggtgttt 4140

gcggacatca gcaaagacct ggagaagatg atggttaaga ggagagacta cttggacctt 4200gcggacatca gcaaagacct ggagaagatg atggttaaga ggagagacta cttggacctt 4200

gcggcgtcca ctccatctga ctccctgatt tatgacgacg gcctctcaga ggaggagaca 4260gcggcgtcca ctccatctga ctccctgatt tatgacgacg gcctctcaga ggaggagaca 4260

ccgctggtgg actgtaataa tgcccccctc cctcgagccc tcccttccac atggattgaa 4320ccgctggtgg actgtaataa tgcccccctc cctcgagccc tcccttccac atggattgaa 4320

aacaaactct atggcatgtc agacccgaac tggcctggag agagtcctgt accactcacg 4380aacaaactct atggcatgtc agacccgaac tggcctggag agagtcctgt accactcacg 4380

agagctgatg gcactaacac tgggtttcca agatatccaa atgatagtgt atatgctaac 4440agagctgatg gcactaacac tgggtttcca agatatccaa atgatagtgt atatgctaac 4440

tggatgcttt caccctcagc ggcaaaatta atggacacgt ttgatagtta a 4491tggatgcttt caccctcagc ggcaaaatta atggacacgt ttgatagtta a 4491

<210> 14<210> 14

<211> 1496<211> 1496

<212> белок<212> protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> слитый пептид<223> fusion peptide

<400> 14<400> 14

Met Met Arg Gln Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg ProMet Met Arg Gln Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg Pro

1. 5 10 151. 5 10 15

Lys Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser SerLys Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser Ser

20 25 3020 25 30

Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser GluLeu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser Glu

35 40 4535 40 45

Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro ThrPro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro Thr

50 55 6050 55 60

Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro SerPro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro Ser

65 70 75 8065 70 75 80

Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu LysLys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu Lys

85 90 9585 90 95

Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu LysLeu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu Lys

100 105 110100 105 110

Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp LysGlu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp Lys

115 120 125115 120 125

Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys GluSer Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys Glu

130 135 140130 135 140

Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr MetAla Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr Met

145 150 155 160145 150 155 160

Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu AspGlu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu Asp

165 170 175165 170 175

Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val GluLys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val Glu

180 185 190180 185 190

Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile LeuAla Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile Leu

195 200 205195 200 205

Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser TyrLys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser Tyr

210 215 220210 215 220

Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala LeuGln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala Leu

225 230 235 240225 230 235 240

Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val LysVal Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val Lys

245 250 255245 250 255

Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val ArgLeu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val Arg

260 265 270260 265 270

Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser ThrGln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser Thr

275 280 285275 280 285

Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu GluIle Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu Glu

290 295 300290 295 300

Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys ValMet Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys Val

305 310 315 320305 310 315 320

Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu MetArg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu Met

325 330 335325 330 335

Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu ArgAsn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu Arg

340 345 350340 345 350

Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys ArgGlu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys Arg

355 360 365355 360 365

Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile LysVal Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile Lys

370 375 380370 375 380

Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu LeuLys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu Leu

385 390 395 400385 390 395 400

Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro ProThr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro Pro

405 410 415405 410 415

Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His AlaGlu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His Ala

420 425 430420 425 430

Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala AsnLys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala Asn

435 440 445435 440 445

Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu ArgArg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu Arg

450 455 460450 455 460

Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro ArgPro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro Arg

465 470 475 480465 470 475 480

Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys PheLeu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys Phe

485 490 495485 490 495

Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala AlaGlu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala Ala

500 505 510500 505 510

Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser LeuGly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser Leu

515 520 525515 520 525

Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys SerLeu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys Ser

530 535 540530 535 540

Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser AlaVal Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser Ala

545 550 555 560545 550 555 560

His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp GlnHis Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp Gln

565 570 575565 570 575

Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys TyrLeu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys Tyr

580 585 590580 585 590

Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp CysTyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp Cys

595 600 605595 600 605

Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu AspThr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu Asp

610 615 620610 615 620

Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly GlyCys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly Gly

625 630 635 640625 630 635 640

Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr SerGln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr Ser

645 650 655645 650 655

Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met ProCys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met Pro

660 665 670660 665 670

Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro GlnGly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro Gln

675 680 685675 680 685

Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val ValVal Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val Val

690 695 700690 695 700

Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala ProAla Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala Pro

705 710 715 720705 710 715 720

Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu AlaLeu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu Ala

725 730 735725 730 735

Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro TyrPhe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro Tyr

740 745 750740 745 750

Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn LysGlu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn Lys

755 760 765755 760 765

Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro ProLeu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro Pro

770 775 780770 775 780

Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala GluSer Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala Glu

785 790 795 800785 790 795 800

Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu ThrIle Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu Thr

805 810 815805 810 815

Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu LeuVal Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu Leu

820 825 830820 825 830

Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp SerSer Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp Ser

835 840 845835 840 845

Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg LeuAla Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg Leu

850 855 860850 855 860

Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu GluGlu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu Glu

865 870 875 880865 870 875 880

Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu LysThr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu Lys

885 890 895885 890 895

Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile GluAla Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile Glu

900 905 910900 905 910

Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val Ser GlyGly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val Ser Gly

915 920 925915 920 925

Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser Val Pro GlyIle Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser Val Pro Gly

930 935 940930 935 940

Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln Gln Ile Ser AlaPro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln Gln Ile Ser Ala

945 950 955 960945 950 955 960

Met Arg Leu His Ile Ser Gln Leu Gln His Glu Asn Ser Ile Leu LysMet Arg Leu His Ile Ser Gln Leu Gln His Glu Asn Ser Ile Leu Lys

965 970 975965 970 975

Gly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu Pro Pro Leu His ValGly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu Pro Pro Leu His Val

980 985 990980 985 990

Ala Lys Leu Ser His Glu Gly Pro Gly Ser Glu Leu Pro Ala Gly AlaAla Lys Leu Ser His Glu Gly Pro Gly Ser Glu Leu Pro Ala Gly Ala

995 1000 1005995 1000 1005

Leu Tyr Arg Lys Thr Ser Gln Leu Leu Glu Thr Leu Asn Gln LeuLeu Tyr Arg Lys Thr Ser Gln Leu Leu Glu Thr Leu Asn Gln Leu

1010 1015 10201010 1015 1020

Ser Thr His Thr His Val Val Asp Ile Thr Arg Thr Ser Pro AlaSer Thr His Thr His Val Val Asp Ile Thr Arg Thr Ser Pro Ala

1025 1030 10351025 1030 1035

Ala Lys Ser Pro Ser Ala Gln Leu Met Glu Gln Val Ala Gln LeuAla Lys Ser Pro Ser Ala Gln Leu Met Glu Gln Val Ala Gln Leu

1040 1045 10501040 1045 1050

Lys Ser Leu Ser Asp Thr Val Glu Lys Leu Lys Asp Glu Val LeuLys Ser Leu Ser Asp Thr Val Glu Lys Leu Lys Asp Glu Val Leu

1055 1060 10651055 1060 1065

Lys Glu Thr Val Ser Gln Arg Pro Gly Ala Thr Val Pro Thr AspLys Glu Thr Val Ser Gln Arg Pro Gly Ala Thr Val Pro Thr Asp

1070 1075 10801070 1075 1080

Phe Ala Thr Phe Pro Ser Ser Ala Phe Leu Arg Glu Asp Pro LysPhe Ala Thr Phe Pro Ser Ser Ala Phe Leu Arg Glu Asp Pro Lys

1085 1090 10951085 1090 1095

Trp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly Lys Thr Leu GlyTrp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly Lys Thr Leu Gly

1100 1105 11101100 1105 1110

Glu Gly Glu Phe Gly Lys Val Val Lys Ala Thr Ala Phe His LeuGlu Gly Glu Phe Gly Lys Val Val Lys Ala Thr Ala Phe His Leu

1115 1120 11251115 1120 1125

Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu LysLys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu Lys

1130 1135 11401130 1135 1140

Glu Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu PheGlu Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe

1145 1150 11551145 1150 1155

Asn Val Leu Lys Gln Val Asn His Pro His Val Ile Lys Leu TyrAsn Val Leu Lys Gln Val Asn His Pro His Val Ile Lys Leu Tyr

1160 1165 11701160 1165 1170

Gly Ala Cys Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu TyrGly Ala Cys Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr

1175 1180 11851175 1180 1185

Ala Lys Tyr Gly Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg LysAla Lys Tyr Gly Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys

1190 1195 12001190 1195 1200

Val Gly Pro Gly Tyr Leu Gly Ser Gly Gly Ser Arg Asn Ser SerVal Gly Pro Gly Tyr Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser

1205 1210 12151205 1210 1215

Ser Leu Asp His Pro Asp Glu Arg Ala Leu Thr Met Gly Asp LeuSer Leu Asp His Pro Asp Glu Arg Ala Leu Thr Met Gly Asp Leu

1220 1225 12301220 1225 1230

Ile Ser Phe Ala Trp Gln Ile Ser Gln Gly Met Gln Tyr Leu AlaIle Ser Phe Ala Trp Gln Ile Ser Gln Gly Met Gln Tyr Leu Ala

1235 1240 12451235 1240 1245

Glu Met Lys Leu Val His Arg Asp Leu Ala Ala Arg Asn Ile LeuGlu Met Lys Leu Val His Arg Asp Leu Ala Ala Arg Asn Ile Leu

1250 1255 12601250 1255 1260

Val Ala Glu Gly Arg Lys Met Lys Ile Ser Asp Phe Gly Leu SerVal Ala Glu Gly Arg Lys Met Lys Ile Ser Asp Phe Gly Leu Ser

1265 1270 12751265 1270 1275

Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val Lys Arg Ser Gln GlyArg Asp Val Tyr Glu Glu Asp Ser Tyr Val Lys Arg Ser Gln Gly

1280 1285 12901280 1285 1290

Arg Ile Pro Val Lys Trp Met Ala Ile Glu Ser Leu Phe Asp HisArg Ile Pro Val Lys Trp Met Ala Ile Glu Ser Leu Phe Asp His

1295 1300 13051295 1300 1305

Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser Phe Gly Val Leu LeuIle Tyr Thr Thr Gln Ser Asp Val Trp Ser Phe Gly Val Leu Leu

1310 1315 13201310 1315 1320

Trp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr Pro Gly Ile ProTrp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr Pro Gly Ile Pro

1325 1330 13351325 1330 1335

Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly His Arg Met GluPro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly His Arg Met Glu

1340 1345 13501340 1345 1350

Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu GlnArg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu Gln

1355 1360 13651355 1360 1365

Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp IleCys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp Ile

1370 1375 13801370 1375 1380

Ser Lys Asp Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr LeuSer Lys Asp Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu

1385 1390 13951385 1390 1395

Asp Leu Ala Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp AspAsp Leu Ala Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp

1400 1405 14101400 1405 1410

Gly Leu Ser Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn AlaGly Leu Ser Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala

1415 1420 14251415 1420 1425

Pro Leu Pro Arg Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys LeuPro Leu Pro Arg Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu

1430 1435 14401430 1435 1440

Tyr Gly Met Ser Asp Pro Asn Trp Pro Gly Glu Ser Pro Val ProTyr Gly Met Ser Asp Pro Asn Trp Pro Gly Glu Ser Pro Val Pro

1445 1450 14551445 1450 1455

Leu Thr Arg Ala Asp Gly Thr Asn Thr Gly Phe Pro Arg Tyr ProLeu Thr Arg Ala Asp Gly Thr Asn Thr Gly Phe Pro Arg Tyr Pro

1460 1465 14701460 1465 1470

Asn Asp Ser Val Tyr Ala Asn Trp Met Leu Ser Pro Ser Ala AlaAsn Asp Ser Val Tyr Ala Asn Trp Met Leu Ser Pro Ser Ala Ala

1475 1480 14851475 1480 1485

Lys Leu Met Asp Thr Phe Asp SerLys Leu Met Asp Thr Phe Asp Ser

1490 14951490 1495

<210> 15<210> 15

<211> 4365<211> 4365

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кодирующая последовательность слитого пептида<223> fusion peptide coding sequence

<400> 15<400> 15

atgatgagac aggcaccgac agcccgaaag accacaactc ggcgacccaa gcccacgcgc 60atgatgagac aggcaccgac agcccgaaag accacaactc ggcgacccaa gcccacgcgc 60

ccagccagta ctggggtggc tggggccagt agctccctgg gcccctctgg ctcagcgtca 120ccagccagta ctggggtggc tggggccagt agctccctgg gcccctctgg ctcagcgtca 120

gcaggtgagc tgagcagcag tgagcccagc accccggctc agactccgct ggcagcaccc 180gcaggtgagc tgagcagcag tgagcccagc accccggctc agactccgct ggcagcaccc 180

atcatcccca cgccggtcct cacctctcct ggagcagtcc ccccgcttcc ttccccatcc 240atcatcccca cgccggtcct cacctctcct ggagcagtcc ccccgcttcc ttccccatcc 240

aaggaggagg agggactaag ggctcaggtg cgggacctgg aggagaaact agagaccctg 300aaggaggagg agggactaag ggctcaggtg cgggacctgg aggagaaact agagaccctg 300

agactgaaac gggcagaaga caaagcaaag ctaaaagagc tggagaaaca caaaatccag 360agactgaaac gggcagaaga caaagcaaag ctaaaagagc tggagaaaca caaaatccag 360

ctggagcagg tgcaggaatg gaagagcaaa atgcaggagc agcaggccga cctgcagcgg 420ctggagcagg tgcaggaatg gaagagcaaa atgcaggagc agcaggccga cctgcagcgg 420

cgcctcaagg aggcgagaaa ggaagccaag gaggcgctgg aggcaaagga acgctatatg 480cgcctcaagg aggcgagaaa ggaagccaag gaggcgctgg aggcaaagga acgctatatg 480

gaggagatgg ctgatactgc tgatgccatt gagatggcca ctttggacaa ggagatggct 540gaggagatgg ctgatactgc tgatgccatt gagatggcca ctttggacaa ggagatggct 540

gaagagcggg ctgagtccct gcagcaggag gtggaggcac tgaaggagcg ggtggacgag 600gaagagcggg ctgagtccct gcagcaggag gtggaggcac tgaaggagcg ggtggacgag 600

ctcactactg acttagagat cctcaaggct gagattgaag agaagggctc agatggcgct 660ctcactactg acttagagat cctcaaggct gagattgaag agaagggctc agatggcgct 660

gcatccagtt atcagctcaa gcagcttgag gagcagaatg cccgcctgaa ggatgccctg 720gcatccagtt atcagctcaa gcagcttgag gagcagaatg cccgcctgaa ggatgccctg 720

gtgaggatgc gggatctttc ttcctcagag aagcaggagc atgtgaagct ccagaagctc 780gtgaggatgc gggatctttc ttcctcagag aagcaggagc atgtgaagct ccagaagctc 780

atggaaaaga agaaccaaga gctggaagtt gtgaggcaac agcgggagcg tctgcaggag 840atggaaaaga agaaccaaga gctggaagtt gtgaggcaac agcgggagcg tctgcaggag 840

gagctaagcc aggcagagag caccattgat gagctcaagg agcaggtgga tgctgctctg 900gagctaagcc aggcagagag caccattgat gagctcaagg agcaggtgga tgctgctctg 900

ggtgctgagg agatggtgga gatgctgaca gatcggaacc tgaatctgga agagaaagtg 960ggtgctgagg agatggtgga gatgctgaca gatcggaacc tgaatctgga agagaaagtg 960

cgcgagttga gggagactgt gggagacttg gaagcgatga atgagatgaa cgatgagctg 1020cgcgagttga gggagactgt gggagacttg gaagcgatga atgagatgaa cgatgagctg 1020

caggagaatg cacgtgagac agaactggag ctgcgggagc agctggacat ggcaggcgcg 1080caggagaatg cacgtgagac agaactggag ctgcgggagc agctggacat ggcaggcgcg 1080

cgggttcgtg aggcccagaa gcgtgtggag gcagcccagg agacggttgc agactaccag 1140cgggttcgtg aggcccagaa gcgtgtggag gcagcccagg agacggttgc agactaccag 1140

cagaccatca agaagtaccg ccagctgacc gcccatctac aggatgtgaa tcgggaactg 1200cagaccatca agaagtaccg ccagctgacc gcccatctac aggatgtgaa tcgggaactg 1200

acaaaccagc aggaagcatc tgtggagagg caacagcagc cacctccaga gacctttgac 1260acaaaccagc aggaagcatc tgtggagagg caacagcagc cacctccaga gacctttgac 1260

ttcaaaatca agtttgctga gactaaggcc catgccaagg caattgagat ggaattgagg 1320ttcaaaatca agtttgctga gactaaggcc catgccaagg caattgagat ggaattgagg 1320

cagatggagg tggcccaggc caatcgacac atgtccctgc tgacagcctt catgcctgac 1380cagatggagg tggcccaggc caatcgacac atgtccctgc tgacagcctt catgcctgac 1380

agcttccttc ggccaggtgg ggaccatgac tgcgttctgg tgctgttgct catgcctcgt 1440agcttccttc ggccaggtgg ggaccatgac tgcgttctgg tgctgttgct catgcctcgt 1440

ctcatttgca aggcagagct gatccggaag caggcccagg agaagtttga actaagtgag 1500ctcatttgca aggcagagct gatccggaag caggcccagg agaagtttga actaagtgag 1500

aactgttcag agcggcctgg gctgcgagga gctgctgggg agcaactcag ctttgctgct 1560aactgttcag agcggcctgg gctgcgagga gctgctgggg agcaactcag ctttgctgct 1560

ggactggtgt actcgctgag cctgctgcag gccacgctac accgctatga gcatgccctc 1620ggactggtgt actcgctgag cctgctgcag gccacgctac accgctatga gcatgccctc 1620

tctcagtgca gtgtggatgt gtataagaaa gtgggcagcc tgtaccctga gatgagtgcc 1680tctcagtgca gtgtggatgt gtataagaaa gtgggcagcc tgtaccctga gatgagtgcc 1680

catgagcgct ccttggattt cctcattgaa ctgctgcaca aggatcagct ggatgagact 1740catgagcgct ccttggattt cctcattgaa ctgctgcaca aggatcagct ggatgagact 1740

gtcaatgtgg agcctctcac caaggccatc aagtactatc agcatctgta cagcatccac 1800gtcaatgtgg agcctctcac caaggccatc aagtactatc agcatctgta cagcatccac 1800

cttgccgaac agcctgagga ctgtactatg cagctggctg accacattaa gttcacgcag 1860cttgccgaac agcctgagga ctgtactatg cagctggctg accacattaa gttcacgcag 1860

agtgctctgg actgcatgag tgtggaggta ggacggctgc gtgccttctt gcagggtggg 1920agtgctctgg actgcatgag tgtggaggta ggacggctgc gtgccttctt gcagggtggg 1920

caggaggcta cagatattgc cctcctgctc cgggatctgg aaacttcatg cagtgacatc 1980caggaggcta cagatattgc cctcctgctc cgggatctgg aaacttcatg cagtgacatc 1980

cgccagttct gcaagaagat ccgaaggcga atgccaggga cagatgctcc tgggatccca 2040cgccagttct gcaagaagat ccgaaggcga atgccaggga cagatgctcc tgggatccca 2040

gctgcactgg cctttggacc acaggtatct gacacgctcc tagactgcag gaaacacttg 2100gctgcactgg cctttggacc acaggtatct gacacgctcc tagactgcag gaaacacttg 2100

acgtgggtcg tggctgtgct gcaggaggtg gcagctgctg ctgcccagct cattgcccca 2160acgtgggtcg tggctgtgct gcaggaggtg gcagctgctg ctgcccagct cattgcccca 2160

ctggcagaga atgaggggct acttgtggct gctctggagg aactggcttt caaagcaagc 2220ctggcagaga atgaggggct acttgtggct gctctggagg aactggcttt caaagcaagc 2220

gagcagatct atgggacccc ctccagcagc ccctatgagt gtctgcgcca gtcatgcaac 2280gagcagatct atgggacccc ctccagcagc ccctatgagt gtctgcgcca gtcatgcaac 2280

atcctcatca gtaccatgaa caagctggcc acagccatgc aggaggggga gtatgatgca 2340atcctcatca gtaccatgaa caagctggcc acagccatgc aggaggggga gtatgatgca 2340

gagcggcccc ccagcaagcc tccaccggtt gaactgcggg ctgctgccct tcgtgcagag 2400gagcggcccc ccagcaagcc tccaccggtt gaactgcggg ctgctgccct tcgtgcagag 2400

atcacagatg ctgaaggcct gggtttgaag ctcgaagatc gagagacagt tattaaggag 2460atcacagatg ctgaaggcct gggtttgaag ctcgaagatc gagagacagt tattaaggag 2460

ttgaagaagt cactcaagat taagggagag gagctaagtg aggccaatgt gcggctgagc 2520ttgaagaagt cactcaagat taagggagag gagctaagtg aggccaatgt gcggctgagc 2520

ctcctggaga agaagttgga cagtgctgcc aaggatgcag atgagcgcat cgagaaagtc 2580ctcctggaga agaagttgga cagtgctgcc aaggatgcag atgagcgcat cgagaaagtc 2580

cagactcggc tggaggagac ccaggcactg ctgcgaaaga aggagaaaga gtttgaggag 2640cagactcggc tggagaggagac ccaggcactg ctgcgaaaga aggagaaaga gtttgaggag 2640

acaatggatg cactccaggc tgacatcgac cagctggagg cagagaaggc agaactaaag 2700acaatggatg cactccaggc tgacatcgac cagctggagg cagagaaggc agaactaaag 2700

cagcgtctga acagccagtc caaacgcacg attgagggac tccggggccc tcctccttca 2760cagcgtctga acagccagtc caaacgcacg attgagggac tccggggccc tcctccttca 2760

ggcattgcta ctctggtctc tggcattgct ggtggagcca tccctgggca ggctccaggg 2820ggcattgcta ctctggtctc tggcattgct ggtggagcca tccctgggca ggctccaggg 2820

tctgtgccag gcccagggct ggtgaaggac tcaccactgc tgcttcagca gatctctgcc 2880tctgtgccag gcccagggct ggtgaaggac tcaccactgc tgcttcagca gatctctgcc 2880

atgaggctgc acatctccca gctccagcat gagaacagca tcctcaaggg agcccagatg 2940atgaggctgc acatctccca gctccagcat gagaacagca tcctcaaggg agccgatg 2940

aaggcatcct tggcatccct gccccctctg catgttgcaa agctatccca tgagggccct 3000aaggcatcct tggcatccct gccccctctg catgttgcaa agctatccca tgagggccct 3000

ggcagtgagt taccagctgg agcgctgtat cgtaagacca gccagctgct ggagacattg 3060ggcagtgagt taccagctgg agcgctgtat cgtaagacca gccagctgct ggagacattg 3060

aatcaattga gcacacacac gcacgtagta gacatcactc gcaccagccc tgctgccaag 3120aatcaattga gcacacacac gcacgtagta gacatcactc gcaccagccc tgctgccaag 3120

agcccgtcgg cccaacttat ggagcaagtg gctcagctta agtccctgag tgacaccgtc 3180agcccgtcgg cccaacttat ggagcaagtg gctcagctta agtccctgag tgacaccgtc 3180

gagaagctca aggatgaggt cctcaaggag acagtatctc agcgccctgg agccacagta 3240gagaagctca aggatgaggt cctcaaggag acagtatctc agcgccctgg agccacagta 3240

cccactgact ttgccacctt cccttcatca gccttcctca gggaggatcc aaagtgggaa 3300cccactgact ttgccacctt cccttcatca gccttcctca gggaggatcc aaagtgggaa 3300

ttccctcgga agaacttggt tcttggaaaa actctaggag aaggcgaatt tggaaaagtg 3360ttccctcgga agaacttggt tcttggaaaa actctaggag aaggcgaatt tggaaaagtg 3360

gtcaaggcaa cggccttcca tctgaaaggc agagcagggt acaccacggt ggccgtgaag 3420gtcaaggcaa cggccttcca tctgaaaggc agagcagggt acaccacggt ggccgtgaag 3420

atgctgaaag agaacgcctc cccgagtgag cttcgagacc tgctgtcaga gttcaacgtc 3480atgctgaaag agaacgcctc cccgagtgag cttcgagacc tgctgtcaga gttcaacgtc 3480

ctgaagcagg tcaaccaccc acatgtcatc aaattgtatg gggcctgcag ccaggatggc 3540ctgaagcagg tcaaccaccc acatgtcatc aaattgtatg gggcctgcag ccaggatggc 3540

ccgctcctcc tcatcgtgga gtacgccaaa tacggctccc tgcggggctt cctccgcgag 3600ccgctcctcc tcatcgtgga gtacgccaaa tacggctccc tgcggggctt cctccgcgag 3600

agccgcaaag tggggcctgg ctacctgggc agtggaggca gccgcaactc cagctccctg 3660agccgcaaag tggggcctgg ctacctgggc agtggaggca gccgcaactc cagctccctg 3660

gaccacccgg atgagcgggc cctcaccatg ggcgacctca tctcatttgc ctggcagatc 3720gaccacccgg atgagcgggc cctcaccatg ggcgacctca tctcatttgc ctggcagatc 3720

tcacagggga tgcagtatct ggccgagatg aagctcgttc atcgggactt ggcagccaga 3780tcacagggga tgcagtatct ggccgagatg aagctcgttc atcgggactt ggcagccaga 3780

aacatcctgg tagctgaggg gcggaagatg aagatttcgg atttcggctt gtcccgagat 3840aacatcctgg tagctgaggg gcggaagatg aagatttcgg atttcggctt gtcccgagat 3840

gtttatgaag aggattccta cgtgaagagg agccagggtc ggattccagt taaatggatg 3900gtttatgaag aggattccta cgtgaagagg agccagggtc ggattccagt taaatggatg 3900

gcaattgaat ccctttttga tcatatctac accacgcaaa gtgatgtatg gtcttttggt 3960gcaattgaat ccctttttga tcatatctac accacgcaaa gtgatgtatg gtcttttggt 3960

gtcctgctgt gggagatcgt gaccctaggg ggaaacccct atcctgggat tcctcctgag 4020gtcctgctgt gggagatcgt gaccctaggg ggaaacccct atcctgggat tcctcctgag 4020

cggctcttca accttctgaa gaccggccac cggatggaga ggccagacaa ctgcagcgag 4080cggctcttca accttctgaa gaccggccac cggatggaga ggccagacaa ctgcagcgag 4080

gagatgtacc gcctgatgct gcaatgctgg aagcaggagc cggacaaaag gccggtgttt 4140gagatgtacc gcctgatgct gcaatgctgg aagcaggagc cggacaaaag gccggtgttt 4140

gcggacatca gcaaagacct ggagaagatg atggttaaga ggagagacta cttggacctt 4200gcggacatca gcaaagacct ggagaagatg atggttaaga ggagagacta cttggacctt 4200

gcggcgtcca ctccatctga ctccctgatt tatgacgacg gcctctcaga ggaggagaca 4260gcggcgtcca ctccatctga ctccctgatt tatgacgacg gcctctcaga ggaggagaca 4260

ccgctggtgg actgtaataa tgcccccctc cctcgagccc tcccttccac atggattgaa 4320ccgctggtgg actgtaataa tgcccccctc cctcgagccc tcccttccac atggattgaa 4320

aacaaactct atggtagaat ttcccatgca tttactagat tctag 4365aacaaactct atggtagaat ttcccatgca tttactagat tctag 4365

<210> 16<210> 16

<211> 1454<211> 1454

<212> белок<212> protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> слитый пептид<223> fusion peptide

<400> 16<400> 16

Met Met Arg Gln Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg ProMet Met Arg Gln Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg Pro

1. 5 10 151. 5 10 15

Lys Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser SerLys Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser Ser

20 25 3020 25 30

Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser GluLeu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser Glu

35 40 4535 40 45

Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro ThrPro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro Thr

50 55 6050 55 60

Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro SerPro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro Ser

65 70 75 8065 70 75 80

Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu LysLys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu Lys

85 90 9585 90 95

Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu LysLeu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu Lys

100 105 110100 105 110

Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp LysGlu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp Lys

115 120 125115 120 125

Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys GluSer Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys Glu

130 135 140130 135 140

Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr MetAla Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr Met

145 150 155 160145 150 155 160

Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu AspGlu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu Asp

165 170 175165 170 175

Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val GluLys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val Glu

180 185 190180 185 190

Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile LeuAla Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile Leu

195 200 205195 200 205

Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser TyrLys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser Tyr

210 215 220210 215 220

Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala LeuGln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala Leu

225 230 235 240225 230 235 240

Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val LysVal Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val Lys

245 250 255245 250 255

Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val ArgLeu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val Arg

260 265 270260 265 270

Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser ThrGln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser Thr

275 280 285275 280 285

Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu GluIle Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu Glu

290 295 300290 295 300

Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys ValMet Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys Val

305 310 315 320305 310 315 320

Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu MetArg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu Met

325 330 335325 330 335

Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu ArgAsn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu Arg

340 345 350340 345 350

Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys ArgGlu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys Arg

355 360 365355 360 365

Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile LysVal Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile Lys

370 375 380370 375 380

Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu LeuLys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu Leu

385 390 395 400385 390 395 400

Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro ProThr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro Pro

405 410 415405 410 415

Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His AlaGlu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His Ala

420 425 430420 425 430

Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala AsnLys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala Asn

435 440 445435 440 445

Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu ArgArg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu Arg

450 455 460450 455 460

Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro ArgPro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro Arg

465 470 475 480465 470 475 480

Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys PheLeu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys Phe

485 490 495485 490 495

Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala AlaGlu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala Ala

500 505 510500 505 510

Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser LeuGly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser Leu

515 520 525515 520 525

Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys SerLeu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys Ser

530 535 540530 535 540

Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser AlaVal Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser Ala

545 550 555 560545 550 555 560

His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp GlnHis Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp Gln

565 570 575565 570 575

Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys TyrLeu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys Tyr

580 585 590580 585 590

Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp CysTyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp Cys

595 600 605595 600 605

Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu AspThr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu Asp

610 615 620610 615 620

Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly GlyCys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly Gly

625 630 635 640625 630 635 640

Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr SerGln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr Ser

645 650 655645 650 655

Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met ProCys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met Pro

660 665 670660 665 670

Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro GlnGly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro Gln

675 680 685675 680 685

Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val ValVal Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val Val

690 695 700690 695 700

Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala ProAla Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala Pro

705 710 715 720705 710 715 720

Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu AlaLeu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu Ala

725 730 735725 730 735

Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro TyrPhe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro Tyr

740 745 750740 745 750

Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn LysGlu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn Lys

755 760 765755 760 765

Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro ProLeu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro Pro

770 775 780770 775 780

Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala GluSer Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala Glu

785 790 795 800785 790 795 800

Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu ThrIle Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu Thr

805 810 815805 810 815

Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu LeuVal Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu Leu

820 825 830820 825 830

Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp SerSer Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp Ser

835 840 845835 840 845

Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg LeuAla Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg Leu

850 855 860850 855 860

Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu GluGlu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu Glu

865 870 875 880865 870 875 880

Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu LysThr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu Lys

885 890 895885 890 895

Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile GluAla Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile Glu

900 905 910900 905 910

Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val Ser GlyGly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val Ser Gly

915 920 925915 920 925

Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser Val Pro GlyIle Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser Val Pro Gly

930 935 940930 935 940

Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln Gln Ile Ser AlaPro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln Gln Ile Ser Ala

945 950 955 960945 950 955 960

Met Arg Leu His Ile Ser Gln Leu Gln His Glu Asn Ser Ile Leu LysMet Arg Leu His Ile Ser Gln Leu Gln His Glu Asn Ser Ile Leu Lys

965 970 975965 970 975

Gly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu Pro Pro Leu His ValGly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu Pro Pro Leu His Val

980 985 990980 985 990

Ala Lys Leu Ser His Glu Gly Pro Gly Ser Glu Leu Pro Ala Gly AlaAla Lys Leu Ser His Glu Gly Pro Gly Ser Glu Leu Pro Ala Gly Ala

995 1000 1005995 1000 1005

Leu Tyr Arg Lys Thr Ser Gln Leu Leu Glu Thr Leu Asn Gln LeuLeu Tyr Arg Lys Thr Ser Gln Leu Leu Glu Thr Leu Asn Gln Leu

1010 1015 10201010 1015 1020

Ser Thr His Thr His Val Val Asp Ile Thr Arg Thr Ser Pro AlaSer Thr His Thr His Val Val Asp Ile Thr Arg Thr Ser Pro Ala

1025 1030 10351025 1030 1035

Ala Lys Ser Pro Ser Ala Gln Leu Met Glu Gln Val Ala Gln LeuAla Lys Ser Pro Ser Ala Gln Leu Met Glu Gln Val Ala Gln Leu

1040 1045 10501040 1045 1050

Lys Ser Leu Ser Asp Thr Val Glu Lys Leu Lys Asp Glu Val LeuLys Ser Leu Ser Asp Thr Val Glu Lys Leu Lys Asp Glu Val Leu

1055 1060 10651055 1060 1065

Lys Glu Thr Val Ser Gln Arg Pro Gly Ala Thr Val Pro Thr AspLys Glu Thr Val Ser Gln Arg Pro Gly Ala Thr Val Pro Thr Asp

1070 1075 10801070 1075 1080

Phe Ala Thr Phe Pro Ser Ser Ala Phe Leu Arg Glu Asp Pro LysPhe Ala Thr Phe Pro Ser Ser Ala Phe Leu Arg Glu Asp Pro Lys

1085 1090 10951085 1090 1095

Trp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly Lys Thr Leu GlyTrp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly Lys Thr Leu Gly

1100 1105 11101100 1105 1110

Glu Gly Glu Phe Gly Lys Val Val Lys Ala Thr Ala Phe His LeuGlu Gly Glu Phe Gly Lys Val Val Lys Ala Thr Ala Phe His Leu

1115 1120 11251115 1120 1125

Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu LysLys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu Lys

1130 1135 11401130 1135 1140

Glu Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu PheGlu Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe

1145 1150 11551145 1150 1155

Asn Val Leu Lys Gln Val Asn His Pro His Val Ile Lys Leu TyrAsn Val Leu Lys Gln Val Asn His Pro His Val Ile Lys Leu Tyr

1160 1165 11701160 1165 1170

Gly Ala Cys Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu TyrGly Ala Cys Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr

1175 1180 11851175 1180 1185

Ala Lys Tyr Gly Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg LysAla Lys Tyr Gly Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys

1190 1195 12001190 1195 1200

Val Gly Pro Gly Tyr Leu Gly Ser Gly Gly Ser Arg Asn Ser SerVal Gly Pro Gly Tyr Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser

1205 1210 12151205 1210 1215

Ser Leu Asp His Pro Asp Glu Arg Ala Leu Thr Met Gly Asp LeuSer Leu Asp His Pro Asp Glu Arg Ala Leu Thr Met Gly Asp Leu

1220 1225 12301220 1225 1230

Ile Ser Phe Ala Trp Gln Ile Ser Gln Gly Met Gln Tyr Leu AlaIle Ser Phe Ala Trp Gln Ile Ser Gln Gly Met Gln Tyr Leu Ala

1235 1240 12451235 1240 1245

Glu Met Lys Leu Val His Arg Asp Leu Ala Ala Arg Asn Ile LeuGlu Met Lys Leu Val His Arg Asp Leu Ala Ala Arg Asn Ile Leu

1250 1255 12601250 1255 1260

Val Ala Glu Gly Arg Lys Met Lys Ile Ser Asp Phe Gly Leu SerVal Ala Glu Gly Arg Lys Met Lys Ile Ser Asp Phe Gly Leu Ser

1265 1270 12751265 1270 1275

Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val Lys Arg Ser Gln GlyArg Asp Val Tyr Glu Glu Asp Ser Tyr Val Lys Arg Ser Gln Gly

1280 1285 12901280 1285 1290

Arg Ile Pro Val Lys Trp Met Ala Ile Glu Ser Leu Phe Asp HisArg Ile Pro Val Lys Trp Met Ala Ile Glu Ser Leu Phe Asp His

1295 1300 13051295 1300 1305

Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser Phe Gly Val Leu LeuIle Tyr Thr Thr Gln Ser Asp Val Trp Ser Phe Gly Val Leu Leu

1310 1315 13201310 1315 1320

Trp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr Pro Gly Ile ProTrp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr Pro Gly Ile Pro

1325 1330 13351325 1330 1335

Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly His Arg Met GluPro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly His Arg Met Glu

1340 1345 13501340 1345 1350

Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu GlnArg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu Gln

1355 1360 13651355 1360 1365

Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp IleCys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp Ile

1370 1375 13801370 1375 1380

Ser Lys Asp Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr LeuSer Lys Asp Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu

1385 1390 13951385 1390 1395

Asp Leu Ala Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp AspAsp Leu Ala Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp

1400 1405 14101400 1405 1410

Gly Leu Ser Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn AlaGly Leu Ser Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala

1415 1420 14251415 1420 1425

Pro Leu Pro Arg Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys LeuPro Leu Pro Arg Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu

1430 1435 14401430 1435 1440

Tyr Gly Arg Ile Ser His Ala Phe Thr Arg PheTyr Gly Arg Ile Ser His Ala Phe Thr Arg Phe

1445 14501445 1450

<210> 17<210> 17

<211> 4782<211> 4782

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кодирующая последовательность слитого пептида<223> fusion peptide coding sequence

<400> 17<400> 17

atgagtgcgg aggcaagcgc ccggcctctg cgggtgggct cccgtgtaga ggtgattgga 60atgagtgcgg aggcaagcgc ccggcctctg cgggtgggct cccgtgtaga ggtgattgga 60

aaaggccacc gaggcactgt ggcctatgtt ggagccacac tgtttgccac tggcaaatgg 120aaaggccacc gaggcactgt ggcctatgtt ggagccacac tgtttgccac tggcaaatgg 120

gtaggcgtga ttctggatga agcaaagggc aaaaatgatg gaactgttca aggcaggaag 180gtaggcgtga ttctggatga agcaaagggc aaaaatgatg gaactgttca aggcaggaag 180

tacttcactt gtgatgaagg gcatggcatc tttgtgcgcc agtcccagat ccaggtattt 240tacttcactt gtgatgaagg gcatggcatc tttgtgcgcc agtcccagat ccaggtattt 240

gaagatggag cagatactac ttccccagag acacctgatt cttctgcttc aaaagtcctc 300gaagatggag cagatactac ttccccagag acacctgatt cttctgcttc aaaagtcctc 300

aaaagagagg gaactgatac aactgcaaag actagcaaac tgcccacgcg cccagccagt 360aaaagagagg gaactgatac aactgcaaag actagcaaac tgcccacgcg cccagccagt 360

actggggtgg ctggggccag tagctccctg ggcccctctg gctcagcgtc agcaggtgag 420actggggtgg ctggggccag tagctccctg ggcccctctg gctcagcgtc agcaggtgag 420

ctgagcagca gtgagcccag caccccggct cagactccgc tggcagcacc catcatcccc 480ctgagcagca gtgagcccag caccccggct cagactccgc tggcagcacc catcatcccc 480

acgccggtcc tcacctctcc tggagcagtc cccccgcttc cttccccatc caaggaggag 540acgccggtcc tcacctctcc tggagcagtc cccccgcttc cttccccatc caaggaggag 540

gagggactaa gggctcaggt gcgggacctg gaggagaaac tagagaccct gagactgaaa 600gagggactaa gggctcaggt gcgggacctg gaggagaaac tagagaccct gagactgaaa 600

cgggcagaag acaaagcaaa gctaaaagag ctggagaaac acaaaatcca gctggagcag 660cgggcagaag acaaagcaaa gctaaaagag ctggagaaac acaaaatcca gctggagcag 660

gtgcaggaat ggaagagcaa aatgcaggag cagcaggccg acctgcagcg gcgcctcaag 720gtgcaggaat ggaagagcaa aatgcaggag cagcaggccg acctgcagcg gcgcctcaag 720

gaggcgagaa aggaagccaa ggaggcgctg gaggcaaagg aacgctatat ggaggagatg 780gaggcgagaa aggaagccaa ggaggcgctg gaggcaaagg aacgctatat ggaggagatg 780

gctgatactg ctgatgccat tgagatggcc actttggaca aggagatggc tgaagagcgg 840gctgatactg ctgatgccat tgagatggcc actttggaca aggagatggc tgaagagcgg 840

gctgagtccc tgcagcagga ggtggaggca ctgaaggagc gggtggacga gctcactact 900gctgagtccc tgcagcagga ggtggaggca ctgaaggagc gggtggacga gctcactact 900

gacttagaga tcctcaaggc tgagattgaa gagaagggct cagatggcgc tgcatccagt 960gacttagaga tcctcaaggc tgagattgaa gagaagggct cagatggcgc tgcatccagt 960

tatcagctca agcagcttga ggagcagaat gcccgcctga aggatgccct ggtgaggatg 1020tatcagctca agcagcttga ggagcagaat gcccgcctga aggatgccct ggtgaggatg 1020

cgggatcttt cttcctcaga gaagcaggag catgtgaagc tccagaagct catggaaaag 1080cgggatcttt cttcctcaga gaagcaggag catgtgaagc tccagaagct catggaaaag 1080

aagaaccaag agctggaagt tgtgaggcaa cagcgggagc gtctgcagga ggagctaagc 1140aagaaccaag agctggaagt tgtgaggcaa cagcgggagc gtctgcagga ggagctaagc 1140

caggcagaga gcaccattga tgagctcaag gagcaggtgg atgctgctct gggtgctgag 1200caggcagaga gcaccattga tgagctcaag gagcaggtgg atgctgctct gggtgctgag 1200

gagatggtgg agatgctgac agatcggaac ctgaatctgg aagagaaagt gcgcgagttg 1260gagatggtgg agatgctgac agatcggaac ctgaatctgg aagagaaagt gcgcgagttg 1260

agggagactg tgggagactt ggaagcgatg aatgagatga acgatgagct gcaggagaat 1320agggagactg tgggagactt ggaagcgatg aatgagatga acgatgagct gcaggagaat 1320

gcacgtgaga cagaactgga gctgcgggag cagctggaca tggcaggcgc gcgggttcgt 1380gcacgtgaga cagaactgga gctgcgggag cagctggaca tggcaggcgc gcgggttcgt 1380

gaggcccaga agcgtgtgga ggcagcccag gagacggttg cagactacca gcagaccatc 1440gaggcccaga agcgtgtgga ggcagcccag gagacggttg cagactacca gcagaccatc 1440

aagaagtacc gccagctgac cgcccatcta caggatgtga atcgggaact gacaaaccag 1500aagaagtacc gccagctgac cgcccatcta caggatgtga atcgggaact gacaaaccag 1500

caggaagcat ctgtggagag gcaacagcag ccacctccag agacctttga cttcaaaatc 1560caggaagcat ctgtggagag gcaacagcag ccacctccag agacctttga cttcaaaatc 1560

aagtttgctg agactaaggc ccatgccaag gcaattgaga tggaattgag gcagatggag 1620aagtttgctg agactaaggc ccatgccaag gcaattgaga tggaattgag gcagatggag 1620

gtggcccagg ccaatcgaca catgtccctg ctgacagcct tcatgcctga cagcttcctt 1680gtggcccagg ccaatcgaca catgtccctg ctgacagcct tcatgcctga cagcttcctt 1680

cggccaggtg gggaccatga ctgcgttctg gtgctgttgc tcatgcctcg tctcatttgc 1740cggccaggtg gggaccatga ctgcgttctg gtgctgttgc tcatgcctcg tctcatttgc 1740

aaggcagagc tgatccggaa gcaggcccag gagaagtttg aactaagtga gaactgttca 1800aaggcagagc tgatccggaa gcaggcccag gagaagtttg aactaagtga gaactgttca 1800

gagcggcctg ggctgcgagg agctgctggg gagcaactca gctttgctgc tggactggtg 1860gagcggcctg ggctgcgagg agctgctggg gagcaactca gctttgctgc tggactggtg 1860

tactcgctga gcctgctgca ggccacgcta caccgctatg agcatgccct ctctcagtgc 1920tactcgctga gcctgctgca ggccacgcta caccgctatg agcatgccct ctctcagtgc 1920

agtgtggatg tgtataagaa agtgggcagc ctgtaccctg agatgagtgc ccatgagcgc 1980agtgtggatg tgtataagaa agtgggcagc ctgtaccctg agatgagtgc ccatgagcgc 1980

tccttggatt tcctcattga actgctgcac aaggatcagc tggatgagac tgtcaatgtg 2040tccttggatt tcctcattga actgctgcac aaggatcagc tggatgagac tgtcaatgtg 2040

gagcctctca ccaaggccat caagtactat cagcatctgt acagcatcca ccttgccgaa 2100gagcctctca ccaaggccat caagtactat cagcatctgt acagcatcca ccttgccgaa 2100

cagcctgagg actgtactat gcagctggct gaccacatta agttcacgca gagtgctctg 2160cagcctgagg actgtactat gcagctggct gaccacatta agttcacgca gagtgctctg 2160

gactgcatga gtgtggaggt aggacggctg cgtgccttct tgcagggtgg gcaggaggct 2220gactgcatga gtgtggaggt aggacggctg cgtgccttct tgcagggtgg gcaggaggct 2220

acagatattg ccctcctgct ccgggatctg gaaacttcat gcagtgacat ccgccagttc 2280acagatattg ccctcctgct ccgggatctg gaaacttcat gcagtgacat ccgccagttc 2280

tgcaagaaga tccgaaggcg aatgccaggg acagatgctc ctgggatccc agctgcactg 2340tgcaagaaga tccgaaggcg aatgccaggg acagatgctc ctgggatccc agctgcactg 2340

gcctttggac cacaggtatc tgacacgctc ctagactgca ggaaacactt gacgtgggtc 2400gcctttggac cacaggtatc tgacacgctc ctagactgca ggaaacactt gacgtgggtc 2400

gtggctgtgc tgcaggaggt ggcagctgct gctgcccagc tcattgcccc actggcagag 2460gtggctgtgc tgcaggaggt ggcagctgct gctgcccagc tcattgcccc actggcagag 2460

aatgaggggc tacttgtggc tgctctggag gaactggctt tcaaagcaag cgagcagatc 2520aatgaggggc tacttgtggc tgctctggag gaactggctt tcaaagcaag cgagcagatc 2520

tatgggaccc cctccagcag cccctatgag tgtctgcgcc agtcatgcaa catcctcatc 2580tatgggaccc cctccagcag cccctatgag tgtctgcgcc agtcatgcaa catcctcatc 2580

agtaccatga acaagctggc cacagccatg caggaggggg agtatgatgc agagcggccc 2640agtaccatga acaagctggc cacagccatg caggaggggg agtatgatgc agagcggccc 2640

cccagcaagc ctccaccggt tgaactgcgg gctgctgccc ttcgtgcaga gatcacagat 2700cccagcaagc ctccaccggt tgaactgcgg gctgctgccc ttcgtgcaga gatcacagat 2700

gctgaaggcc tgggtttgaa gctcgaagat cgagagacag ttattaagga gttgaagaag 2760gctgaaggcc tgggtttgaa gctcgaagat cgagagacag ttattaagga gttgaagaag 2760

tcactcaaga ttaagggaga ggagctaagt gaggccaatg tgcggctgag cctcctggag 2820tcactcaaga ttaagggaga ggagctaagt gaggccaatg tgcggctgag cctcctggag 2820

aagaagttgg acagtgctgc caaggatgca gatgagcgca tcgagaaagt ccagactcgg 2880aagaagttgg acagtgctgc caaggatgca gatgagcgca tcgagaaagt ccagactcgg 2880

ctggaggaga cccaggcact gctgcgaaag aaggagaaag agtttgagga gacaatggat 2940ctggaggaga cccaggcact gctgcgaaag aaggagaaag agtttgagga gacaatggat 2940

gcactccagg ctgacatcga ccagctggag gcagagaagg cagaactaaa gcagcgtctg 3000gcactccagg ctgacatcga ccagctggag gcagagaagg cagaactaaa gcagcgtctg 3000

aacagccagt ccaaacgcac gattgaggga ctccggggcc ctcctccttc aggcattgct 3060aacagccagt ccaaacgcac gattgaggga ctccggggcc ctcctccttc aggcattgct 3060

actctggtct ctggcattgc tggtggagcc atccctgggc aggctccagg gtctgtgcca 3120actctggtct ctggcattgc tggtggagcc atccctgggc aggctccagg gtctgtgcca 3120

ggcccagggc tggtgaagga ctcaccactg ctgcttcagc agatctctgc catgaggctg 3180ggcccaagggc tggtgaagga ctcaccactg ctgcttcagc agatctctgc catgaggctg 3180

cacatctccc agctccagca tgagaacagc atcctcaagg gagcccagat gaaggcatcc 3240cacatctccc agctccagca tgagaacagc atcctcaagg gagcccagat gaaggcatcc 3240

ttggcatccc tgccccctct gcatgttgca aagctatccc atgagggccc tggcagtgag 3300ttggcatccc tgccccctct gcatgttgca aagctatccc atgagggccc tggcagtgag 3300

ttaccagctg gagcgctgta tcgtaagacc agccagctgc tggagacatt gaatcaattg 3360ttaccagctg gagcgctgta tcgtaagacc agccagctgc tggagacatt gaatcaattg 3360

agcacacaca cgcacgtagt agacatcact cgcaccagcc ctgctgccaa gagcccgtcg 3420agcacacaca cgcacgtagt agacatcact cgcaccagcc ctgctgccaa gagcccgtcg 3420

gcccaactta tggagcaagt ggctcagctt aagtccctga gtgacaccgt cgagaagctc 3480gcccaactta tggagcaagt ggctcagctt aagtccctga gtgacaccgt cgagaagctc 3480

aaggatgagg tcctcaagga gacagtatct cagcgccctg gagccacagt acccactgac 3540aaggatgagg tcctcaagga gacagtatct cagcgccctg gagccacagt acccactgac 3540

tttgccacct tcccttcatc agccttcctc agggaggatc caaagtggga attccctcgg 3600tttgccacct tcccttcatc agccttcctc agggaggatc caaagtggga attccctcgg 3600

aagaacttgg ttcttggaaa aactctagga gaaggcgaat ttggaaaagt ggtcaaggca 3660aagaacttgg ttcttggaaa aactctagga gaaggcgaat ttggaaaagt ggtcaaggca 3660

acggccttcc atctgaaagg cagagcaggg tacaccacgg tggccgtgaa gatgctgaaa 3720acggccttcc atctgaaagg cagagcaggg tacaccacgg tggccgtgaa gatgctgaaa 3720

gagaacgcct ccccgagtga gcttcgagac ctgctgtcag agttcaacgt cctgaagcag 3780gagaacgcct ccccgagtga gcttcgagac ctgctgtcag agttcaacgt cctgaagcag 3780

gtcaaccacc cacatgtcat caaattgtat ggggcctgca gccaggatgg cccgctcctc 3840gtcaaccacc cacatgtcat caaattgtat ggggcctgca gccaggatgg cccgctcctc 3840

ctcatcgtgg agtacgccaa atacggctcc ctgcggggct tcctccgcga gagccgcaaa 3900ctcatcgtgg agtacgccaa atacggctcc ctgcggggct tcctccgcga gagccgcaaa 3900

gtggggcctg gctacctggg cagtggaggc agccgcaact ccagctccct ggaccacccg 3960gtggggcctg gctacctggg cagtggaggc agccgcaact ccagctccct ggaccacccg 3960

gatgagcggg ccctcaccat gggcgacctc atctcatttg cctggcagat ctcacagggg 4020gatgagcggg ccctcaccat gggcgacctc atctcatttg cctggcagat ctcacagggg 4020

atgcagtatc tggccgagat gaagctcgtt catcgggact tggcagccag aaacatcctg 4080atgcagtatc tggccgagat gaagctcgtt catcgggact tggcagccag aaacatcctg 4080

gtagctgagg ggcggaagat gaagatttcg gatttcggct tgtcccgaga tgtttatgaa 4140gtagctgagg ggcggaagat gaagatttcg gatttcggct tgtcccgaga tgtttatgaa 4140

gaggattcct acgtgaagag gagccagggt cggattccag ttaaatggat ggcaattgaa 4200gaggattcct acgtgaagag gagccagggt cggattccag ttaaatggat ggcaattgaa 4200

tccctttttg atcatatcta caccacgcaa agtgatgtat ggtcttttgg tgtcctgctg 4260tccctttttg atcatatcta caccacgcaa agtgatgtat ggtcttttgg tgtcctgctg 4260

tgggagatcg tgaccctagg gggaaacccc tatcctggga ttcctcctga gcggctcttc 4320tggggagatcg tgaccctagg gggaaacccc tatcctggga ttcctcctga gcggctcttc 4320

aaccttctga agaccggcca ccggatggag aggccagaca actgcagcga ggagatgtac 4380aaccttctga agaccggcca ccggatggag aggccagaca actgcagcga ggagatgtac 4380

cgcctgatgc tgcaatgctg gaagcaggag ccggacaaaa ggccggtgtt tgcggacatc 4440cgcctgatgc tgcaatgctg gaagcaggag ccggacaaaa ggccggtgtt tgcggacatc 4440

agcaaagacc tggagaagat gatggttaag aggagagact acttggacct tgcggcgtcc 4500agcaaagacc tggagaagat gatggttaag aggagagact acttggacct tgcggcgtcc 4500

actccatctg actccctgat ttatgacgac ggcctctcag aggaggagac accgctggtg 4560actccatctg actccctgat ttatgacgac ggcctctcag aggaggagac accgctggtg 4560

gactgtaata atgcccccct ccctcgagcc ctcccttcca catggattga aaacaaactc 4620gactgtaata atgcccccct ccctcgagcc ctcccttcca catggattga aaacaaactc 4620

tatggcatgt cagacccgaa ctggcctgga gagagtcctg taccactcac gagagctgat 4680tatggcatgt cagacccgaa ctggcctgga gagagtcctg taccactcac gagagctgat 4680

ggcactaaca ctgggtttcc aagatatcca aatgatagtg tatatgctaa ctggatgctt 4740ggcactaaca ctgggtttcc aagatatcca aatgatagtg tatatgctaa ctggatgctt 4740

tcaccctcag cggcaaaatt aatggacacg tttgatagtt aa 4782tcaccctcag cggcaaaatt aatggacacg tttgatagtt aa 4782

<210> 18<210> 18

<211> 1593<211> 1593

<212> белок<212> protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> слитый пептид<223> fusion peptide

<400> 18<400> 18

Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg ValMet Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg Val

1. 5 10 151. 5 10 15

Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly AlaGlu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly Ala

20 25 3020 25 30

Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu AlaThr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu Ala

35 40 4535 40 45

Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr CysLys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr Cys

50 55 6050 55 60

Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val PheAsp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val Phe

65 70 75 8065 70 75 80

Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser AlaGlu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser Ala

85 90 9585 90 95

Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr SerSer Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr Ser

100 105 110100 105 110

Lys Leu Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser SerLys Leu Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser

115 120 125115 120 125

Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser SerSer Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser

130 135 140130 135 140

Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile ProGlu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro

145 150 155 160145 150 155 160

Thr Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser ProThr Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro

165 170 175165 170 175

Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu GluSer Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu

180 185 190180 185 190

Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys LeuLys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu

195 200 205195 200 205

Lys Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu TrpLys Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp

210 215 220210 215 220

Lys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu LysLys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys

225 230 235 240225 230 235 240

Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg TyrGlu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr

245 250 255245 250 255

Met Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr LeuMet Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu

260 265 270260 265 270

Asp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu ValAsp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val

275 280 285275 280 285

Glu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu IleGlu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile

290 295 300290 295 300

Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser SerLeu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser

305 310 315 320305 310 315 320

Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp AlaTyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala

325 330 335325 330 335

Leu Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His ValLeu Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val

340 345 350340 345 350

Lys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val ValLys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val

355 360 365355 360 365

Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu SerArg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser

370 375 380370 375 380

Thr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala GluThr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu

385 390 395 400385 390 395 400

Glu Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu LysGlu Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys

405 410 415405 410 415

Val Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn GluVal Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu

420 425 430420 425 430

Met Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu LeuMet Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu

435 440 445435 440 445

Arg Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln LysArg Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys

450 455 460450 455 460

Arg Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr IleArg Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile

465 470 475 480465 470 475 480

Lys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg GluLys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu

485 490 495485 490 495

Leu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro ProLeu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro

500 505 510500 505 510

Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala HisPro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His

515 520 525515 520 525

Ala Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln AlaAla Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala

530 535 540530 535 540

Asn Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe LeuAsn Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu

545 550 555 560545 550 555 560

Arg Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met ProArg Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro

565 570 575565 570 575

Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu LysArg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys

580 585 590580 585 590

Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly AlaPhe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala

595 600 605595 600 605

Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu SerAla Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser

610 615 620610 615 620

Leu Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln CysLeu Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys

625 630 635 640625 630 635 640

Ser Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met SerSer Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser

645 650 655645 650 655

Ala His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys AspAla His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp

660 665 670660 665 670

Gln Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile LysGln Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys

675 680 685675 680 685

Tyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu AspTyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp

690 695 700690 695 700

Cys Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala LeuCys Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu

705 710 715 720705 710 715 720

Asp Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln GlyAsp Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly

725 730 735725 730 735

Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu ThrGly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr

740 745 750740 745 750

Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg MetSer Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met

755 760 765755 760 765

Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly ProPro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro

770 775 780770 775 780

Gln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp ValGln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val

785 790 795 800785 790 795 800

Val Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile AlaVal Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala

805 810 815805 810 815

Pro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu LeuPro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu

820 825 830820 825 830

Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser ProAla Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro

835 840 845835 840 845

Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met AsnTyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn

850 855 860850 855 860

Lys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg ProLys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro

865 870 875 880865 870 875 880

Pro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg AlaPro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala

885 890 895885 890 895

Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg GluGlu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu

900 905 910900 905 910

Thr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu GluThr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu

915 920 925915 920 925

Leu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu AspLeu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp

930 935 940930 935 940

Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr ArgSer Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg

945 950 955 960945 950 955 960

Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe GluLeu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu

965 970 975965 970 975

Glu Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala GluGlu Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu

980 985 990980 985 990

Lys Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr IleLys Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile

995 1000 1005995 1000 1005

Glu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu ValGlu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val

1010 1015 10201010 1015 1020

Ser Gly Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro Gly SerSer Gly Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser

1025 1030 10351025 1030 1035

Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu GlnVal Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln

1040 1045 10501040 1045 1050

Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln His GluGln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln His Glu

1055 1060 10651055 1060 1065

Asn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala SerAsn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser

1070 1075 10801070 1075 1080

Leu Pro Pro Leu His Val Ala Lys Leu Ser His Glu Gly Pro GlyLeu Pro Pro Leu His Val Ala Lys Leu Ser His Glu Gly Pro Gly

1085 1090 10951085 1090 1095

Ser Glu Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln LeuSer Glu Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu

1100 1105 11101100 1105 1110

Leu Glu Thr Leu Asn Gln Leu Ser Thr His Thr His Val Val AspLeu Glu Thr Leu Asn Gln Leu Ser Thr His Thr His Val Val Asp

1115 1120 11251115 1120 1125

Ile Thr Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln LeuIle Thr Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu

1130 1135 11401130 1135 1140

Met Glu Gln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val GluMet Glu Gln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu

1145 1150 11551145 1150 1155

Lys Leu Lys Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg ProLys Leu Lys Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro

1160 1165 11701160 1165 1170

Gly Ala Thr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser AlaGly Ala Thr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala

1175 1180 11851175 1180 1185

Phe Leu Arg Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn LeuPhe Leu Arg Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu

1190 1195 12001190 1195 1200

Val Leu Gly Lys Thr Leu Gly Glu Gly Glu Phe Gly Lys Val ValVal Leu Gly Lys Thr Leu Gly Glu Gly Glu Phe Gly Lys Val Val

1205 1210 12151205 1210 1215

Lys Ala Thr Ala Phe His Leu Lys Gly Arg Ala Gly Tyr Thr ThrLys Ala Thr Ala Phe His Leu Lys Gly Arg Ala Gly Tyr Thr Thr

1220 1225 12301220 1225 1230

Val Ala Val Lys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu LeuVal Ala Val Lys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu Leu

1235 1240 12451235 1240 1245

Arg Asp Leu Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn HisArg Asp Leu Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn His

1250 1255 12601250 1255 1260

Pro His Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly ProPro His Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro

1265 1270 12751265 1270 1275

Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg GlyLeu Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly

1280 1285 12901280 1285 1290

Phe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly SerPhe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser

1295 1300 13051295 1300 1305

Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro Asp Glu ArgGly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg

1310 1315 13201310 1315 1320

Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile SerAla Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser

1325 1330 13351325 1330 1335

Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg AspGln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp

1340 1345 13501340 1345 1350

Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met LysLeu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys

1355 1360 13651355 1360 1365

Ile Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp SerIle Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser

1370 1375 13801370 1375 1380

Tyr Val Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met AlaTyr Val Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala

1385 1390 13951385 1390 1395

Ile Glu Ser Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp ValIle Glu Ser Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val

1400 1405 14101400 1405 1410

Trp Ser Phe Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly GlyTrp Ser Phe Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly

1415 1420 14251415 1420 1425

Asn Pro Tyr Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu LeuAsn Pro Tyr Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu

1430 1435 14401430 1435 1440

Lys Thr Gly His Arg Met Glu Arg Pro Asp Asn Cys Ser Glu GluLys Thr Gly His Arg Met Glu Arg Pro Asp Asn Cys Ser Glu Glu

1445 1450 14551445 1450 1455

Met Tyr Arg Leu Met Leu Gln Cys Trp Lys Gln Glu Pro Asp LysMet Tyr Arg Leu Met Leu Gln Cys Trp Lys Gln Glu Pro Asp Lys

1460 1465 14701460 1465 1470

Arg Pro Val Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met MetArg Pro Val Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met Met

1475 1480 14851475 1480 1485

Val Lys Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro SerVal Lys Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro Ser

1490 1495 15001490 1495 1500

Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr ProAsp Ser Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr Pro

1505 1510 15151505 1510 1515

Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro SerLeu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro Ser

1520 1525 15301520 1525 1530

Thr Trp Ile Glu Asn Lys Leu Tyr Gly Met Ser Asp Pro Asn TrpThr Trp Ile Glu Asn Lys Leu Tyr Gly Met Ser Asp Pro Asn Trp

1535 1540 15451535 1540 1545

Pro Gly Glu Ser Pro Val Pro Leu Thr Arg Ala Asp Gly Thr AsnPro Gly Glu Ser Pro Val Pro Leu Thr Arg Ala Asp Gly Thr Asn

1550 1555 15601550 1555 1560

Thr Gly Phe Pro Arg Tyr Pro Asn Asp Ser Val Tyr Ala Asn TrpThr Gly Phe Pro Arg Tyr Pro Asn Asp Ser Val Tyr Ala Asn Trp

1565 1570 15751565 1570 1575

Met Leu Ser Pro Ser Ala Ala Lys Leu Met Asp Thr Phe Asp SerMet Leu Ser Pro Ser Ala Ala Lys Leu Met Asp Thr Phe Asp Ser

1580 1585 15901580 1585 1590

<210> 19<210> 19

<211> 4656<211> 4656

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кодирующая последовательность слитого пептида<223> fusion peptide coding sequence

<400> 19<400> 19

atgagtgcgg aggcaagcgc ccggcctctg cgggtgggct cccgtgtaga ggtgattgga 60atgagtgcgg aggcaagcgc ccggcctctg cgggtgggct cccgtgtaga ggtgattgga 60

aaaggccacc gaggcactgt ggcctatgtt ggagccacac tgtttgccac tggcaaatgg 120aaaggccacc gaggcactgt ggcctatgtt ggagccacac tgtttgccac tggcaaatgg 120

gtaggcgtga ttctggatga agcaaagggc aaaaatgatg gaactgttca aggcaggaag 180gtaggcgtga ttctggatga agcaaagggc aaaaatgatg gaactgttca aggcaggaag 180

tacttcactt gtgatgaagg gcatggcatc tttgtgcgcc agtcccagat ccaggtattt 240tacttcactt gtgatgaagg gcatggcatc tttgtgcgcc agtcccagat ccaggtattt 240

gaagatggag cagatactac ttccccagag acacctgatt cttctgcttc aaaagtcctc 300gaagatggag cagatactac ttccccagag acacctgatt cttctgcttc aaaagtcctc 300

aaaagagagg gaactgatac aactgcaaag actagcaaac tgcccacgcg cccagccagt 360aaaagagagg gaactgatac aactgcaaag actagcaaac tgcccacgcg cccagccagt 360

actggggtgg ctggggccag tagctccctg ggcccctctg gctcagcgtc agcaggtgag 420actggggtgg ctggggccag tagctccctg ggcccctctg gctcagcgtc agcaggtgag 420

ctgagcagca gtgagcccag caccccggct cagactccgc tggcagcacc catcatcccc 480ctgagcagca gtgagcccag caccccggct cagactccgc tggcagcacc catcatcccc 480

acgccggtcc tcacctctcc tggagcagtc cccccgcttc cttccccatc caaggaggag 540acgccggtcc tcacctctcc tggagcagtc cccccgcttc cttccccatc caaggaggag 540

gagggactaa gggctcaggt gcgggacctg gaggagaaac tagagaccct gagactgaaa 600gagggactaa gggctcaggt gcgggacctg gaggagaaac tagagaccct gagactgaaa 600

cgggcagaag acaaagcaaa gctaaaagag ctggagaaac acaaaatcca gctggagcag 660cgggcagaag acaaagcaaa gctaaaagag ctggagaaac acaaaatcca gctggagcag 660

gtgcaggaat ggaagagcaa aatgcaggag cagcaggccg acctgcagcg gcgcctcaag 720gtgcaggaat ggaagagcaa aatgcaggag cagcaggccg acctgcagcg gcgcctcaag 720

gaggcgagaa aggaagccaa ggaggcgctg gaggcaaagg aacgctatat ggaggagatg 780gaggcgagaa aggaagccaa ggaggcgctg gaggcaaagg aacgctatat ggaggagatg 780

gctgatactg ctgatgccat tgagatggcc actttggaca aggagatggc tgaagagcgg 840gctgatactg ctgatgccat tgagatggcc actttggaca aggagatggc tgaagagcgg 840

gctgagtccc tgcagcagga ggtggaggca ctgaaggagc gggtggacga gctcactact 900gctgagtccc tgcagcagga ggtggaggca ctgaaggagc gggtggacga gctcactact 900

gacttagaga tcctcaaggc tgagattgaa gagaagggct cagatggcgc tgcatccagt 960gacttagaga tcctcaaggc tgagattgaa gagaagggct cagatggcgc tgcatccagt 960

tatcagctca agcagcttga ggagcagaat gcccgcctga aggatgccct ggtgaggatg 1020tatcagctca agcagcttga ggagcagaat gcccgcctga aggatgccct ggtgaggatg 1020

cgggatcttt cttcctcaga gaagcaggag catgtgaagc tccagaagct catggaaaag 1080cgggatcttt cttcctcaga gaagcaggag catgtgaagc tccagaagct catggaaaag 1080

aagaaccaag agctggaagt tgtgaggcaa cagcgggagc gtctgcagga ggagctaagc 1140aagaaccaag agctggaagt tgtgaggcaa cagcgggagc gtctgcagga ggagctaagc 1140

caggcagaga gcaccattga tgagctcaag gagcaggtgg atgctgctct gggtgctgag 1200caggcagaga gcaccattga tgagctcaag gagcaggtgg atgctgctct gggtgctgag 1200

gagatggtgg agatgctgac agatcggaac ctgaatctgg aagagaaagt gcgcgagttg 1260gagatggtgg agatgctgac agatcggaac ctgaatctgg aagagaaagt gcgcgagttg 1260

agggagactg tgggagactt ggaagcgatg aatgagatga acgatgagct gcaggagaat 1320agggagactg tgggagactt ggaagcgatg aatgagatga acgatgagct gcaggagaat 1320

gcacgtgaga cagaactgga gctgcgggag cagctggaca tggcaggcgc gcgggttcgt 1380gcacgtgaga cagaactgga gctgcgggag cagctggaca tggcaggcgc gcgggttcgt 1380

gaggcccaga agcgtgtgga ggcagcccag gagacggttg cagactacca gcagaccatc 1440gaggcccaga agcgtgtgga ggcagcccag gagacggttg cagactacca gcagaccatc 1440

aagaagtacc gccagctgac cgcccatcta caggatgtga atcgggaact gacaaaccag 1500aagaagtacc gccagctgac cgcccatcta caggatgtga atcgggaact gacaaaccag 1500

caggaagcat ctgtggagag gcaacagcag ccacctccag agacctttga cttcaaaatc 1560caggaagcat ctgtggagag gcaacagcag ccacctccag agacctttga cttcaaaatc 1560

aagtttgctg agactaaggc ccatgccaag gcaattgaga tggaattgag gcagatggag 1620aagtttgctg agactaaggc ccatgccaag gcaattgaga tggaattgag gcagatggag 1620

gtggcccagg ccaatcgaca catgtccctg ctgacagcct tcatgcctga cagcttcctt 1680gtggcccagg ccaatcgaca catgtccctg ctgacagcct tcatgcctga cagcttcctt 1680

cggccaggtg gggaccatga ctgcgttctg gtgctgttgc tcatgcctcg tctcatttgc 1740cggccaggtg gggaccatga ctgcgttctg gtgctgttgc tcatgcctcg tctcatttgc 1740

aaggcagagc tgatccggaa gcaggcccag gagaagtttg aactaagtga gaactgttca 1800aaggcagagc tgatccggaa gcaggcccag gagaagtttg aactaagtga gaactgttca 1800

gagcggcctg ggctgcgagg agctgctggg gagcaactca gctttgctgc tggactggtg 1860gagcggcctg ggctgcgagg agctgctggg gagcaactca gctttgctgc tggactggtg 1860

tactcgctga gcctgctgca ggccacgcta caccgctatg agcatgccct ctctcagtgc 1920tactcgctga gcctgctgca ggccacgcta caccgctatg agcatgccct ctctcagtgc 1920

agtgtggatg tgtataagaa agtgggcagc ctgtaccctg agatgagtgc ccatgagcgc 1980agtgtggatg tgtataagaa agtgggcagc ctgtaccctg agatgagtgc ccatgagcgc 1980

tccttggatt tcctcattga actgctgcac aaggatcagc tggatgagac tgtcaatgtg 2040tccttggatt tcctcattga actgctgcac aaggatcagc tggatgagac tgtcaatgtg 2040

gagcctctca ccaaggccat caagtactat cagcatctgt acagcatcca ccttgccgaa 2100gagcctctca ccaaggccat caagtactat cagcatctgt acagcatcca ccttgccgaa 2100

cagcctgagg actgtactat gcagctggct gaccacatta agttcacgca gagtgctctg 2160cagcctgagg actgtactat gcagctggct gaccacatta agttcacgca gagtgctctg 2160

gactgcatga gtgtggaggt aggacggctg cgtgccttct tgcagggtgg gcaggaggct 2220gactgcatga gtgtggaggt aggacggctg cgtgccttct tgcagggtgg gcaggaggct 2220

acagatattg ccctcctgct ccgggatctg gaaacttcat gcagtgacat ccgccagttc 2280acagatattg ccctcctgct ccgggatctg gaaacttcat gcagtgacat ccgccagttc 2280

tgcaagaaga tccgaaggcg aatgccaggg acagatgctc ctgggatccc agctgcactg 2340tgcaagaaga tccgaaggcg aatgccaggg acagatgctc ctgggatccc agctgcactg 2340

gcctttggac cacaggtatc tgacacgctc ctagactgca ggaaacactt gacgtgggtc 2400gcctttggac cacaggtatc tgacacgctc ctagactgca ggaaacactt gacgtgggtc 2400

gtggctgtgc tgcaggaggt ggcagctgct gctgcccagc tcattgcccc actggcagag 2460gtggctgtgc tgcaggaggt ggcagctgct gctgcccagc tcattgcccc actggcagag 2460

aatgaggggc tacttgtggc tgctctggag gaactggctt tcaaagcaag cgagcagatc 2520aatgaggggc tacttgtggc tgctctggag gaactggctt tcaaagcaag cgagcagatc 2520

tatgggaccc cctccagcag cccctatgag tgtctgcgcc agtcatgcaa catcctcatc 2580tatgggaccc cctccagcag cccctatgag tgtctgcgcc agtcatgcaa catcctcatc 2580

agtaccatga acaagctggc cacagccatg caggaggggg agtatgatgc agagcggccc 2640agtaccatga acaagctggc cacagccatg caggaggggg agtatgatgc agagcggccc 2640

cccagcaagc ctccaccggt tgaactgcgg gctgctgccc ttcgtgcaga gatcacagat 2700cccagcaagc ctccaccggt tgaactgcgg gctgctgccc ttcgtgcaga gatcacagat 2700

gctgaaggcc tgggtttgaa gctcgaagat cgagagacag ttattaagga gttgaagaag 2760gctgaaggcc tgggtttgaa gctcgaagat cgagagacag ttattaagga gttgaagaag 2760

tcactcaaga ttaagggaga ggagctaagt gaggccaatg tgcggctgag cctcctggag 2820tcactcaaga ttaagggaga ggagctaagt gaggccaatg tgcggctgag cctcctggag 2820

aagaagttgg acagtgctgc caaggatgca gatgagcgca tcgagaaagt ccagactcgg 2880aagaagttgg acagtgctgc caaggatgca gatgagcgca tcgagaaagt ccagactcgg 2880

ctggaggaga cccaggcact gctgcgaaag aaggagaaag agtttgagga gacaatggat 2940ctggaggaga cccaggcact gctgcgaaag aaggagaaag agtttgagga gacaatggat 2940

gcactccagg ctgacatcga ccagctggag gcagagaagg cagaactaaa gcagcgtctg 3000gcactccagg ctgacatcga ccagctggag gcagagaagg cagaactaaa gcagcgtctg 3000

aacagccagt ccaaacgcac gattgaggga ctccggggcc ctcctccttc aggcattgct 3060aacagccagt ccaaacgcac gattgaggga ctccggggcc ctcctccttc aggcattgct 3060

actctggtct ctggcattgc tggtggagcc atccctgggc aggctccagg gtctgtgcca 3120actctggtct ctggcattgc tggtggagcc atccctgggc aggctccagg gtctgtgcca 3120

ggcccagggc tggtgaagga ctcaccactg ctgcttcagc agatctctgc catgaggctg 3180ggcccaagggc tggtgaagga ctcaccactg ctgcttcagc agatctctgc catgaggctg 3180

cacatctccc agctccagca tgagaacagc atcctcaagg gagcccagat gaaggcatcc 3240cacatctccc agctccagca tgagaacagc atcctcaagg gagcccagat gaaggcatcc 3240

ttggcatccc tgccccctct gcatgttgca aagctatccc atgagggccc tggcagtgag 3300ttggcatccc tgccccctct gcatgttgca aagctatccc atgagggccc tggcagtgag 3300

ttaccagctg gagcgctgta tcgtaagacc agccagctgc tggagacatt gaatcaattg 3360ttaccagctg gagcgctgta tcgtaagacc agccagctgc tggagacatt gaatcaattg 3360

agcacacaca cgcacgtagt agacatcact cgcaccagcc ctgctgccaa gagcccgtcg 3420agcacacaca cgcacgtagt agacatcact cgcaccagcc ctgctgccaa gagcccgtcg 3420

gcccaactta tggagcaagt ggctcagctt aagtccctga gtgacaccgt cgagaagctc 3480gcccaactta tggagcaagt ggctcagctt aagtccctga gtgacaccgt cgagaagctc 3480

aaggatgagg tcctcaagga gacagtatct cagcgccctg gagccacagt acccactgac 3540aaggatgagg tcctcaagga gacagtatct cagcgccctg gagccacagt acccactgac 3540

tttgccacct tcccttcatc agccttcctc agggaggatc caaagtggga attccctcgg 3600tttgccacct tcccttcatc agccttcctc agggaggatc caaagtggga attccctcgg 3600

aagaacttgg ttcttggaaa aactctagga gaaggcgaat ttggaaaagt ggtcaaggca 3660aagaacttgg ttcttggaaa aactctagga gaaggcgaat ttggaaaagt ggtcaaggca 3660

acggccttcc atctgaaagg cagagcaggg tacaccacgg tggccgtgaa gatgctgaaa 3720acggccttcc atctgaaagg cagagcaggg tacaccacgg tggccgtgaa gatgctgaaa 3720

gagaacgcct ccccgagtga gcttcgagac ctgctgtcag agttcaacgt cctgaagcag 3780gagaacgcct ccccgagtga gcttcgagac ctgctgtcag agttcaacgt cctgaagcag 3780

gtcaaccacc cacatgtcat caaattgtat ggggcctgca gccaggatgg cccgctcctc 3840gtcaaccacc cacatgtcat caaattgtat ggggcctgca gccaggatgg cccgctcctc 3840

ctcatcgtgg agtacgccaa atacggctcc ctgcggggct tcctccgcga gagccgcaaa 3900ctcatcgtgg agtacgccaa atacggctcc ctgcggggct tcctccgcga gagccgcaaa 3900

gtggggcctg gctacctggg cagtggaggc agccgcaact ccagctccct ggaccacccg 3960gtggggcctg gctacctggg cagtggaggc agccgcaact ccagctccct ggaccacccg 3960

gatgagcggg ccctcaccat gggcgacctc atctcatttg cctggcagat ctcacagggg 4020gatgagcggg ccctcaccat gggcgacctc atctcatttg cctggcagat ctcacagggg 4020

atgcagtatc tggccgagat gaagctcgtt catcgggact tggcagccag aaacatcctg 4080atgcagtatc tggccgagat gaagctcgtt catcgggact tggcagccag aaacatcctg 4080

gtagctgagg ggcggaagat gaagatttcg gatttcggct tgtcccgaga tgtttatgaa 4140gtagctgagg ggcggaagat gaagatttcg gatttcggct tgtcccgaga tgtttatgaa 4140

gaggattcct acgtgaagag gagccagggt cggattccag ttaaatggat ggcaattgaa 4200gaggattcct acgtgaagag gagccagggt cggattccag ttaaatggat ggcaattgaa 4200

tccctttttg atcatatcta caccacgcaa agtgatgtat ggtcttttgg tgtcctgctg 4260tccctttttg atcatatcta caccacgcaa agtgatgtat ggtcttttgg tgtcctgctg 4260

tgggagatcg tgaccctagg gggaaacccc tatcctggga ttcctcctga gcggctcttc 4320tggggagatcg tgaccctagg gggaaacccc tatcctggga ttcctcctga gcggctcttc 4320

aaccttctga agaccggcca ccggatggag aggccagaca actgcagcga ggagatgtac 4380aaccttctga agaccggcca ccggatggag aggccagaca actgcagcga ggagatgtac 4380

cgcctgatgc tgcaatgctg gaagcaggag ccggacaaaa ggccggtgtt tgcggacatc 4440cgcctgatgc tgcaatgctg gaagcaggag ccggacaaaa ggccggtgtt tgcggacatc 4440

agcaaagacc tggagaagat gatggttaag aggagagact acttggacct tgcggcgtcc 4500agcaaagacc tggagaagat gatggttaag aggagagact acttggacct tgcggcgtcc 4500

actccatctg actccctgat ttatgacgac ggcctctcag aggaggagac accgctggtg 4560actccatctg actccctgat ttatgacgac ggcctctcag aggaggagac accgctggtg 4560

gactgtaata atgcccccct ccctcgagcc ctcccttcca catggattga aaacaaactc 4620gactgtaata atgcccccct ccctcgagcc ctcccttcca catggattga aaacaaactc 4620

tatggtagaa tttcccatgc atttactaga ttctag 4656tatggtagaa tttcccatgc atttactaga ttctag 4656

<210> 20<210> 20

<211> 1551<211> 1551

<212> белок<212> protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> слитый пептид<223> fusion peptide

<400> 20<400> 20

Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg ValMet Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg Val

1. 5 10 151. 5 10 15

Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly AlaGlu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly Ala

20 25 3020 25 30

Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu AlaThr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu Ala

35 40 4535 40 45

Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr CysLys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr Cys

50 55 6050 55 60

Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val PheAsp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val Phe

65 70 75 8065 70 75 80

Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser AlaGlu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser Ala

85 90 9585 90 95

Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr SerSer Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr Ser

100 105 110100 105 110

Lys Leu Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser SerLys Leu Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser

115 120 125115 120 125

Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser SerSer Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser

130 135 140130 135 140

Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile ProGlu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro

145 150 155 160145 150 155 160

Thr Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser ProThr Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro

165 170 175165 170 175

Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu GluSer Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu

180 185 190180 185 190

Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys LeuLys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu

195 200 205195 200 205

Lys Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu TrpLys Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp

210 215 220210 215 220

Lys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu LysLys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys

225 230 235 240225 230 235 240

Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg TyrGlu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr

245 250 255245 250 255

Met Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr LeuMet Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu

260 265 270260 265 270

Asp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu ValAsp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val

275 280 285275 280 285

Glu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu IleGlu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile

290 295 300290 295 300

Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser SerLeu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser

305 310 315 320305 310 315 320

Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp AlaTyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala

325 330 335325 330 335

Leu Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His ValLeu Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val

340 345 350340 345 350

Lys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val ValLys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val

355 360 365355 360 365

Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu SerArg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser

370 375 380370 375 380

Thr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala GluThr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu

385 390 395 400385 390 395 400

Glu Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu LysGlu Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys

405 410 415405 410 415

Val Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn GluVal Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu

420 425 430420 425 430

Met Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu LeuMet Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu

435 440 445435 440 445

Arg Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln LysArg Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys

450 455 460450 455 460

Arg Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr IleArg Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile

465 470 475 480465 470 475 480

Lys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg GluLys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu

485 490 495485 490 495

Leu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro ProLeu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro

500 505 510500 505 510

Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala HisPro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His

515 520 525515 520 525

Ala Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln AlaAla Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala

530 535 540530 535 540

Asn Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe LeuAsn Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu

545 550 555 560545 550 555 560

Arg Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met ProArg Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro

565 570 575565 570 575

Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu LysArg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys

580 585 590580 585 590

Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly AlaPhe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala

595 600 605595 600 605

Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu SerAla Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser

610 615 620610 615 620

Leu Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln CysLeu Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys

625 630 635 640625 630 635 640

Ser Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met SerSer Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser

645 650 655645 650 655

Ala His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys AspAla His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp

660 665 670660 665 670

Gln Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile LysGln Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys

675 680 685675 680 685

Tyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu AspTyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp

690 695 700690 695 700

Cys Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala LeuCys Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu

705 710 715 720705 710 715 720

Asp Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln GlyAsp Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly

725 730 735725 730 735

Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu ThrGly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr

740 745 750740 745 750

Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg MetSer Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met

755 760 765755 760 765

Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly ProPro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro

770 775 780770 775 780

Gln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp ValGln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val

785 790 795 800785 790 795 800

Val Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile AlaVal Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala

805 810 815805 810 815

Pro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu LeuPro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu

820 825 830820 825 830

Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser ProAla Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro

835 840 845835 840 845

Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met AsnTyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn

850 855 860850 855 860

Lys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg ProLys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro

865 870 875 880865 870 875 880

Pro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg AlaPro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala

885 890 895885 890 895

Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg GluGlu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu

900 905 910900 905 910

Thr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu GluThr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu

915 920 925915 920 925

Leu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu AspLeu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp

930 935 940930 935 940

Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr ArgSer Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg

945 950 955 960945 950 955 960

Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe GluLeu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu

965 970 975965 970 975

Glu Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala GluGlu Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu

980 985 990980 985 990

Lys Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr IleLys Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile

995 1000 1005995 1000 1005

Glu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu ValGlu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val

1010 1015 10201010 1015 1020

Ser Gly Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro Gly SerSer Gly Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser

1025 1030 10351025 1030 1035

Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu GlnVal Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln

1040 1045 10501040 1045 1050

Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln His GluGln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln His Glu

1055 1060 10651055 1060 1065

Asn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala SerAsn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser

1070 1075 10801070 1075 1080

Leu Pro Pro Leu His Val Ala Lys Leu Ser His Glu Gly Pro GlyLeu Pro Pro Leu His Val Ala Lys Leu Ser His Glu Gly Pro Gly

1085 1090 10951085 1090 1095

Ser Glu Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln LeuSer Glu Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu

1100 1105 11101100 1105 1110

Leu Glu Thr Leu Asn Gln Leu Ser Thr His Thr His Val Val AspLeu Glu Thr Leu Asn Gln Leu Ser Thr His Thr His Val Val Asp

1115 1120 11251115 1120 1125

Ile Thr Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln LeuIle Thr Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu

1130 1135 11401130 1135 1140

Met Glu Gln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val GluMet Glu Gln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu

1145 1150 11551145 1150 1155

Lys Leu Lys Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg ProLys Leu Lys Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro

1160 1165 11701160 1165 1170

Gly Ala Thr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser AlaGly Ala Thr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala

1175 1180 11851175 1180 1185

Phe Leu Arg Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn LeuPhe Leu Arg Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu

1190 1195 12001190 1195 1200

Val Leu Gly Lys Thr Leu Gly Glu Gly Glu Phe Gly Lys Val ValVal Leu Gly Lys Thr Leu Gly Glu Gly Glu Phe Gly Lys Val Val

1205 1210 12151205 1210 1215

Lys Ala Thr Ala Phe His Leu Lys Gly Arg Ala Gly Tyr Thr ThrLys Ala Thr Ala Phe His Leu Lys Gly Arg Ala Gly Tyr Thr Thr

1220 1225 12301220 1225 1230

Val Ala Val Lys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu LeuVal Ala Val Lys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu Leu

1235 1240 12451235 1240 1245

Arg Asp Leu Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn HisArg Asp Leu Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn His

1250 1255 12601250 1255 1260

Pro His Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly ProPro His Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro

1265 1270 12751265 1270 1275

Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg GlyLeu Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly

1280 1285 12901280 1285 1290

Phe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly SerPhe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser

1295 1300 13051295 1300 1305

Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro Asp Glu ArgGly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg

1310 1315 13201310 1315 1320

Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile SerAla Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser

1325 1330 13351325 1330 1335

Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg AspGln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp

1340 1345 13501340 1345 1350

Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met LysLeu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys

1355 1360 13651355 1360 1365

Ile Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp SerIle Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser

1370 1375 13801370 1375 1380

Tyr Val Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met AlaTyr Val Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala

1385 1390 13951385 1390 1395

Ile Glu Ser Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp ValIle Glu Ser Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val

1400 1405 14101400 1405 1410

Trp Ser Phe Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly GlyTrp Ser Phe Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly

1415 1420 14251415 1420 1425

Asn Pro Tyr Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu LeuAsn Pro Tyr Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu

1430 1435 14401430 1435 1440

Lys Thr Gly His Arg Met Glu Arg Pro Asp Asn Cys Ser Glu GluLys Thr Gly His Arg Met Glu Arg Pro Asp Asn Cys Ser Glu Glu

1445 1450 14551445 1450 1455

Met Tyr Arg Leu Met Leu Gln Cys Trp Lys Gln Glu Pro Asp LysMet Tyr Arg Leu Met Leu Gln Cys Trp Lys Gln Glu Pro Asp Lys

1460 1465 14701460 1465 1470

Arg Pro Val Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met MetArg Pro Val Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met Met

1475 1480 14851475 1480 1485

Val Lys Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro SerVal Lys Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro Ser

1490 1495 15001490 1495 1500

Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr ProAsp Ser Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr Pro

1505 1510 15151505 1510 1515

Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro SerLeu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro Ser

1520 1525 15301520 1525 1530

Thr Trp Ile Glu Asn Lys Leu Tyr Gly Arg Ile Ser His Ala PheThr Trp Ile Glu Asn Lys Leu Tyr Gly Arg Ile Ser His Ala Phe

1535 1540 15451535 1540 1545

Thr Arg PheThr Arg Phe

15501550

<210> 21<210> 21

<211> 4887<211> 4887

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кодирующая последовательность слитого пептида<223> fusion peptide coding sequence

<400> 21<400> 21

atggcacaga gcaagaggca cgtgtacagc cggacgccca gcggcagcag gatgagtgcg 60atggcacaga gcaagaggca cgtgtacagc cggacgccca gcggcagcag gatgagtgcg 60

gaggcaagcg cccggcctct gcgggtgggc tcccgtgtag aggtgattgg aaaaggccac 120gaggcaagcg cccggcctct gcgggtgggc tcccgtgtag aggtgattgg aaaaggccac 120

cgaggcactg tggcctatgt tggagccaca ctgtttgcca ctggcaaatg ggtaggcgtg 180cgaggcactg tggcctatgt tggagccaca ctgtttgcca ctggcaaatg ggtaggcgtg 180

attctggatg aagcaaaggg caaaaatgat ggaactgttc aaggcaggaa gtacttcact 240attctggatg aagcaaaggg caaaaatgat ggaactgttc aaggcaggaa gtacttcact 240

tgtgatgaag ggcatggcat ctttgtgcgc cagtcccaga tccaggtatt tgaagatgga 300tgtgatgaag ggcatggcat ctttgtgcgc cagtcccaga tccaggtatt tgaagatgga 300

gcagatacta cttccccaga gacacctgat tcttctgctt caaaagtcct caaaagagag 360gcagatacta cttccccaga gacacctgat tcttctgctt caaaagtcct caaaagagag 360

ggaactgata caactgcaaa gactagcaaa ctggcaccga cagcccgaaa gaccacaact 420ggaactgata caactgcaaa gactagcaaa ctggcaccga cagcccgaaa gaccacaact 420

cggcgaccca agcccacgcg cccagccagt actggggtgg ctggggccag tagctccctg 480cggcgaccca agcccacgcg cccagccagt actggggtgg ctggggccag tagctccctg 480

ggcccctctg gctcagcgtc agcaggtgag ctgagcagca gtgagcccag caccccggct 540ggcccctctg gctcagcgtc agcaggtgag ctgagcagca gtgagcccag caccccggct 540

cagactccgc tggcagcacc catcatcccc acgccggtcc tcacctctcc tggagcagtc 600cagactccgc tggcagcacc catcatcccc acgccggtcc tcacctctcc tggagcagtc 600

cccccgcttc cttccccatc caaggaggag gagggactaa gggctcaggt gcgggacctg 660cccccgcttc cttccccatc caaggaggag gagggactaa gggctcaggt gcgggacctg 660

gaggagaaac tagagaccct gagactgaaa cgggcagaag acaaagcaaa gctaaaagag 720gaggagaaac tagagaccct gagactgaaa cgggcagaag acaaagcaaa gctaaaagag 720

ctggagaaac acaaaatcca gctggagcag gtgcaggaat ggaagagcaa aatgcaggag 780ctggagaaac acaaaatcca gctggagcag gtgcaggaat ggaagagcaa aatgcaggag 780

cagcaggccg acctgcagcg gcgcctcaag gaggcgagaa aggaagccaa ggaggcgctg 840cagcaggccg acctgcagcg gcgcctcaag gaggcgagaa aggaagccaa ggaggcgctg 840

gaggcaaagg aacgctatat ggaggagatg gctgatactg ctgatgccat tgagatggcc 900gaggcaaagg aacgctatat ggaggagatg gctgatactg ctgatgccat tgagatggcc 900

actttggaca aggagatggc tgaagagcgg gctgagtccc tgcagcagga ggtggaggca 960actttggaca aggagatggc tgaagagcgg gctgagtccc tgcagcagga ggtggaggca 960

ctgaaggagc gggtggacga gctcactact gacttagaga tcctcaaggc tgagattgaa 1020ctgaaggagc gggtggacga gctcactact gacttagaga tcctcaaggc tgagattgaa 1020

gagaagggct cagatggcgc tgcatccagt tatcagctca agcagcttga ggagcagaat 1080gagaagggct cagatggcgc tgcatccagt tatcagctca agcagcttga ggagcagaat 1080

gcccgcctga aggatgccct ggtgaggatg cgggatcttt cttcctcaga gaagcaggag 1140gcccgcctga aggatgccct ggtgaggatg cgggatcttt cttcctcaga gaagcaggag 1140

catgtgaagc tccagaagct catggaaaag aagaaccaag agctggaagt tgtgaggcaa 1200catgtgaagc tccagaagct catggaaaag aagaaccaag agctggaagt tgtgaggcaa 1200

cagcgggagc gtctgcagga ggagctaagc caggcagaga gcaccattga tgagctcaag 1260cagcgggagc gtctgcagga ggagctaagc caggcagaga gcaccattga tgagctcaag 1260

gagcaggtgg atgctgctct gggtgctgag gagatggtgg agatgctgac agatcggaac 1320gagcaggtgg atgctgctct gggtgctgag gagatggtgg agatgctgac agatcggaac 1320

ctgaatctgg aagagaaagt gcgcgagttg agggagactg tgggagactt ggaagcgatg 1380ctgaatctgg aagagaaagt gcgcgagttg agggagactg tgggagactt ggaagcgatg 1380

aatgagatga acgatgagct gcaggagaat gcacgtgaga cagaactgga gctgcgggag 1440aatgagatga acgatgagct gcaggagaat gcacgtgaga cagaactgga gctgcgggag 1440

cagctggaca tggcaggcgc gcgggttcgt gaggcccaga agcgtgtgga ggcagcccag 1500cagctggaca tggcaggcgc gcgggttcgt gaggcccaga agcgtgtgga ggcagcccag 1500

gagacggttg cagactacca gcagaccatc aagaagtacc gccagctgac cgcccatcta 1560gagacggttg cagactacca gcagaccatc aagaagtacc gccagctgac cgcccatcta 1560

caggatgtga atcgggaact gacaaaccag caggaagcat ctgtggagag gcaacagcag 1620caggatgtga atcgggaact gacaaaccag caggaagcat ctgtggagag gcaacagcag 1620

ccacctccag agacctttga cttcaaaatc aagtttgctg agactaaggc ccatgccaag 1680ccacctccag agacctttga cttcaaaatc aagtttgctg agactaaggc ccatgccaag 1680

gcaattgaga tggaattgag gcagatggag gtggcccagg ccaatcgaca catgtccctg 1740gcaattgaga tggaattgag gcagatggag gtggcccagg ccaatcgaca catgtccctg 1740

ctgacagcct tcatgcctga cagcttcctt cggccaggtg gggaccatga ctgcgttctg 1800ctgacagcct tcatgcctga cagcttcctt cggccaggtg gggaccatga ctgcgttctg 1800

gtgctgttgc tcatgcctcg tctcatttgc aaggcagagc tgatccggaa gcaggcccag 1860gtgctgttgc tcatgcctcg tctcatttgc aaggcagagc tgatccggaa gcaggcccag 1860

gagaagtttg aactaagtga gaactgttca gagcggcctg ggctgcgagg agctgctggg 1920gagaagtttg aactaagtga gaactgttca gagcggcctg ggctgcgagg agctgctggg 1920

gagcaactca gctttgctgc tggactggtg tactcgctga gcctgctgca ggccacgcta 1980gagcaactca gctttgctgc tggactggtg tactcgctga gcctgctgca ggccacgcta 1980

caccgctatg agcatgccct ctctcagtgc agtgtggatg tgtataagaa agtgggcagc 2040caccgctatg agcatgccct ctctcagtgc agtgtggatg tgtataagaa agtgggcagc 2040

ctgtaccctg agatgagtgc ccatgagcgc tccttggatt tcctcattga actgctgcac 2100ctgtaccctg agatgagtgc ccatgagcgc tccttggatt tcctcattga actgctgcac 2100

aaggatcagc tggatgagac tgtcaatgtg gagcctctca ccaaggccat caagtactat 2160aaggatcagc tggatgagac tgtcaatgtg gagcctctca ccaaggccat caagtactat 2160

cagcatctgt acagcatcca ccttgccgaa cagcctgagg actgtactat gcagctggct 2220cagcatctgt acagcatcca ccttgccgaa cagcctgagg actgtactat gcagctggct 2220

gaccacatta agttcacgca gagtgctctg gactgcatga gtgtggaggt aggacggctg 2280gaccacatta agttcacgca gagtgctctg gactgcatga gtgtggaggt aggacggctg 2280

cgtgccttct tgcagggtgg gcaggaggct acagatattg ccctcctgct ccgggatctg 2340cgtgccttct tgcagggtgg gcaggaggct acagatattg ccctcctgct ccgggatctg 2340

gaaacttcat gcagtgacat ccgccagttc tgcaagaaga tccgaaggcg aatgccaggg 2400gaaacttcat gcagtgacat ccgccagttc tgcaagaaga tccgaaggcg aatgccaggg 2400

acagatgctc ctgggatccc agctgcactg gcctttggac cacaggtatc tgacacgctc 2460acagatgctc ctgggatccc agctgcactg gcctttggac cacaggtatc tgacacgctc 2460

ctagactgca ggaaacactt gacgtgggtc gtggctgtgc tgcaggaggt ggcagctgct 2520ctagactgca ggaaacactt gacgtgggtc gtggctgtgc tgcaggaggt ggcagctgct 2520

gctgcccagc tcattgcccc actggcagag aatgaggggc tacttgtggc tgctctggag 2580gctgcccagc tcattgcccc actggcagag aatgaggggc tacttgtggc tgctctggag 2580

gaactggctt tcaaagcaag cgagcagatc tatgggaccc cctccagcag cccctatgag 2640gaactggctt tcaaagcaag cgagcagatc tatgggaccc cctccagcag cccctatgag 2640

tgtctgcgcc agtcatgcaa catcctcatc agtaccatga acaagctggc cacagccatg 2700tgtctgcgcc agtcatgcaa catcctcatc agtaccatga acaagctggc cacagccatg 2700

caggaggggg agtatgatgc agagcggccc cccagcaagc ctccaccggt tgaactgcgg 2760caggaggggg agtatgatgc agagcggccc cccagcaagc ctccaccggt tgaactgcgg 2760

gctgctgccc ttcgtgcaga gatcacagat gctgaaggcc tgggtttgaa gctcgaagat 2820gctgctgccc ttcgtgcaga gatcacagat gctgaaggcc tgggtttgaa gctcgaagat 2820

cgagagacag ttattaagga gttgaagaag tcactcaaga ttaagggaga ggagctaagt 2880cgagagacag ttattaagga gttgaagaag tcactcaaga ttaagggaga ggagctaagt 2880

gaggccaatg tgcggctgag cctcctggag aagaagttgg acagtgctgc caaggatgca 2940gaggccaatg tgcggctgag cctcctggag aagaagttgg acagtgctgc caaggatgca 2940

gatgagcgca tcgagaaagt ccagactcgg ctggaggaga cccaggcact gctgcgaaag 3000gatgagcgca tcgagaaagt ccagactcgg ctggaggaga cccaggcact gctgcgaaag 3000

aaggagaaag agtttgagga gacaatggat gcactccagg ctgacatcga ccagctggag 3060aaggagaaag agtttgagga gacaatggat gcactccagg ctgacatcga ccagctggag 3060

gcagagaagg cagaactaaa gcagcgtctg aacagccagt ccaaacgcac gattgaggga 3120gcagagaagg cagaactaaa gcagcgtctg aacagccagt ccaaacgcac gattgaggga 3120

ctccggggcc ctcctccttc aggcattgct actctggtct ctggcattgc tggtgaagaa 3180ctccggggcc ctcctccttc aggcattgct actctggtct ctggcattgc tggtgaagaa 3180

cagcagcgag gagccatccc tgggcaggct ccagggtctg tgccaggccc agggctggtg 3240cagcagcgag gagccatccc tgggcaggct ccagggtctg tgccaggccc agggctggtg 3240

aaggactcac cactgctgct tcagcagatc tctgccatga ggctgcacat ctcccagctc 3300aaggactcac cactgctgct tcagcagatc tctgccatga ggctgcacat ctcccagctc 3300

cagcatgaga acagcatcct caagggagcc cagatgaagg catccttggc atccctgccc 3360cagcatgaga acagcatcct caagggagcc cagatgaagg catccttggc atccctgccc 3360

cctctgcatg ttgcaaagct atcccatgag ggccctggca gtgagttacc agctggagcg 3420cctctgcatg ttgcaaagct atcccatgag ggccctggca gtgagttacc agctggagcg 3420

ctgtatcgta agaccagcca gctgctggag acattgaatc aattgagcac acacacgcac 3480ctgtatcgta agaccagcca gctgctggag acattgaatc aattgagcac acacacgcac 3480

gtagtagaca tcactcgcac cagccctgct gccaagagcc cgtcggccca acttatggag 3540gtagtagaca tcactcgcac cagccctgct gccaagagcc cgtcggccca acttatggag 3540

caagtggctc agcttaagtc cctgagtgac accgtcgaga agctcaagga tgaggtcctc 3600caagtggctc agcttaagtc cctgagtgac accgtcgaga agctcaagga tgaggtcctc 3600

aaggagacag tatctcagcg ccctggagcc acagtaccca ctgactttgc caccttccct 3660aaggagacag tatctcagcg ccctggagcc acagtaccca ctgactttgc caccttccct 3660

tcatcagcct tcctcaggga ggatccaaag tgggaattcc ctcggaagaa cttggttctt 3720tcatcagcct tcctcaggga ggatccaaag tgggaattcc ctcggaagaa cttggttctt 3720

ggaaaaactc taggagaagg cgaatttgga aaagtggtca aggcaacggc cttccatctg 3780ggaaaaactc taggagaagg cgaatttgga aaagtggtca aggcaacggc cttccatctg 3780

aaaggcagag cagggtacac cacggtggcc gtgaagatgc tgaaagagaa cgcctccccg 3840aaaggcagag cagggtacac cacggtggcc gtgaagatgc tgaaagagaa cgcctccccg 3840

agtgagcttc gagacctgct gtcagagttc aacgtcctga agcaggtcaa ccacccacat 3900agtgagcttc gagacctgct gtcagagttc aacgtcctga agcaggtcaa ccacccacat 3900

gtcatcaaat tgtatggggc ctgcagccag gatggcccgc tcctcctcat cgtggagtac 3960gtcatcaaat tgtatggggc ctgcagccag gatggcccgc tcctcctcat cgtggagtac 3960

gccaaatacg gctccctgcg gggcttcctc cgcgagagcc gcaaagtggg gcctggctac 4020gccaaatacg gctccctgcg gggcttcctc cgcgagagcc gcaaagtggg gcctggctac 4020

ctgggcagtg gaggcagccg caactccagc tccctggacc acccggatga gcgggccctc 4080ctgggcagtg gaggcagccg caactccagc tccctggacc acccggatga gcgggccctc 4080

accatgggcg acctcatctc atttgcctgg cagatctcac aggggatgca gtatctggcc 4140accatgggcg acctcatctc atttgcctgg cagatctcac aggggatgca gtatctggcc 4140

gagatgaagc tcgttcatcg ggacttggca gccagaaaca tcctggtagc tgaggggcgg 4200gagatgaagc tcgttcatcg ggacttggca gccagaaaca tcctggtagc tgaggggcgg 4200

aagatgaaga tttcggattt cggcttgtcc cgagatgttt atgaagagga ttcctacgtg 4260aagatgaaga tttcggattt cggcttgtcc cgagatgttt atgaagagga ttcctacgtg 4260

aagaggagcc agggtcggat tccagttaaa tggatggcaa ttgaatccct ttttgatcat 4320aagaggagcc agggtcggat tccagttaaa tggatggcaa ttgaatccct ttttgatcat 4320

atctacacca cgcaaagtga tgtatggtct tttggtgtcc tgctgtggga gatcgtgacc 4380atctacacca cgcaaagtga tgtatggtct tttggtgtcc tgctgtggga gatcgtgacc 4380

ctagggggaa acccctatcc tgggattcct cctgagcggc tcttcaacct tctgaagacc 4440ctagggggaa acccctatcc tgggattcct cctgagcggc tcttcaacct tctgaagacc 4440

ggccaccgga tggagaggcc agacaactgc agcgaggaga tgtaccgcct gatgctgcaa 4500ggccaccgga tggagaggcc agacaactgc agcgaggaga tgtaccgcct gatgctgcaa 4500

tgctggaagc aggagccgga caaaaggccg gtgtttgcgg acatcagcaa agacctggag 4560tgctggaagc aggagccgga caaaaggccg gtgtttgcgg acatcagcaa agacctggag 4560

aagatgatgg ttaagaggag agactacttg gaccttgcgg cgtccactcc atctgactcc 4620aagatgatgg ttaagaggag agactacttg gaccttgcgg cgtccactcc atctgactcc 4620

ctgatttatg acgacggcct ctcagaggag gagacaccgc tggtggactg taataatgcc 4680ctgatttatg acgacggcct ctcagaggag gagacaccgc tggtggactg taataatgcc 4680

cccctccctc gagccctccc ttccacatgg attgaaaaca aactctatgg catgtcagac 4740cccctccctc gagccctccc ttccacatgg attgaaaaca aactctatgg catgtcagac 4740

ccgaactggc ctggagagag tcctgtacca ctcacgagag ctgatggcac taacactggg 4800ccgaactggc ctggagagag tcctgtacca ctcacgagag ctgatggcac taacactggg 4800

tttccaagat atccaaatga tagtgtatat gctaactgga tgctttcacc ctcagcggca 4860tttccaagat atccaaatga tagtgtatat gctaactgga tgctttcacc ctcagcggca 4860

aaattaatgg acacgtttga tagttaa 4887aaattaatgg acacgtttga tagttaa 4887

<210> 22<210> 22

<211> 1628<211> 1628

<212> белок<212> protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> слитый пептид<223> fusion peptide

<400> 22<400> 22

Met Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly SerMet Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly Ser

1. 5 10 151. 5 10 15

Arg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser ArgArg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg

20 25 3020 25 30

Val Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val GlyVal Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly

35 40 4535 40 45

Ala Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp GluAla Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu

50 55 6050 55 60

Ala Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe ThrAla Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr

65 70 75 8065 70 75 80

Cys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln ValCys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val

85 90 9585 90 95

Phe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser SerPhe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser

100 105 110100 105 110

Ala Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys ThrAla Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr

115 120 125115 120 125

Ser Lys Leu Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg Pro LysSer Lys Leu Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg Pro Lys

130 135 140130 135 140

Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser Ser LeuPro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser Ser Leu

145 150 155 160145 150 155 160

Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser Glu ProGly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser Glu Pro

165 170 175165 170 175

Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro Thr ProSer Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro Thr Pro

180 185 190180 185 190

Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro Ser LysVal Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro Ser Lys

195 200 205195 200 205

Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu Lys LeuGlu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu Lys Leu

210 215 220210 215 220

Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu Lys GluGlu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu Lys Glu

225 230 235 240225 230 235 240

Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp Lys SerLeu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp Lys Ser

245 250 255245 250 255

Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys Glu AlaLys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys Glu Ala

260 265 270260 265 270

Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr Met GluArg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr Met Glu

275 280 285275 280 285

Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu Asp LysGlu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu Asp Lys

290 295 300290 295 300

Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val Glu AlaGlu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val Glu Ala

305 310 315 320305 310 315 320

Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile Leu LysLeu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile Leu Lys

325 330 335325 330 335

Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser Tyr GlnAla Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser Tyr Gln

340 345 350340 345 350

Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala Leu ValLeu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala Leu Val

355 360 365355 360 365

Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val Lys LeuArg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val Lys Leu

370 375 380370 375 380

Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val Arg GlnGln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val Arg Gln

385 390 395 400385 390 395 400

Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser Thr IleGln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser Thr Ile

405 410 415405 410 415

Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu Glu MetAsp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu Glu Met

420 425 430420 425 430

Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys Val ArgVal Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys Val Arg

435 440 445435 440 445

Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu Met AsnGlu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu Met Asn

450 455 460450 455 460

Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu Arg GluAsp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu Arg Glu

465 470 475 480465 470 475 480

Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys Arg ValGln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys Arg Val

485 490 495485 490 495

Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile Lys LysGlu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile Lys Lys

500 505 510500 505 510

Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu Leu ThrTyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu Leu Thr

515 520 525515 520 525

Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro Pro GluAsn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro Pro Glu

530 535 540530 535 540

Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His Ala LysThr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His Ala Lys

545 550 555 560545 550 555 560

Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala Asn ArgAla Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala Asn Arg

565 570 575565 570 575

His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu Arg ProHis Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu Arg Pro

580 585 590580 585 590

Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro Arg LeuGly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro Arg Leu

595 600 605595 600 605

Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys Phe GluIle Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys Phe Glu

610 615 620610 615 620

Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala Ala GlyLeu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala Ala Gly

625 630 635 640625 630 635 640

Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser Leu LeuGlu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser Leu Leu

645 650 655645 650 655

Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys Ser ValGln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys Ser Val

660 665 670660 665 670

Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser Ala HisAsp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser Ala His

675 680 685675 680 685

Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp Gln LeuGlu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp Gln Leu

690 695 700690 695 700

Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys Tyr TyrAsp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys Tyr Tyr

705 710 715 720705 710 715 720

Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp Cys ThrGln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp Cys Thr

725 730 735725 730 735

Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu Asp CysMet Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu Asp Cys

740 745 750740 745 750

Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly Gly GlnMet Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly Gly Gln

755 760 765755 760 765

Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr Ser CysGlu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr Ser Cys

770 775 780770 775 780

Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met Pro GlySer Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met Pro Gly

785 790 795 800785 790 795 800

Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro Gln ValThr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro Gln Val

805 810 815805 810 815

Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val Val AlaSer Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val Val Ala

820 825 830820 825 830

Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala Pro LeuVal Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala Pro Leu

835 840 845835 840 845

Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu Ala PheAla Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu Ala Phe

850 855 860850 855 860

Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro Tyr GluLys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro Tyr Glu

865 870 875 880865 870 875 880

Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn Lys LeuCys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn Lys Leu

885 890 895885 890 895

Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro Pro SerAla Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro Pro Ser

900 905 910900 905 910

Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala Glu IleLys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala Glu Ile

915 920 925915 920 925

Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu Thr ValThr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu Thr Val

930 935 940930 935 940

Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu Leu SerIle Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu Leu Ser

945 950 955 960945 950 955 960

Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp Ser AlaGlu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp Ser Ala

965 970 975965 970 975

Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg Leu GluAla Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg Leu Glu

980 985 990980 985 990

Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu Glu ThrGlu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu Glu Thr

995 1000 1005995 1000 1005

Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu LysMet Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu Lys

1010 1015 10201010 1015 1020

Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr IleAla Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile

1025 1030 10351025 1030 1035

Glu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu ValGlu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val

1040 1045 10501040 1045 1050

Ser Gly Ile Ala Gly Glu Glu Gln Gln Arg Gly Ala Ile Pro GlySer Gly Ile Ala Gly Glu Glu Gln Gln Arg Gly Ala Ile Pro Gly

1055 1060 10651055 1060 1065

Gln Ala Pro Gly Ser Val Pro Gly Pro Gly Leu Val Lys Asp SerGln Ala Pro Gly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser

1070 1075 10801070 1075 1080

Pro Leu Leu Leu Gln Gln Ile Ser Ala Met Arg Leu His Ile SerPro Leu Leu Leu Gln Gln Ile Ser Ala Met Arg Leu His Ile Ser

1085 1090 10951085 1090 1095

Gln Leu Gln His Glu Asn Ser Ile Leu Lys Gly Ala Gln Met LysGln Leu Gln His Glu Asn Ser Ile Leu Lys Gly Ala Gln Met Lys

1100 1105 11101100 1105 1110

Ala Ser Leu Ala Ser Leu Pro Pro Leu His Val Ala Lys Leu SerAla Ser Leu Ala Ser Leu Pro Pro Leu His Val Ala Lys Leu Ser

1115 1120 11251115 1120 1125

His Glu Gly Pro Gly Ser Glu Leu Pro Ala Gly Ala Leu Tyr ArgHis Glu Gly Pro Gly Ser Glu Leu Pro Ala Gly Ala Leu Tyr Arg

1130 1135 11401130 1135 1140

Lys Thr Ser Gln Leu Leu Glu Thr Leu Asn Gln Leu Ser Thr HisLys Thr Ser Gln Leu Leu Glu Thr Leu Asn Gln Leu Ser Thr His

1145 1150 11551145 1150 1155

Thr His Val Val Asp Ile Thr Arg Thr Ser Pro Ala Ala Lys SerThr His Val Val Asp Ile Thr Arg Thr Ser Pro Ala Ala Lys Ser

1160 1165 11701160 1165 1170

Pro Ser Ala Gln Leu Met Glu Gln Val Ala Gln Leu Lys Ser LeuPro Ser Ala Gln Leu Met Glu Gln Val Ala Gln Leu Lys Ser Leu

1175 1180 11851175 1180 1185

Ser Asp Thr Val Glu Lys Leu Lys Asp Glu Val Leu Lys Glu ThrSer Asp Thr Val Glu Lys Leu Lys Asp Glu Val Leu Lys Glu Thr

1190 1195 12001190 1195 1200

Val Ser Gln Arg Pro Gly Ala Thr Val Pro Thr Asp Phe Ala ThrVal Ser Gln Arg Pro Gly Ala Thr Val Pro Thr Asp Phe Ala Thr

1205 1210 12151205 1210 1215

Phe Pro Ser Ser Ala Phe Leu Arg Glu Asp Pro Lys Trp Glu PhePhe Pro Ser Ser Ala Phe Leu Arg Glu Asp Pro Lys Trp Glu Phe

1220 1225 12301220 1225 1230

Pro Arg Lys Asn Leu Val Leu Gly Lys Thr Leu Gly Glu Gly GluPro Arg Lys Asn Leu Val Leu Gly Lys Thr Leu Gly Glu Gly Glu

1235 1240 12451235 1240 1245

Phe Gly Lys Val Val Lys Ala Thr Ala Phe His Leu Lys Gly ArgPhe Gly Lys Val Val Lys Ala Thr Ala Phe His Leu Lys Gly Arg

1250 1255 12601250 1255 1260

Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu Lys Glu Asn AlaAla Gly Tyr Thr Thr Val Ala Val Lys Met Leu Lys Glu Asn Ala

1265 1270 12751265 1270 1275

Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe Asn Val LeuSer Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe Asn Val Leu

1280 1285 12901280 1285 1290

Lys Gln Val Asn His Pro His Val Ile Lys Leu Tyr Gly Ala CysLys Gln Val Asn His Pro His Val Ile Lys Leu Tyr Gly Ala Cys

1295 1300 13051295 1300 1305

Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys TyrSer Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr

1310 1315 13201310 1315 1320

Gly Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly ProGly Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro

1325 1330 13351325 1330 1335

Gly Tyr Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu AspGly Tyr Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp

1340 1345 13501340 1345 1350

His Pro Asp Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser PheHis Pro Asp Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe

1355 1360 13651355 1360 1365

Ala Trp Gln Ile Ser Gln Gly Met Gln Tyr Leu Ala Glu Met LysAla Trp Gln Ile Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys

1370 1375 13801370 1375 1380

Leu Val His Arg Asp Leu Ala Ala Arg Asn Ile Leu Val Ala GluLeu Val His Arg Asp Leu Ala Ala Arg Asn Ile Leu Val Ala Glu

1385 1390 13951385 1390 1395

Gly Arg Lys Met Lys Ile Ser Asp Phe Gly Leu Ser Arg Asp ValGly Arg Lys Met Lys Ile Ser Asp Phe Gly Leu Ser Arg Asp Val

1400 1405 14101400 1405 1410

Tyr Glu Glu Asp Ser Tyr Val Lys Arg Ser Gln Gly Arg Ile ProTyr Glu Glu Asp Ser Tyr Val Lys Arg Ser Gln Gly Arg Ile Pro

1415 1420 14251415 1420 1425

Val Lys Trp Met Ala Ile Glu Ser Leu Phe Asp His Ile Tyr ThrVal Lys Trp Met Ala Ile Glu Ser Leu Phe Asp His Ile Tyr Thr

1430 1435 14401430 1435 1440

Thr Gln Ser Asp Val Trp Ser Phe Gly Val Leu Leu Trp Glu IleThr Gln Ser Asp Val Trp Ser Phe Gly Val Leu Leu Trp Glu Ile

1445 1450 14551445 1450 1455

Val Thr Leu Gly Gly Asn Pro Tyr Pro Gly Ile Pro Pro Glu ArgVal Thr Leu Gly Gly Asn Pro Tyr Pro Gly Ile Pro Pro Glu Arg

1460 1465 14701460 1465 1470

Leu Phe Asn Leu Leu Lys Thr Gly His Arg Met Glu Arg Pro AspLeu Phe Asn Leu Leu Lys Thr Gly His Arg Met Glu Arg Pro Asp

1475 1480 14851475 1480 1485

Asn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu Gln Cys Trp LysAsn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu Gln Cys Trp Lys

1490 1495 15001490 1495 1500

Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp Ile Ser Lys AspGln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp Ile Ser Lys Asp

1505 1510 15151505 1510 1515

Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu Asp Leu AlaLeu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu Asp Leu Ala

1520 1525 15301520 1525 1530

Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu SerAla Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser

1535 1540 15451535 1540 1545

Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu ProGlu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro

1550 1555 15601550 1555 1560

Arg Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly MetArg Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Met

1565 1570 15751565 1570 1575

Ser Asp Pro Asn Trp Pro Gly Glu Ser Pro Val Pro Leu Thr ArgSer Asp Pro Asn Trp Pro Gly Glu Ser Pro Val Pro Leu Thr Arg

1580 1585 15901580 1585 1590

Ala Asp Gly Thr Asn Thr Gly Phe Pro Arg Tyr Pro Asn Asp SerAla Asp Gly Thr Asn Thr Gly Phe Pro Arg Tyr Pro Asn Asp Ser

1595 1600 16051595 1600 1605

Val Tyr Ala Asn Trp Met Leu Ser Pro Ser Ala Ala Lys Leu MetVal Tyr Ala Asn Trp Met Leu Ser Pro Ser Ala Ala Lys Leu Met

1610 1615 16201610 1615 1620

Asp Thr Phe Asp SerAsp Thr Phe Asp Ser

16251625

<210> 23<210> 23

<211> 4761<211> 4761

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> кодирующая последовательность слитого пептида<223> fusion peptide coding sequence

<400> 23<400> 23

atggcacaga gcaagaggca cgtgtacagc cggacgccca gcggcagcag gatgagtgcg 60atggcacaga gcaagaggca cgtgtacagc cggacgccca gcggcagcag gatgagtgcg 60

gaggcaagcg cccggcctct gcgggtgggc tcccgtgtag aggtgattgg aaaaggccac 120gaggcaagcg cccggcctct gcgggtgggc tcccgtgtag aggtgattgg aaaaggccac 120

cgaggcactg tggcctatgt tggagccaca ctgtttgcca ctggcaaatg ggtaggcgtg 180cgaggcactg tggcctatgt tggagccaca ctgtttgcca ctggcaaatg ggtaggcgtg 180

attctggatg aagcaaaggg caaaaatgat ggaactgttc aaggcaggaa gtacttcact 240attctggatg aagcaaaggg caaaaatgat ggaactgttc aaggcaggaa gtacttcact 240

tgtgatgaag ggcatggcat ctttgtgcgc cagtcccaga tccaggtatt tgaagatgga 300tgtgatgaag ggcatggcat ctttgtgcgc cagtcccaga tccaggtatt tgaagatgga 300

gcagatacta cttccccaga gacacctgat tcttctgctt caaaagtcct caaaagagag 360gcagatacta cttccccaga gacacctgat tcttctgctt caaaagtcct caaaagagag 360

ggaactgata caactgcaaa gactagcaaa ctggcaccga cagcccgaaa gaccacaact 420ggaactgata caactgcaaa gactagcaaa ctggcaccga cagcccgaaa gaccacaact 420

cggcgaccca agcccacgcg cccagccagt actggggtgg ctggggccag tagctccctg 480cggcgaccca agcccacgcg cccagccagt actggggtgg ctggggccag tagctccctg 480

ggcccctctg gctcagcgtc agcaggtgag ctgagcagca gtgagcccag caccccggct 540ggcccctctg gctcagcgtc agcaggtgag ctgagcagca gtgagcccag caccccggct 540

cagactccgc tggcagcacc catcatcccc acgccggtcc tcacctctcc tggagcagtc 600cagactccgc tggcagcacc catcatcccc acgccggtcc tcacctctcc tggagcagtc 600

cccccgcttc cttccccatc caaggaggag gagggactaa gggctcaggt gcgggacctg 660cccccgcttc cttccccatc caaggaggag gagggactaa gggctcaggt gcgggacctg 660

gaggagaaac tagagaccct gagactgaaa cgggcagaag acaaagcaaa gctaaaagag 720gaggagaaac tagagaccct gagactgaaa cgggcagaag acaaagcaaa gctaaaagag 720

ctggagaaac acaaaatcca gctggagcag gtgcaggaat ggaagagcaa aatgcaggag 780ctggagaaac acaaaatcca gctggagcag gtgcaggaat ggaagagcaa aatgcaggag 780

cagcaggccg acctgcagcg gcgcctcaag gaggcgagaa aggaagccaa ggaggcgctg 840cagcaggccg acctgcagcg gcgcctcaag gaggcgagaa aggaagccaa ggaggcgctg 840

gaggcaaagg aacgctatat ggaggagatg gctgatactg ctgatgccat tgagatggcc 900gaggcaaagg aacgctatat ggaggagatg gctgatactg ctgatgccat tgagatggcc 900

actttggaca aggagatggc tgaagagcgg gctgagtccc tgcagcagga ggtggaggca 960actttggaca aggagatggc tgaagagcgg gctgagtccc tgcagcagga ggtggaggca 960

ctgaaggagc gggtggacga gctcactact gacttagaga tcctcaaggc tgagattgaa 1020ctgaaggagc gggtggacga gctcactact gacttagaga tcctcaaggc tgagattgaa 1020

gagaagggct cagatggcgc tgcatccagt tatcagctca agcagcttga ggagcagaat 1080gagaagggct cagatggcgc tgcatccagt tatcagctca agcagcttga ggagcagaat 1080

gcccgcctga aggatgccct ggtgaggatg cgggatcttt cttcctcaga gaagcaggag 1140gcccgcctga aggatgccct ggtgaggatg cgggatcttt cttcctcaga gaagcaggag 1140

catgtgaagc tccagaagct catggaaaag aagaaccaag agctggaagt tgtgaggcaa 1200catgtgaagc tccagaagct catggaaaag aagaaccaag agctggaagt tgtgaggcaa 1200

cagcgggagc gtctgcagga ggagctaagc caggcagaga gcaccattga tgagctcaag 1260cagcgggagc gtctgcagga ggagctaagc caggcagaga gcaccattga tgagctcaag 1260

gagcaggtgg atgctgctct gggtgctgag gagatggtgg agatgctgac agatcggaac 1320gagcaggtgg atgctgctct gggtgctgag gagatggtgg agatgctgac agatcggaac 1320

ctgaatctgg aagagaaagt gcgcgagttg agggagactg tgggagactt ggaagcgatg 1380ctgaatctgg aagagaaagt gcgcgagttg agggagactg tgggagactt ggaagcgatg 1380

aatgagatga acgatgagct gcaggagaat gcacgtgaga cagaactgga gctgcgggag 1440aatgagatga acgatgagct gcaggagaat gcacgtgaga cagaactgga gctgcgggag 1440

cagctggaca tggcaggcgc gcgggttcgt gaggcccaga agcgtgtgga ggcagcccag 1500cagctggaca tggcaggcgc gcgggttcgt gaggcccaga agcgtgtgga ggcagcccag 1500

gagacggttg cagactacca gcagaccatc aagaagtacc gccagctgac cgcccatcta 1560gagacggttg cagactacca gcagaccatc aagaagtacc gccagctgac cgcccatcta 1560

caggatgtga atcgggaact gacaaaccag caggaagcat ctgtggagag gcaacagcag 1620caggatgtga atcgggaact gacaaaccag caggaagcat ctgtggagag gcaacagcag 1620

ccacctccag agacctttga cttcaaaatc aagtttgctg agactaaggc ccatgccaag 1680ccacctccag agacctttga cttcaaaatc aagtttgctg agactaaggc ccatgccaag 1680

gcaattgaga tggaattgag gcagatggag gtggcccagg ccaatcgaca catgtccctg 1740gcaattgaga tggaattgag gcagatggag gtggcccagg ccaatcgaca catgtccctg 1740

ctgacagcct tcatgcctga cagcttcctt cggccaggtg gggaccatga ctgcgttctg 1800ctgacagcct tcatgcctga cagcttcctt cggccaggtg gggaccatga ctgcgttctg 1800

gtgctgttgc tcatgcctcg tctcatttgc aaggcagagc tgatccggaa gcaggcccag 1860gtgctgttgc tcatgcctcg tctcatttgc aaggcagagc tgatccggaa gcaggcccag 1860

gagaagtttg aactaagtga gaactgttca gagcggcctg ggctgcgagg agctgctggg 1920gagaagtttg aactaagtga gaactgttca gagcggcctg ggctgcgagg agctgctggg 1920

gagcaactca gctttgctgc tggactggtg tactcgctga gcctgctgca ggccacgcta 1980gagcaactca gctttgctgc tggactggtg tactcgctga gcctgctgca ggccacgcta 1980

caccgctatg agcatgccct ctctcagtgc agtgtggatg tgtataagaa agtgggcagc 2040caccgctatg agcatgccct ctctcagtgc agtgtggatg tgtataagaa agtgggcagc 2040

ctgtaccctg agatgagtgc ccatgagcgc tccttggatt tcctcattga actgctgcac 2100ctgtaccctg agatgagtgc ccatgagcgc tccttggatt tcctcattga actgctgcac 2100

aaggatcagc tggatgagac tgtcaatgtg gagcctctca ccaaggccat caagtactat 2160aaggatcagc tggatgagac tgtcaatgtg gagcctctca ccaaggccat caagtactat 2160

cagcatctgt acagcatcca ccttgccgaa cagcctgagg actgtactat gcagctggct 2220cagcatctgt acagcatcca ccttgccgaa cagcctgagg actgtactat gcagctggct 2220

gaccacatta agttcacgca gagtgctctg gactgcatga gtgtggaggt aggacggctg 2280gaccacatta agttcacgca gagtgctctg gactgcatga gtgtggaggt aggacggctg 2280

cgtgccttct tgcagggtgg gcaggaggct acagatattg ccctcctgct ccgggatctg 2340cgtgccttct tgcagggtgg gcaggaggct acagatattg ccctcctgct ccgggatctg 2340

gaaacttcat gcagtgacat ccgccagttc tgcaagaaga tccgaaggcg aatgccaggg 2400gaaacttcat gcagtgacat ccgccagttc tgcaagaaga tccgaaggcg aatgccaggg 2400

acagatgctc ctgggatccc agctgcactg gcctttggac cacaggtatc tgacacgctc 2460acagatgctc ctgggatccc agctgcactg gcctttggac cacaggtatc tgacacgctc 2460

ctagactgca ggaaacactt gacgtgggtc gtggctgtgc tgcaggaggt ggcagctgct 2520ctagactgca ggaaacactt gacgtgggtc gtggctgtgc tgcaggaggt ggcagctgct 2520

gctgcccagc tcattgcccc actggcagag aatgaggggc tacttgtggc tgctctggag 2580gctgcccagc tcattgcccc actggcagag aatgaggggc tacttgtggc tgctctggag 2580

gaactggctt tcaaagcaag cgagcagatc tatgggaccc cctccagcag cccctatgag 2640gaactggctt tcaaagcaag cgagcagatc tatgggaccc cctccagcag cccctatgag 2640

tgtctgcgcc agtcatgcaa catcctcatc agtaccatga acaagctggc cacagccatg 2700tgtctgcgcc agtcatgcaa catcctcatc agtaccatga acaagctggc cacagccatg 2700

caggaggggg agtatgatgc agagcggccc cccagcaagc ctccaccggt tgaactgcgg 2760caggaggggg agtatgatgc agagcggccc cccagcaagc ctccaccggt tgaactgcgg 2760

gctgctgccc ttcgtgcaga gatcacagat gctgaaggcc tgggtttgaa gctcgaagat 2820gctgctgccc ttcgtgcaga gatcacagat gctgaaggcc tgggtttgaa gctcgaagat 2820

cgagagacag ttattaagga gttgaagaag tcactcaaga ttaagggaga ggagctaagt 2880cgagagacag ttattaagga gttgaagaag tcactcaaga ttaagggaga ggagctaagt 2880

gaggccaatg tgcggctgag cctcctggag aagaagttgg acagtgctgc caaggatgca 2940gaggccaatg tgcggctgag cctcctggag aagaagttgg acagtgctgc caaggatgca 2940

gatgagcgca tcgagaaagt ccagactcgg ctggaggaga cccaggcact gctgcgaaag 3000gatgagcgca tcgagaaagt ccagactcgg ctggaggaga cccaggcact gctgcgaaag 3000

aaggagaaag agtttgagga gacaatggat gcactccagg ctgacatcga ccagctggag 3060aaggagaaag agtttgagga gacaatggat gcactccagg ctgacatcga ccagctggag 3060

gcagagaagg cagaactaaa gcagcgtctg aacagccagt ccaaacgcac gattgaggga 3120gcagagaagg cagaactaaa gcagcgtctg aacagccagt ccaaacgcac gattgaggga 3120

ctccggggcc ctcctccttc aggcattgct actctggtct ctggcattgc tggtgaagaa 3180ctccggggcc ctcctccttc aggcattgct actctggtct ctggcattgc tggtgaagaa 3180

cagcagcgag gagccatccc tgggcaggct ccagggtctg tgccaggccc agggctggtg 3240cagcagcgag gagccatccc tgggcaggct ccagggtctg tgccaggccc agggctggtg 3240

aaggactcac cactgctgct tcagcagatc tctgccatga ggctgcacat ctcccagctc 3300aaggactcac cactgctgct tcagcagatc tctgccatga ggctgcacat ctcccagctc 3300

cagcatgaga acagcatcct caagggagcc cagatgaagg catccttggc atccctgccc 3360cagcatgaga acagcatcct caagggagcc cagatgaagg catccttggc atccctgccc 3360

cctctgcatg ttgcaaagct atcccatgag ggccctggca gtgagttacc agctggagcg 3420cctctgcatg ttgcaaagct atcccatgag ggccctggca gtgagttacc agctggagcg 3420

ctgtatcgta agaccagcca gctgctggag acattgaatc aattgagcac acacacgcac 3480ctgtatcgta agaccagcca gctgctggag acattgaatc aattgagcac acacacgcac 3480

gtagtagaca tcactcgcac cagccctgct gccaagagcc cgtcggccca acttatggag 3540gtagtagaca tcactcgcac cagccctgct gccaagagcc cgtcggccca acttatggag 3540

caagtggctc agcttaagtc cctgagtgac accgtcgaga agctcaagga tgaggtcctc 3600caagtggctc agcttaagtc cctgagtgac accgtcgaga agctcaagga tgaggtcctc 3600

aaggagacag tatctcagcg ccctggagcc acagtaccca ctgactttgc caccttccct 3660aaggagacag tatctcagcg ccctggagcc acagtaccca ctgactttgc caccttccct 3660

tcatcagcct tcctcaggga ggatccaaag tgggaattcc ctcggaagaa cttggttctt 3720tcatcagcct tcctcaggga ggatccaaag tgggaattcc ctcggaagaa cttggttctt 3720

ggaaaaactc taggagaagg cgaatttgga aaagtggtca aggcaacggc cttccatctg 3780ggaaaaactc taggagaagg cgaatttgga aaagtggtca aggcaacggc cttccatctg 3780

aaaggcagag cagggtacac cacggtggcc gtgaagatgc tgaaagagaa cgcctccccg 3840aaaggcagag cagggtacac cacggtggcc gtgaagatgc tgaaagagaa cgcctccccg 3840

agtgagcttc gagacctgct gtcagagttc aacgtcctga agcaggtcaa ccacccacat 3900agtgagcttc gagacctgct gtcagagttc aacgtcctga agcaggtcaa ccacccacat 3900

gtcatcaaat tgtatggggc ctgcagccag gatggcccgc tcctcctcat cgtggagtac 3960gtcatcaaat tgtatggggc ctgcagccag gatggcccgc tcctcctcat cgtggagtac 3960

gccaaatacg gctccctgcg gggcttcctc cgcgagagcc gcaaagtggg gcctggctac 4020gccaaatacg gctccctgcg gggcttcctc cgcgagagcc gcaaagtggg gcctggctac 4020

ctgggcagtg gaggcagccg caactccagc tccctggacc acccggatga gcgggccctc 4080ctgggcagtg gaggcagccg caactccagc tccctggacc acccggatga gcgggccctc 4080

accatgggcg acctcatctc atttgcctgg cagatctcac aggggatgca gtatctggcc 4140accatgggcg acctcatctc atttgcctgg cagatctcac aggggatgca gtatctggcc 4140

gagatgaagc tcgttcatcg ggacttggca gccagaaaca tcctggtagc tgaggggcgg 4200gagatgaagc tcgttcatcg ggacttggca gccagaaaca tcctggtagc tgaggggcgg 4200

aagatgaaga tttcggattt cggcttgtcc cgagatgttt atgaagagga ttcctacgtg 4260aagatgaaga tttcggattt cggcttgtcc cgagatgttt atgaagagga ttcctacgtg 4260

aagaggagcc agggtcggat tccagttaaa tggatggcaa ttgaatccct ttttgatcat 4320aagaggagcc agggtcggat tccagttaaa tggatggcaa ttgaatccct ttttgatcat 4320

atctacacca cgcaaagtga tgtatggtct tttggtgtcc tgctgtggga gatcgtgacc 4380atctacacca cgcaaagtga tgtatggtct tttggtgtcc tgctgtggga gatcgtgacc 4380

ctagggggaa acccctatcc tgggattcct cctgagcggc tcttcaacct tctgaagacc 4440ctagggggaa acccctatcc tgggattcct cctgagcggc tcttcaacct tctgaagacc 4440

ggccaccgga tggagaggcc agacaactgc agcgaggaga tgtaccgcct gatgctgcaa 4500ggccaccgga tggagaggcc agacaactgc agcgaggaga tgtaccgcct gatgctgcaa 4500

tgctggaagc aggagccgga caaaaggccg gtgtttgcgg acatcagcaa agacctggag 4560tgctggaagc aggagccgga caaaaggccg gtgtttgcgg acatcagcaa agacctggag 4560

aagatgatgg ttaagaggag agactacttg gaccttgcgg cgtccactcc atctgactcc 4620aagatgatgg ttaagaggag agactacttg gaccttgcgg cgtccactcc atctgactcc 4620

ctgatttatg acgacggcct ctcagaggag gagacaccgc tggtggactg taataatgcc 4680ctgatttatg acgacggcct ctcagaggag gagacaccgc tggtggactg taataatgcc 4680

cccctccctc gagccctccc ttccacatgg attgaaaaca aactctatgg tagaatttcc 4740cccctccctc gagccctccc ttccacatgg attgaaaaca aactctatgg tagaatttcc 4740

catgcattta ctagattcta g 4761catgcattta ctagattcta g 4761

<210> 24<210> 24

<211> 1586<211> 1586

<212> белок<212> protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> слитый пептид<223> fusion peptide

<400> 24<400> 24

Met Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly SerMet Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly Ser

1. 5 10 151. 5 10 15

Arg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser ArgArg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg

20 25 3020 25 30

Val Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val GlyVal Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly

35 40 4535 40 45

Ala Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp GluAla Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu

50 55 6050 55 60

Ala Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe ThrAla Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr

65 70 75 8065 70 75 80

Cys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln ValCys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val

85 90 9585 90 95

Phe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser SerPhe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser

100 105 110100 105 110

Ala Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys ThrAla Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr

115 120 125115 120 125

Ser Lys Leu Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg Pro LysSer Lys Leu Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg Pro Lys

130 135 140130 135 140

Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser Ser LeuPro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser Ser Leu

145 150 155 160145 150 155 160

Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser Glu ProGly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser Glu Pro

165 170 175165 170 175

Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro Thr ProSer Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro Thr Pro

180 185 190180 185 190

Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro Ser LysVal Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro Ser Lys

195 200 205195 200 205

Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu Lys LeuGlu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu Lys Leu

210 215 220210 215 220

Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu Lys GluGlu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu Lys Glu

225 230 235 240225 230 235 240

Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp Lys SerLeu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp Lys Ser

245 250 255245 250 255

Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys Glu AlaLys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys Glu Ala

260 265 270260 265 270

Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr Met GluArg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr Met Glu

275 280 285275 280 285

Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu Asp LysGlu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu Asp Lys

290 295 300290 295 300

Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val Glu AlaGlu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val Glu Ala

305 310 315 320305 310 315 320

Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile Leu LysLeu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile Leu Lys

325 330 335325 330 335

Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser Tyr GlnAla Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser Tyr Gln

340 345 350340 345 350

Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala Leu ValLeu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala Leu Val

355 360 365355 360 365

Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val Lys LeuArg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val Lys Leu

370 375 380370 375 380

Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val Arg GlnGln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val Arg Gln

385 390 395 400385 390 395 400

Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser Thr IleGln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser Thr Ile

405 410 415405 410 415

Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu Glu MetAsp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu Glu Met

420 425 430420 425 430

Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys Val ArgVal Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys Val Arg

435 440 445435 440 445

Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu Met AsnGlu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu Met Asn

450 455 460450 455 460

Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu Arg GluAsp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu Arg Glu

465 470 475 480465 470 475 480

Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys Arg ValGln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys Arg Val

485 490 495485 490 495

Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile Lys LysGlu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile Lys Lys

500 505 510500 505 510

Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu Leu ThrTyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu Leu Thr

515 520 525515 520 525

Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro Pro GluAsn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro Pro Glu

530 535 540530 535 540

Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His Ala LysThr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His Ala Lys

545 550 555 560545 550 555 560

Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala Asn ArgAla Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala Asn Arg

565 570 575565 570 575

His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu Arg ProHis Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu Arg Pro

580 585 590580 585 590

Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro Arg LeuGly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro Arg Leu

595 600 605595 600 605

Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys Phe GluIle Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys Phe Glu

610 615 620610 615 620

Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala Ala GlyLeu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala Ala Gly

625 630 635 640625 630 635 640

Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser Leu LeuGlu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser Leu Leu

645 650 655645 650 655

Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys Ser ValGln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys Ser Val

660 665 670660 665 670

Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser Ala HisAsp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser Ala His

675 680 685675 680 685

Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp Gln LeuGlu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp Gln Leu

690 695 700690 695 700

Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys Tyr TyrAsp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys Tyr Tyr

705 710 715 720705 710 715 720

Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp Cys ThrGln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp Cys Thr

725 730 735725 730 735

Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu Asp CysMet Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu Asp Cys

740 745 750740 745 750

Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly Gly GlnMet Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly Gly Gln

755 760 765755 760 765

Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr Ser CysGlu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr Ser Cys

770 775 780770 775 780

Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met Pro GlySer Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met Pro Gly

785 790 795 800785 790 795 800

Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro Gln ValThr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro Gln Val

805 810 815805 810 815

Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val Val AlaSer Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val Val Ala

820 825 830820 825 830

Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala Pro LeuVal Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala Pro Leu

835 840 845835 840 845

Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu Ala PheAla Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu Ala Phe

850 855 860850 855 860

Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro Tyr GluLys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro Tyr Glu

865 870 875 880865 870 875 880

Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn Lys LeuCys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn Lys Leu

885 890 895885 890 895

Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro Pro SerAla Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro Pro Ser

900 905 910900 905 910

Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala Glu IleLys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala Glu Ile

915 920 925915 920 925

Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu Thr ValThr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu Thr Val

930 935 940930 935 940

Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu Leu SerIle Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu Leu Ser

945 950 955 960945 950 955 960

Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp Ser AlaGlu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp Ser Ala

965 970 975965 970 975

Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg Leu GluAla Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg Leu Glu

980 985 990980 985 990

Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu Glu ThrGlu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu Glu Thr

995 1000 1005995 1000 1005

Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu LysMet Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu Lys

1010 1015 10201010 1015 1020

Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr IleAla Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile

1025 1030 10351025 1030 1035

Glu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu ValGlu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val

1040 1045 10501040 1045 1050

Ser Gly Ile Ala Gly Glu Glu Gln Gln Arg Gly Ala Ile Pro GlySer Gly Ile Ala Gly Glu Glu Gln Gln Arg Gly Ala Ile Pro Gly

1055 1060 10651055 1060 1065

Gln Ala Pro Gly Ser Val Pro Gly Pro Gly Leu Val Lys Asp SerGln Ala Pro Gly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser

1070 1075 10801070 1075 1080

Pro Leu Leu Leu Gln Gln Ile Ser Ala Met Arg Leu His Ile SerPro Leu Leu Leu Gln Gln Ile Ser Ala Met Arg Leu His Ile Ser

1085 1090 10951085 1090 1095

Gln Leu Gln His Glu Asn Ser Ile Leu Lys Gly Ala Gln Met LysGln Leu Gln His Glu Asn Ser Ile Leu Lys Gly Ala Gln Met Lys

1100 1105 11101100 1105 1110

Ala Ser Leu Ala Ser Leu Pro Pro Leu His Val Ala Lys Leu SerAla Ser Leu Ala Ser Leu Pro Pro Leu His Val Ala Lys Leu Ser

1115 1120 11251115 1120 1125

His Glu Gly Pro Gly Ser Glu Leu Pro Ala Gly Ala Leu Tyr ArgHis Glu Gly Pro Gly Ser Glu Leu Pro Ala Gly Ala Leu Tyr Arg

1130 1135 11401130 1135 1140

Lys Thr Ser Gln Leu Leu Glu Thr Leu Asn Gln Leu Ser Thr HisLys Thr Ser Gln Leu Leu Glu Thr Leu Asn Gln Leu Ser Thr His

1145 1150 11551145 1150 1155

Thr His Val Val Asp Ile Thr Arg Thr Ser Pro Ala Ala Lys SerThr His Val Val Asp Ile Thr Arg Thr Ser Pro Ala Ala Lys Ser

1160 1165 11701160 1165 1170

Pro Ser Ala Gln Leu Met Glu Gln Val Ala Gln Leu Lys Ser LeuPro Ser Ala Gln Leu Met Glu Gln Val Ala Gln Leu Lys Ser Leu

1175 1180 11851175 1180 1185

Ser Asp Thr Val Glu Lys Leu Lys Asp Glu Val Leu Lys Glu ThrSer Asp Thr Val Glu Lys Leu Lys Asp Glu Val Leu Lys Glu Thr

1190 1195 12001190 1195 1200

Val Ser Gln Arg Pro Gly Ala Thr Val Pro Thr Asp Phe Ala ThrVal Ser Gln Arg Pro Gly Ala Thr Val Pro Thr Asp Phe Ala Thr

1205 1210 12151205 1210 1215

Phe Pro Ser Ser Ala Phe Leu Arg Glu Asp Pro Lys Trp Glu PhePhe Pro Ser Ser Ala Phe Leu Arg Glu Asp Pro Lys Trp Glu Phe

1220 1225 12301220 1225 1230

Pro Arg Lys Asn Leu Val Leu Gly Lys Thr Leu Gly Glu Gly GluPro Arg Lys Asn Leu Val Leu Gly Lys Thr Leu Gly Glu Gly Glu

1235 1240 12451235 1240 1245

Phe Gly Lys Val Val Lys Ala Thr Ala Phe His Leu Lys Gly ArgPhe Gly Lys Val Val Lys Ala Thr Ala Phe His Leu Lys Gly Arg

1250 1255 12601250 1255 1260

Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu Lys Glu Asn AlaAla Gly Tyr Thr Thr Val Ala Val Lys Met Leu Lys Glu Asn Ala

1265 1270 12751265 1270 1275

Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe Asn Val LeuSer Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe Asn Val Leu

1280 1285 12901280 1285 1290

Lys Gln Val Asn His Pro His Val Ile Lys Leu Tyr Gly Ala CysLys Gln Val Asn His Pro His Val Ile Lys Leu Tyr Gly Ala Cys

1295 1300 13051295 1300 1305

Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys TyrSer Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr

1310 1315 13201310 1315 1320

Gly Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly ProGly Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro

1325 1330 13351325 1330 1335

Gly Tyr Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu AspGly Tyr Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp

1340 1345 13501340 1345 1350

His Pro Asp Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser PheHis Pro Asp Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe

1355 1360 13651355 1360 1365

Ala Trp Gln Ile Ser Gln Gly Met Gln Tyr Leu Ala Glu Met LysAla Trp Gln Ile Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys

1370 1375 13801370 1375 1380

Leu Val His Arg Asp Leu Ala Ala Arg Asn Ile Leu Val Ala GluLeu Val His Arg Asp Leu Ala Ala Arg Asn Ile Leu Val Ala Glu

1385 1390 13951385 1390 1395

Gly Arg Lys Met Lys Ile Ser Asp Phe Gly Leu Ser Arg Asp ValGly Arg Lys Met Lys Ile Ser Asp Phe Gly Leu Ser Arg Asp Val

1400 1405 14101400 1405 1410

Tyr Glu Glu Asp Ser Tyr Val Lys Arg Ser Gln Gly Arg Ile ProTyr Glu Glu Asp Ser Tyr Val Lys Arg Ser Gln Gly Arg Ile Pro

1415 1420 14251415 1420 1425

Val Lys Trp Met Ala Ile Glu Ser Leu Phe Asp His Ile Tyr ThrVal Lys Trp Met Ala Ile Glu Ser Leu Phe Asp His Ile Tyr Thr

1430 1435 14401430 1435 1440

Thr Gln Ser Asp Val Trp Ser Phe Gly Val Leu Leu Trp Glu IleThr Gln Ser Asp Val Trp Ser Phe Gly Val Leu Leu Trp Glu Ile

1445 1450 14551445 1450 1455

Val Thr Leu Gly Gly Asn Pro Tyr Pro Gly Ile Pro Pro Glu ArgVal Thr Leu Gly Gly Asn Pro Tyr Pro Gly Ile Pro Pro Glu Arg

1460 1465 14701460 1465 1470

Leu Phe Asn Leu Leu Lys Thr Gly His Arg Met Glu Arg Pro AspLeu Phe Asn Leu Leu Lys Thr Gly His Arg Met Glu Arg Pro Asp

1475 1480 14851475 1480 1485

Asn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu Gln Cys Trp LysAsn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu Gln Cys Trp Lys

1490 1495 15001490 1495 1500

Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp Ile Ser Lys AspGln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp Ile Ser Lys Asp

1505 1510 15151505 1510 1515

Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu Asp Leu AlaLeu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu Asp Leu Ala

1520 1525 15301520 1525 1530

Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu SerAla Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser

1535 1540 15451535 1540 1545

Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu ProGlu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro

1550 1555 15601550 1555 1560

Arg Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly ArgArg Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Arg

1565 1570 15751565 1570 1575

Ile Ser His Ala Phe Thr Arg PheIle Ser His Ala Phe Thr Arg Phe

1580 15851580 1585

<210> 25<210> 25

<211> 1278<211> 1278

<212> белок<212> protein

<213> Homo sapiens<213> Homo sapiens

<400> 25<400> 25

Met Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly SerMet Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly Ser

1. 5 10 151. 5 10 15

Arg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser ArgArg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg

20 25 3020 25 30

Val Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val GlyVal Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly

35 40 4535 40 45

Ala Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp GluAla Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu

50 55 6050 55 60

Ala Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe ThrAla Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr

65 70 75 8065 70 75 80

Cys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln ValCys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val

85 90 9585 90 95

Phe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser SerPhe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser

100 105 110100 105 110

Ala Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys ThrAla Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr

115 120 125115 120 125

Ser Lys Leu Arg Gly Leu Lys Pro Lys Lys Ala Pro Thr Ala Arg LysSer Lys Leu Arg Gly Leu Lys Pro Lys Lys Ala Pro Thr Ala Arg Lys

130 135 140130 135 140

Thr Thr Thr Arg Arg Pro Lys Pro Thr Arg Pro Ala Ser Thr Gly ValThr Thr Thr Arg Arg Pro Lys Pro Thr Arg Pro Ala Ser Thr Gly Val

145 150 155 160145 150 155 160

Ala Gly Ala Ser Ser Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala GlyAla Gly Ala Ser Ser Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly

165 170 175165 170 175

Glu Leu Ser Ser Ser Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu AlaGlu Leu Ser Ser Ser Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala

180 185 190180 185 190

Ala Pro Ile Ile Pro Thr Pro Val Leu Thr Ser Pro Gly Ala Val ProAla Pro Ile Ile Pro Thr Pro Val Leu Thr Ser Pro Gly Ala Val Pro

195 200 205195 200 205

Pro Leu Pro Ser Pro Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln ValPro Leu Pro Ser Pro Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln Val

210 215 220210 215 220

Arg Asp Leu Glu Glu Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala GluArg Asp Leu Glu Glu Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu

225 230 235 240225 230 235 240

Asp Lys Ala Lys Leu Lys Glu Leu Glu Lys His Lys Ile Gln Leu GluAsp Lys Ala Lys Leu Lys Glu Leu Glu Lys His Lys Ile Gln Leu Glu

245 250 255245 250 255

Gln Val Gln Glu Trp Lys Ser Lys Met Gln Glu Gln Gln Ala Asp LeuGln Val Gln Glu Trp Lys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu

260 265 270260 265 270

Gln Arg Arg Leu Lys Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu GluGln Arg Arg Leu Lys Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu

275 280 285275 280 285

Ala Lys Glu Arg Tyr Met Glu Glu Met Ala Asp Thr Ala Asp Ala IleAla Lys Glu Arg Tyr Met Glu Glu Met Ala Asp Thr Ala Asp Ala Ile

290 295 300290 295 300

Glu Met Ala Thr Leu Asp Lys Glu Met Ala Glu Glu Arg Ala Glu SerGlu Met Ala Thr Leu Asp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser

305 310 315 320305 310 315 320

Leu Gln Gln Glu Val Glu Ala Leu Lys Glu Arg Val Asp Glu Leu ThrLeu Gln Gln Glu Val Glu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr

325 330 335325 330 335

Thr Asp Leu Glu Ile Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser AspThr Asp Leu Glu Ile Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp

340 345 350340 345 350

Gly Ala Ala Ser Ser Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn AlaGly Ala Ala Ser Ser Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala

355 360 365355 360 365

Arg Leu Lys Asp Ala Leu Val Arg Met Arg Asp Leu Ser Ser Ser GluArg Leu Lys Asp Ala Leu Val Arg Met Arg Asp Leu Ser Ser Ser Glu

370 375 380370 375 380

Lys Gln Glu His Val Lys Leu Gln Lys Leu Met Glu Lys Lys Asn GlnLys Gln Glu His Val Lys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln

385 390 395 400385 390 395 400

Glu Leu Glu Val Val Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu LeuGlu Leu Glu Val Val Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu

405 410 415405 410 415

Ser Gln Ala Glu Ser Thr Ile Asp Glu Leu Lys Glu Gln Val Asp AlaSer Gln Ala Glu Ser Thr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala

420 425 430420 425 430

Ala Leu Gly Ala Glu Glu Met Val Glu Met Leu Thr Asp Arg Asn LeuAla Leu Gly Ala Glu Glu Met Val Glu Met Leu Thr Asp Arg Asn Leu

435 440 445435 440 445

Asn Leu Glu Glu Lys Val Arg Glu Leu Arg Glu Thr Val Gly Asp LeuAsn Leu Glu Glu Lys Val Arg Glu Leu Arg Glu Thr Val Gly Asp Leu

450 455 460450 455 460

Glu Ala Met Asn Glu Met Asn Asp Glu Leu Gln Glu Asn Ala Arg GluGlu Ala Met Asn Glu Met Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu

465 470 475 480465 470 475 480

Thr Glu Leu Glu Leu Arg Glu Gln Leu Asp Met Ala Gly Ala Arg ValThr Glu Leu Glu Leu Arg Glu Gln Leu Asp Met Ala Gly Ala Arg Val

485 490 495485 490 495

Arg Glu Ala Gln Lys Arg Val Glu Ala Ala Gln Glu Thr Val Ala AspArg Glu Ala Gln Lys Arg Val Glu Ala Ala Gln Glu Thr Val Ala Asp

500 505 510500 505 510

Tyr Gln Gln Thr Ile Lys Lys Tyr Arg Gln Leu Thr Ala His Leu GlnTyr Gln Gln Thr Ile Lys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln

515 520 525515 520 525

Asp Val Asn Arg Glu Leu Thr Asn Gln Gln Glu Ala Ser Val Glu ArgAsp Val Asn Arg Glu Leu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg

530 535 540530 535 540

Gln Gln Gln Pro Pro Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe AlaGln Gln Gln Pro Pro Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala

545 550 555 560545 550 555 560

Glu Thr Lys Ala His Ala Lys Ala Ile Glu Met Glu Leu Arg Gln MetGlu Thr Lys Ala His Ala Lys Ala Ile Glu Met Glu Leu Arg Gln Met

565 570 575565 570 575

Glu Val Ala Gln Ala Asn Arg His Met Ser Leu Leu Thr Ala Phe MetGlu Val Ala Gln Ala Asn Arg His Met Ser Leu Leu Thr Ala Phe Met

580 585 590580 585 590

Pro Asp Ser Phe Leu Arg Pro Gly Gly Asp His Asp Cys Val Leu ValPro Asp Ser Phe Leu Arg Pro Gly Gly Asp His Asp Cys Val Leu Val

595 600 605595 600 605

Leu Leu Leu Met Pro Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg LysLeu Leu Leu Met Pro Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys

610 615 620610 615 620

Gln Ala Gln Glu Lys Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg ProGln Ala Gln Glu Lys Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro

625 630 635 640625 630 635 640

Gly Leu Arg Gly Ala Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly LeuGly Leu Arg Gly Ala Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu

645 650 655645 650 655

Val Tyr Ser Leu Ser Leu Leu Gln Ala Thr Leu His Arg Tyr Glu HisVal Tyr Ser Leu Ser Leu Leu Gln Ala Thr Leu His Arg Tyr Glu His

660 665 670660 665 670

Ala Leu Ser Gln Cys Ser Val Asp Val Tyr Lys Lys Val Gly Ser LeuAla Leu Ser Gln Cys Ser Val Asp Val Tyr Lys Lys Val Gly Ser Leu

675 680 685675 680 685

Tyr Pro Glu Met Ser Ala His Glu Arg Ser Leu Asp Phe Leu Ile GluTyr Pro Glu Met Ser Ala His Glu Arg Ser Leu Asp Phe Leu Ile Glu

690 695 700690 695 700

Leu Leu His Lys Asp Gln Leu Asp Glu Thr Val Asn Val Glu Pro LeuLeu Leu His Lys Asp Gln Leu Asp Glu Thr Val Asn Val Glu Pro Leu

705 710 715 720705 710 715 720

Thr Lys Ala Ile Lys Tyr Tyr Gln His Leu Tyr Ser Ile His Leu AlaThr Lys Ala Ile Lys Tyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala

725 730 735725 730 735

Glu Gln Pro Glu Asp Cys Thr Met Gln Leu Ala Asp His Ile Lys PheGlu Gln Pro Glu Asp Cys Thr Met Gln Leu Ala Asp His Ile Lys Phe

740 745 750740 745 750

Thr Gln Ser Ala Leu Asp Cys Met Ser Val Glu Val Gly Arg Leu ArgThr Gln Ser Ala Leu Asp Cys Met Ser Val Glu Val Gly Arg Leu Arg

755 760 765755 760 765

Ala Phe Leu Gln Gly Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu LeuAla Phe Leu Gln Gly Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu

770 775 780770 775 780

Arg Asp Leu Glu Thr Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys LysArg Asp Leu Glu Thr Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys

785 790 795 800785 790 795 800

Ile Arg Arg Arg Met Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala AlaIle Arg Arg Arg Met Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala

805 810 815805 810 815

Leu Ala Phe Gly Pro Gln Val Ser Asp Thr Leu Leu Asp Cys Arg LysLeu Ala Phe Gly Pro Gln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys

820 825 830820 825 830

His Leu Thr Trp Val Val Ala Val Leu Gln Glu Val Ala Ala Ala AlaHis Leu Thr Trp Val Val Ala Val Leu Gln Glu Val Ala Ala Ala Ala

835 840 845835 840 845

Ala Gln Leu Ile Ala Pro Leu Ala Glu Asn Glu Gly Leu Leu Val AlaAla Gln Leu Ile Ala Pro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala

850 855 860850 855 860

Ala Leu Glu Glu Leu Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly ThrAla Leu Glu Glu Leu Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr

865 870 875 880865 870 875 880

Pro Ser Ser Ser Pro Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile LeuPro Ser Ser Ser Pro Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu

885 890 895885 890 895

Ile Ser Thr Met Asn Lys Leu Ala Thr Ala Met Gln Glu Gly Glu TyrIle Ser Thr Met Asn Lys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr

900 905 910900 905 910

Asp Ala Glu Arg Pro Pro Ser Lys Pro Pro Pro Val Glu Leu Arg AlaAsp Ala Glu Arg Pro Pro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala

915 920 925915 920 925

Ala Ala Leu Arg Ala Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu LysAla Ala Leu Arg Ala Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys

930 935 940930 935 940

Leu Glu Asp Arg Glu Thr Val Ile Lys Glu Leu Lys Lys Ser Leu LysLeu Glu Asp Arg Glu Thr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys

945 950 955 960945 950 955 960

Ile Lys Gly Glu Glu Leu Ser Glu Ala Asn Val Arg Leu Ser Leu LeuIle Lys Gly Glu Glu Leu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu

965 970 975965 970 975

Glu Lys Lys Leu Asp Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile GluGlu Lys Lys Leu Asp Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu

980 985 990980 985 990

Lys Val Gln Thr Arg Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys LysLys Val Gln Thr Arg Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys

995 1000 1005995 1000 1005

Glu Lys Glu Phe Glu Glu Thr Met Asp Ala Leu Gln Ala Asp IleGlu Lys Glu Phe Glu Glu Thr Met Asp Ala Leu Gln Ala Asp Ile

1010 1015 10201010 1015 1020

Asp Gln Leu Glu Ala Glu Lys Ala Glu Leu Lys Gln Arg Leu AsnAsp Gln Leu Glu Ala Glu Lys Ala Glu Leu Lys Gln Arg Leu Asn

1025 1030 10351025 1030 1035

Ser Gln Ser Lys Arg Thr Ile Glu Gly Leu Arg Gly Pro Pro ProSer Gln Ser Lys Arg Thr Ile Glu Gly Leu Arg Gly Pro Pro Pro

1040 1045 10501040 1045 1050

Ser Gly Ile Ala Thr Leu Val Ser Gly Ile Ala Gly Glu Glu GlnSer Gly Ile Ala Thr Leu Val Ser Gly Ile Ala Gly Glu Glu Gln

1055 1060 10651055 1060 1065

Gln Arg Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser Val Pro GlyGln Arg Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser Val Pro Gly

1070 1075 10801070 1075 1080

Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln Gln Ile SerPro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln Gln Ile Ser

1085 1090 10951085 1090 1095

Ala Met Arg Leu His Ile Ser Gln Leu Gln His Glu Asn Ser IleAla Met Arg Leu His Ile Ser Gln Leu Gln His Glu Asn Ser Ile

1100 1105 11101100 1105 1110

Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu Pro ProLeu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu Pro Pro

1115 1120 11251115 1120 1125

Leu His Val Ala Lys Leu Ser His Glu Gly Pro Gly Ser Glu LeuLeu His Val Ala Lys Leu Ser His Glu Gly Pro Gly Ser Glu Leu

1130 1135 11401130 1135 1140

Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu Leu Glu ThrPro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu Leu Glu Thr

1145 1150 11551145 1150 1155

Leu Asn Gln Leu Ser Thr His Thr His Val Val Asp Ile Thr ArgLeu Asn Gln Leu Ser Thr His Thr His Val Val Asp Ile Thr Arg

1160 1165 11701160 1165 1170

Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu Met Glu GlnThr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu Met Glu Gln

1175 1180 11851175 1180 1185

Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu Lys Leu LysVal Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu Lys Leu Lys

1190 1195 12001190 1195 1200

Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro Gly Ala ThrAsp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro Gly Ala Thr

1205 1210 12151205 1210 1215

Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala Phe Leu ArgVal Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala Phe Leu Arg

1220 1225 12301220 1225 1230

Ala Lys Glu Glu Gln Gln Asp Asp Thr Val Tyr Met Gly Lys ValAla Lys Glu Glu Gln Gln Asp Asp Thr Val Tyr Met Gly Lys Val

1235 1240 12451235 1240 1245

Thr Phe Ser Cys Ala Ala Gly Phe Gly Gln Arg His Arg Leu ValThr Phe Ser Cys Ala Ala Gly Phe Gly Gln Arg His Arg Leu Val

1250 1255 12601250 1255 1260

Leu Thr Gln Glu Gln Leu His Gln Leu His Ser Arg Leu Ile SerLeu Thr Gln Glu Gln Leu His Gln Leu His Ser Arg Leu Ile Ser

1265 1270 12751265 1270 1275

<210> 26<210> 26

<211> 1144<211> 1144

<212> белок<212> protein

<213> Homo sapiens<213> Homo sapiens

<400> 26<400> 26

Met Met Arg Gln Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg ProMet Met Arg Gln Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg Pro

1. 5 10 151. 5 10 15

Lys Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser SerLys Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser Ser

20 25 3020 25 30

Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser GluLeu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser Glu

35 40 4535 40 45

Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro ThrPro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro Thr

50 55 6050 55 60

Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro SerPro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro Ser

65 70 75 8065 70 75 80

Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu LysLys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu Lys

85 90 9585 90 95

Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu LysLeu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu Lys

100 105 110100 105 110

Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp LysGlu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp Lys

115 120 125115 120 125

Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys GluSer Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys Glu

130 135 140130 135 140

Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr MetAla Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr Met

145 150 155 160145 150 155 160

Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu AspGlu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu Asp

165 170 175165 170 175

Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val GluLys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val Glu

180 185 190180 185 190

Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile LeuAla Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile Leu

195 200 205195 200 205

Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser TyrLys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser Tyr

210 215 220210 215 220

Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala LeuGln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala Leu

225 230 235 240225 230 235 240

Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val LysVal Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val Lys

245 250 255245 250 255

Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val ArgLeu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val Arg

260 265 270260 265 270

Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser ThrGln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser Thr

275 280 285275 280 285

Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu GluIle Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu Glu

290 295 300290 295 300

Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys ValMet Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys Val

305 310 315 320305 310 315 320

Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu MetArg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu Met

325 330 335325 330 335

Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu ArgAsn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu Arg

340 345 350340 345 350

Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys ArgGlu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys Arg

355 360 365355 360 365

Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile LysVal Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile Lys

370 375 380370 375 380

Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu LeuLys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu Leu

385 390 395 400385 390 395 400

Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro ProThr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro Pro

405 410 415405 410 415

Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His AlaGlu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His Ala

420 425 430420 425 430

Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala AsnLys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala Asn

435 440 445435 440 445

Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu ArgArg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu Arg

450 455 460450 455 460

Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro ArgPro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro Arg

465 470 475 480465 470 475 480

Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys PheLeu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys Phe

485 490 495485 490 495

Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala AlaGlu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala Ala

500 505 510500 505 510

Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser LeuGly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser Leu

515 520 525515 520 525

Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys SerLeu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys Ser

530 535 540530 535 540

Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser AlaVal Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser Ala

545 550 555 560545 550 555 560

His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp GlnHis Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp Gln

565 570 575565 570 575

Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys TyrLeu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys Tyr

580 585 590580 585 590

Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp CysTyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp Cys

595 600 605595 600 605

Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu AspThr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu Asp

610 615 620610 615 620

Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly GlyCys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly Gly

625 630 635 640625 630 635 640

Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr SerGln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr Ser

645 650 655645 650 655

Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met ProCys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met Pro

660 665 670660 665 670

Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro GlnGly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro Gln

675 680 685675 680 685

Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val ValVal Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val Val

690 695 700690 695 700

Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala ProAla Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala Pro

705 710 715 720705 710 715 720

Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu AlaLeu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu Ala

725 730 735725 730 735

Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro TyrPhe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro Tyr

740 745 750740 745 750

Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn LysGlu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn Lys

755 760 765755 760 765

Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro ProLeu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro Pro

770 775 780770 775 780

Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala GluSer Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala Glu

785 790 795 800785 790 795 800

Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu ThrIle Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu Thr

805 810 815805 810 815

Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu LeuVal Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu Leu

820 825 830820 825 830

Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp SerSer Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp Ser

835 840 845835 840 845

Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg LeuAla Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg Leu

850 855 860850 855 860

Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu GluGlu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu Glu

865 870 875 880865 870 875 880

Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu LysThr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu Lys

885 890 895885 890 895

Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile GluAla Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile Glu

900 905 910900 905 910

Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val Ser GlyGly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val Ser Gly

915 920 925915 920 925

Ile Ala Gly Glu Glu Gln Gln Arg Gly Ala Ile Pro Gly Gln Ala ProIle Ala Gly Glu Glu Gln Gln Arg Gly Ala Ile Pro Gly Gln Ala Pro

930 935 940930 935 940

Gly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu LeuGly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu

945 950 955 960945 950 955 960

Gln Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln His GluGln Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln His Glu

965 970 975965 970 975

Asn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser LeuAsn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu

980 985 990980 985 990

Pro Pro Leu His Val Ala Lys Leu Ser His Glu Gly Pro Gly Ser GluPro Pro Leu His Val Ala Lys Leu Ser His Glu Gly Pro Gly Ser Glu

995 1000 1005995 1000 1005

Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu Leu GluLeu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu Leu Glu

1010 1015 10201010 1015 1020

Thr Leu Asn Gln Leu Ser Thr His Thr His Val Val Asp Ile ThrThr Leu Asn Gln Leu Ser Thr His Thr His Val Val Asp Ile Thr

1025 1030 10351025 1030 1035

Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu Met GluArg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu Met Glu

1040 1045 10501040 1045 1050

Gln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu Lys LeuGln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu Lys Leu

1055 1060 10651055 1060 1065

Lys Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro Gly AlaLys Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro Gly Ala

1070 1075 10801070 1075 1080

Thr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala Phe LeuThr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala Phe Leu

1085 1090 10951085 1090 1095

Arg Ala Lys Glu Glu Gln Gln Asp Asp Thr Val Tyr Met Gly LysArg Ala Lys Glu Glu Gln Gln Asp Asp Thr Val Tyr Met Gly Lys

1100 1105 11101100 1105 1110

Val Thr Phe Ser Cys Ala Ala Gly Phe Gly Gln Arg His Arg LeuVal Thr Phe Ser Cys Ala Ala Gly Phe Gly Gln Arg His Arg Leu

1115 1120 11251115 1120 1125

Val Leu Thr Gln Glu Gln Leu His Gln Leu His Ser Arg Leu IleVal Leu Thr Gln Glu Gln Leu His Gln Leu His Ser Arg Leu Ile

1130 1135 11401130 1135 1140

SerSer

<210> 27<210> 27

<211> 1253<211> 1253

<212> белок<212> protein

<213> Homo sapiens<213> Homo sapiens

<400> 27<400> 27

Met Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly SerMet Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly Ser

1. 5 10 151. 5 10 15

Arg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser ArgArg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg

20 25 3020 25 30

Val Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val GlyVal Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly

35 40 4535 40 45

Ala Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp GluAla Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu

50 55 6050 55 60

Ala Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe ThrAla Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr

65 70 75 8065 70 75 80

Cys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln ValCys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val

85 90 9585 90 95

Phe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser SerPhe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser

100 105 110100 105 110

Ala Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys ThrAla Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr

115 120 125115 120 125

Ser Lys Leu Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala SerSer Lys Leu Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser

130 135 140130 135 140

Ser Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser SerSer Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser

145 150 155 160145 150 155 160

Ser Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile IleSer Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile

165 170 175165 170 175

Pro Thr Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro SerPro Thr Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser

180 185 190180 185 190

Pro Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu GluPro Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu

195 200 205195 200 205

Glu Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala LysGlu Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys

210 215 220210 215 220

Leu Lys Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln GluLeu Lys Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu

225 230 235 240225 230 235 240

Trp Lys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg LeuTrp Lys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu

245 250 255245 250 255

Lys Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu ArgLys Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg

260 265 270260 265 270

Tyr Met Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala ThrTyr Met Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr

275 280 285275 280 285

Leu Asp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln GluLeu Asp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu

290 295 300290 295 300

Val Glu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu GluVal Glu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu

305 310 315 320305 310 315 320

Ile Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala SerIle Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser

325 330 335325 330 335

Ser Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys AspSer Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp

340 345 350340 345 350

Ala Leu Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu HisAla Leu Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His

355 360 365355 360 365

Val Lys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu ValVal Lys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val

370 375 380370 375 380

Val Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala GluVal Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu

385 390 395 400385 390 395 400

Ser Thr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly AlaSer Thr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala

405 410 415405 410 415

Glu Glu Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu GluGlu Glu Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu

420 425 430420 425 430

Lys Val Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met AsnLys Val Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn

435 440 445435 440 445

Glu Met Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu GluGlu Met Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu

450 455 460450 455 460

Leu Arg Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala GlnLeu Arg Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln

465 470 475 480465 470 475 480

Lys Arg Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln ThrLys Arg Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr

485 490 495485 490 495

Ile Lys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn ArgIle Lys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg

500 505 510500 505 510

Glu Leu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln ProGlu Leu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro

515 520 525515 520 525

Pro Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys AlaPro Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala

530 535 540530 535 540

His Ala Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala GlnHis Ala Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln

545 550 555 560545 550 555 560

Ala Asn Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser PheAla Asn Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe

565 570 575565 570 575

Leu Arg Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu MetLeu Arg Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met

580 585 590580 585 590

Pro Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln GluPro Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu

595 600 605595 600 605

Lys Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg GlyLys Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly

610 615 620610 615 620

Ala Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser LeuAla Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu

625 630 635 640625 630 635 640

Ser Leu Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser GlnSer Leu Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln

645 650 655645 650 655

Cys Ser Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu MetCys Ser Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met

660 665 670660 665 670

Ser Ala His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His LysSer Ala His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys

675 680 685675 680 685

Asp Gln Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala IleAsp Gln Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile

690 695 700690 695 700

Lys Tyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro GluLys Tyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu

705 710 715 720705 710 715 720

Asp Cys Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser AlaAsp Cys Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala

725 730 735725 730 735

Leu Asp Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu GlnLeu Asp Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln

740 745 750740 745 750

Gly Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu GluGly Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu

755 760 765755 760 765

Thr Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg ArgThr Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg

770 775 780770 775 780

Met Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe GlyMet Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly

785 790 795 800785 790 795 800

Pro Gln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr TrpPro Gln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp

805 810 815805 810 815

Val Val Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu IleVal Val Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile

820 825 830820 825 830

Ala Pro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu GluAla Pro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu

835 840 845835 840 845

Leu Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser SerLeu Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser

850 855 860850 855 860

Pro Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr MetPro Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met

865 870 875 880865 870 875 880

Asn Lys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu ArgAsn Lys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg

885 890 895885 890 895

Pro Pro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu ArgPro Pro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg

900 905 910900 905 910

Ala Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp ArgAla Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg

915 920 925915 920 925

Glu Thr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly GluGlu Thr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu

930 935 940930 935 940

Glu Leu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys LeuGlu Leu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu

945 950 955 960945 950 955 960

Asp Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln ThrAsp Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr

965 970 975965 970 975

Arg Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu PheArg Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe

980 985 990980 985 990

Glu Glu Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu AlaGlu Glu Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala

995 1000 1005995 1000 1005

Glu Lys Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys ArgGlu Lys Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg

1010 1015 10201010 1015 1020

Thr Ile Glu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala ThrThr Ile Glu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr

1025 1030 10351025 1030 1035

Leu Val Ser Gly Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala ProLeu Val Ser Gly Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro

1040 1045 10501040 1045 1050

Gly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu LeuGly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu

1055 1060 10651055 1060 1065

Leu Gln Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu GlnLeu Gln Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln

1070 1075 10801070 1075 1080

His Glu Asn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser LeuHis Glu Asn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu

1085 1090 10951085 1090 1095

Ala Ser Leu Pro Pro Leu His Val Ala Lys Leu Ser His Glu GlyAla Ser Leu Pro Pro Leu His Val Ala Lys Leu Ser His Glu Gly

1100 1105 11101100 1105 1110

Pro Gly Ser Glu Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr SerPro Gly Ser Glu Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser

1115 1120 11251115 1120 1125

Gln Leu Leu Glu Thr Leu Asn Gln Leu Ser Thr His Thr His ValGln Leu Leu Glu Thr Leu Asn Gln Leu Ser Thr His Thr His Val

1130 1135 11401130 1135 1140

Val Asp Ile Thr Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser AlaVal Asp Ile Thr Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala

1145 1150 11551145 1150 1155

Gln Leu Met Glu Gln Val Ala Gln Leu Lys Ser Leu Ser Asp ThrGln Leu Met Glu Gln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr

1160 1165 11701160 1165 1170

Val Glu Lys Leu Lys Asp Glu Val Leu Lys Glu Thr Val Ser GlnVal Glu Lys Leu Lys Asp Glu Val Leu Lys Glu Thr Val Ser Gln

1175 1180 11851175 1180 1185

Arg Pro Gly Ala Thr Val Pro Thr Asp Phe Ala Thr Phe Pro SerArg Pro Gly Ala Thr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser

1190 1195 12001190 1195 1200

Ser Ala Phe Leu Arg Ala Lys Glu Glu Gln Gln Asp Asp Thr ValSer Ala Phe Leu Arg Ala Lys Glu Glu Gln Gln Asp Asp Thr Val

1205 1210 12151205 1210 1215

Tyr Met Gly Lys Val Thr Phe Ser Cys Ala Ala Gly Phe Gly GlnTyr Met Gly Lys Val Thr Phe Ser Cys Ala Ala Gly Phe Gly Gln

1220 1225 12301220 1225 1230

Arg His Arg Leu Val Leu Thr Gln Glu Gln Leu His Gln Leu HisArg His Arg Leu Val Leu Thr Gln Glu Gln Leu His Gln Leu His

1235 1240 12451235 1240 1245

Ser Arg Leu Ile SerSer Arg Leu Ile Ser

12501250

<210> 28<210> 28

<211> 1139<211> 1139

<212> белок<212> protein

<213> Homo sapiens<213> Homo sapiens

<400> 28<400> 28

Met Met Arg Gln Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg ProMet Met Arg Gln Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg Pro

1. 5 10 151. 5 10 15

Lys Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser SerLys Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser Ser

20 25 3020 25 30

Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser GluLeu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser Glu

35 40 4535 40 45

Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro ThrPro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro Thr

50 55 6050 55 60

Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro SerPro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro Ser

65 70 75 8065 70 75 80

Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu LysLys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu Lys

85 90 9585 90 95

Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu LysLeu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu Lys

100 105 110100 105 110

Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp LysGlu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp Lys

115 120 125115 120 125

Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys GluSer Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys Glu

130 135 140130 135 140

Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr MetAla Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr Met

145 150 155 160145 150 155 160

Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu AspGlu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu Asp

165 170 175165 170 175

Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val GluLys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val Glu

180 185 190180 185 190

Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile LeuAla Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile Leu

195 200 205195 200 205

Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser TyrLys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser Tyr

210 215 220210 215 220

Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala LeuGln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala Leu

225 230 235 240225 230 235 240

Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val LysVal Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val Lys

245 250 255245 250 255

Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val ArgLeu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val Arg

260 265 270260 265 270

Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser ThrGln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser Thr

275 280 285275 280 285

Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu GluIle Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu Glu

290 295 300290 295 300

Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys ValMet Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys Val

305 310 315 320305 310 315 320

Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu MetArg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu Met

325 330 335325 330 335

Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu ArgAsn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu Arg

340 345 350340 345 350

Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys ArgGlu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys Arg

355 360 365355 360 365

Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile LysVal Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile Lys

370 375 380370 375 380

Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu LeuLys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu Leu

385 390 395 400385 390 395 400

Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro ProThr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro Pro

405 410 415405 410 415

Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His AlaGlu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His Ala

420 425 430420 425 430

Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala AsnLys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala Asn

435 440 445435 440 445

Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu ArgArg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu Arg

450 455 460450 455 460

Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro ArgPro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro Arg

465 470 475 480465 470 475 480

Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys PheLeu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys Phe

485 490 495485 490 495

Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala AlaGlu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala Ala

500 505 510500 505 510

Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser LeuGly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser Leu

515 520 525515 520 525

Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys SerLeu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys Ser

530 535 540530 535 540

Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser AlaVal Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser Ala

545 550 555 560545 550 555 560

His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp GlnHis Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp Gln

565 570 575565 570 575

Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys TyrLeu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys Tyr

580 585 590580 585 590

Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp CysTyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp Cys

595 600 605595 600 605

Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu AspThr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu Asp

610 615 620610 615 620

Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly GlyCys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly Gly

625 630 635 640625 630 635 640

Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr SerGln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr Ser

645 650 655645 650 655

Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met ProCys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met Pro

660 665 670660 665 670

Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro GlnGly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro Gln

675 680 685675 680 685

Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val ValVal Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val Val

690 695 700690 695 700

Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala ProAla Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala Pro

705 710 715 720705 710 715 720

Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu AlaLeu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu Ala

725 730 735725 730 735

Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro TyrPhe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro Tyr

740 745 750740 745 750

Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn LysGlu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn Lys

755 760 765755 760 765

Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro ProLeu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro Pro

770 775 780770 775 780

Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala GluSer Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala Glu

785 790 795 800785 790 795 800

Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu ThrIle Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu Thr

805 810 815805 810 815

Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu LeuVal Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu Leu

820 825 830820 825 830

Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp SerSer Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp Ser

835 840 845835 840 845

Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg LeuAla Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg Leu

850 855 860850 855 860

Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu GluGlu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu Glu

865 870 875 880865 870 875 880

Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu LysThr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu Lys

885 890 895885 890 895

Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile GluAla Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile Glu

900 905 910900 905 910

Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val Ser GlyGly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val Ser Gly

915 920 925915 920 925

Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser Val Pro GlyIle Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser Val Pro Gly

930 935 940930 935 940

Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln Gln Ile Ser AlaPro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln Gln Ile Ser Ala

945 950 955 960945 950 955 960

Met Arg Leu His Ile Ser Gln Leu Gln His Glu Asn Ser Ile Leu LysMet Arg Leu His Ile Ser Gln Leu Gln His Glu Asn Ser Ile Leu Lys

965 970 975965 970 975

Gly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu Pro Pro Leu His ValGly Ala Gln Met Lys Ala Ser Leu Ala Ser Leu Pro Pro Leu His Val

980 985 990980 985 990

Ala Lys Leu Ser His Glu Gly Pro Gly Ser Glu Leu Pro Ala Gly AlaAla Lys Leu Ser His Glu Gly Pro Gly Ser Glu Leu Pro Ala Gly Ala

995 1000 1005995 1000 1005

Leu Tyr Arg Lys Thr Ser Gln Leu Leu Glu Thr Leu Asn Gln LeuLeu Tyr Arg Lys Thr Ser Gln Leu Leu Glu Thr Leu Asn Gln Leu

1010 1015 10201010 1015 1020

Ser Thr His Thr His Val Val Asp Ile Thr Arg Thr Ser Pro AlaSer Thr His Thr His Val Val Asp Ile Thr Arg Thr Ser Pro Ala

1025 1030 10351025 1030 1035

Ala Lys Ser Pro Ser Ala Gln Leu Met Glu Gln Val Ala Gln LeuAla Lys Ser Pro Ser Ala Gln Leu Met Glu Gln Val Ala Gln Leu

1040 1045 10501040 1045 1050

Lys Ser Leu Ser Asp Thr Val Glu Lys Leu Lys Asp Glu Val LeuLys Ser Leu Ser Asp Thr Val Glu Lys Leu Lys Asp Glu Val Leu

1055 1060 10651055 1060 1065

Lys Glu Thr Val Ser Gln Arg Pro Gly Ala Thr Val Pro Thr AspLys Glu Thr Val Ser Gln Arg Pro Gly Ala Thr Val Pro Thr Asp

1070 1075 10801070 1075 1080

Phe Ala Thr Phe Pro Ser Ser Ala Phe Leu Arg Ala Lys Glu GluPhe Ala Thr Phe Pro Ser Ser Ala Phe Leu Arg Ala Lys Glu Glu

1085 1090 10951085 1090 1095

Gln Gln Asp Asp Thr Val Tyr Met Gly Lys Val Thr Phe Ser CysGln Gln Asp Asp Thr Val Tyr Met Gly Lys Val Thr Phe Ser Cys

1100 1105 11101100 1105 1110

Ala Ala Gly Phe Gly Gln Arg His Arg Leu Val Leu Thr Gln GluAla Ala Gly Phe Gly Gln Arg His Arg Leu Val Leu Thr Gln Glu

1115 1120 11251115 1120 1125

Gln Leu His Gln Leu His Ser Arg Leu Ile SerGln Leu His Gln Leu His Ser Arg Leu Ile Ser

1130 11351130 1135

<210> 29<210> 29

<211> 1236<211> 1236

<212> белок<212> protein

<213> Homo sapiens<213> Homo sapiens

<400> 29<400> 29

Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg ValMet Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg Val

1. 5 10 151. 5 10 15

Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly AlaGlu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly Ala

20 25 3020 25 30

Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu AlaThr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu Ala

35 40 4535 40 45

Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr CysLys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr Cys

50 55 6050 55 60

Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val PheAsp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val Phe

65 70 75 8065 70 75 80

Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser AlaGlu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser Ala

85 90 9585 90 95

Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr SerSer Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr Ser

100 105 110100 105 110

Lys Leu Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser SerLys Leu Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser

115 120 125115 120 125

Ser Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser SerSer Leu Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser

130 135 140130 135 140

Glu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile ProGlu Pro Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro

145 150 155 160145 150 155 160

Thr Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser ProThr Pro Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro

165 170 175165 170 175

Ser Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu GluSer Lys Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu

180 185 190180 185 190

Lys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys LeuLys Leu Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu

195 200 205195 200 205

Lys Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu TrpLys Glu Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp

210 215 220210 215 220

Lys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu LysLys Ser Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys

225 230 235 240225 230 235 240

Glu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg TyrGlu Ala Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr

245 250 255245 250 255

Met Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr LeuMet Glu Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu

260 265 270260 265 270

Asp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu ValAsp Lys Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val

275 280 285275 280 285

Glu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu IleGlu Ala Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile

290 295 300290 295 300

Leu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser SerLeu Lys Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser

305 310 315 320305 310 315 320

Tyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp AlaTyr Gln Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala

325 330 335325 330 335

Leu Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His ValLeu Val Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val

340 345 350340 345 350

Lys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val ValLys Leu Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val

355 360 365355 360 365

Arg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu SerArg Gln Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser

370 375 380370 375 380

Thr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala GluThr Ile Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu

385 390 395 400385 390 395 400

Glu Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu LysGlu Met Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys

405 410 415405 410 415

Val Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn GluVal Arg Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu

420 425 430420 425 430

Met Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu LeuMet Asn Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu

435 440 445435 440 445

Arg Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln LysArg Glu Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys

450 455 460450 455 460

Arg Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr IleArg Val Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile

465 470 475 480465 470 475 480

Lys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg GluLys Lys Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu

485 490 495485 490 495

Leu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro ProLeu Thr Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro

500 505 510500 505 510

Pro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala HisPro Glu Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His

515 520 525515 520 525

Ala Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln AlaAla Lys Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala

530 535 540530 535 540

Asn Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe LeuAsn Arg His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu

545 550 555 560545 550 555 560

Arg Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met ProArg Pro Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro

565 570 575565 570 575

Arg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu LysArg Leu Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys

580 585 590580 585 590

Phe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly AlaPhe Glu Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala

595 600 605595 600 605

Ala Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu SerAla Gly Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser

610 615 620610 615 620

Leu Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln CysLeu Leu Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys

625 630 635 640625 630 635 640

Ser Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met SerSer Val Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser

645 650 655645 650 655

Ala His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys AspAla His Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp

660 665 670660 665 670

Gln Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile LysGln Leu Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys

675 680 685675 680 685

Tyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu AspTyr Tyr Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp

690 695 700690 695 700

Cys Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala LeuCys Thr Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu

705 710 715 720705 710 715 720

Asp Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln GlyAsp Cys Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly

725 730 735725 730 735

Gly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu ThrGly Gln Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr

740 745 750740 745 750

Ser Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg MetSer Cys Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met

755 760 765755 760 765

Pro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly ProPro Gly Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro

770 775 780770 775 780

Gln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp ValGln Val Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val

785 790 795 800785 790 795 800

Val Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile AlaVal Ala Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala

805 810 815805 810 815

Pro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu LeuPro Leu Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu

820 825 830820 825 830

Ala Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser ProAla Phe Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro

835 840 845835 840 845

Tyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met AsnTyr Glu Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn

850 855 860850 855 860

Lys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg ProLys Leu Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro

865 870 875 880865 870 875 880

Pro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg AlaPro Ser Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala

885 890 895885 890 895

Glu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg GluGlu Ile Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu

900 905 910900 905 910

Thr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu GluThr Val Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu

915 920 925915 920 925

Leu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu AspLeu Ser Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp

930 935 940930 935 940

Ser Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr ArgSer Ala Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg

945 950 955 960945 950 955 960

Leu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe GluLeu Glu Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu

965 970 975965 970 975

Glu Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala GluGlu Thr Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu

980 985 990980 985 990

Lys Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr IleLys Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile

995 1000 1005995 1000 1005

Glu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu ValGlu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val

1010 1015 10201010 1015 1020

Ser Gly Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro Gly SerSer Gly Ile Ala Gly Gly Ala Ile Pro Gly Gln Ala Pro Gly Ser

1025 1030 10351025 1030 1035

Val Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu GlnVal Pro Gly Pro Gly Leu Val Lys Asp Ser Pro Leu Leu Leu Gln

1040 1045 10501040 1045 1050

Gln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln His GluGln Ile Ser Ala Met Arg Leu His Ile Ser Gln Leu Gln His Glu

1055 1060 10651055 1060 1065

Asn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala SerAsn Ser Ile Leu Lys Gly Ala Gln Met Lys Ala Ser Leu Ala Ser

1070 1075 10801070 1075 1080

Leu Pro Pro Leu His Val Ala Lys Leu Ser His Glu Gly Pro GlyLeu Pro Pro Leu His Val Ala Lys Leu Ser His Glu Gly Pro Gly

1085 1090 10951085 1090 1095

Ser Glu Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln LeuSer Glu Leu Pro Ala Gly Ala Leu Tyr Arg Lys Thr Ser Gln Leu

1100 1105 11101100 1105 1110

Leu Glu Thr Leu Asn Gln Leu Ser Thr His Thr His Val Val AspLeu Glu Thr Leu Asn Gln Leu Ser Thr His Thr His Val Val Asp

1115 1120 11251115 1120 1125

Ile Thr Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln LeuIle Thr Arg Thr Ser Pro Ala Ala Lys Ser Pro Ser Ala Gln Leu

1130 1135 11401130 1135 1140

Met Glu Gln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val GluMet Glu Gln Val Ala Gln Leu Lys Ser Leu Ser Asp Thr Val Glu

1145 1150 11551145 1150 1155

Lys Leu Lys Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg ProLys Leu Lys Asp Glu Val Leu Lys Glu Thr Val Ser Gln Arg Pro

1160 1165 11701160 1165 1170

Gly Ala Thr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser AlaGly Ala Thr Val Pro Thr Asp Phe Ala Thr Phe Pro Ser Ser Ala

1175 1180 11851175 1180 1185

Phe Leu Arg Ala Lys Glu Glu Gln Gln Asp Asp Thr Val Tyr MetPhe Leu Arg Ala Lys Glu Glu Gln Gln Asp Asp Thr Val Tyr Met

1190 1195 12001190 1195 1200

Gly Lys Val Thr Phe Ser Cys Ala Ala Gly Phe Gly Gln Arg HisGly Lys Val Thr Phe Ser Cys Ala Ala Gly Phe Gly Gln Arg His

1205 1210 12151205 1210 1215

Arg Leu Val Leu Thr Gln Glu Gln Leu His Gln Leu His Ser ArgArg Leu Val Leu Thr Gln Glu Gln Leu His Gln Leu His Ser Arg

1220 1225 12301220 1225 1230

Leu Ile SerLeu Ile Ser

12351235

<210> 30<210> 30

<211> 1271<211> 1271

<212> белок<212> protein

<213> Homo sapiens<213> Homo sapiens

<400> 30<400> 30

Met Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly SerMet Ala Gln Ser Lys Arg His Val Tyr Ser Arg Thr Pro Ser Gly Ser

1. 5 10 151.5 10 15

Arg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser ArgArg Met Ser Ala Glu Ala Ser Ala Arg Pro Leu Arg Val Gly Ser Arg

20 25 3020 25 30

Val Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val GlyVal Glu Val Ile Gly Lys Gly His Arg Gly Thr Val Ala Tyr Val Gly

35 40 4535 40 45

Ala Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp GluAla Thr Leu Phe Ala Thr Gly Lys Trp Val Gly Val Ile Leu Asp Glu

50 55 6050 55 60

Ala Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe ThrAla Lys Gly Lys Asn Asp Gly Thr Val Gln Gly Arg Lys Tyr Phe Thr

65 70 75 8065 70 75 80

Cys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln ValCys Asp Glu Gly His Gly Ile Phe Val Arg Gln Ser Gln Ile Gln Val

85 90 9585 90 95

Phe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser SerPhe Glu Asp Gly Ala Asp Thr Thr Ser Pro Glu Thr Pro Asp Ser Ser

100 105 110100 105 110

Ala Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys ThrAla Ser Lys Val Leu Lys Arg Glu Gly Thr Asp Thr Thr Ala Lys Thr

115 120 125115 120 125

Ser Lys Leu Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg Pro LysSer Lys Leu Ala Pro Thr Ala Arg Lys Thr Thr Thr Arg Arg Pro Lys

130 135 140130 135 140

Pro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser Ser LeuPro Thr Arg Pro Ala Ser Thr Gly Val Ala Gly Ala Ser Ser Ser Leu

145 150 155 160145 150 155 160

Gly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser Glu ProGly Pro Ser Gly Ser Ala Ser Ala Gly Glu Leu Ser Ser Ser Glu Pro

165 170 175165 170 175

Ser Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro Thr ProSer Thr Pro Ala Gln Thr Pro Leu Ala Ala Pro Ile Ile Pro Thr Pro

180 185 190180 185 190

Val Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro Ser LysVal Leu Thr Ser Pro Gly Ala Val Pro Pro Leu Pro Ser Pro Ser Lys

195 200 205195 200 205

Glu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu Lys LeuGlu Glu Glu Gly Leu Arg Ala Gln Val Arg Asp Leu Glu Glu Lys Leu

210 215 220210 215 220

Glu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu Lys GluGlu Thr Leu Arg Leu Lys Arg Ala Glu Asp Lys Ala Lys Leu Lys Glu

225 230 235 240225 230 235 240

Leu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp Lys SerLeu Glu Lys His Lys Ile Gln Leu Glu Gln Val Gln Glu Trp Lys Ser

245 250 255245 250 255

Lys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys Glu AlaLys Met Gln Glu Gln Gln Ala Asp Leu Gln Arg Arg Leu Lys Glu Ala

260 265 270260 265 270

Arg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr Met GluArg Lys Glu Ala Lys Glu Ala Leu Glu Ala Lys Glu Arg Tyr Met Glu

275 280 285275 280 285

Glu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu Asp LysGlu Met Ala Asp Thr Ala Asp Ala Ile Glu Met Ala Thr Leu Asp Lys

290 295 300290 295 300

Glu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val Glu AlaGlu Met Ala Glu Glu Arg Ala Glu Ser Leu Gln Gln Glu Val Glu Ala

305 310 315 320305 310 315 320

Leu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile Leu LysLeu Lys Glu Arg Val Asp Glu Leu Thr Thr Asp Leu Glu Ile Leu Lys

325 330 335325 330 335

Ala Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser Tyr GlnAla Glu Ile Glu Glu Lys Gly Ser Asp Gly Ala Ala Ser Ser Tyr Gln

340 345 350340 345 350

Leu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala Leu ValLeu Lys Gln Leu Glu Glu Gln Asn Ala Arg Leu Lys Asp Ala Leu Val

355 360 365355 360 365

Arg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val Lys LeuArg Met Arg Asp Leu Ser Ser Ser Glu Lys Gln Glu His Val Lys Leu

370 375 380370 375 380

Gln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val Arg GlnGln Lys Leu Met Glu Lys Lys Asn Gln Glu Leu Glu Val Val Arg Gln

385 390 395 400385 390 395 400

Gln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser Thr IleGln Arg Glu Arg Leu Gln Glu Glu Leu Ser Gln Ala Glu Ser Thr Ile

405 410 415405 410 415

Asp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu Glu MetAsp Glu Leu Lys Glu Gln Val Asp Ala Ala Leu Gly Ala Glu Glu Met

420 425 430420 425 430

Val Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys Val ArgVal Glu Met Leu Thr Asp Arg Asn Leu Asn Leu Glu Glu Lys Val Arg

435 440 445435 440 445

Glu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu Met AsnGlu Leu Arg Glu Thr Val Gly Asp Leu Glu Ala Met Asn Glu Met Asn

450 455 460450 455 460

Asp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu Arg GluAsp Glu Leu Gln Glu Asn Ala Arg Glu Thr Glu Leu Glu Leu Arg Glu

465 470 475 480465 470 475 480

Gln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys Arg ValGln Leu Asp Met Ala Gly Ala Arg Val Arg Glu Ala Gln Lys Arg Val

485 490 495485 490 495

Glu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile Lys LysGlu Ala Ala Gln Glu Thr Val Ala Asp Tyr Gln Gln Thr Ile Lys Lys

500 505 510500 505 510

Tyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu Leu ThrTyr Arg Gln Leu Thr Ala His Leu Gln Asp Val Asn Arg Glu Leu Thr

515 520 525515 520 525

Asn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro Pro GluAsn Gln Gln Glu Ala Ser Val Glu Arg Gln Gln Gln Pro Pro Pro Glu

530 535 540530 535 540

Thr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His Ala LysThr Phe Asp Phe Lys Ile Lys Phe Ala Glu Thr Lys Ala His Ala Lys

545 550 555 560545 550 555 560

Ala Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala Asn ArgAla Ile Glu Met Glu Leu Arg Gln Met Glu Val Ala Gln Ala Asn Arg

565 570 575565 570 575

His Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu Arg ProHis Met Ser Leu Leu Thr Ala Phe Met Pro Asp Ser Phe Leu Arg Pro

580 585 590580 585 590

Gly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro Arg LeuGly Gly Asp His Asp Cys Val Leu Val Leu Leu Leu Met Pro Arg Leu

595 600 605595 600 605

Ile Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys Phe GluIle Cys Lys Ala Glu Leu Ile Arg Lys Gln Ala Gln Glu Lys Phe Glu

610 615 620610 615 620

Leu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala Ala GlyLeu Ser Glu Asn Cys Ser Glu Arg Pro Gly Leu Arg Gly Ala Ala Gly

625 630 635 640625 630 635 640

Glu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser Leu LeuGlu Gln Leu Ser Phe Ala Ala Gly Leu Val Tyr Ser Leu Ser Leu Leu

645 650 655645 650 655

Gln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys Ser ValGln Ala Thr Leu His Arg Tyr Glu His Ala Leu Ser Gln Cys Ser Val

660 665 670660 665 670

Asp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser Ala HisAsp Val Tyr Lys Lys Val Gly Ser Leu Tyr Pro Glu Met Ser Ala His

675 680 685675 680 685

Glu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp Gln LeuGlu Arg Ser Leu Asp Phe Leu Ile Glu Leu Leu His Lys Asp Gln Leu

690 695 700690 695 700

Asp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys Tyr TyrAsp Glu Thr Val Asn Val Glu Pro Leu Thr Lys Ala Ile Lys Tyr Tyr

705 710 715 720705 710 715 720

Gln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp Cys ThrGln His Leu Tyr Ser Ile His Leu Ala Glu Gln Pro Glu Asp Cys Thr

725 730 735725 730 735

Met Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu Asp CysMet Gln Leu Ala Asp His Ile Lys Phe Thr Gln Ser Ala Leu Asp Cys

740 745 750740 745 750

Met Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly Gly GlnMet Ser Val Glu Val Gly Arg Leu Arg Ala Phe Leu Gln Gly Gly Gln

755 760 765755 760 765

Glu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr Ser CysGlu Ala Thr Asp Ile Ala Leu Leu Leu Arg Asp Leu Glu Thr Ser Cys

770 775 780770 775 780

Ser Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met Pro GlySer Asp Ile Arg Gln Phe Cys Lys Lys Ile Arg Arg Arg Met Pro Gly

785 790 795 800785 790 795 800

Thr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro Gln ValThr Asp Ala Pro Gly Ile Pro Ala Ala Leu Ala Phe Gly Pro Gln Val

805 810 815805 810 815

Ser Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val Val AlaSer Asp Thr Leu Leu Asp Cys Arg Lys His Leu Thr Trp Val Val Ala

820 825 830820 825 830

Val Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala Pro LeuVal Leu Gln Glu Val Ala Ala Ala Ala Ala Gln Leu Ile Ala Pro Leu

835 840 845835 840 845

Ala Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu Ala PheAla Glu Asn Glu Gly Leu Leu Val Ala Ala Leu Glu Glu Leu Ala Phe

850 855 860850 855 860

Lys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro Tyr GluLys Ala Ser Glu Gln Ile Tyr Gly Thr Pro Ser Ser Ser Pro Tyr Glu

865 870 875 880865 870 875 880

Cys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn Lys LeuCys Leu Arg Gln Ser Cys Asn Ile Leu Ile Ser Thr Met Asn Lys Leu

885 890 895885 890 895

Ala Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro Pro SerAla Thr Ala Met Gln Glu Gly Glu Tyr Asp Ala Glu Arg Pro Pro Ser

900 905 910900 905 910

Lys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala Glu IleLys Pro Pro Pro Val Glu Leu Arg Ala Ala Ala Leu Arg Ala Glu Ile

915 920 925915 920 925

Thr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu Thr ValThr Asp Ala Glu Gly Leu Gly Leu Lys Leu Glu Asp Arg Glu Thr Val

930 935 940930 935 940

Ile Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu Leu SerIle Lys Glu Leu Lys Lys Ser Leu Lys Ile Lys Gly Glu Glu Leu Ser

945 950 955 960945 950 955 960

Glu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp Ser AlaGlu Ala Asn Val Arg Leu Ser Leu Leu Glu Lys Lys Leu Asp Ser Ala

965 970 975965 970 975

Ala Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg Leu GluAla Lys Asp Ala Asp Glu Arg Ile Glu Lys Val Gln Thr Arg Leu Glu

980 985 990980 985 990

Glu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu Glu ThrGlu Thr Gln Ala Leu Leu Arg Lys Lys Glu Lys Glu Phe Glu Glu Thr

995 1000 1005995 1000 1005

Met Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu LysMet Asp Ala Leu Gln Ala Asp Ile Asp Gln Leu Glu Ala Glu Lys

1010 1015 10201010 1015 1020

Ala Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr IleAla Glu Leu Lys Gln Arg Leu Asn Ser Gln Ser Lys Arg Thr Ile

1025 1030 10351025 1030 1035

Glu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu ValGlu Gly Leu Arg Gly Pro Pro Pro Ser Gly Ile Ala Thr Leu Val

1040 1045 10501040 1045 1050

Ser Gly Ile Ala Gly Glu Glu Gln Gln Arg Gly Ala Ile Pro GlySer Gly Ile Ala Gly Glu Glu Gln Gln Arg Gly Ala Ile Pro Gly

1055 1060 10651055 1060 1065

Gln Ala Pro Gly Ser Val Pro Gly Pro Gly Leu Val Lys Asp SerGln Ala Pro Gly Ser Val Pro Gly Pro Gly Leu Val Lys Asp Ser

1070 1075 10801070 1075 1080

Pro Leu Leu Leu Gln Gln Ile Ser Ala Met Arg Leu His Ile SerPro Leu Leu Leu Gln Gln Ile Ser Ala Met Arg Leu His Ile Ser

1085 1090 10951085 1090 1095

Gln Leu Gln His Glu Asn Ser Ile Leu Lys Gly Ala Gln Met LysGln Leu Gln His Glu Asn Ser Ile Leu Lys Gly Ala Gln Met Lys

1100 1105 11101100 1105 1110

Ala Ser Leu Ala Ser Leu Pro Pro Leu His Val Ala Lys Leu SerAla Ser Leu Ala Ser Leu Pro Pro Leu His Val Ala Lys Leu Ser

1115 1120 11251115 1120 1125

His Glu Gly Pro Gly Ser Glu Leu Pro Ala Gly Ala Leu Tyr ArgHis Glu Gly Pro Gly Ser Glu Leu Pro Ala Gly Ala Leu Tyr Arg

1130 1135 11401130 1135 1140

Lys Thr Ser Gln Leu Leu Glu Thr Leu Asn Gln Leu Ser Thr HisLys Thr Ser Gln Leu Leu Glu Thr Leu Asn Gln Leu Ser Thr His

1145 1150 11551145 1150 1155

Thr His Val Val Asp Ile Thr Arg Thr Ser Pro Ala Ala Lys SerThr His Val Val Asp Ile Thr Arg Thr Ser Pro Ala Ala Lys Ser

1160 1165 11701160 1165 1170

Pro Ser Ala Gln Leu Met Glu Gln Val Ala Gln Leu Lys Ser LeuPro Ser Ala Gln Leu Met Glu Gln Val Ala Gln Leu Lys Ser Leu

1175 1180 11851175 1180 1185

Ser Asp Thr Val Glu Lys Leu Lys Asp Glu Val Leu Lys Glu ThrSer Asp Thr Val Glu Lys Leu Lys Asp Glu Val Leu Lys Glu Thr

1190 1195 12001190 1195 1200

Val Ser Gln Arg Pro Gly Ala Thr Val Pro Thr Asp Phe Ala ThrVal Ser Gln Arg Pro Gly Ala Thr Val Pro Thr Asp Phe Ala Thr

1205 1210 12151205 1210 1215

Phe Pro Ser Ser Ala Phe Leu Arg Ala Lys Glu Glu Gln Gln AspPhe Pro Ser Ser Ala Phe Leu Arg Ala Lys Glu Glu Gln Gln Asp

1220 1225 12301220 1225 1230

Asp Thr Val Tyr Met Gly Lys Val Thr Phe Ser Cys Ala Ala GlyAsp Thr Val Tyr Met Gly Lys Val Thr Phe Ser Cys Ala Ala Gly

1235 1240 12451235 1240 1245

Phe Gly Gln Arg His Arg Leu Val Leu Thr Gln Glu Gln Leu HisPhe Gly Gln Arg His Arg Leu Val Leu Thr Gln Glu Gln Leu His

1250 1255 12601250 1255 1260

Gln Leu His Ser Arg Leu Ile SerGln Leu His Ser Arg Leu Ile Ser

1265 12701265 1270

<210> 31<210> 31

<211> 1114<211> 1114

<212> белок<212> protein

<213> Homo sapiens<213> Homo sapiens

<400> 31<400> 31

Met Ala Lys Ala Thr Ser Gly Ala Ala Gly Leu Arg Leu Leu Leu LeuMet Ala Lys Ala Thr Ser Gly Ala Ala Gly Leu Arg Leu Leu Leu Leu

1. 5 10 151. 5 10 15

Leu Leu Leu Pro Leu Leu Gly Lys Val Ala Leu Gly Leu Tyr Phe SerLeu Leu Leu Pro Leu Leu Gly Lys Val Ala Leu Gly Leu Tyr Phe Ser

20 25 3020 25 30

Arg Asp Ala Tyr Trp Glu Lys Leu Tyr Val Asp Gln Ala Ala Gly ThrArg Asp Ala Tyr Trp Glu Lys Leu Tyr Val Asp Gln Ala Ala Gly Thr

35 40 4535 40 45

Pro Leu Leu Tyr Val His Ala Leu Arg Asp Ala Pro Glu Glu Val ProPro Leu Leu Tyr Val His Ala Leu Arg Asp Ala Pro Glu Glu Val Pro

50 55 6050 55 60

Ser Phe Arg Leu Gly Gln His Leu Tyr Gly Thr Tyr Arg Thr Arg LeuSer Phe Arg Leu Gly Gln His Leu Tyr Gly Thr Tyr Arg Thr Arg Leu

65 70 75 8065 70 75 80

His Glu Asn Asn Trp Ile Cys Ile Gln Glu Asp Thr Gly Leu Leu TyrHis Glu Asn Asn Trp Ile Cys Ile Gln Glu Asp Thr Gly Leu Leu Tyr

85 90 9585 90 95

Leu Asn Arg Ser Leu Asp His Ser Ser Trp Glu Lys Leu Ser Val ArgLeu Asn Arg Ser Leu Asp His Ser Ser Trp Glu Lys Leu Ser Val Arg

100 105 110100 105 110

Asn Arg Gly Phe Pro Leu Leu Thr Val Tyr Leu Lys Val Phe Leu SerAsn Arg Gly Phe Pro Leu Leu Thr Val Tyr Leu Lys Val Phe Leu Ser

115 120 125115 120 125

Pro Thr Ser Leu Arg Glu Gly Glu Cys Gln Trp Pro Gly Cys Ala ArgPro Thr Ser Leu Arg Glu Gly Glu Cys Gln Trp Pro Gly Cys Ala Arg

130 135 140130 135 140

Val Tyr Phe Ser Phe Phe Asn Thr Ser Phe Pro Ala Cys Ser Ser LeuVal Tyr Phe Ser Phe Phe Asn Thr Ser Phe Pro Ala Cys Ser Ser Leu

145 150 155 160145 150 155 160

Lys Pro Arg Glu Leu Cys Phe Pro Glu Thr Arg Pro Ser Phe Arg IleLys Pro Arg Glu Leu Cys Phe Pro Glu Thr Arg Pro Ser Phe Arg Ile

165 170 175165 170 175

Arg Glu Asn Arg Pro Pro Gly Thr Phe His Gln Phe Arg Leu Leu ProArg Glu Asn Arg Pro Pro Gly Thr Phe His Gln Phe Arg Leu Leu Pro

180 185 190180 185 190

Val Gln Phe Leu Cys Pro Asn Ile Ser Val Ala Tyr Arg Leu Leu GluVal Gln Phe Leu Cys Pro Asn Ile Ser Val Ala Tyr Arg Leu Leu Glu

195 200 205195 200 205

Gly Glu Gly Leu Pro Phe Arg Cys Ala Pro Asp Ser Leu Glu Val SerGly Glu Gly Leu Pro Phe Arg Cys Ala Pro Asp Ser Leu Glu Val Ser

210 215 220210 215 220

Thr Arg Trp Ala Leu Asp Arg Glu Gln Arg Glu Lys Tyr Glu Leu ValThr Arg Trp Ala Leu Asp Arg Glu Gln Arg Glu Lys Tyr Glu Leu Val

225 230 235 240225 230 235 240

Ala Val Cys Thr Val His Ala Gly Ala Arg Glu Glu Val Val Met ValAla Val Cys Thr Val His Ala Gly Ala Arg Glu Glu Val Val Met Val

245 250 255245 250 255

Pro Phe Pro Val Thr Val Tyr Asp Glu Asp Asp Ser Ala Pro Thr PhePro Phe Pro Val Thr Val Tyr Asp Glu Asp Asp Ser Ala Pro Thr Phe

260 265 270260 265 270

Pro Ala Gly Val Asp Thr Ala Ser Ala Val Val Glu Phe Lys Arg LysPro Ala Gly Val Asp Thr Ala Ser Ala Val Val Glu Phe Lys Arg Lys

275 280 285275 280 285

Glu Asp Thr Val Val Ala Thr Leu Arg Val Phe Asp Ala Asp Val ValGlu Asp Thr Val Val Ala Thr Leu Arg Val Phe Asp Ala Asp Val Val

290 295 300290 295 300

Pro Ala Ser Gly Glu Leu Val Arg Arg Tyr Thr Ser Thr Leu Leu ProPro Ala Ser Gly Glu Leu Val Arg Arg Tyr Thr Ser Thr Leu Leu Pro

305 310 315 320305 310 315 320

Gly Asp Thr Trp Ala Gln Gln Thr Phe Arg Val Glu His Trp Pro AsnGly Asp Thr Trp Ala Gln Gln Thr Phe Arg Val Glu His Trp Pro Asn

325 330 335325 330 335

Glu Thr Ser Val Gln Ala Asn Gly Ser Phe Val Arg Ala Thr Val HisGlu Thr Ser Val Gln Ala Asn Gly Ser Phe Val Arg Ala Thr Val His

340 345 350340 345 350

Asp Tyr Arg Leu Val Leu Asn Arg Asn Leu Ser Ile Ser Glu Asn ArgAsp Tyr Arg Leu Val Leu Asn Arg Asn Leu Ser Ile Ser Glu Asn Arg

355 360 365355 360 365

Thr Met Gln Leu Ala Val Leu Val Asn Asp Ser Asp Phe Gln Gly ProThr Met Gln Leu Ala Val Leu Val Asn Asp Ser Asp Phe Gln Gly Pro

370 375 380370 375 380

Gly Ala Gly Val Leu Leu Leu His Phe Asn Val Ser Val Leu Pro ValGly Ala Gly Val Leu Leu Leu His Phe Asn Val Ser Val Leu Pro Val

385 390 395 400385 390 395 400

Ser Leu His Leu Pro Ser Thr Tyr Ser Leu Ser Val Ser Arg Arg AlaSer Leu His Leu Pro Ser Thr Tyr Ser Leu Ser Val Ser Arg Arg Ala

405 410 415405 410 415

Arg Arg Phe Ala Gln Ile Gly Lys Val Cys Val Glu Asn Cys Gln AlaArg Arg Phe Ala Gln Ile Gly Lys Val Cys Val Glu Asn Cys Gln Ala

420 425 430420 425 430

Phe Ser Gly Ile Asn Val Gln Tyr Lys Leu His Ser Ser Gly Ala AsnPhe Ser Gly Ile Asn Val Gln Tyr Lys Leu His Ser Ser Gly Ala Asn

435 440 445435 440 445

Cys Ser Thr Leu Gly Val Val Thr Ser Ala Glu Asp Thr Ser Gly IleCys Ser Thr Leu Gly Val Val Thr Ser Ala Glu Asp Thr Ser Gly Ile

450 455 460450 455 460

Leu Phe Val Asn Asp Thr Lys Ala Leu Arg Arg Pro Lys Cys Ala GluLeu Phe Val Asn Asp Thr Lys Ala Leu Arg Arg Pro Lys Cys Ala Glu

465 470 475 480465 470 475 480

Leu His Tyr Met Val Val Ala Thr Asp Gln Gln Thr Ser Arg Gln AlaLeu His Tyr Met Val Val Ala Thr Asp Gln Gln Thr Ser Arg Gln Ala

485 490 495485 490 495

Gln Ala Gln Leu Leu Val Thr Val Glu Gly Ser Tyr Val Ala Glu GluGln Ala Gln Leu Leu Val Thr Val Glu Gly Ser Tyr Val Ala Glu Glu

500 505 510500 505 510

Ala Gly Cys Pro Leu Ser Cys Ala Val Ser Lys Arg Arg Leu Glu CysAla Gly Cys Pro Leu Ser Cys Ala Val Ser Lys Arg Arg Leu Glu Cys

515 520 525515 520 525

Glu Glu Cys Gly Gly Leu Gly Ser Pro Thr Gly Arg Cys Glu Trp ArgGlu Glu Cys Gly Gly Leu Gly Ser Pro Thr Gly Arg Cys Glu Trp Arg

530 535 540530 535 540

Gln Gly Asp Gly Lys Gly Ile Thr Arg Asn Phe Ser Thr Cys Ser ProGln Gly Asp Gly Lys Gly Ile Thr Arg Asn Phe Ser Thr Cys Ser Pro

545 550 555 560545 550 555 560

Ser Thr Lys Thr Cys Pro Asp Gly His Cys Asp Val Val Glu Thr GlnSer Thr Lys Thr Cys Pro Asp Gly His Cys Asp Val Val Glu Thr Gln

565 570 575565 570 575

Asp Ile Asn Ile Cys Pro Gln Asp Cys Leu Arg Gly Ser Ile Val GlyAsp Ile Asn Ile Cys Pro Gln Asp Cys Leu Arg Gly Ser Ile Val Gly

580 585 590580 585 590

Gly His Glu Pro Gly Glu Pro Arg Gly Ile Lys Ala Gly Tyr Gly ThrGly His Glu Pro Gly Glu Pro Arg Gly Ile Lys Ala Gly Tyr Gly Thr

595 600 605595 600 605

Cys Asn Cys Phe Pro Glu Glu Glu Lys Cys Phe Cys Glu Pro Glu AspCys Asn Cys Phe Pro Glu Glu Glu Lys Cys Phe Cys Glu Pro Glu Asp

610 615 620610 615 620

Ile Gln Asp Pro Leu Cys Asp Glu Leu Cys Arg Thr Val Ile Ala AlaIle Gln Asp Pro Leu Cys Asp Glu Leu Cys Arg Thr Val Ile Ala Ala

625 630 635 640625 630 635 640

Ala Val Leu Phe Ser Phe Ile Val Ser Val Leu Leu Ser Ala Phe CysAla Val Leu Phe Ser Phe Ile Val Ser Val Leu Leu Ser Ala Phe Cys

645 650 655645 650 655

Ile His Cys Tyr His Lys Phe Ala His Lys Pro Pro Ile Ser Ser AlaIle His Cys Tyr His Lys Phe Ala His Lys Pro Pro Ile Ser Ser Ala

660 665 670660 665 670

Glu Met Thr Phe Arg Arg Pro Ala Gln Ala Phe Pro Val Ser Tyr SerGlu Met Thr Phe Arg Arg Pro Ala Gln Ala Phe Pro Val Ser Tyr Ser

675 680 685675 680 685

Ser Ser Gly Ala Arg Arg Pro Ser Leu Asp Ser Met Glu Asn Gln ValSer Ser Gly Ala Arg Arg Pro Ser Leu Asp Ser Met Glu Asn Gln Val

690 695 700690 695 700

Ser Val Asp Ala Phe Lys Ile Leu Glu Asp Pro Lys Trp Glu Phe ProSer Val Asp Ala Phe Lys Ile Leu Glu Asp Pro Lys Trp Glu Phe Pro

705 710 715 720705 710 715 720

Arg Lys Asn Leu Val Leu Gly Lys Thr Leu Gly Glu Gly Glu Phe GlyArg Lys Asn Leu Val Leu Gly Lys Thr Leu Gly Glu Gly Glu Phe Gly

725 730 735725 730 735

Lys Val Val Lys Ala Thr Ala Phe His Leu Lys Gly Arg Ala Gly TyrLys Val Val Lys Ala Thr Ala Phe His Leu Lys Gly Arg Ala Gly Tyr

740 745 750740 745 750

Thr Thr Val Ala Val Lys Met Leu Lys Glu Asn Ala Ser Pro Ser GluThr Thr Val Ala Val Lys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu

755 760 765755 760 765

Leu Arg Asp Leu Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn HisLeu Arg Asp Leu Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn His

770 775 780770 775 780

Pro His Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro LeuPro His Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro Leu

785 790 795 800785 790 795 800

Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly Phe LeuLeu Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly Phe Leu

805 810 815805 810 815

Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser Gly Gly SerArg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser Gly Gly Ser

820 825 830820 825 830

Arg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg Ala Leu Thr MetArg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg Ala Leu Thr Met

835 840 845835 840 845

Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser Gln Gly Met Gln TyrGly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser Gln Gly Met Gln Tyr

850 855 860850 855 860

Leu Ala Glu Met Lys Leu Val His Arg Asp Leu Ala Ala Arg Asn IleLeu Ala Glu Met Lys Leu Val His Arg Asp Leu Ala Ala Arg Asn Ile

865 870 875 880865 870 875 880

Leu Val Ala Glu Gly Arg Lys Met Lys Ile Ser Asp Phe Gly Leu SerLeu Val Ala Glu Gly Arg Lys Met Lys Ile Ser Asp Phe Gly Leu Ser

885 890 895885 890 895

Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val Lys Arg Ser Gln Gly ArgArg Asp Val Tyr Glu Glu Asp Ser Tyr Val Lys Arg Ser Gln Gly Arg

900 905 910900 905 910

Ile Pro Val Lys Trp Met Ala Ile Glu Ser Leu Phe Asp His Ile TyrIle Pro Val Lys Trp Met Ala Ile Glu Ser Leu Phe Asp His Ile Tyr

915 920 925915 920 925

Thr Thr Gln Ser Asp Val Trp Ser Phe Gly Val Leu Leu Trp Glu IleThr Thr Gln Ser Asp Val Trp Ser Phe Gly Val Leu Leu Trp Glu Ile

930 935 940930 935 940

Val Thr Leu Gly Gly Asn Pro Tyr Pro Gly Ile Pro Pro Glu Arg LeuVal Thr Leu Gly Gly Asn Pro Tyr Pro Gly Ile Pro Pro Glu Arg Leu

945 950 955 960945 950 955 960

Phe Asn Leu Leu Lys Thr Gly His Arg Met Glu Arg Pro Asp Asn CysPhe Asn Leu Leu Lys Thr Gly His Arg Met Glu Arg Pro Asp Asn Cys

965 970 975965 970 975

Ser Glu Glu Met Tyr Arg Leu Met Leu Gln Cys Trp Lys Gln Glu ProSer Glu Glu Met Tyr Arg Leu Met Leu Gln Cys Trp Lys Gln Glu Pro

980 985 990980 985 990

Asp Lys Arg Pro Val Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys MetAsp Lys Arg Pro Val Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met

995 1000 1005995 1000 1005

Met Val Lys Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr ProMet Val Lys Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro

1010 1015 10201010 1015 1020

Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu ThrSer Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr

1025 1030 10351025 1030 1035

Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu ProPro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro

1040 1045 10501040 1045 1050

Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Met Ser Asp Pro AsnSer Thr Trp Ile Glu Asn Lys Leu Tyr Gly Met Ser Asp Pro Asn

1055 1060 10651055 1060 1065

Trp Pro Gly Glu Ser Pro Val Pro Leu Thr Arg Ala Asp Gly ThrTrp Pro Gly Glu Ser Pro Val Pro Leu Thr Arg Ala Asp Gly Thr

1070 1075 10801070 1075 1080

Asn Thr Gly Phe Pro Arg Tyr Pro Asn Asp Ser Val Tyr Ala AsnAsn Thr Gly Phe Pro Arg Tyr Pro Asn Asp Ser Val Tyr Ala Asn

1085 1090 10951085 1090 1095

Trp Met Leu Ser Pro Ser Ala Ala Lys Leu Met Asp Thr Phe AspTrp Met Leu Ser Pro Ser Ala Ala Lys Leu Met Asp Thr Phe Asp

1100 1105 11101100 1105 1110

SerSer

<210> 32<210> 32

<211> 1072<211> 1072

<212> белок<212> protein

<213> Homo sapiens<213> Homo sapiens

<400> 32<400> 32

Met Ala Lys Ala Thr Ser Gly Ala Ala Gly Leu Arg Leu Leu Leu LeuMet Ala Lys Ala Thr Ser Gly Ala Ala Gly Leu Arg Leu Leu Leu Leu

1. 5 10 151. 5 10 15

Leu Leu Leu Pro Leu Leu Gly Lys Val Ala Leu Gly Leu Tyr Phe SerLeu Leu Leu Pro Leu Leu Gly Lys Val Ala Leu Gly Leu Tyr Phe Ser

20 25 3020 25 30

Arg Asp Ala Tyr Trp Glu Lys Leu Tyr Val Asp Gln Ala Ala Gly ThrArg Asp Ala Tyr Trp Glu Lys Leu Tyr Val Asp Gln Ala Ala Gly Thr

35 40 4535 40 45

Pro Leu Leu Tyr Val His Ala Leu Arg Asp Ala Pro Glu Glu Val ProPro Leu Leu Tyr Val His Ala Leu Arg Asp Ala Pro Glu Glu Val Pro

50 55 6050 55 60

Ser Phe Arg Leu Gly Gln His Leu Tyr Gly Thr Tyr Arg Thr Arg LeuSer Phe Arg Leu Gly Gln His Leu Tyr Gly Thr Tyr Arg Thr Arg Leu

65 70 75 8065 70 75 80

His Glu Asn Asn Trp Ile Cys Ile Gln Glu Asp Thr Gly Leu Leu TyrHis Glu Asn Asn Trp Ile Cys Ile Gln Glu Asp Thr Gly Leu Leu Tyr

85 90 9585 90 95

Leu Asn Arg Ser Leu Asp His Ser Ser Trp Glu Lys Leu Ser Val ArgLeu Asn Arg Ser Leu Asp His Ser Ser Trp Glu Lys Leu Ser Val Arg

100 105 110100 105 110

Asn Arg Gly Phe Pro Leu Leu Thr Val Tyr Leu Lys Val Phe Leu SerAsn Arg Gly Phe Pro Leu Leu Thr Val Tyr Leu Lys Val Phe Leu Ser

115 120 125115 120 125

Pro Thr Ser Leu Arg Glu Gly Glu Cys Gln Trp Pro Gly Cys Ala ArgPro Thr Ser Leu Arg Glu Gly Glu Cys Gln Trp Pro Gly Cys Ala Arg

130 135 140130 135 140

Val Tyr Phe Ser Phe Phe Asn Thr Ser Phe Pro Ala Cys Ser Ser LeuVal Tyr Phe Ser Phe Phe Asn Thr Ser Phe Pro Ala Cys Ser Ser Leu

145 150 155 160145 150 155 160

Lys Pro Arg Glu Leu Cys Phe Pro Glu Thr Arg Pro Ser Phe Arg IleLys Pro Arg Glu Leu Cys Phe Pro Glu Thr Arg Pro Ser Phe Arg Ile

165 170 175165 170 175

Arg Glu Asn Arg Pro Pro Gly Thr Phe His Gln Phe Arg Leu Leu ProArg Glu Asn Arg Pro Pro Gly Thr Phe His Gln Phe Arg Leu Leu Pro

180 185 190180 185 190

Val Gln Phe Leu Cys Pro Asn Ile Ser Val Ala Tyr Arg Leu Leu GluVal Gln Phe Leu Cys Pro Asn Ile Ser Val Ala Tyr Arg Leu Leu Glu

195 200 205195 200 205

Gly Glu Gly Leu Pro Phe Arg Cys Ala Pro Asp Ser Leu Glu Val SerGly Glu Gly Leu Pro Phe Arg Cys Ala Pro Asp Ser Leu Glu Val Ser

210 215 220210 215 220

Thr Arg Trp Ala Leu Asp Arg Glu Gln Arg Glu Lys Tyr Glu Leu ValThr Arg Trp Ala Leu Asp Arg Glu Gln Arg Glu Lys Tyr Glu Leu Val

225 230 235 240225 230 235 240

Ala Val Cys Thr Val His Ala Gly Ala Arg Glu Glu Val Val Met ValAla Val Cys Thr Val His Ala Gly Ala Arg Glu Glu Val Val Met Val

245 250 255245 250 255

Pro Phe Pro Val Thr Val Tyr Asp Glu Asp Asp Ser Ala Pro Thr PhePro Phe Pro Val Thr Val Tyr Asp Glu Asp Asp Ser Ala Pro Thr Phe

260 265 270260 265 270

Pro Ala Gly Val Asp Thr Ala Ser Ala Val Val Glu Phe Lys Arg LysPro Ala Gly Val Asp Thr Ala Ser Ala Val Val Glu Phe Lys Arg Lys

275 280 285275 280 285

Glu Asp Thr Val Val Ala Thr Leu Arg Val Phe Asp Ala Asp Val ValGlu Asp Thr Val Val Ala Thr Leu Arg Val Phe Asp Ala Asp Val Val

290 295 300290 295 300

Pro Ala Ser Gly Glu Leu Val Arg Arg Tyr Thr Ser Thr Leu Leu ProPro Ala Ser Gly Glu Leu Val Arg Arg Tyr Thr Ser Thr Leu Leu Pro

305 310 315 320305 310 315 320

Gly Asp Thr Trp Ala Gln Gln Thr Phe Arg Val Glu His Trp Pro AsnGly Asp Thr Trp Ala Gln Gln Thr Phe Arg Val Glu His Trp Pro Asn

325 330 335325 330 335

Glu Thr Ser Val Gln Ala Asn Gly Ser Phe Val Arg Ala Thr Val HisGlu Thr Ser Val Gln Ala Asn Gly Ser Phe Val Arg Ala Thr Val His

340 345 350340 345 350

Asp Tyr Arg Leu Val Leu Asn Arg Asn Leu Ser Ile Ser Glu Asn ArgAsp Tyr Arg Leu Val Leu Asn Arg Asn Leu Ser Ile Ser Glu Asn Arg

355 360 365355 360 365

Thr Met Gln Leu Ala Val Leu Val Asn Asp Ser Asp Phe Gln Gly ProThr Met Gln Leu Ala Val Leu Val Asn Asp Ser Asp Phe Gln Gly Pro

370 375 380370 375 380

Gly Ala Gly Val Leu Leu Leu His Phe Asn Val Ser Val Leu Pro ValGly Ala Gly Val Leu Leu Leu His Phe Asn Val Ser Val Leu Pro Val

385 390 395 400385 390 395 400

Ser Leu His Leu Pro Ser Thr Tyr Ser Leu Ser Val Ser Arg Arg AlaSer Leu His Leu Pro Ser Thr Tyr Ser Leu Ser Val Ser Arg Arg Ala

405 410 415405 410 415

Arg Arg Phe Ala Gln Ile Gly Lys Val Cys Val Glu Asn Cys Gln AlaArg Arg Phe Ala Gln Ile Gly Lys Val Cys Val Glu Asn Cys Gln Ala

420 425 430420 425 430

Phe Ser Gly Ile Asn Val Gln Tyr Lys Leu His Ser Ser Gly Ala AsnPhe Ser Gly Ile Asn Val Gln Tyr Lys Leu His Ser Ser Gly Ala Asn

435 440 445435 440 445

Cys Ser Thr Leu Gly Val Val Thr Ser Ala Glu Asp Thr Ser Gly IleCys Ser Thr Leu Gly Val Val Thr Ser Ala Glu Asp Thr Ser Gly Ile

450 455 460450 455 460

Leu Phe Val Asn Asp Thr Lys Ala Leu Arg Arg Pro Lys Cys Ala GluLeu Phe Val Asn Asp Thr Lys Ala Leu Arg Arg Pro Lys Cys Ala Glu

465 470 475 480465 470 475 480

Leu His Tyr Met Val Val Ala Thr Asp Gln Gln Thr Ser Arg Gln AlaLeu His Tyr Met Val Val Ala Thr Asp Gln Gln Thr Ser Arg Gln Ala

485 490 495485 490 495

Gln Ala Gln Leu Leu Val Thr Val Glu Gly Ser Tyr Val Ala Glu GluGln Ala Gln Leu Leu Val Thr Val Glu Gly Ser Tyr Val Ala Glu Glu

500 505 510500 505 510

Ala Gly Cys Pro Leu Ser Cys Ala Val Ser Lys Arg Arg Leu Glu CysAla Gly Cys Pro Leu Ser Cys Ala Val Ser Lys Arg Arg Leu Glu Cys

515 520 525515 520 525

Glu Glu Cys Gly Gly Leu Gly Ser Pro Thr Gly Arg Cys Glu Trp ArgGlu Glu Cys Gly Gly Leu Gly Ser Pro Thr Gly Arg Cys Glu Trp Arg

530 535 540530 535 540

Gln Gly Asp Gly Lys Gly Ile Thr Arg Asn Phe Ser Thr Cys Ser ProGln Gly Asp Gly Lys Gly Ile Thr Arg Asn Phe Ser Thr Cys Ser Pro

545 550 555 560545 550 555 560

Ser Thr Lys Thr Cys Pro Asp Gly His Cys Asp Val Val Glu Thr GlnSer Thr Lys Thr Cys Pro Asp Gly His Cys Asp Val Val Glu Thr Gln

565 570 575565 570 575

Asp Ile Asn Ile Cys Pro Gln Asp Cys Leu Arg Gly Ser Ile Val GlyAsp Ile Asn Ile Cys Pro Gln Asp Cys Leu Arg Gly Ser Ile Val Gly

580 585 590580 585 590

Gly His Glu Pro Gly Glu Pro Arg Gly Ile Lys Ala Gly Tyr Gly ThrGly His Glu Pro Gly Glu Pro Arg Gly Ile Lys Ala Gly Tyr Gly Thr

595 600 605595 600 605

Cys Asn Cys Phe Pro Glu Glu Glu Lys Cys Phe Cys Glu Pro Glu AspCys Asn Cys Phe Pro Glu Glu Glu Lys Cys Phe Cys Glu Pro Glu Asp

610 615 620610 615 620

Ile Gln Asp Pro Leu Cys Asp Glu Leu Cys Arg Thr Val Ile Ala AlaIle Gln Asp Pro Leu Cys Asp Glu Leu Cys Arg Thr Val Ile Ala Ala

625 630 635 640625 630 635 640

Ala Val Leu Phe Ser Phe Ile Val Ser Val Leu Leu Ser Ala Phe CysAla Val Leu Phe Ser Phe Ile Val Ser Val Leu Leu Ser Ala Phe Cys

645 650 655645 650 655

Ile His Cys Tyr His Lys Phe Ala His Lys Pro Pro Ile Ser Ser AlaIle His Cys Tyr His Lys Phe Ala His Lys Pro Pro Ile Ser Ser Ala

660 665 670660 665 670

Glu Met Thr Phe Arg Arg Pro Ala Gln Ala Phe Pro Val Ser Tyr SerGlu Met Thr Phe Arg Arg Pro Ala Gln Ala Phe Pro Val Ser Tyr Ser

675 680 685675 680 685

Ser Ser Gly Ala Arg Arg Pro Ser Leu Asp Ser Met Glu Asn Gln ValSer Ser Gly Ala Arg Arg Pro Ser Leu Asp Ser Met Glu Asn Gln Val

690 695 700690 695 700

Ser Val Asp Ala Phe Lys Ile Leu Glu Asp Pro Lys Trp Glu Phe ProSer Val Asp Ala Phe Lys Ile Leu Glu Asp Pro Lys Trp Glu Phe Pro

705 710 715 720705 710 715 720

Arg Lys Asn Leu Val Leu Gly Lys Thr Leu Gly Glu Gly Glu Phe GlyArg Lys Asn Leu Val Leu Gly Lys Thr Leu Gly Glu Gly Glu Phe Gly

725 730 735725 730 735

Lys Val Val Lys Ala Thr Ala Phe His Leu Lys Gly Arg Ala Gly TyrLys Val Val Lys Ala Thr Ala Phe His Leu Lys Gly Arg Ala Gly Tyr

740 745 750740 745 750

Thr Thr Val Ala Val Lys Met Leu Lys Glu Asn Ala Ser Pro Ser GluThr Thr Val Ala Val Lys Met Leu Lys Glu Asn Ala Ser Pro Ser Glu

755 760 765755 760 765

Leu Arg Asp Leu Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn HisLeu Arg Asp Leu Leu Ser Glu Phe Asn Val Leu Lys Gln Val Asn His

770 775 780770 775 780

Pro His Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro LeuPro His Val Ile Lys Leu Tyr Gly Ala Cys Ser Gln Asp Gly Pro Leu

785 790 795 800785 790 795 800

Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly Phe LeuLeu Leu Ile Val Glu Tyr Ala Lys Tyr Gly Ser Leu Arg Gly Phe Leu

805 810 815805 810 815

Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser Gly Gly SerArg Glu Ser Arg Lys Val Gly Pro Gly Tyr Leu Gly Ser Gly Gly Ser

820 825 830820 825 830

Arg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg Ala Leu Thr MetArg Asn Ser Ser Ser Leu Asp His Pro Asp Glu Arg Ala Leu Thr Met

835 840 845835 840 845

Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser Gln Gly Met Gln TyrGly Asp Leu Ile Ser Phe Ala Trp Gln Ile Ser Gln Gly Met Gln Tyr

850 855 860850 855 860

Leu Ala Glu Met Lys Leu Val His Arg Asp Leu Ala Ala Arg Asn IleLeu Ala Glu Met Lys Leu Val His Arg Asp Leu Ala Ala Arg Asn Ile

865 870 875 880865 870 875 880

Leu Val Ala Glu Gly Arg Lys Met Lys Ile Ser Asp Phe Gly Leu SerLeu Val Ala Glu Gly Arg Lys Met Lys Ile Ser Asp Phe Gly Leu Ser

885 890 895885 890 895

Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val Lys Arg Ser Gln Gly ArgArg Asp Val Tyr Glu Glu Asp Ser Tyr Val Lys Arg Ser Gln Gly Arg

900 905 910900 905 910

Ile Pro Val Lys Trp Met Ala Ile Glu Ser Leu Phe Asp His Ile TyrIle Pro Val Lys Trp Met Ala Ile Glu Ser Leu Phe Asp His Ile Tyr

915 920 925915 920 925

Thr Thr Gln Ser Asp Val Trp Ser Phe Gly Val Leu Leu Trp Glu IleThr Thr Gln Ser Asp Val Trp Ser Phe Gly Val Leu Leu Trp Glu Ile

930 935 940930 935 940

Val Thr Leu Gly Gly Asn Pro Tyr Pro Gly Ile Pro Pro Glu Arg LeuVal Thr Leu Gly Gly Asn Pro Tyr Pro Gly Ile Pro Pro Glu Arg Leu

945 950 955 960945 950 955 960

Phe Asn Leu Leu Lys Thr Gly His Arg Met Glu Arg Pro Asp Asn CysPhe Asn Leu Leu Lys Thr Gly His Arg Met Glu Arg Pro Asp Asn Cys

965 970 975965 970 975

Ser Glu Glu Met Tyr Arg Leu Met Leu Gln Cys Trp Lys Gln Glu ProSer Glu Glu Met Tyr Arg Leu Met Leu Gln Cys Trp Lys Gln Glu Pro

980 985 990980 985 990

Asp Lys Arg Pro Val Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys MetAsp Lys Arg Pro Val Phe Ala Asp Ile Ser Lys Asp Leu Glu Lys Met

995 1000 1005995 1000 1005

Met Val Lys Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr ProMet Val Lys Arg Arg Asp Tyr Leu Asp Leu Ala Ala Ser Thr Pro

1010 1015 10201010 1015 1020

Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu ThrSer Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser Glu Glu Glu Thr

1025 1030 10351025 1030 1035

Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu ProPro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg Ala Leu Pro

1040 1045 10501040 1045 1050

Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Arg Ile Ser His AlaSer Thr Trp Ile Glu Asn Lys Leu Tyr Gly Arg Ile Ser His Ala

1055 1060 10651055 1060 1065

Phe Thr Arg PhePhe Thr Arg Phe

10701070

<210> 33<210> 33

<211> 26<211> 26

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 33<400> 33

tgtccagctt tgtgcctgat tgatgt 26tgtccagctt tgtgcctgat tgatgt 26

<210> 34<210> 34

<211> 26<211> 26

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 34<400> 34

gctgggcact gaagagaaag gaatgc 26gctgggcact gaagagaaag gaatgc 26

<210> 35<210> 35

<211> 24<211> 24

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 35<400> 35

agcaggatga gtgcggaggc aagc 24agcaggatga gtgcggaggc aagc 24

<210> 36<210> 36

<211> 33<211> 33

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 36<400> 36

ttaactatca aacgtgtcca ttaattttgc cgc 33ttaactatca aacgtgtcca ttaattttgc cgc 33

<210> 37<210> 37

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 37<400> 37

agtactgggg tggctggg 18agtactgggg tggctggg 18

<210> 38<210> 38

<211> 19<211> 19

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 38<400> 38

cactttggac aaggagatg 19cactttggac aaggatg 19

<210> 39<210> 39

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 39<400> 39

acagaactgg agctgcgg 18acagaactgg agctgcgg 18

<210> 40<210> 40

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 40<400> 40

ggactggtgt actcgctg 18ggactggtgt actcgctg 18

<210> 41<210> 41

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 41<400> 41

tcctagactg caggaaacac 20tcctagactg caggaaacac 20

<210> 42<210> 42

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 42<400> 42

catcgagaaa gtccagac 18catcgagaaa gtccagac 18

<210> 43<210> 43

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 43<400> 43

gctgctggag acattgaa 18gctgctggag acattgaa 18

<210> 44<210> 44

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 44<400> 44

tcactgctgc tcagctca 18tcactgctgc tcagctca 18

<210> 45<210> 45

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 45<400> 45

gaggatccaa agtgggaatt 20gaggatccaa agtgggaatt 20

<210> 46<210> 46

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 46<400> 46

agtatctggc cgagatgaag 20agtatctggc cgagatgaag 20

<210> 47<210> 47

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 47<400> 47

gcaaagacct ggagaagatg 20gcaaagacct ggagaagatg 20

<210> 48<210> 48

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 48<400> 48

aggacgttga actctgacag 20aggacgttga actctgacag 20

<210> 49<210> 49

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 49<400> 49

cctttgcttc atccagaatc 20cctttgcttc atccagaatc 20

<210> 50<210> 50

<211> 22<211> 22

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 50<400> 50

gattttgtgt ttctccagct ct 22gattttgtgt ttctccagct ct 22

<210> 51<210> 51

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 51<400> 51

cctgcttctc tgaggaagaa 20cctgcttctc tgaggaagaa 20

<210> 52<210> 52

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 52<400> 52

gggccttagt ctcagcaaac 20gggccttagt ctcagcaaac 20

<210> 53<210> 53

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 53<400> 53

gagcactctg cgtgaactta 20gagcactctg cgtgaactta 20

<210> 54<210> 54

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 54<400> 54

cagcttgttc atggtactga t 21cagcttgttc atggtactga t 21

<210> 55<210> 55

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 55<400> 55

tggtgagtcc ttcaccag 18tggtgagtcc ttcaccag 18

<210> 56<210> 56

<211> 22<211> 22

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 56<400> 56

cctagagttt ttccaagaac ca 22cctagagttt ttccaagaac ca 22

<210> 57<210> 57

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 57<400> 57

catttaactg gaatccgacc 20catttaactggaatccgacc 20

<210> 58<210> 58

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 58<400> 58

gactctctcc aggccagttc 20gactctctcc aggccagttc 20

<210> 59<210> 59

<211> 22<211> 22

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 59<400> 59

ggctatcaga agtaaaacca cc 22ggctatcaga agtaaaacca cc 22

<210> 60<210> 60

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 60<400> 60

cgagagctga tggcacta 18cgagagctga tggcacta 18

<210> 61<210> 61

<211> 24<211> 24

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 61<400> 61

cttcatcaca agtgaagtac ttcc 24cttcatcaca agtgaagtac ttcc 24

<210> 62<210> 62

<211> 19<211> 19

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 62<400> 62

cgtactccac gatgaggag 19cgtactccac gatgaggag 19

<210> 63<210> 63

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 63<400> 63

gattctggat gaagcaaagg 20gattctggat gaagcaaagg 20

<210> 64<210> 64

<211> 24<211> 24

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 64<400> 64

ggaagtactt cacttgtgat gaag 24ggaagtactt cacttgtgat gaag 24

<210> 65<210> 65

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 65<400> 65

cccagccacc ccagtact 18cccagccacc ccagtact 18

<210> 66<210> 66

<211> 17<211> 17

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 66<400> 66

gtaaaacgac ggccagt 17gtaaaacgac ggccagt 17

<210> 67<210> 67

<211> 17<211> 17

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 67<400> 67

gttttcccag tcacgac 17gttttcccag tcacgac 17

<210> 68<210> 68

<211> 17<211> 17

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 68<400> 68

caggaaacag ctatgac 17caggaaacag ctatgac 17

<210> 69<210> 69

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 69<400> 69

ctggagccac agtacccact 20ctggagccac agtaccact 20

<210> 70<210> 70

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 70<400> 70

tccaaattcg ccttctccta 20tccaaattcg ccttctccta 20

<210> 71<210> 71

<211> 25<211> 25

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 71<400> 71

ttcatcagcc ttcctcaggg aggat 25ttcatcagcc ttcctcaggg aggat 25

<210> 72<210> 72

<211> 41<211> 41

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 72<400> 72

ggggacaagt ttgtacaaaa aagcaggctt cgccaccagc a 41ggggacaagt ttgtacaaaa aagcaggctt cgccaccagc a 41

<210> 73<210> 73

<211> 42<211> 42

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер<223> primer

<400> 73<400> 73

ggggaccact ttgtacaaga aagctgggtt ttaactatca aa 42ggggaccact ttgtacaaga aagctgggtt ttaactatca aa 42

<210> 74<210> 74

<211> 21<211> 21

<212> РНК<212> RNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> RET siРНК1<223> RET siRNA1

<220><220>

<221> разное<221> miscellaneous

<223> n обозначает тимин<223> n stands for thymine

<220><220>

<221> разное<221> miscellaneous

<222> (20)..(21)<222> (20)..(21)

<223> n обозначает тимин<223> n stands for thymine

<400> 74<400> 74

cacaugucau caaauuguan n 21cacaugucau caaauuguan n 21

<210> 75<210> 75

<211> 21<211> 21

<212> РНК<212> RNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> RET siРНК2<223> RET siRNA2

<220><220>

<221> разное<221> miscellaneous

<222> (20)..(21)<222> (20)..(21)

<223> n обозначает тимин<223> n stands for thymine

<400> 75<400> 75

ggauugaaaa caaacucuan n 21ggauugaaaa caaacucuan n 21

<210> 76<210> 76

<211> 21<211> 21

<212> РНК<212> RNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> RET siРНК<223> RET siRNA

<220><220>

<221> разное<221> miscellaneous

<222> (20)..(21)<222> (20)..(21)

<223> n обозначает тимин<223> n stands for thymine

<400> 76<400> 76

gcuugucccg agauguuuan n 21gcuugucccg agauguuuan n 21

<210> 77<210> 77

<211> 21<211> 21

<212> РНК<212> RNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> RET siРНК3<223> RET siRNA3

<220><220>

<221> разное<221> miscellaneous

<222> (20)..(21)<222> (20)..(21)

<223> n обозначает тимин<223> n stands for thymine

<400> 77<400> 77

ccacugcuac cacaaguuun n 21ccacugcuac cacaaguuun n 21

<---<---

Claims (71)

Translated fromRussian
1. Слитый полипептид, имеющий киназную активность и эффект вызова пролиферации клеток, в котором N-концевая часть белка DCTN1 слита с C-концевой частью белка RET, выбранный из следующих (a) или (b):1. A fusion polypeptide having kinase activity and cell proliferation inducing effect, in which the N-terminal portion of the DCTN1 protein is fused to the C-terminal portion of the RET protein, selected from the following (a) or (b):(a) полипептид, содержащий аминокислотную последовательность, представленную SEQ ID NO: 18; или(a) a polypeptide containing the amino acid sequence represented by SEQ ID NO: 18; or(b) полипептид, содержащий аминокислотную последовательность, где от 1 до 10 аминокислот заменены, делетированы или добавлены в аминокислотной последовательности, представленной SEQ ID NO: 18.(b) a polypeptide comprising an amino acid sequence wherein from 1 to 10 amino acids are replaced, deleted or added in the amino acid sequence represented by SEQ ID NO: 18.2. Полинуклеотид, кодирующий слитый полипептид по п.1.2. A polynucleotide encoding the fusion polypeptide according to claim 1.3. Полинуклеотид по п.2, выбранный из следующих (d) и (e):3. The polynucleotide according to claim 2, selected from the following (d) and (e):(d) полинуклеотид, кодирующий полипептид, содержащий аминокислотную последовательность, представленную SEQ ID NO: 18;(d) a polynucleotide encoding a polypeptide containing the amino acid sequence represented by SEQ ID NO: 18;(e) полинуклеотид, кодирующий полипептид, содержащий аминокислотную последовательность, где от 1 до 10 аминокислот заменены, делетированы или добавлены в аминокислотной последовательности, представленной SEQ ID NO: 18.(e) a polynucleotide encoding a polypeptide containing an amino acid sequence wherein from 1 to 10 amino acids are replaced, deleted or added in the amino acid sequence represented by SEQ ID NO: 18.4. Полинуклеотид по п.2, выбранный из следующих (g) и (h):4. The polynucleotide according to claim 2, selected from the following (g) and (h):(g) полинуклеотид, содержащий последовательность оснований, представленную SEQ ID NO: 17;(g) a polynucleotide containing the base sequence represented by SEQ ID NO: 17;(h) полинуклеотид, гибридизующийся в строгих условиях с полинуклеотидом, содержащим последовательность оснований, комплементарную последовательности оснований, представленной SEQ ID NO: 17.(h) a polynucleotide that hybridizes under stringent conditions to a polynucleotide containing a base sequence complementary to the base sequence represented by SEQ ID NO: 17.5. Экспрессирующий вектор, содержащий полинуклеотид по любому из пп. 2-4.5. An expression vector containing a polynucleotide according to any one of claims. 2-4.6. Клетка, трансфицированная экспрессирующим вектором по п.5, причем клетка экспрессирует полипептид по п.1.6. A cell transfected with the expression vector of claim 5, wherein the cell expresses the polypeptide of claim 1.7. Способ детекции присутствия слитого полипептида по п.1 в образце, включающий следующие стадии:7. A method for detecting the presence of a fusion polypeptide according to claim 1 in a sample, comprising the following steps:1) контактирование образца с антителом, которое специфически связывается с полипептидом, содержащим точку слияния N-концевой части белка DCTN1 и C-концевой части белка RET в слитом полипептиде по п.1;1) contacting the sample with an antibody that specifically binds to a polypeptide containing the fusion point of the N-terminal part of the DCTN1 protein and the C-terminal part of the RET protein in the fusion polypeptide according to claim 1;2) детекция антитела, слитого с образцом.2) detection of antibody fused to the sample.8. Праймер для детекции присутствия полинуклеотида по любому из пп. 2-4 в образце, причем праймер содержит полинуклеотид, представленный (i) SEQ ID NO: 69.8. Primer for detecting the presence of a polynucleotide according to any one of claims. 2-4 in the sample, wherein the primer contains the polynucleotide represented by (i) SEQ ID NO: 69.9. Зонд для детекции присутствия полинуклеотида по любому из пп. 2-4 в образце, причем зонд содержит полинуклеотид, представленный (iii) SEQ ID NO: 71.9. Probe for detecting the presence of a polynucleotide according to any one of claims. 2-4 in the sample, wherein the probe contains the polynucleotide represented by (iii) SEQ ID NO: 71.10. Способ детекции присутствия полинуклеотида по любому из пп. 2-4 в образце, включающий следующие стадии:10. A method for detecting the presence of a polynucleotide according to any one of claims. 2-4 in a sample, including the following steps:1) контактирование образца с праймером по п.8 или зондом по п.9;1) contacting the sample with the primer according to claim 8 or the probe according to claim 9;2) детекция праймера/зонда, гибридизованного с образцом.2) detection of primer/probe hybridized with the sample.11. Способ диагностики злокачественной опухоли щитовидной железы у пациента, включающий детекцию слитого полипептида по п.1 в образце, полученном от пациента, посредством способа детекции по п.7, причем11. A method for diagnosing a malignant tumor of the thyroid gland in a patient, comprising detecting the fusion polypeptide of claim 1 in a sample obtained from the patient by means of the detection method of claim 7, whereinкогда присутствие слитого полипептида по п.1 детектируют в образце, полученном от пациента, тогда пациента диагностируют как пациента со злокачественной опухолью.when the presence of the fusion polypeptide according to claim 1 is detected in a sample obtained from a patient, then the patient is diagnosed as a patient with a malignant tumor.12. Способ диагностики злокачественной опухоли щитовидной железы у пациента, включающий детекцию полинуклеотида по любому из пп. 2-4 в образце, полученном от пациента, посредством способа детекции по п.10, причем12. A method for diagnosing a malignant tumor of the thyroid gland in a patient, including detection of a polynucleotide according to any one of claims. 2-4 in a sample obtained from a patient by means of the detection method according to claim 10, whereinкогда присутствие полинуклеотида по любому из пп. 2-4 детектируют в образце, полученном от пациента, тогда пациента диагностируют как пациента со злокачественной опухолью.when the presence of a polynucleotide according to any one of claims. 2-4 are detected in the sample obtained from the patient, then the patient is diagnosed as a patient with a malignant tumor.13. Способ скрининга соединения, ингибирующего экспрессию и/или активность слитого полипептида по п.1, включающий следующие стадии (1) и (2):13. A method for screening a compound that inhibits the expression and/or activity of a fusion polypeptide according to claim 1, comprising the following steps (1) and (2):(1) стадию приведения слитого полипептида по п.1 в контакт с тестируемым соединением; и(1) the step of contacting the fusion polypeptide of claim 1 with a test compound; And(2) стадию измерения того, ингибирована ли активность слитого полипептида по п.1 на стадии (1).(2) the step of measuring whether the activity of the fusion polypeptide according to claim 1 is inhibited in step (1).14. Способ скрининга соединения, ингибирующего экспрессию и/или активность слитого полипептида по п.1, включающий следующие стадии (1) и (2):14. A method for screening a compound that inhibits the expression and/or activity of a fusion polypeptide according to claim 1, comprising the following steps (1) and (2):(1) стадию приведения клетки, экспрессирующей слитый полипептид по п.1, в контакт с тестируемым соединением; и(1) the step of bringing a cell expressing the fusion polypeptide according to claim 1 into contact with a test compound; And(2) стадию измерения того, ингибирован ли рост клетки на стадии (1).(2) a step of measuring whether cell growth is inhibited in step (1).15. Способ скрининга соединения, ингибирующего экспрессию и/или активность слитого полипептида по п.1, включающий следующие стадии (1) и (2):15. A method for screening a compound that inhibits the expression and/or activity of a fusion polypeptide according to claim 1, comprising the following steps (1) and (2):(1) стадию приведения клетки по п.6 в контакт с тестируемым соединением; и(1) the step of bringing the cell according to claim 6 into contact with the test compound; And(2) стадию измерения того, ингибирован ли рост клетки на стадии (1).(2) a step of measuring whether cell growth is inhibited in step (1).16. Способ скрининга соединения, ингибирующего экспрессию полинуклеотида по любому из пп. 2-4, включающий следующие стадии (1) и (2):16. A method for screening a compound that inhibits the expression of a polynucleotide according to any one of claims. 2-4, including the following steps (1) and (2):(1) стадию приведения клетки по п.6 в контакт с тестируемым соединением; и(1) the step of bringing the cell according to claim 6 into contact with the test compound; And(2) стадию измерения того, ингибирована ли экспрессия полинуклеотида по любому из пп. 2-4 в указанной клетке на стадии (1), или ингибирован ли рост указанной клетки на стадии (1).(2) the step of measuring whether expression of the polynucleotide according to any one of claims is inhibited. 2-4 in the specified cell at stage (1), or whether the growth of the specified cell at stage (1) is inhibited.17. Способ с использованием слитого полипептида по п.1 в качестве индикатора для определения того, является ли эффективной химиотерапия с использованием соединения, ингибирующего RET,17. A method using the fusion polypeptide of claim 1 as an indicator for determining whether chemotherapy using a RET inhibitory compound is effective,включающий определение того, что химиотерапия с использованием соединения, ингибирующего RET, является эффективной, когда слитый полипептид по п.1 детектируют в образце посредством способа детекции по п.7.comprising determining that chemotherapy using a RET inhibitory compound is effective when the fusion polypeptide of claim 1 is detected in the sample by the detection method of claim 7.18. Способ с использованием полинуклеотида по любому из пп. 2-4 в качестве индикатора для определения того, является ли эффективной химиотерапия с использованием соединения, ингибирующего RET,18. Method using a polynucleotide according to any one of paragraphs. 2-4 as an indicator to determine whether chemotherapy using a RET inhibitory compound is effective,включающий определение того, что химиотерапия с использованием соединения, ингибирующего RET, является эффективной, когда присутствие полинуклеотида по любому из пп. 2-4 детектируют в образце посредством способа детекции по п.10.comprising determining that chemotherapy using a RET inhibitory compound is effective when the presence of a polynucleotide according to any one of claims. 2-4 are detected in the sample using the detection method according to claim 10.19. Биомаркер для детекции злокачественной опухоли щитовидной железы, экспрессирующей слитый ген DCTN1-RET, содержащий полинуклеотид по любому из пп. 2-4.19. Biomarker for detection of a malignant thyroid tumor expressing the DCTN1-RET fusion gene containing a polynucleotide according to any one of claims. 2-4.20. Биомаркер для детекции злокачественной опухоли щитовидной железы, экспрессирующей слитый ген DCTN1-RET, содержащий слитый полипептид по п.1.20. Biomarker for detection of a malignant thyroid tumor expressing the DCTN1-RET fusion gene containing the fusion polypeptide according to claim 1.21. Способ лечения злокачественной опухоли щитовидной железы, которая является положительной в отношении экспрессии полинуклеотида по любому из пп. 2-4, включающий21. A method of treating a malignant tumor of the thyroid gland, which is positive for the expression of a polynucleotide according to any one of claims. 2-4, includingпроведение химиотерапии с использованием соединения, ингибирующего RET, для пациента со злокачественной опухолью, положительного в отношении экспрессии полинуклеотида по любому из пп. 2-4.administering chemotherapy using a compound that inhibits RET to a patient with a malignant tumor positive for the expression of a polynucleotide according to any one of claims. 2-4.22. Способ лечения злокачественной опухоли щитовидной железы, которая является положительной в отношении слитого полипептида по п.1, включающий22. A method of treating a thyroid cancer that is positive for a fusion polypeptide according to claim 1, comprisingпроведение химиотерапии с использованием соединения, ингибирующего RET, для пациента со злокачественной опухолью, положительного в отношении экспрессии слитого полипептида по п.1.administering chemotherapy using a RET inhibitory compound to a patient with a cancer positive for expression of the fusion polypeptide of claim 1.23. Способ лечения злокачественной опухоли щитовидной железы, которая является положительной в отношении экспрессии гена полинуклеотида по любому из пп. 2-4, включающий23. A method for treating a malignant tumor of the thyroid gland, which is positive for polynucleotide gene expression according to any one of claims. 2-4, includingдетекцию присутствия полинуклеотида по любому из пп. 2-4 в образце, полученном от тестируемого субъекта, иdetecting the presence of a polynucleotide according to any one of claims. 2-4 in a sample obtained from a test subject, andпроведение химиотерапии с использованием соединения, ингибирующего RET, для тестируемого субъекта, когда детектировано присутствие полинуклеотида по любому из пп. 2-4.administering chemotherapy using a RET inhibitory compound to a test subject when the presence of a polynucleotide according to any one of claims is detected. 2-4.24. Способ лечения злокачественной опухоли щитовидной железы, которая является положительной в отношении экспрессии слитого полипептида по п.1, включающий24. A method of treating a thyroid cancer that is positive for expression of a fusion polypeptide according to claim 1, comprisingдетекцию присутствия слитого полипептида по п.1 в образце, полученном от тестируемого субъекта, иdetecting the presence of a fusion polypeptide according to claim 1 in a sample obtained from a test subject, andпроведение химиотерапии с использованием соединения, ингибирующего RET, для тестируемого субъекта, когда детектировано присутствие слитого полипептида по п.1.administering chemotherapy using a RET inhibitory compound to a test subject when the presence of the fusion polypeptide of claim 1 is detected.25. Применение соединения, ингибирующего RET, для лечения пациента со злокачественной опухолью щитовидной железы, положительного в отношении экспрессии гена полинуклеотида по любому из пп. 2-4.25. The use of a compound inhibiting RET for the treatment of a patient with a malignant tumor of the thyroid gland, positive for gene expression of the polynucleotide according to any one of claims. 2-4.26. Применение соединения, ингибирующего RET, для лечения пациента со злокачественной опухолью щитовидной железы, положительного в отношении экспрессии слитого полипептида по п.1.26. Use of a RET inhibitory compound for treating a patient with thyroid cancer positive for expression of the fusion polypeptide of claim 1.27. Применение соединения, ингибирующего RET, для получения фармацевтической композиции для лечения злокачественной опухоли щитовидной железы для лечения пациента со злокачественной опухолью, положительного в отношении экспрессии гена полинуклеотида по любому из пп. 2-4.27. The use of a compound inhibiting RET for the preparation of a pharmaceutical composition for the treatment of a malignant tumor of the thyroid gland for the treatment of a patient with a malignant tumor positive for polynucleotide gene expression according to any one of claims. 2-4.28. Применение соединения, ингибирующего RET, для получения фармацевтической композиции для лечения злокачественной опухоли щитовидной железы для лечения пациента со злокачественной опухолью, положительного в отношении экспрессии слитого полипептида по п.1.28. Use of a RET inhibitory compound for the preparation of a pharmaceutical composition for the treatment of thyroid cancer for treating a patient with cancer positive for expression of the fusion polypeptide of claim 1.29. Способ получения реагента для определения того, является ли химиотерапия с использованием соединения, ингибирующего RET, эффективной, с использованием средств для детекции присутствия слитого полипептида по п.1 в образце, и/или средств для детекции присутствия полинуклеотида по любому из пп. 2-4 в образце.29. A method for producing a reagent for determining whether chemotherapy using a RET inhibitory compound is effective, using means for detecting the presence of a fusion polypeptide according to claim 1 in a sample, and/or means for detecting the presence of a polynucleotide according to any one of claims. 2-4 per sample.30. Комбинация антитела к DCTN1 и антитела к RET для детекции присутствия слитого полипептида по п.1.30. A combination of an anti-DCTN1 antibody and an anti-RET antibody for detecting the presence of a fusion polypeptide according to claim 1.31. Применение комбинации антител по п.30 в получении детектирующего реагента для детекции присутствия слитого полипептида по п.1.31. Use of the combination of antibodies according to claim 30 in the preparation of a detection reagent for detecting the presence of the fusion polypeptide according to claim 1.32. Применение праймера по п.8 или зонда по п.9 для получения детектирующего реагента для детекции присутствия полинуклеотида по любому из пп. 2-4.32. Use of a primer according to claim 8 or a probe according to claim 9 to obtain a detection reagent for detecting the presence of a polynucleotide according to any one of claims. 2-4.33. Применение соединения, ингибирующего RET, в лечении злокачественной опухоли щитовидной железы, где лечение осуществляют способом, включающим33. Use of a RET inhibitory compound in the treatment of thyroid cancer, wherein the treatment is carried out by a method comprising:проведение химиотерапии с использованием соединения, ингибирующего RET, для пациента со злокачественной опухолью, положительного в отношении экспрессии гена полинуклеотида по любому из пп. 2-4.administering chemotherapy using a compound that inhibits RET to a patient with a malignant tumor positive for polynucleotide gene expression according to any one of claims. 2-4.34. Применение соединения, ингибирующего RET, в лечении злокачественной опухоли щитовидной железы, где лечение осуществляют способом, включающим34. Use of a RET inhibitory compound in the treatment of thyroid cancer, wherein the treatment is carried out by a method comprising:проведение химиотерапии с использованием соединения, ингибирующего RET, для пациента со злокачественной опухолью, положительного в отношении экспрессии слитого полипептида по п.1.administering chemotherapy using a RET inhibitory compound to a patient with a cancer positive for expression of the fusion polypeptide of claim 1.35. Применение соединения, ингибирующего RET, в лечении злокачественной опухоли щитовидной железы, где лечение осуществляют способом, включающим35. Use of a RET inhibitory compound in the treatment of thyroid cancer, wherein the treatment is carried out by a method comprising:детекцию присутствия слитого полипептида по п.1 в образце, полученном от тестируемого субъекта, иdetecting the presence of a fusion polypeptide according to claim 1 in a sample obtained from a test subject, andпроведение химиотерапии с использованием соединения, ингибирующего RET, для тестируемого субъекта, когда детектировано присутствие слитого полипептида по п.1.administering chemotherapy using a RET inhibitory compound to a test subject when the presence of the fusion polypeptide of claim 1 is detected.36. Применение соединения, ингибирующего RET, в лечении злокачественной опухоли щитовидной железы, где лечение осуществляют способом, включающим36. Use of a RET inhibitory compound in the treatment of thyroid cancer, wherein the treatment is carried out by a method comprising:детекцию присутствия полинуклеотида по любому из пп. 2-4 в образце, полученном от тестируемого субъекта, иdetecting the presence of a polynucleotide according to any one of claims. 2-4 in a sample obtained from a test subject, andпроведение химиотерапии с использованием соединения, ингибирующего RET, для тестируемого субъекта, когда детектировано присутствие полинуклеотида по любому из пп. 2-4.administering chemotherapy using a RET inhibitory compound to a test subject when the presence of a polynucleotide according to any one of claims is detected. 2-4.37. Применение полинуклеотида, представленного (i) SEQ ID NO: 69 или (ii) SEQ ID NO: 70, в получении праймера для детекции присутствия полинуклеотида по любому из пп. 2-4 в образце.37. The use of a polynucleotide represented by (i) SEQ ID NO: 69 or (ii) SEQ ID NO: 70 in the preparation of a primer for detecting the presence of a polynucleotide according to any one of claims. 2-4 per sample.
RU2020111214A2017-08-212018-08-20Fusion protein of dctn1 protein with ret proteinRU2813996C2 (en)

Applications Claiming Priority (3)

Application NumberPriority DateFiling DateTitle
JP20171587962017-08-21
JP2017-1587962017-08-21
PCT/JP2018/030688WO2019039439A1 (en)2017-08-212018-08-20Fusion protein of dctn1 protein with ret protein

Publications (3)

Publication NumberPublication Date
RU2020111214A RU2020111214A (en)2021-09-24
RU2020111214A3 RU2020111214A3 (en)2021-12-17
RU2813996C2true RU2813996C2 (en)2024-02-21

Family

ID=

Citations (1)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
WO2014130975A1 (en)*2013-02-222014-08-28Bastian Boris CFusion polynucleotides and fusion polypeptides associated with cancer and particularly melanoma and their uses as therapeutic and diagnostic targets

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
WO2014130975A1 (en)*2013-02-222014-08-28Bastian Boris CFusion polynucleotides and fusion polypeptides associated with cancer and particularly melanoma and their uses as therapeutic and diagnostic targets

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GRUPP S. A. et al., Chimeric antigen receptor-modified T cells for acute lymphoid leukemia, New England Journal of Medicine, 2013, v. 368, n. 16, p.1509-1518.*
VAUGHAN K. T. et al., Cytoplasmic dynein binds dynactin through a direct interaction between the intermediate chains and p150Glued, The Journal of cell biology, 1995, v.131, n. 6, p.1507-1516, МАНЬКОВСКАЯ С.В. и др., ПЕРЕСТРОЙКИ ПРОТООНКОГЕНА C-RET В КЛЕТКАХ ПАПИЛЛЯРНОГО РАКА ЩИТОВИДНОЙ ЖЕЛЕЗЫ, Вестник Витебского государственного медицинского университета, 2008, v. 7, n. 1, с.82-88, FARRER M. J. et al., DCTN1 mutations in Perry syndrome, Nature genetics, 2009, v. 41, n. 2, p.163-165, SO M. T. et al., RET mutational spectrum in Hirschsprung disease: evaluation of 601 Chinese patients, PloS one, 2011, v. 6, n. 12, p.e28986, COLMAN P. M., Effects of amino acid sequence changes on antibody-antigen interactions, Research in Immunology, 1994, v. 145, n. 1, p.33-36, SAFDARI Y. et al., Antibody humanization methods-a review and update, Biotechnology and Genetic Engineering Reviews, 2013, v. 29, n. 2, p.175-186, SHEN J. et al., Single variable domain-IgG fusion: a novel recombinant approach to*

Similar Documents

PublicationPublication DateTitle
JP4579246B2 (en) How to diagnose breast cancer
WO2016084883A1 (en)Novel therapeutic target fusion gene in biliary tract cancer
JP2007506425A (en) Methods for diagnosing hepatocellular carcinoma
CN105658814A (en)New fusion gene detected in lung cancer
CN101175862A (en) Ways to Diagnose Bladder Cancer
JP2006500946A (en) Diagnostic method of testicular seminoma
KR20100075857A (en)Ebi3, dlx5, nptx1 and cdkn3 for target genes of lung cancer therapy and diagnosis
JP2009502112A (en) Methods for diagnosing and treating renal cell carcinoma
WO2015093557A1 (en)Novel fusion gene as factor responsible for stomach cancer
JP4851451B2 (en) Breast cancer-related gene ZNFN3A1
US20100204060A1 (en)Hypoxia-inducible protein 2 (hig 2), a diagnostic marker for clear cell renal cell carcinoma
CN106460054A (en)Fusion genes in cancer
AU2018322286B2 (en)Fusion protein of DCTN1 protein with RET protein
JP2009505632A (en) Pancreatic cancer-related genes CST6 and GABRP
WO2022244807A1 (en)Ltk fusion gene
RU2813996C2 (en)Fusion protein of dctn1 protein with ret protein
JP2007528717A (en) How to diagnose colorectal cancer
KR102099684B1 (en)Novel Biomarkers for Predicting Susceptibility to Anti-Cancer Drug and Uses Thereof
HK40018026A (en)Fusion protein of dctn1 protein with ret protein
KR101496745B1 (en)Gene involved in immortalization of human cancer cell and use thereof
CN101528768A (en)Genes and polypeptides relating to breast cancers
KR101897322B1 (en)A method for diagnosing a metastasis of a primary thyroid cancer and a diagnostic kit using the method
JP2009505631A (en) Cancer-related gene RASEGEF1A
US20040072192A1 (en)Cancer-linked genes as targets for chemotherapy

[8]ページ先頭

©2009-2025 Movatter.jp