Movatterモバイル変換


[0]ホーム

URL:


JP7570088B2 - Information processing system, information processing method, identification method and program - Google Patents

Information processing system, information processing method, identification method and program
Download PDF

Info

Publication number
JP7570088B2
JP7570088B2JP2020105587AJP2020105587AJP7570088B2JP 7570088 B2JP7570088 B2JP 7570088B2JP 2020105587 AJP2020105587 AJP 2020105587AJP 2020105587 AJP2020105587 AJP 2020105587AJP 7570088 B2JP7570088 B2JP 7570088B2
Authority
JP
Japan
Prior art keywords
formula
base sequence
test subject
disease
mutation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020105587A
Other languages
Japanese (ja)
Other versions
JP2021197100A5 (en
JP2021197100A (en
Inventor
英明 間世田
賢一郎 今井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AISTfiledCriticalNational Institute of Advanced Industrial Science and Technology AIST
Priority to JP2020105587ApriorityCriticalpatent/JP7570088B2/en
Priority to PCT/JP2021/022969prioritypatent/WO2021256525A1/en
Publication of JP2021197100ApublicationCriticalpatent/JP2021197100A/en
Publication of JP2021197100A5publicationCriticalpatent/JP2021197100A5/ja
Application grantedgrantedCritical
Publication of JP7570088B2publicationCriticalpatent/JP7570088B2/en
Activelegal-statusCriticalCurrent
Anticipated expirationlegal-statusCritical

Links

Classifications

Landscapes

Description

Translated fromJapanese

本発明は、情報処理システム、情報処理方法、同定方法及びプログラムに関する。The present invention relates to an information processing system, an information processing method, an identification method, and a program.

遺伝子(ゲノム)の変異が様々な疾患の原因となっていることが知られている。例えば、がん細胞は、遺伝子変異により悪性化することが知られている。がんのタイプに特徴的な遺伝子変異を特定することは、発がん機構の解明のみならず、がんの診断、がんの予測、治療法の開発などにも貢献することが期待される(特許文献1参照)。It is known that genetic (genome) mutations are the cause of various diseases. For example, it is known that cancer cells become malignant due to genetic mutations. Identifying genetic mutations characteristic of a type of cancer is expected to contribute not only to elucidating the mechanism of carcinogenesis, but also to cancer diagnosis, cancer prediction, and the development of treatment methods (see Patent Document 1).

再表2015-93557号公報Re-table No. 2015-93557

しかし、健康診断等を受ける検査対象者(被検者)について、遺伝子変異に伴う疾患の将来のリスクを把握することが難しいという第1の問題がある。またそもそも遺伝子(ゲノム)の変異がランダムに起こることから、莫大な遺伝子変異から、疾患に関与する遺伝子変異を見つけ出すことは難しいという第2の問題がある。However, the first problem is that it is difficult to grasp the future risk of diseases associated with gene mutations in test subjects (examinees) undergoing health checkups, etc. The second problem is that, because gene (genome) mutations occur randomly in the first place, it is difficult to find gene mutations that are involved in disease from the enormous number of gene mutations.

本発明の一態様は、上記第1の問題に鑑みてなされたものであり、遺伝子変異に伴う疾患のリスクを把握することを容易化する、もしくは遺伝子変異が起こる可能性を把握することを容易化することを可能とする情報処理システム、情報処理方法及びプログラムを提供することを目的とする。
本発明の別の態様は、上記第2の問題に鑑みてなされたものであり、疾患に関与する遺伝子変異を見つけ出すことを容易化することを可能とする情報処理システム、同定方法及びプログラムを提供することを目的とする。
One aspect of the present invention has been made in consideration of the first problem described above, and aims to provide an information processing system, an information processing method, and a program that make it easier to understand the risk of a disease associated with a genetic mutation, or to make it easier to understand the possibility of a genetic mutation occurring.
Another aspect of the present invention has been made in consideration of the second problem described above, and aims to provide an information processing system, an identification method, and a program that make it possible to easily find genetic mutations involved in disease.

遺伝子変異に伴う疾患のリスクを把握することを容易化することについては、以下の第1の態様から第7の態様で解決する。
本発明の第1の態様に係る情報処理システムは、第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]から第2の式:X-Y-Xの塩基配列への遺伝子変異に関する情報処理システムであって、検査対象者の遺伝子配列において、対象の疾患に対応する特定の遺伝子位置における前記第2の式:X-Y-Xの塩基配列への変異があるか否かの探索の実行、及び/または前記検査対象者の検体中の第2の式:X-Y-Xの塩基配列のRNAへの転写量の抽出の実行を行う実行部と、前記実行部による少なくとも一方の実行結果を用いて、前記対象の疾患に前記検査対象者が罹るリスクに関する情報もしくは遺伝子変異に関する情報を出力する出力部と、を備える。
The problem of facilitating understanding of the risk of diseases associated with gene mutations is solved by the following first to seventh aspects.
The information processing system according to a first aspect of the present invention is an information processing system for a genetic mutation from a first formula: X-Y-X-Y-X [wherein X and Y are base sequences with two or more different bases. However, Y does not follow immediately after the last X, and Y does not appear immediately before the first X] to a base sequence of a second formula: X-Y-X, and is provided with an execution unit that executes a search for whether or not there is a mutation in the base sequence of the second formula: X-Y-X at a specific gene position corresponding to a target disease in the genetic sequence of a test subject, and/or executes extraction of the amount of transcription of the base sequence of the second formula: X-Y-X to RNA in a sample of the test subject, and an output unit that outputs information on the risk of the test subject suffering from the target disease or information on the genetic mutation using at least one of the execution results by the execution unit.

この構成によれば、対象の疾患に前記検査対象者が罹るリスクに関する情報が出力される場合であって第1の式:X-Y-X-Y-Xから第2の式:X-Y-Xの塩基配列への特定の遺伝子位置における変異が対象の疾患に関与する場合には、対象の疾患に検査対象者が罹るリスクに関する情報を取得することができるので、遺伝子変異に伴う疾患のリスクを把握することを容易化することができる。一方、遺伝子変異に関する情報が出力される場合であって遺伝子変異に関する情報が出力される場合、第2の式:X-Y-Xの塩基配列への変異が起こる可能性が分かるので、遺伝子変異が起こる可能性を把握することを容易化することができる。なお、ここで検体は組織もしくは体液である。According to this configuration, when information on the risk of the test subject suffering from the target disease is output and a mutation at a specific gene position from the base sequence of the first formula: X-Y-X-Y-X to the base sequence of the second formula: X-Y-X is involved in the target disease, information on the risk of the test subject suffering from the target disease can be obtained, making it easier to understand the risk of the disease associated with a genetic mutation. On the other hand, when information on a genetic mutation is output, the possibility of a mutation to the base sequence of the second formula: X-Y-X occurring can be known, making it easier to understand the possibility of a genetic mutation occurring. Note that the sample here is a tissue or a body fluid.

本発明の第2の態様に係る情報処理システムは、第1の態様に係る情報処理システムであって、前記出力部は、前記検査対象者の前記転写量と、健常者及び/または前記対象の疾患の患者の前記転写量とを比較し、当該比較結果及び/または前記探索の実行結果を用いて、前記対象の疾患に前記検査対象者が罹るリスクに関する情報を出力する。The information processing system according to the second aspect of the present invention is the information processing system according to the first aspect, in which the output unit compares the transcription amount of the test subject with the transcription amount of a healthy individual and/or a patient with the target disease, and outputs information regarding the risk of the test subject suffering from the target disease using the comparison result and/or the execution result of the search.

この構成によれば、検査対象者の転写量と、健常者及び/または対象の疾患の患者の前記転写量とを比較結果を用いて、対象の疾患に検査対象者が罹るリスクを推定することができる。With this configuration, the test subject's risk of contracting the target disease can be estimated using the results of comparing the transcription amount of the test subject with that of healthy individuals and/or patients with the target disease.

本発明の第3の態様に係る情報処理システムは、第2の態様に係る情報処理システムであって、健常者及び/または前記対象の疾患の患者の検体中の第2の式:X-Y-Xの塩基配列のRNAへの転写量が記憶されているストレージを備え、前記出力部は、前記ストレージを参照して前記検査対象者の前記転写量と、健常者及び/または前記対象の疾患の患者の前記転写量とを比較し、当該比較結果及び/または前記探索の実行結果を用いて、前記対象の疾患に前記検査対象者が罹るリスクに関する情報を出力する。The information processing system according to the third aspect of the present invention is the information processing system according to the second aspect, and includes a storage device in which the amount of transcription into RNA of the base sequence of the second formula: X-Y-X in a sample from a healthy individual and/or a patient with the target disease is stored, and the output unit refers to the storage device to compare the amount of transcription of the test subject with the amount of transcription of the healthy individual and/or the patient with the target disease, and outputs information regarding the risk of the test subject suffering from the target disease using the comparison result and/or the execution result of the search.

この構成によれば、遺伝子変異に伴う疾患のリスクを把握することを容易化することができる。This configuration makes it easier to understand the risk of disease associated with genetic mutations.

本発明の第4の態様に係る情報処理システムは、第1から3のいずれかの態様に係る情報処理システムであって、前記対象の疾患に関与する遺伝子変異後の第2の式:X-Y-Xの塩基配列と、当該対象の疾患に関与する当該第2の式:X-Y-Xの塩基配列への変異が生じる遺伝子位置とが関連付けられて記憶されているストレージを備え、前記実行部は、前記ストレージから前記第2の式:X-Y-Xの塩基配列と前記遺伝子位置とを読み出し、前記検査対象者の遺伝子配列において、当該読み出した遺伝子位置において当該読み出した前記第2の式:X-Y-Xの塩基配列への変異があるか否かの探索の実行を行う
An information processing system according to a fourth aspect of the present invention is the information processing system according to any one of the first to third aspects, comprising a storage in which a base sequence of a second formula: X-Y-X after a gene mutation involved in a disease of the subject and a gene position at which a mutation to the base sequence of the second formula: X-Y-X involved in the disease of the subject occurs are stored in association with each other, and the execution unit reads out the base sequence of the second formula: X-Y-X and the gene position from the storage, and executes a search for whether or not there is a mutation to the read-out base sequence of the second formula: X-Y-X at the read-out gene position in the gene sequence of the test subject.

この構成によれば、遺伝子変異に伴う疾患のリスクを把握することを容易化することができる。This configuration makes it easier to understand the risk of disease associated with genetic mutations.

本発明の第5の態様に係る情報処理システムは、第1から4のいずれかの態様に係る情報処理システムであって、前記第2の式:X-Y-Xの塩基配列の前後の塩基配列の長さの合計は、40mer以上である。The information processing system according to the fifth aspect of the present invention is an information processing system according to any one of the first to fourth aspects, in which the total length of the base sequences before and after the base sequence of the second formula: X-Y-X is 40 mer or more.

この構成によれば、遺伝子変異が起こる確率が高い配列について、疾患に関与する遺伝子変異としてリスク推定の考慮に入れることができ、疾患のリスク推定の精度を担保することができる。With this configuration, sequences with a high probability of genetic mutations can be taken into consideration in risk estimation as genetic mutations involved in disease, ensuring the accuracy of disease risk estimation.

本発明の第6の態様に係る情報処理方法は、第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]から第2の式:X-Y-Xの塩基配列への遺伝子変異に関する情報処理方法であって、検査対象者の遺伝子配列において、対象の疾患に対応する特定の遺伝子位置における前記第2の式:X-Y-Xの塩基配列への変異があるか否かの探索の実行、及び/または前記検査対象者の検体中の第2の式:X-Y-Xの塩基配列のRNAへの転写量の抽出の実行を行う実行工程と、前記実行工程による少なくとも一方の実行結果を用いて、前記対象の疾患に前記検査対象者が罹るリスクに関する情報もしくは遺伝子変異に関する情報を出力する出力工程と、を有する。The information processing method according to the sixth aspect of the present invention is an information processing method for a genetic mutation from a first formula: X-Y-X-Y-X [wherein X and Y represent base sequences with two or more different bases. However, Y does not follow immediately after the last X, and Y does not appear immediately before the first X.] to a base sequence of a second formula: X-Y-X, and includes an execution step of searching for a mutation in the base sequence of the second formula: X-Y-X at a specific gene position corresponding to a target disease in the genetic sequence of a test subject, and/or extracting the amount of transcription of the base sequence of the second formula: X-Y-X to RNA in a sample from the test subject, and an output step of outputting information on the risk of the test subject suffering from the target disease or information on the genetic mutation using at least one of the execution results from the execution step.

この構成によれば、対象の疾患に前記検査対象者が罹るリスクに関する情報が出力される場合であって第1の式:X-Y-X-Y-Xから第2の式:X-Y-Xの塩基配列への特定の遺伝子位置における変異が対象の疾患に関与する場合には、対象の疾患に検査対象者が罹るリスクに関する情報を取得することができるので、遺伝子変異に伴う疾患のリスクを把握することを容易化することができる。一方、遺伝子変異に関する情報が出力される場合であって遺伝子変異に関する情報が出力される場合、第2の式:X-Y-Xの塩基配列への変異が起こる可能性が分かるので、遺伝子変異が起こる可能性を把握することを容易化することができる。According to this configuration, when information on the risk of the test subject suffering from the target disease is output and a mutation at a specific genetic position from the base sequence of the first formula: X-Y-X-Y-X to the base sequence of the second formula: X-Y-X is involved in the target disease, information on the risk of the test subject suffering from the target disease can be obtained, making it easier to grasp the risk of disease associated with a genetic mutation. On the other hand, when information on a genetic mutation is output, the possibility of a mutation occurring in the base sequence of the second formula: X-Y-X is known, making it easier to grasp the possibility of a genetic mutation occurring.

本発明の第7の態様に係るプログラムは、第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]から第2の式:X-Y-Xの塩基配列への遺伝子変異に関するプログラムであって、コンピュータを、検査対象者の遺伝子配列において、対象の疾患に対応する特定の遺伝子位置における前記第2の式:X-Y-Xの塩基配列への変異があるか否かの探索の実行、及び/または前記検査対象者の検体中の第2の式:X-Y-Xの塩基配列のRNAへの転写量の抽出の実行を行う実行部と、前記実行部による少なくとも一方の実行結果を用いて、前記対象の疾患に前記検査対象者が罹るリスクに関する情報もしくは遺伝子変異に関する情報を出力する出力部と、として機能させるためのプログラムである。The program according to the seventh aspect of the present invention is a program for gene mutation from a first formula: X-Y-X-Y-X [wherein X and Y are base sequences with two or more different bases. However, Y does not follow immediately after the last X, and Y does not appear immediately before the first X.] to a base sequence of a second formula: X-Y-X, and causes a computer to function as an execution unit that searches for a mutation in the base sequence of the second formula: X-Y-X at a specific gene position corresponding to a target disease in the genetic sequence of a test subject, and/or extracts the amount of transcription of the base sequence of the second formula: X-Y-X to RNA in a sample from the test subject, and an output unit that outputs information on the risk of the test subject suffering from the target disease or information on the gene mutation using at least one of the execution results by the execution unit.

この構成によれば、対象の疾患に前記検査対象者が罹るリスクに関する情報が出力される場合であって第1の式:X-Y-X-Y-Xから第2の式:X-Y-Xの塩基配列への特定の遺伝子位置における変異が対象の疾患に関与する場合には、対象の疾患に検査対象者が罹るリスクに関する情報を取得することができるので、遺伝子変異に伴う疾患のリスクを把握することを容易化することができる。一方、遺伝子変異に関する情報が出力される場合であって遺伝子変異に関する情報が出力される場合、第2の式:X-Y-Xの塩基配列への変異が起こる可能性が分かるので、遺伝子変異が起こる可能性を把握することを容易化することができる。According to this configuration, when information on the risk of the test subject suffering from the target disease is output and a mutation at a specific genetic position from the base sequence of the first formula: X-Y-X-Y-X to the base sequence of the second formula: X-Y-X is involved in the target disease, information on the risk of the test subject suffering from the target disease can be obtained, making it easier to grasp the risk of disease associated with a genetic mutation. On the other hand, when information on a genetic mutation is output, the possibility of a mutation occurring in the base sequence of the second formula: X-Y-X is known, making it easier to grasp the possibility of a genetic mutation occurring.

疾患に関与する遺伝子変異を見つけ出すことを容易化することについては以下の第8から第10の態様で解決する。
本発明の第8の態様に係る情報処理システムは、標準もしくは健常者の遺伝子配列において、第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]の塩基配列が存在する一方、対象の疾患の患者の遺伝子配列の対応する遺伝子位置において第1の式:X-Y-X-Y-Xではなく前記第2の式:X-Y-Xの塩基配列が存在する場合、当該遺伝子位置における前記第2の式:X-Y-Xの塩基配列への変異を前記対象の疾患に関与する遺伝子変異として抽出する抽出部を備える。
The problem of facilitating the discovery of genetic mutations involved in diseases is solved in the following eighth to tenth aspects.
An information processing system according to an eighth aspect of the present invention includes an extraction unit that, when a base sequence of a first formula: X-Y-X-Y-X [wherein X and Y represent base sequences differing in number of bases by two or more, with the proviso that Y does not follow immediately after the last X, and Y does not appear immediately before the first X] is present in a genetic sequence of a standard or healthy individual, while a base sequence of the second formula: X-Y-X, rather than the first formula: X-Y-X-Y-X, is present at a corresponding genetic position in a genetic sequence of a patient with a target disease, extracts a mutation to the base sequence of the second formula: X-Y-X at the genetic position as a genetic mutation involved in the target disease.

この構成によれば、対象の疾患に関与する遺伝子変異を抽出することができるので、疾患に関与する遺伝子変異を見つけ出すことを容易化することができる。This configuration makes it possible to extract genetic mutations involved in the target disease, making it easier to find genetic mutations involved in the disease.

本発明の第9の態様に係る同定方法は、標準もしくは健常者の遺伝子配列において、第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]の塩基配列が存在する一方、対象の疾患の患者の遺伝子配列の対応する位置において第1の式:X-Y-X-Y-Xではなく前記第2の式:X-Y-Xの塩基配列が存在する場合、前記第2の式:X-Y-Xの塩基配列を前記対象の疾患に関与する遺伝子変異として抽出する工程を有する。The identification method according to the ninth aspect of the present invention includes a step of extracting the base sequence of the second formula: X-Y-X-Y-X [wherein X and Y represent base sequences differing in number of bases by two or more, provided that Y does not immediately follow the last X, and Y does not appear immediately before the first X] in the genetic sequence of a standard or healthy individual, while the base sequence of the second formula: X-Y-X, rather than the first formula: X-Y-X-Y-X, is present at the corresponding position in the genetic sequence of a patient with a target disease, extracting the base sequence of the second formula: X-Y-X as a genetic mutation involved in the target disease.

この構成によれば、対象の疾患に関与する遺伝子変異を抽出することができるので、疾患に関与する遺伝子変異を見つけ出すことを容易化することができる。This configuration makes it possible to extract genetic mutations involved in the target disease, making it easier to find genetic mutations involved in the disease.

本発明の第10の態様に係るプログラムは、コンピュータを、標準もしくは健常者の遺伝子配列において、第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]の塩基配列が存在する一方、対象の疾患の患者の遺伝子配列の対応する位置において第1の式:X-Y-X-Y-Xではなく前記第2の式:X-Y-Xの塩基配列が存在する場合、前記第2の式:X-Y-Xの塩基配列を前記対象の疾患に関与する遺伝子変異として抽出する抽出部として機能させるためのプログラムである。The program according to the tenth aspect of the present invention is a program for causing a computer to function as an extraction unit that extracts the base sequence of the second formula: X-Y-X-Y-X [wherein X and Y represent base sequences differing in number of bases by two or more, provided that Y does not immediately follow the last X, and Y does not appear immediately before the first X] in the genetic sequence of a standard or healthy individual, while the base sequence of the second formula: X-Y-X, rather than the first formula: X-Y-X-Y-X, is present at the corresponding position in the genetic sequence of a patient with a target disease, as a genetic mutation involved in the target disease.

この構成によれば、対象の疾患に関与する遺伝子変異を自動で抽出することができるので、疾患に関与する遺伝子変異を見つけ出すことを容易化することができる。This configuration makes it possible to automatically extract genetic mutations involved in a target disease, making it easier to find genetic mutations involved in the disease.

本発明の一態様によれば、対象の疾患に検査対象者が罹るリスクに関する情報を取得することができるので、遺伝子変異に伴う疾患のリスクを把握することを容易化することができる。本発明の別の態様によれば、対象の疾患に関与する遺伝子変異を自動で抽出することができるので、疾患に関与する遺伝子変異を見つけ出すことを容易化することができる。According to one aspect of the present invention, it is possible to obtain information regarding the risk of a test subject suffering from a target disease, thereby facilitating the understanding of the risk of disease associated with a genetic mutation. According to another aspect of the present invention, it is possible to automatically extract genetic mutations involved in a target disease, thereby facilitating the discovery of genetic mutations involved in the disease.

第1の実施形態に係る遺伝子変異を説明するための模式図である。FIG. 2 is a schematic diagram for explaining a gene mutation according to the first embodiment.第1の実施形態に係る標準もしくは健常者と、ある疾患Aの患者の遺伝子配列の模式図である。FIG. 2 is a schematic diagram of gene sequences of a standard or healthy subject and a patient with disease A according to the first embodiment.第1の実施形態に係る情報処理システムの概略構成図である。1 is a schematic configuration diagram of an information processing system according to a first embodiment.第1の実施形態に係る端末の概略構成図である。FIG. 2 is a schematic configuration diagram of a terminal according to the first embodiment.第1の実施形態に係るサーバの概略構成図である。FIG. 2 is a schematic configuration diagram of a server according to the first embodiment.第1の実施形態に係る端末1の画面遷移の一例である。6 is an example of a screen transition of the terminal 1 according to the first embodiment.第1の実施形態に係る処理の流れの第1の例を示すフローチャートである。4 is a flowchart showing a first example of a processing flow according to the first embodiment.第1の実施形態に係るサーバのストレージに記憶される変異塩基配列テーブルTの一例である。4 is an example of a mutant base sequence table T stored in a storage of a server according to the first embodiment.第2の実施形態において検査対象者の疾患リスクを説明するための模式図である。FIG. 11 is a schematic diagram for explaining a disease risk of a test subject in the second embodiment.第2の実施形態において第1の式:X-Y-X-Y-Xの塩基配列からX-Yの塩基配列が抜ける過程を説明するための模式図である。FIG. 11 is a schematic diagram for explaining the process in which the base sequence XY is removed from the base sequence of the first formula: XY-XY-X in the second embodiment.第2の実施形態で検査対象者の別の疾患リスクを説明するための模式図である。FIG. 11 is a schematic diagram for explaining another disease risk of a test subject in the second embodiment.転写量とその測定法のイメージについて説明するための模式図である。FIG. 1 is a schematic diagram for explaining an image of a transfer amount and a method for measuring the transfer amount.第2の実施形態に係る端末1の検査における画面遷移の一例である。13 is a diagram illustrating an example of a screen transition during an inspection of the terminal 1 according to the second embodiment.RNA転写量情報のファイルの中身の例である。13 is an example of the contents of a file of RNA transcription amount information.リスク値の計算方法の一例を説明するための表である。13 is a table for explaining an example of a method for calculating a risk value.ストレージに保存されている疾患毎の遺伝子変異テーブルの例である。13 is an example of a gene mutation table for each disease stored in the storage.ストレージに保存されている疾患毎の転写量テーブルの例である。13 is an example of a transcription amount table for each disease stored in the storage.DNA配列とRNA転写量の両方を用いて、検査対象者が罹る疾患リスクの一覧を表示する処理の一例を示すフローチャートである。13 is a flowchart showing an example of a process for displaying a list of disease risks of a test subject using both a DNA sequence and an RNA transcription amount.図18Aの続きのフローチャートである。This is a continuation of the flowchart in Figure 18A.DNA配列を用いて、検査対象者が罹る疾患リスクの一覧を表示する処理の一例を示すフローチャートである。13 is a flowchart showing an example of a process for displaying a list of disease risks to which a test subject is subject using a DNA sequence.RNA転写量情報を用いて、検査対象者が罹る疾患リスクの一覧を表示する処理の一例を示すフローチャートである。13 is a flowchart showing an example of a process for displaying a list of disease risks to which a test subject is subject, using RNA transcription amount information.図20Aの続きのフローチャートである。This is a continuation of the flowchart in Figure 20A.

以下、各実施形態について、図面を参照しながら説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。Each embodiment will be described below with reference to the drawings. However, more detailed explanation than necessary may be omitted. For example, detailed explanation of already well-known matters or duplicate explanation of substantially identical configurations may be omitted. This is to avoid the following explanation becoming unnecessarily redundant and to make it easier for those skilled in the art to understand.

<第1の実施形態>
第1の実施形態では、本発明の課題のうち、疾患に関与する遺伝子変異を見つけ出すことを容易化する課題を解決する。図1は、第1の実施形態に係る遺伝子変異を説明するための模式図である。例えば、図1に示すように、生物の遺伝子配列(具体的には例えばDNA配列もしくはRNA配列)に含まれている第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]は、DNAからRNAに転写される過程においてある確率で、第1の式:X-Y-X-Y-Xの塩基配列から、例えば、図1の破線の四つの枠のいずれかで囲まれたX-YもしくはY-Xの塩基配列が抜けることにより、その塩基配列の構成要素である塩基配列X及びYから構成される第2の式:X-Y-Xの塩基配列に変異することを、本願の発明者は新たに発見した。ただし、最終的にX-Y-Xが生じればその抜け方は上記のみに規定されるものではない。塩基配列がX-Y-Xに短くなった結果として、フレームシフトによってコドンの読み枠が変わり、異常なタンパク質に変わることが疾患の原因となり得る。またフレームシフトが生じなくてもタンパク質が短縮され、異常なタンパク質に変わることが疾患の原因となり得る。
ここで、第1の式:X-Y-X-Y-Xの塩基配列から第2の式:X-Y-Xの塩基配列への変異については、(1)ゲノムDNAの塩基配列を読む場合と、(2)mRNAの塩基配列を読む場合の両方があり得る。第1の実施形態では、いずれの場合であってもよい。
First Embodiment
In the first embodiment, the present invention solves the problem of facilitating the discovery of genetic mutations involved in diseases. FIG. 1 is a schematic diagram for explaining genetic mutations according to the first embodiment. For example, as shown in FIG. 1, the inventors of the present application have newly discovered that a first formula: X-Y-X-Y-X [wherein X and Y represent base sequences with two or more different bases, respectively, which are included in the genetic sequence of an organism (specifically, for example, a DNA sequence or an RNA sequence). However, Y does not follow immediately after the last X, and Y does not appear immediately before the first X] is mutated to a second formula: X-Y-X base sequence composed of the base sequences X and Y, which are components of the base sequence, with a certain probability in the process of transcription from DNA to RNA, by removing, for example, the base sequence of X-Y or Y-X enclosed in any of the four dashed frames in FIG. 1 from the base sequence of the first formula: X-Y-X-Y-X. However, if X-Y-X is finally generated, the manner of removal is not limited to the above. As a result of the shortening of the base sequence to X-Y-X, the reading frame of the codon changes due to a frameshift, resulting in an abnormal protein, which can cause disease.In addition, even if a frameshift does not occur, the protein can be shortened and turned into an abnormal protein, which can cause disease.
Here, regarding the mutation from the base sequence of the first formula: X-Y-X-Y-X to the base sequence of the second formula: X-Y-X, there are two cases: (1) reading the base sequence of genomic DNA, and (2) reading the base sequence of mRNA. In the first embodiment, either case may be used.

図2は、第1の実施形態に係る標準もしくは健常者と、ある疾患Aの患者の遺伝子配列の模式図である。図2では、標準もしくは健常者の遺伝子配列(具体的には例えばDNA配列もしくはRNA配列)において、23995番の遺伝子位置において第1の式の一例であるX1-Y1-X1―Y1-X1の塩基配列であるのに対し、疾患Aの患者の遺伝子配列において、23995番の遺伝子位置において第2の式の一例であるX1-Y1-X1の塩基配列が示されている。図2に示すように、第1の実施形態では、標準もしくは健常者の遺伝子配列において、第1の式:X-Y-X-Y-Xの塩基配列が存在するが、特定の疾患の患者の遺伝子配列の対応する位置において、第1の式:X-Y-X-Y-Xではなく前記第2の式:X-Y-Xの塩基配列が存在する場合、第2の式:X-Y-Xの塩基配列を疾患Aに関与する遺伝子変異として抽出する。ここで、健常者及び疾患Aの患者において塩基配列が得られた検体は、DNAを取得する検体と、RNAを取得する検体があり得る。上記(1)のゲノムDNAの塩基配列を読む場合には、検体には少なくともDNAが含まれる。一方、上記(2)のmRNAの塩基配列を読む場合には、検体には少なくともRNAが含まれる。 FIG. 2 is a schematic diagram of the gene sequences of a standard or healthy individual and a patient with a certain disease A according to the first embodiment. In FIG. 2, the gene sequence (specifically, for example, a DNA sequence or an RNA sequence) of the standard or healthy individual has a base sequence of X1 -Y1 -X1 -Y1 -X1 , which is an example of the first formula, at the gene position 23995, whereas the gene sequence of the patient with disease A has a base sequence of X1 -Y1 -X1 , which is an example of the second formula, at the gene position 23995. As shown in FIG. 2, in the first embodiment, when the gene sequence of the standard or healthy individual has a base sequence of the first formula: X-Y-X-Y-X, but the gene sequence of the patient with a certain disease has a base sequence of the second formula: X-Y-X rather than the first formula: X-Y-X-Y-X at the corresponding position, the base sequence of the second formula: X-Y-X is extracted as a genetic mutation involved in disease A. Here, the samples from which base sequences are obtained in healthy individuals and patients with disease A may be either samples from which DNA is obtained or samples from which RNA is obtained. When reading the base sequence of genomic DNA as described above in (1), the sample contains at least DNA. On the other hand, when reading the base sequence of mRNA as described above in (2), the sample contains at least RNA.

図3は、第1の実施形態に係る情報処理システムの概略構成図である。図3に示すように、情報処理システムSは一例として、端末1-1~1-Nと通信回路網CNを介して接続されたサーバ2を備える。端末1-1、…、1-N(Nは自然数)は一例として、情報処理システムSの外部に設けられている。なお、情報処理システムSは、端末1-1、…、1-Nを備えてもよい。ここでは一例として情報処理システムSは一台のサーバ2で構成される例を示すが、これに限定されるものではなく、クラウドサービスのように複数のコンピュータで構成されてもよい。Figure 3 is a schematic diagram of an information processing system according to a first embodiment. As shown in Figure 3, the information processing system S includes, as an example, a server 2 connected to terminals 1-1 to 1-N via a communication circuit network CN. As an example, terminals 1-1, ..., 1-N (N is a natural number) are provided outside the information processing system S. Note that the information processing system S may also include terminals 1-1, ..., 1-N. Here, an example is shown in which the information processing system S is configured with one server 2, but the information processing system S is not limited to this and may be configured with multiple computers like a cloud service.

端末1-1~1-Nは、別々のユーザが使用する端末装置であり、例えば、多機能携帯電話(いわゆるスマートフォン)などの携帯電話、タブレット、ノートパソコン、またはデスクトップパソコンなどである。端末1-1~1-Nには例えば、第1の実施形態に係るプログラムを含むアプリケーションがインストールされており、このアプリケーションを立ち上げることで、このアプリケーションによって表示される画面においてサーバ2から提供される情報を表示する。なお、これに限らず、端末1-1~1-Nは例えば、WEBブラウザを用いて、サーバ2から提供される情報を表示してもよい。以下、第1の実施形態では、端末1は、一例としてデスクトップパソコンであるものとして説明する。Terminals 1-1 to 1-N are terminal devices used by different users, and may be, for example, mobile phones such as multi-function mobile phones (so-called smartphones), tablets, notebook computers, or desktop computers. An application including a program according to the first embodiment is installed on terminals 1-1 to 1-N, and by launching this application, information provided by server 2 is displayed on a screen displayed by this application. However, this is not limited to this, and terminals 1-1 to 1-N may display information provided by server 2 using, for example, a web browser. In the following first embodiment, terminal 1 will be described as a desktop computer as an example.

サーバ2は情報処理装置の一例であり、端末1-1~1-Nに対して情報を提供する。以下、端末1-1~1-Nを総称して端末1とも呼ぶ。Server 2 is an example of an information processing device, and provides information to terminals 1-1 to 1-N. Hereinafter, terminals 1-1 to 1-N will also be collectively referred to as terminal 1.

図4は、第1の実施形態に係る端末の概略構成図である。図4に示すように、端末1は例えば、入力インタフェース11と、通信回路12と、ストレージ13と、メモリ14と、出力インタフェース15と、プロセッサ16と、ディスプレイ17とを備える。
入力インタフェース11は、ユーザからの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ16へ出力する。入力インタフェース11は例えばキーボードである。
通信回路12は、通信回路網CNに接続されて、通信回路網CNに接続されているサーバ2と通信する。この通信は有線であっても無線であってもよい。
Fig. 4 is a schematic configuration diagram of a terminal according to the first embodiment. As shown in Fig. 4, the terminal 1 includes, for example, an input interface 11, a communication circuit 12, a storage 13, a memory 14, an output interface 15, a processor 16, and a display 17.
The input interface 11 receives an input from a user, and outputs an input signal corresponding to the received input to the processor 16. The input interface 11 is, for example, a keyboard.
The communication circuit 12 is connected to a communication network CN and communicates with a server 2 which is also connected to the communication network CN. This communication may be wired or wireless.

ストレージ13には、プロセッサ16が読み出して実行するためのアプリケーションのプログラム及び各種のデータが格納されている。このアプリケーションは、サーバもしくはクラウド経由でダウンロードされてインストールされたものである。
メモリ14は、データ及びプログラムを一時的に保持する。メモリ14は、揮発性メモリであり、例えばRAM(Random Access Memory)である。
出力インタフェース15は、ディスプレイ17に接続されており、プロセッサ16の指令に従って映像信号をディスプレイに出力する。なお、ディスプレイ17は端末1に外付けではなく、内蔵であってもよい。
The storage 13 stores application programs and various data to be read and executed by the processor 16. These applications are downloaded and installed via a server or the cloud.
The memory 14 temporarily stores data and programs and is a volatile memory, such as a random access memory (RAM).
The output interface 15 is connected to a display 17, and outputs a video signal to the display in accordance with a command from the processor 16. The display 17 does not have to be external to the terminal 1, and may be built into the terminal 1.

プロセッサ16は、ストレージ13から第1の実施形態に係るアプリケーションのプログラムをメモリ14にロードし、当該プログラムに含まれる一連の命令を実行する。The processor 16 loads the program of the application according to the first embodiment from the storage 13 into the memory 14 and executes a series of instructions contained in the program.

図5は、第1の実施形態に係るサーバの概略構成図である。図5に示すように、サーバ2は、入力インタフェース21と、通信回路22と、ストレージ23と、メモリ24と、出力インタフェース25と、プロセッサ26とを備える。
入力インタフェース21は、サーバ2の管理者からの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ26へ出力する。
通信回路22は、通信回路網CNに接続されて、通信回路網CNに接続されている端末1-1~1-Nと通信する。この通信は有線であっても無線であってもよい。
Fig. 5 is a schematic configuration diagram of a server according to the first embodiment. As shown in Fig. 5, the server 2 includes an input interface 21, a communication circuit 22, a storage 23, a memory 24, an output interface 25, and a processor 26.
The input interface 21 receives an input from an administrator of the server 2, and outputs an input signal corresponding to the received input to the processor 26.
The communication circuit 22 is connected to a communication network CN and communicates with the terminals 1-1 to 1-N connected to the communication network CN. This communication may be wired or wireless.

ストレージ23は、プロセッサ26が読み出して実行するためのプログラム及び各種のデータが格納されている。例えば、ストレージ23には、標準もしくは健常者の遺伝子配列及び転写量情報が記憶されている。
メモリ24は、データ及びプログラムを一時的に保持する。メモリ24は、揮発性メモリであり、例えばRAM(Random Access Memory)である。
出力インタフェース25は、外部の機器(例えばディスプレイと接続されており、プロセッサ26からの指令に従って当該外部の機器に信号(例えば映像信号)を出力する。これにより、例えばディスプレイに映像信号が入力されて情報が表示される。
The storage 23 stores various data and programs to be read and executed by the processor 26. For example, the storage 23 stores gene sequences and transcription amount information of standard or healthy individuals.
The memory 24 temporarily stores data and programs and is a volatile memory, such as a random access memory (RAM).
The output interface 25 is connected to an external device (e.g., a display), and outputs a signal (e.g., a video signal) to the external device in accordance with a command from the processor 26. As a result, the video signal is input to, for example, a display, and information is displayed.

プロセッサ26は、ストレージ23からプログラムをメモリ24にロードし、当該プログラムに含まれる一連の命令を実行することにより、抽出部261、実行部262、出力部263、通信制御部264として機能する。The processor 26 loads a program from the storage 23 into the memory 24 and executes a series of instructions contained in the program, thereby functioning as an extraction unit 261, an execution unit 262, an output unit 263, and a communication control unit 264.

図6は、第1の実施形態に係る端末1の画面遷移の一例である。画面G1には、疾患名が入力可能なテキストボックスB1が表示されており、当該疾患の患者の遺伝子配列を受付可能なボックスB2が表示されている。ここで患者の遺伝子配列は例えば、独自に取得したデータや公開サーバからの取得したデータである。また画面G1には送信ボタンB3が表示されており、この送信ボタンB3が押下された場合、入力された疾患名と当該疾患の患者の遺伝子配列がサーバ2へ送信される。Figure 6 shows an example of screen transitions on terminal 1 according to the first embodiment. Screen G1 displays a text box B1 in which the name of a disease can be input, and a box B2 in which the genetic sequence of a patient with that disease can be received. Here, the genetic sequence of the patient is, for example, data acquired independently or data acquired from a public server. Screen G1 also displays a send button B3, and when this send button B3 is pressed, the input disease name and the genetic sequence of the patient with that disease are sent to server 2.

サーバ2は、この疾患名と当該疾患の患者の遺伝子配列を受信した場合、サーバ2の抽出部261は、ストレージ23に記憶されている標準もしくは健常者の遺伝子配列において、第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]の塩基配列が存在する一方、当該疾患の患者の遺伝子配列の対応する位置において第1の式:X-Y-X-Y-Xではなく前記第2の式:X-Y-Xの塩基配列が存在する場合、前記第2の式:X-Y-Xの塩基配列を当該疾患に関与する遺伝子変異として抽出する。When the server 2 receives the disease name and the genetic sequence of a patient with the disease, the extraction unit 261 of the server 2 extracts the base sequence of the second formula: X-Y-X-Y-X [wherein X and Y indicate base sequences with two or more different bases. However, Y does not follow immediately after the last X, and Y does not appear immediately before the first X] in the genetic sequence of a standard or healthy individual stored in the storage 23, if the base sequence of the second formula: X-Y-X is present at the corresponding position in the genetic sequence of the patient with the disease, rather than the first formula: X-Y-X-Y-X, the extraction unit 261 of the server 2 extracts the base sequence of the second formula: X-Y-X as a genetic mutation involved in the disease.

ここで、前記標準もしくは健常者の遺伝子配列において、第1の式:X-Y-X-Y-Xの塩基配列が存在するが、対象の疾患の患者の遺伝子配列の対応する位置において、第1の式:X-Y-X-Y-Xではなく前記第2の式:X-Y-Xの塩基配列が存在する場合とは、前記対応する場所において、健常者の前記遺伝子配列に比べて、前記対象の疾患の患者の前記遺伝子配列に、統計的に優位に、前記第2の式:X-Y-Xの塩基配列が存在する場合であってもよい。ここで、統計的優位性を示す場合、対象の疾患について複数の患者の遺伝子配列群から統計検定を行うが、複数の患者の遺伝子配列群それぞれを予め入手した上で、抽出部261は、前記対応する場所において、健常者の遺伝子配列に比べて、対象の疾患の患者の遺伝子配列に、統計的に優位に、第2の式:X-Y-Xの塩基配列が存在する場合に、当該対象の疾患に関与する遺伝子変異として抽出する(もしくは当該遺伝子を疾患関連変異遺伝子として抽出する)。これにより、疾患に関与していないのに疾患に関与している遺伝子変異として抽出されるという擬陽性の確率を低減することができる。
ここで対象の疾患の患者であっても、対象の遺伝子位置における第2の式:X-Y-Xの塩基配列への遺伝子変異が起こっている患者と起こっていない患者がいる。そのため、抽出部261は、対象の遺伝子位置における第2の式:X-Y-Xの塩基配列への遺伝子変異を対象の疾患に関与する遺伝子変異として抽出した場合において、対象の疾患の患者群において、この対象の遺伝子位置における第2の式:X-Y-Xの塩基配列への遺伝子変異が起こっている確率(以下、変異発生率という)を算出してもよい。
Here, the case where the base sequence of the first formula: X-Y-X-Y-X is present in the gene sequence of the standard or healthy individual, but the base sequence of the second formula: X-Y-X is present instead of the first formula: X-Y-X-Y-X at the corresponding position of the gene sequence of the patient with the target disease may be the case where the base sequence of the second formula: X-Y-X is present in the gene sequence of the patient with the target disease in a statistically superior manner compared to the gene sequence of the healthy individual at the corresponding position. Here, when statistical superiority is shown, a statistical test is performed from gene sequence groups of multiple patients for the target disease, and after obtaining each of the gene sequence groups of multiple patients in advance, the extraction unit 261 extracts the gene as a genetic mutation involved in the target disease (or extracts the gene as a disease-related mutant gene) when the base sequence of the second formula: X-Y-X is present in a statistically superior manner compared to the gene sequence of the healthy individual at the corresponding position. This can reduce the probability of false positives, where a gene mutation that is not involved in a disease is extracted as being involved in the disease.
Here, even among patients with the target disease, there are patients in which a genetic mutation to the base sequence of the second formula: X-Y-X has occurred at the target gene position and patients in which no genetic mutation has occurred. Therefore, when the extraction unit 261 extracts a genetic mutation to the base sequence of the second formula: X-Y-X at the target gene position as a genetic mutation involved in the target disease, the extraction unit 261 may calculate the probability that a genetic mutation to the base sequence of the second formula: X-Y-X has occurred at the target gene position in a patient group with the target disease (hereinafter referred to as the mutation occurrence rate).

遺伝子配列(例えばDNA配列)の第2の式:X-Y-Xの塩基配列の前の塩基配列abc(但し、a、b、cは一つ以上の塩基配列)と、当該第2の式:X-Y-Xの塩基配列の後の塩基配列def(但し、d、e、fは一つ以上の塩基配列)の長さの合計が40mer以上であることが好ましい。これは、第2の式:X-Y-Xの塩基配列の前後の塩基配列が40mer未満であると、X-YもしくはY-Xの抜けが起こる頻度が落ちる(すなわち抜ける確率が落ちる)ので、抽出部261が抽出する第2の式:X-Y-Xの塩基配列の前後の塩基配列は、40mer以上であることが好ましい。これにより、遺伝子変異が起こる確率が高いものについて、疾患に関与する遺伝子変異として同定することができる。但し、当該第2の式:X-Y-Xの塩基配列が十分な長さがあれば、第2の式:X-Y-Xの塩基配列の前後の塩基配列abcとdefの長さの合計が0でもよく、好ましくは1mer以上、より好ましくは20mer以上、更に好ましくは40mer以上である。It is preferable that the total length of the base sequence abc (where a, b, c are one or more base sequences) before the base sequence of the second formula: X-Y-X in the gene sequence (e.g., DNA sequence) and the base sequence def (where d, e, f are one or more base sequences) after the base sequence of the second formula: X-Y-X is 40mer or more. This is because if the base sequence before and after the base sequence of the second formula: X-Y-X is less than 40mer, the frequency of X-Y or Y-X omissions decreases (i.e., the probability of omission decreases), so it is preferable that the base sequence before and after the base sequence of the second formula: X-Y-X extracted by the extraction unit 261 is 40mer or more. This makes it possible to identify those with a high probability of genetic mutations occurring as genetic mutations involved in diseases. However, if the base sequence of the second formula: X-Y-X is sufficiently long, the total length of the base sequences abc and def before and after the base sequence of the second formula: X-Y-X may be 0, and is preferably 1 mer or more, more preferably 20 mer or more, and even more preferably 40 mer or more.

また、対象の疾患の患者の遺伝子配列は、前記対象の疾患が生じている組織もしくは血液などの体液から抽出されたものである。これは、対象の疾患の患者であっても、疾患が生じていない組織においては、当該疾患に関与する遺伝子変異が起きていない可能性があるからである。また血液などの体液中に、疾患に関与する遺伝子変異が起きたRNAが染み出すことがあるので血液などの体液でもよい。これにより、疾患に関与する遺伝子変異の同定精度を向上させることができる。The gene sequence of a patient with a target disease is extracted from tissues in which the target disease occurs or from bodily fluids such as blood. This is because even in patients with the target disease, genetic mutations involved in the disease may not occur in tissues in which the disease does not occur. In addition, bodily fluids such as blood may be used, since RNA in which genetic mutations involved in the disease have occurred may seep into bodily fluids such as blood. This can improve the accuracy of identifying genetic mutations involved in the disease.

またここで、ストレージ23には、一例として遺伝子変異の配列位置と遺伝子名との組が蓄積されている。この場合、抽出部261は例えば、この遺伝子変異の配列位置に対応する遺伝子名をストレージ23から読み出す。そして、抽出部261は、この読み出した遺伝子名と、XY欠失が起こった配列位置、元の塩基配列、変異後の塩基配列とを関連付けて表示するための情報(例えば、画面G2を表示するための情報)を生成する。通信制御部264は、この情報を端末1に送信するよう制御する。端末1は、この情報を受信すると、この情報をディスプレイ17に表示する。これにより、図6の画面G2が端末1のディスプレイ17で表示される。Here, as an example, a pair of the sequence position of the gene mutation and the gene name is stored in the storage 23. In this case, the extraction unit 261, for example, reads out the gene name corresponding to the sequence position of this gene mutation from the storage 23. Then, the extraction unit 261 generates information (for example, information for displaying screen G2) for displaying the read out gene name in association with the sequence position where the XY deletion occurred, the original base sequence, and the base sequence after the mutation. The communication control unit 264 controls to transmit this information to the terminal 1. When the terminal 1 receives this information, it displays this information on the display 17. As a result, the screen G2 in FIG. 6 is displayed on the display 17 of the terminal 1.

続いて、図6を参照しつつ、図7を用いて処理の流れを説明する。図7は、第1の実施形態に係る処理の流れの第1の例を示すフローチャートである。以降に示すフローチャートにおける処理は、それぞれ端末1のプロセッサ16もしくはサーバ2のプロセッサ26の処理を示すが、簡略のため、プロセッサの記載は省略する。Next, the process flow will be explained using FIG. 7 while referring to FIG. 6. FIG. 7 is a flowchart showing a first example of the process flow according to the first embodiment. The processes in the flowcharts shown below respectively show the processes of the processor 16 of the terminal 1 or the processor 26 of the server 2, but for simplicity, the description of the processors is omitted.

(ステップS10)まず端末1は、図6の画面G1に示すように、疾患名と当該疾患の患者の遺伝子配列を受け付ける。(Step S10) First, terminal 1 accepts the disease name and the genetic sequence of a patient with that disease, as shown on screen G1 in FIG. 6.

(ステップS20)次に、端末1は、疾患名と当該疾患の患者の遺伝子配列を送信する。(Step S20) Next, terminal 1 transmits the disease name and the genetic sequence of the patient with that disease.

(ステップS30)次に、サーバ2は、標準の遺伝子配列(もしくは健常者の遺伝子配列)と、当該疾患の患者の遺伝子配列を比較する。(Step S30) Next, server 2 compares the standard gene sequence (or the gene sequence of a healthy individual) with the gene sequence of a patient with the disease.

(ステップS40)次に、サーバ2の抽出部261は、標準もしくは健常者の遺伝子配列と当該疾患の患者の遺伝子配列とを比較して、標準もしくは健常者の遺伝子配列で第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]の塩基配列が存在する一方で、当該疾患の患者の遺伝子配列の対応する遺伝子位置で例えば統計的に優位に第2の式:X-Y-Xの塩基配列が存在する場合を探索する。(Step S40) Next, the extraction unit 261 of the server 2 compares the genetic sequence of a standard or healthy individual with the genetic sequence of a patient with the disease, and searches for cases where the genetic sequence of the standard or healthy individual contains a base sequence of the first formula: X-Y-X-Y-X [wherein X and Y indicate base sequences that differ by two or more bases. However, Y does not immediately follow the last X, and Y does not appear immediately before the first X], while the genetic sequence of the patient with the disease contains, for example, a base sequence of the second formula: X-Y-X with statistical superiority at the corresponding gene position.

(ステップS50)次に、サーバ2の抽出部261は、標準もしくは健常者の遺伝子配列で第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]の塩基配列が存在する一方で、当該疾患の患者の遺伝子配列の対応する遺伝子位置で例えば統計的に優位に第2の式:X-Y-Xの塩基配列が存在することを検出した場合(ステップS40 YES)、検出位置における当該X-Y-Xの塩基配列を当該疾患の疾患に関与する遺伝子変異として抽出し、当該検出位置と当該X-Y-Xの塩基配列を当該疾患に関連付けてストレージ23に保存する。(Step S50) Next, when the extraction unit 261 of the server 2 detects that a base sequence of the first formula: X-Y-X-Y-X [wherein X and Y indicate base sequences with two or more different bases. However, Y does not follow immediately after the last X, and Y does not appear immediately before the first X] is present in the genetic sequence of a standard or healthy individual, while a base sequence of the second formula: X-Y-X is present, for example, statistically predominantly at the corresponding genetic position of the genetic sequence of a patient with the disease (step S40 YES), the extraction unit 261 of the server 2 extracts the base sequence of X-Y-X at the detected position as a genetic mutation involved in the disease, and stores the detected position and the base sequence of X-Y-X in the storage 23 in association with the disease.

(ステップS60)次に、サーバ2検出位置における当該X-Y-Xの塩基配列を当該疾患に関与する遺伝子変異である旨の情報を送信する。(Step S60) Next, the server 2 transmits information indicating that the base sequence X-Y-X at the detected position is a genetic mutation involved in the disease.

(ステップS70)端末1は、ステップS60で送信された情報を受信した場合、当該情報を用いて、図6の画面G2に示すように、検出位置における当該X-Y-Xの塩基配列を当該疾患に関与する遺伝子変異である旨を表示制御する。(Step S70) When the terminal 1 receives the information transmitted in step S60, it uses the information to control the display to indicate that the X-Y-X base sequence at the detection position is a genetic mutation involved in the disease, as shown on screen G2 in FIG. 6.

以上、第1の実施形態に係る情報処理システムは、標準もしくは健常者の遺伝子配列において、第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]の塩基配列が存在する一方、対象の疾患の患者の遺伝子配列の対応する位置において第1の式:X-Y-X-Y-Xではなく前記第2の式:X-Y-Xの塩基配列が存在する場合、前記第2の式:X-Y-Xの塩基配列を前記対象の疾患に関与する遺伝子変異として抽出する抽出部261を備える。As described above, the information processing system according to the first embodiment includes an extraction unit 261 that extracts the base sequence of the second formula: X-Y-X-Y-X (wherein X and Y represent base sequences with two or more different bases, with the exception that Y does not follow immediately after the last X, and Y does not appear immediately before the first X) in the genetic sequence of a standard or healthy individual, and extracts the base sequence of the second formula: X-Y-X as a genetic mutation associated with the target disease when the base sequence of the second formula: X-Y-X is present rather than the first formula: X-Y-X-Y-X at the corresponding position in the genetic sequence of a patient with the target disease.

この構成により、抽出部261が、対象の疾患に関与する遺伝子変異を自動で抽出することができるので、疾患に関与する遺伝子変異を見つけ出すことを容易化することができる。This configuration allows the extraction unit 261 to automatically extract genetic mutations involved in the target disease, making it easier to find genetic mutations involved in the disease.

図7の処理を繰り返すことにより、図8に示すように、変異塩基配列テーブルT1がストレージ23に蓄積される。図8は、第1の実施形態に係るサーバのストレージに記憶される変異塩基配列テーブルTの一例である。図8に示すように、第1の実施形態に係るサーバ2のストレージ23に記憶されている変異塩基配列テーブルT1には例えば、疾患名、X-Y欠失が起こった配列位置、元の塩基配列、変異後の塩基配列の組のレコードが蓄積されている。このように、ストレージ23に、第2の式:X-Y-Xの塩基配列の遺伝子変異と、当該遺伝子変異が生じた遺伝子配列上の位置と、当該遺伝子変異が関与する疾患とが関連付けられて記憶される。By repeating the process of FIG. 7, a mutant base sequence table T1 is accumulated in the storage 23 as shown in FIG. 8. FIG. 8 is an example of the mutant base sequence table T stored in the storage of the server according to the first embodiment. As shown in FIG. 8, the mutant base sequence table T1 stored in the storage 23 of the server 2 according to the first embodiment stores records of pairs of, for example, a disease name, a sequence position where an X-Y deletion occurred, an original base sequence, and a base sequence after mutation. In this way, the storage 23 stores a genetic mutation of the base sequence of the second formula: X-Y-X, the position in the genetic sequence where the genetic mutation occurred, and a disease associated with the genetic mutation.

<第2の実施形態:疾患リスクの検査方法>
続いて、第2の実施形態において検査対象者(被検者)に疾患のリスクがあるか検査する方法について、以下説明する。第2の実施形態では、本発明の課題のうち、遺伝子変異に伴う疾患のリスクを把握することを容易化する課題を解決する。
Second embodiment: method for testing disease risk
Next, a method for testing whether a test subject (subject) is at risk for a disease in the second embodiment will be described below. In the second embodiment, one of the objects of the present invention is to easily grasp the risk of a disease associated with a gene mutation.

図9は、第2の実施形態において検査対象者の疾患リスクを説明するための模式図である。図2に示すように、23995番の遺伝子位置もしくはその近傍において第2の式の一例であるX1-Y1-X1の塩基配列に変異する遺伝子変異が、疾患Aに関与していることが判明したとする。その場合において、図9に示すように、検査対象者の遺伝子配列において、23995番の遺伝子位置において、第2の式の一例であるX1-Y1-X1の塩基配列が検出された場合、疾患Aにかかるリスクがあることが分かる。本実施形態の一例では、これを疾患Aに係るリスクを表すリスク値の計算に利用する。 Fig. 9 is a schematic diagram for explaining the disease risk of a test subject in the second embodiment. As shown in Fig. 2, it is assumed that a gene mutation that mutates to a base sequence of X1 -Y 1 -X1 , which is an example of the second formula, at or near the gene position 23995 is found to be involved in disease A. In that case, as shown in Fig. 9, if the base sequence of X1 -Y1-X1 , which is an example of the second formula, is detected at the gene position 23995 in the gene sequence of the test subject, it is found that there is a risk of contracting disease A. In one example of this embodiment, this is used to calculate a risk value that represents the risk of contracting disease A.

図10の向かって左側において、DNA配列の第1の式:X-Y-X-Y-Xの塩基配列の前後にそれぞれ塩基配列abc、塩基配列defが存在するが、RNAに転写する際に、第1の式:X-Y-X-Y-XからX-Yが弾かれて、一部の塩基配列X-Y-XだけがRNAに転写される。この転写物があたかも鋳型となり対象のDNA配列を第1の式:X-Y-X-Y-Xから当該第2の式:X-Y-Xを生じさせる。この反応が進むためには、当該第2の式:X-Y-Xの塩基配列が十分な長さがあれば、第2の式:X-Y-Xの塩基配列の前後の塩基配列abcとdefの長さの合計が0でもよいが、好ましくは1mer以上、より好ましくは20mer以上、更に好ましくは40mer以上である。図10の向かって右側に示すように、上記の遺伝子位置以外に、RNA配列の第2の式:X-Y-Xの塩基配列の前の塩基配列abcと後の塩基配列defが一致している場合、図10の向かって左側のDNA配列から生じたRNAと同じ挙動をする。このとき、X-Yが抜けるためには、当該第2の式:X-Y-Xの塩基配列が十分な長さがあれば、第2の式:X-Y-Xの塩基配列の前後の塩基配列abcとdefの長さの合計が0でもよいが、好ましくは1mer以上、より好ましくは20mer以上、更に好ましくは40mer以上である。On the left side of Figure 10, the base sequence abc and the base sequence def exist before and after the base sequence of the first formula: X-Y-X-Y-X in the DNA sequence, but when transcribed into RNA, X-Y is rejected from the first formula: X-Y-X-Y-X, and only a portion of the base sequence X-Y-X is transcribed into RNA. This transcript acts as a template to generate the target DNA sequence from the first formula: X-Y-X-Y-X to the second formula: X-Y-X. For this reaction to proceed, if the base sequence of the second formula: X-Y-X is long enough, the total length of the base sequences abc and def before and after the base sequence of the second formula: X-Y-X may be 0, but is preferably 1 mer or more, more preferably 20 mer or more, and even more preferably 40 mer or more. As shown on the right side of Figure 10, in addition to the above gene positions, if the base sequence abc before the base sequence of the second formula: X-Y-X of the RNA sequence matches the base sequence def after it, it will behave in the same way as the RNA generated from the DNA sequence on the left side of Figure 10. In this case, if the base sequence of the second formula: X-Y-X is long enough for X-Y to be removed, the total length of the base sequences abc and def before and after the base sequence of the second formula: X-Y-X can be 0, but is preferably 1 mer or more, more preferably 20 mer or more, and even more preferably 40 mer or more.

図11は、第2の実施形態で検査対象者の別の疾患リスクを説明するための模式図である。図11に示すように、例えば健常者の遺伝子配列において、23821番目の遺伝子位置において第2の式:X1-Y1-X1の塩基配列が検出された場合、他の遺伝子位置である23995番目の位置における第1の式:X1-Y1-X1-Y1-X1の塩基配列から、X1-Y1またはY1-X1が抜けて、第2の式:X1-Y1-X1の塩基配列に変異するリスクがあることを本願の発明者は新たに発見した。また、本願の発明者は、第2の式:X1-Y1-X1の転写量が多いほど、第1の式:X1-Y1-X1-Y1-X1の塩基配列が、第2の式:X1-Y1-X1の塩基配列に変異するリスクが高くなるということを発見した。 Fig. 11 is a schematic diagram for explaining the risk of another disease in a test subject in the second embodiment. As shown in Fig. 11, for example, in the gene sequence of a healthy person, when the base sequence of the second formula:X1 -Y1 -X1 is detected at the 23821st gene position, the inventors of the present application have newly discovered that there is a risk that X1-Y1 orY1 -X1 is removed from the base sequence of the first formula: X1-Y1 -X1-Y1 -X1 at the 23995th gene position, which is another gene position, and the base sequence is mutated to the base sequence of thesecond formula:X1 -Y1 -X1 . In addition, the inventors of the present application have discovered that the greater the transcription amount of the second formula:X1 -Y1 -X1 , the higher the risk that the base sequence of the first formula: X1-Y1 -X1 -Y1 -X1 will mutate to the base sequence of the second formula:X1 -Y1 -X1 .

遺伝子位置23995における第2の式:X1-Y1-X1の変異は、疾患Aに関与するという情報が予め得られていれば、第2の式:X1-Y1-X1の転写量が多いほど、疾患Aにかかるリスクが高い。本実施形態の一例では、これを疾患Aに係るリスクを表すリスク値の計算に利用する。 If it is known in advance that a mutation of the second formula: X1 -Y1 -X1 at gene position 23995 is involved in disease A, then the higher the transcription amount of the second formula: X1 -Y1 -X1 , the higher the risk of contracting disease A. In one example of this embodiment, this is used to calculate a risk value that represents the risk associated with disease A.

ここで、転写量とその測定法のイメージについて図12を用いて説明する。図12は、転写量とその測定法のイメージについて説明するための模式図である。図12に示すように、転写量の情報は例えば、RNAシークエンスから得られる。全転写物の転写量を定量するには、まずサンプル(例えば、検査対象者から得られた検体)から転写物であるRNAを抽出する。ここで検体は例えば組織、細胞、もしくは体液などのRNAを含む検体であり得る。組織は例えば、臓器、臓器の一部、生検検体、髪の毛、体毛、皮膚などが挙げられ、体液は例えば、臓器の一部、血液、血清、血漿、唾液、リンパ液、脳脊髄液、尿、精液などが挙げられるが、それに限るものではない。
第2の実施形態では、検査対象者の検体中の第2の式:X-Y-Xの塩基配列のRNAへの転写量を対象の疾患に罹るリスクを決定するのに用いる場合(図18A、図18B、図20A、図20B参照)と用いない場合(図19参照)がある。RNAの転写量を用いる場合には、検体はRNAの転写量が検出できるものであればよい。一方、RNAの転写量を用いない場合には、(1)ゲノムDNAの塩基配列を読む場合と、(2)mRNAの塩基配列を読む場合の2通りがあり、(1)ゲノムDNAの塩基配列を読む場合には、検体には少なくともDNAが含まれ、(2)mRNAの塩基配列を読む場合には、は、検体には少なくともRNAが含まれる。
次に、検体から単離されたRNAのシークエンスを行うことができる。ある態様では、これらのRNAを短く切断し、できたRNA断片からcDNAライブラリーを作成し、最後に、次世代シーケンサーを利用して、cDNAの両端から1塩基ずつ読み取ることができる。ある態様では、RNAからcDNAを合成し、合成したDNAの断片の塩基配列を読み取ることができる。このように両端から読み込まれた塩基配列はリードと呼ばれる。
Here, the image of the transcription amount and its measurement method will be described with reference to FIG. 12. FIG. 12 is a schematic diagram for explaining the image of the transcription amount and its measurement method. As shown in FIG. 12, information on the transcription amount can be obtained, for example, from RNA sequencing. To quantify the transcription amount of all transcripts, first, RNA, which is a transcript, is extracted from a sample (for example, a specimen obtained from a test subject). Here, the specimen can be, for example, a specimen containing RNA, such as tissue, cell, or body fluid. Examples of tissue include organs, parts of organs, biopsy specimens, hair, body hair, and skin, and examples of body fluids include, but are not limited to, parts of organs, blood, serum, plasma, saliva, lymph, cerebrospinal fluid, urine, and semen.
In the second embodiment, the amount of transcription of the base sequence of the second formula: X-Y-X in the sample of the test subject to RNA may be used to determine the risk of the subject's disease (see FIG. 18A, FIG. 18B, FIG. 20A, FIG. 20B) or not (see FIG. 19). When the amount of transcription of RNA is used, the sample may be one in which the amount of transcription of RNA can be detected. On the other hand, when the amount of transcription of RNA is not used, there are two ways: (1) reading the base sequence of genomic DNA and (2) reading the base sequence of mRNA. When (1) reading the base sequence of genomic DNA, the sample contains at least DNA, and when (2) reading the base sequence of mRNA, the sample contains at least RNA.
The RNA isolated from the sample can then be sequenced. In one embodiment, the RNA is cut into short pieces, a cDNA library is created from the resulting RNA fragments, and finally, a next-generation sequencer is used to read one base at a time from both ends of the cDNA. In one embodiment, cDNA is synthesized from the RNA, and the base sequence of the synthesized DNA fragment can be read. The base sequence read from both ends in this way is called a read.

次に、リードがどの転写物に由来するのかを決定するため、各リードの塩基配列を、転写物の塩基配列と照合し、リードがどの転写物にアラインメントされるのかを調べるマッピングを行う。各転写物にマッピングされたリードの数(例えば順方向と逆方向を足して1とする)を数える。ただし、転写物量が多いほど、リード数も多く、また、転写物が長いと、RNA断片も多くなるので、この場合もリードの数が多くなる。このため、リード数をそのまま転写物の発現量と見做すことはできないので、リード数を、転写物の長さで補正する等の正規化の作業を行い、その結果得られた値が転写量である。Next, to determine which transcript the read comes from, the base sequence of each read is compared with the base sequence of the transcript, and mapping is performed to determine which transcript the read aligns to. The number of reads mapped to each transcript (for example, the forward and reverse reads added together = 1) is counted. However, the greater the amount of transcript, the greater the number of reads, and the longer the transcript, the greater the number of RNA fragments, so in this case too, the number of reads will be greater. For this reason, the number of reads cannot be regarded as the expression level of the transcript as it is, so the number of reads is normalized by correcting it for the length of the transcript, and the resulting value is the transcription amount.

図13は、第2の実施形態に係る端末1の検査における画面遷移の一例である。図13に示すように、画面G3には、「DNA配列および転写量での診断」を選択するためのラジオボタンRB1、「DNA配列のみでの診断」を選択するためのラジオボタンRB2、「転写量のみでの診断」を選択するためのラジオボタンRB3が表示されている。また画面G3には、DNA配列および転写量での診断の場合、検査対象者の遺伝子配列(ここでは一例としてDNA配列)を受付可能なボックスB4及び遺伝子の転写量情報(例えばRNA転写量情報)を受付可能なボックスB5が設けられている。ここでは一例としてユーザがボックスB4内のファイル選択ボタンを押してDNA配列が含まれるファイルを選択することによってDNA配列が入力され、ユーザがボックスB5内のファイル選択ボタンを押してRNA転写量情報が含まれるファイルを選択することによってRNA転写量情報が入力される。Figure 13 is an example of screen transitions in the test of the terminal 1 according to the second embodiment. As shown in Figure 13, the screen G3 displays a radio button RB1 for selecting "Diagnosis by DNA sequence and transcription amount", a radio button RB2 for selecting "Diagnosis by DNA sequence only", and a radio button RB3 for selecting "Diagnosis by transcription amount only". In addition, in the case of diagnosis by DNA sequence and transcription amount, the screen G3 is provided with a box B4 that can receive the gene sequence of the test subject (here, DNA sequence as an example) and a box B5 that can receive gene transcription amount information (for example, RNA transcription amount information). Here, as an example, the user presses the file selection button in box B4 to select a file containing the DNA sequence, thereby inputting the DNA sequence, and the user presses the file selection button in box B5 to select a file containing the RNA transcription amount information, thereby inputting the RNA transcription amount information.

DNA配列のみでの診断の場合、検査対象者の遺伝子配列(ここでは一例としてDNA配列)を受付可能なボックスB6が設けられている。ここでは一例としてユーザがボックスB6内のファイル選択ボタンを押してDNA配列が含まれるファイルを選択することによってDNA配列が入力される。In the case of diagnosis based only on DNA sequence, a box B6 is provided that can accept the genetic sequence of the test subject (here, as an example, a DNA sequence). Here, as an example, the DNA sequence is input by the user pressing the file selection button in box B6 to select a file that contains the DNA sequence.

転写量のみでの診断の場合、検査対象者の遺伝子の転写量情報(例えばRNA転写量情報)を受付可能なボックスB7が設けられている。ここでは一例としてユーザがボックスB7内のファイル選択ボタンを押してRNA転写量情報が含まれるファイルを選択することによってRNA転写量情報が入力される。When diagnosis is based only on the transcription amount, a box B7 is provided that can accept transcription amount information (e.g., RNA transcription amount information) of the subject's genes. As an example, the user presses the file selection button in box B7 to select a file that contains RNA transcription amount information, thereby inputting the RNA transcription amount information.

画面G3において送信ボタンB8が押下された場合、受け付けた検査対象者の遺伝子配列(例えばDNA配列)及び/または遺伝子の転写量情報(例えばRNA転写量情報)が端末1からサーバ2へ送信される。その後、サーバ2で処理が実行され、サーバ2から情報が端末1へ送信され、この情報が端末1で例えば図13に示すように表示される。これにより、画面G4には、疾患リスク表が表示される。この疾患リスク表には、検査対象者が罹るリスクがある疾患名とその疾患のリスク値との組が表示される。When the send button B8 is pressed on screen G3, the accepted gene sequence (e.g., DNA sequence) and/or gene transcription amount information (e.g., RNA transcription amount information) of the test subject is sent from terminal 1 to server 2. Processing is then executed on server 2, and information is sent from server 2 to terminal 1, and this information is displayed on terminal 1, for example, as shown in FIG. 13. As a result, a disease risk table is displayed on screen G4. This disease risk table displays pairs of disease names that the test subject is at risk of suffering from and risk values for those diseases.

ここで、RNA転写量情報が含まれるファイルについて図14を用いて説明する。図14は、RNA転写量情報のファイルの中身の例である。図14に示すRNA転写量情報のファイルには例えば、遺伝子名、当該遺伝子の転写量、当該遺伝子の遺伝子位置の組がリストされている。このように、RNA転写量情報には例えば、遺伝子名、当該遺伝子の転写量、当該遺伝子の遺伝子位置の組のリストが含まれる。なお、RNA転写量情報に、遺伝子名があれば遺伝子位置を特定できるので遺伝子位置がなくてもよいし、遺伝子の遺伝子位置があれば遺伝子名が特定できるので遺伝子名がなくてもよい。Here, a file containing RNA transcription amount information will be described with reference to FIG. 14. FIG. 14 is an example of the contents of an RNA transcription amount information file. The RNA transcription amount information file shown in FIG. 14 lists, for example, pairs of gene names, transcription amounts of the genes, and gene positions of the genes. In this way, the RNA transcription amount information includes, for example, a list of pairs of gene names, transcription amounts of the genes, and gene positions of the genes. Note that if the RNA transcription amount information contains gene names, the gene positions can be specified, so gene positions do not have to be included, and, on the other hand, if the gene positions of the genes are included, the gene names can be specified, so gene names do not have to be included.

図15は、リスク値の計算方法の一例を説明するための表である。図15では、遺伝子位置aにおけるXa-Ya-Xaへの遺伝子変異の有無、遺伝子位置bにおけるXb-Yb-Xbへの遺伝子変異の有無、遺伝子位置cにおけるXc-Yc-Xcへの遺伝子変異の有無の組み合わせ毎に、リスク値が関連付けられている。また図15の表では、Xa-Ya-Xaの転写量のレベル、Xb-Yb-Xbの転写量のレベル、Xc-Yc-Xcの転写量のレベルがそれぞれ3段階で表されている。ここで健常者の転写量をTn、対象の疾患の患者の転写量をTp、検査対象者の転写量をTsとする。レベル1の場合、検査対象者の転写量Tsが健常者の転写量Tn以下(Ts≦Tn)である。レベル2の場合、検査対象者の転写量Tsが健常者の転写量Tnを超えるが患者の転写量Tpを下回る(Tn<Ts<Tp)。レベル3の場合、検査対象者の転写量Tsが患者の転写量Tp以上である(Tp≦Ts)。 FIG. 15 is a table for explaining an example of a method for calculating a risk value. In FIG. 15, a risk value is associated with each combination of the presence or absence of a gene mutation to Xa-Ya -Xa at gene position a, the presence or absence of a gene mutation to Xb-Yb -Xb at gene position b, and the presence or absence of a gene mutation to Xc-Yc -Xc at gene position c. In addition, in the table of FIG. 15, the transcription level of Xa-Ya -Xa , the transcription level of Xb-Yb-Xb, and the transcription level of Xc-Yc -Xc are each expressed in three levels. Here, the transcription amount of a healthy person is Tn, the transcription amount of a patient with a target disease is Tp, and the transcription amount of a test subject is Ts. In the case of level 1, the transcription amount Ts of the test subject is equal to or less than the transcription amount Tn of a healthy person (Ts≦Tn). In the case of level 2, the transcription amount Ts of the test subject exceeds the transcription amount Tn of a healthy person but is less than the transcription amount Tp of the patient (Tn<Ts<Tp). In the case of level 3, the transcription amount Ts of the test subject is equal to or greater than the transcription amount Tp of the patient (Tp≦Ts).

ここで、対象の疾患の患者であっても、遺伝子位置aにおけるXa-Ya-Xaへの遺伝子変異が起こっている患者と起こっていない患者がいるので、対象の疾患の患者群において、この遺伝子位置aにおけるXa-Ya-Xaへの遺伝子変異が起こっている確率(以下、変異発生率という)をPaとする。同様に、対象の疾患の患者であっても、遺伝子位置bにおけるXb-Yb-Xbへの遺伝子変異が起こっている患者と起こっていない患者がいるので、対象の疾患の患者群において、この遺伝子位置bにおけるXb-Yb-Xbへの遺伝子変異が起こっている確率(変異発生率)をPbとする。同様に、対象の疾患の患者であっても、遺伝子位置cにおけるXc-Yc-Xcへの遺伝子変異が起こっている患者と起こっていない患者がいるので、対象の疾患の患者群において、この遺伝子位置cにおけるXc-Yc-Xcへの遺伝子変異が起こっている確率(変異発生率)をPcとする。 Here, even among patients with the target disease, there are patients with and without a gene mutation to Xa-Ya -Xa at gene position a, so the probability (hereinafter referred to as the mutation incidence rate) that a gene mutation to Xa-Ya -Xa has occurred at this gene position a in the patient group with the target disease is Pa. Similarly, even among patients with the target disease, there are patients with and without a gene mutation to Xb-Yb -Xb at gene position b, so the probability (mutation incidence rate) that a gene mutation to Xb-Yb -Xb has occurred at this gene position b in the patient group with the target disease is Pb. Similarly, even among patients with the target disease, there are patients with and without a gene mutation to Xc-Yc -Xc at gene position c, so the probability (mutation incidence rate) that a gene mutation to Xc-Yc -Xc has occurred at this gene position c in the patient group with the target disease is Pc.

ケース1~4の場合、上記三つの遺伝子変異が全て生じているので、対象の疾患の罹るリスクの大きさを表すリスク値は、例えばPa+Pb+Pcで表される。このように、配列情報のみで、リスク値を計算可能である。In cases 1 to 4, all three gene mutations have occurred, so the risk value indicating the magnitude of the risk of contracting the target disease is expressed as, for example, Pa + Pb + Pc. In this way, the risk value can be calculated using only the sequence information.

ここでは転写量がレベル1の場合、転写量が少ないため正常なX-Y-X-Y-Xの配列がX-Y-Xに変異する確率が低いので、変異発生率に乗じる重みwL1は例えば0に設定される。転写量がレベル2の場合、転写量が中程度であるため正常なX-Y-X-Y-Xの配列がX-Y-Xに変異する確率が中程度あるので、変異発生率に乗じる重みwL2は例えば0.5で設定される。転写量がレベル3の場合、転写量が対象の疾患より多いため正常なX-Y-X-Y-Xの配列がX-Y-Xに変異する確率が高いので、変異発生率に乗じる重みwL3は1である。 Here, when the transcription amount is level 1, the probability that a normal X-Y-X-Y-X sequence will mutate to X-Y-X is low because the transcription amount is low, so the weight wL1 multiplied by the mutation rate is set to, for example, 0. When the transcription amount is level 2, the transcription amount is moderate, so the probability that a normal X-Y-X-Y-X sequence will mutate to X-Y-X is moderate, so the weight wL2 multiplied by the mutation rate is set to, for example, 0.5. When the transcription amount is level 3, the transcription amount is greater than the target disease, so the probability that a normal X-Y-X-Y-X sequence will mutate to X-Y-X is high, so the weight wL3 multiplied by the mutation rate is 1.

一方、ケース5では、遺伝子位置a、bでは変異が起こっているが遺伝子位置cでは変異が起こっていない。この場合であっても、遺伝子位置cに対応するXc-Yc-Xcの転写量が多いほど、遺伝子位置cにおいて将来的にXc-Yc-Xcに遺伝子変異する確率が高まる。ここでは、Xc-Yc-Xcの転写量のレベルが3であるため、リスク寄与度としてwL3Pcが算出される。そして、リスク値は、例えば、Pa+Pb+wL3Pcで表される。このように、配列情報と転写量情報の両方を用いてリスク値が算出される。なお、後述するように転写量情報のみを用いてリスク値が算出されてもよい。 On the other hand, in case 5, mutations have occurred at gene positions a and b, but no mutation has occurred at gene position c. Even in this case, the greater the transcription amount of Xc-Yc -Xc corresponding to gene position c, the higher the probability of gene mutation to Xc-Yc -Xc at gene position c in the future. Here, since the transcription amount level of Xc-Yc -Xc is 3,wL3Pc is calculated as the risk contribution. Then, the risk value is expressed, for example, as Pa+Pb+wL3Pc . In this way, the risk value is calculated using both the sequence information and the transcription amount information. Note that the risk value may be calculated using only the transcription amount information, as described later.

ケース6では、遺伝子位置bでは変異が起こっているが遺伝子位置a、cでは変異が起こっていない。この場合であっても、遺伝子位置aに対応するXa-Ya-Xaの転写量が多いほど、遺伝子位置aにおいて将来的にXa-Ya-Xaに遺伝子変異する確率が高まる。ここでは例えば、Xa-Ya-Xaの転写量のレベルが1であるため、リスク寄与度としてwL1Paが算出される。同様に、遺伝子位置cに対応するXc-Yc-Xcの転写量が多いほど、遺伝子位置cにおいて将来的にXc-Yc-Xcに遺伝子変異する確率が高まる。ここでは例えば、Xc-Yc-Xcの転写量のレベルが1であるため、リスク寄与度としてwL1Pcが算出される。そして、リスク値は、例えば、wL1Pa+Pb+wL1Pcで表される。このように、配列情報と転写量情報の両方を用いてリスク値が算出される。なお、後述するように転写量情報のみを用いてリスク値が算出されてもよい。 In case 6, mutation occurs at gene position b, but mutation does not occur at gene positions a and c. Even in this case, the greater the transcription amount of Xa -Ya -Xa corresponding to gene position a, the higher the probability of gene mutation to Xa -Ya -Xa in the future at gene position a. Here, for example, since the level of the transcription amount of Xa -Ya -Xa is 1, wL1 Pa is calculated as the risk contribution. Similarly, the greater the transcription amount of Xc -Yc -Xc corresponding to gene position c, the higher the probability of gene mutation to Xc -Yc -Xc in the future at gene position c. Here, for example, since the level of the transcription amount of Xc -Yc -Xc is 1, wL1 Pc is calculated as the risk contribution. And the risk value is expressed, for example, as wL1 Pa + Pb + wL1 Pc. In this way, the risk value is calculated using both the sequence information and the transcription amount information. It should be noted that the risk value may be calculated using only the transcription amount information as described later.

ケース7~9は、遺伝子位置a、b、cのいずれでも変異が起こっていない場合の例である。この場合、Xa-Ya-Xaの転写量によるリスク寄与度はwLaPaであり、Xb-Yb-Xbの転写量によるリスク寄与度はwLbPbであり、Xc-Yc-Xcの転写量によるリスク寄与度がwLcPcである。そしてリスク値は、例えば、wLaPa+wLbPb+wLcPcで表される。このように、配列情報と転写量情報の両方を用いてリスク値が算出される。なお、後述するように転写量情報のみを用いてリスク値が算出されてもよい。 Cases 7 to 9 are examples where no mutation occurs at any of gene positions a, b, or c. In this case, the risk contribution due to the transcription amount of Xa-Ya -Xa iswLaPa , the risk contribution due to the transcription amount of Xb-Yb-XbiswLbPb , and the risk contribution due to the transcription amount of Xc-Yc -Xc iswLcPc . The risk value is expressed, for example, aswLaPa +wLbPb +wLcPc . In this way, the risk value is calculated using both the sequence information and the transcription amount information. Note that the risk value may be calculated using only the transcription amount information, as described later.

図16は、ストレージに保存されている疾患毎の遺伝子変異テーブルの例である。図16に示すように、例えば、疾患が疾患1から疾患N(Nは自然数)まであるとすると、疾患1の遺伝子変異テーブルTA1から疾患Nの遺伝子変異テーブルTANまで、N個のテーブルがサーバ2のストレージ23に格納されている。N1、N2、N3はインデックスである。i(iは自然数)を疾患インデックスとすると、疾患iの遺伝子変異テーブルTAiには、当該疾患iと関連する遺伝子、遺伝子位置、変異前配列、変異後配列、健常者の当該Xi-Yi-Xiの変異を持つ遺伝子の総転写量、当該疾患iの患者の当該Xi-Yi-Xiの変異を持つ遺伝子の総転写量、当該疾患iの患者が当該遺伝子位置において当該Xi-Yi-Xiの変異の変異発生率の組のレコードが蓄積されている。この疾患毎の遺伝子変異テーブルは、後述する図18のDNA配列とRNA転写量から疾患のリスク値を算出するのに用いられる。 FIG. 16 is an example of a genetic mutation table for each disease stored in the storage. As shown in FIG. 16, for example, assuming that diseases range from disease 1 to disease N (N is a natural number), N tables are stored in the storage 23 of the server 2, from genetic mutation table TA1 for disease 1 to genetic mutation table TAN for disease N. N1, N2, and N3 are indexes. If i (i is a natural number) is a disease index, the genetic mutation table TAi for disease i stores records of a gene associated with the disease i, a genetic position, a pre-mutation sequence, a post-mutation sequence, a total transcription amount of a gene having the Xi -Yi -Xi mutation in a healthy person, a total transcription amount of a gene having the Xi -Yi -Xi mutation in a patient with the disease i, and a mutation occurrence rate of the Xi -Yi -Xi mutation at the genetic position in a patient with the disease i. This genetic mutation table for each disease is used to calculate a risk value of a disease from the DNA sequence and RNA transcription amount in FIG. 18, which will be described later.

図17は、ストレージに保存されている疾患毎の転写量テーブルの例である。図17に示すように、疾患が疾患1から疾患Nまであるとすると、疾患1の転写量テーブルから疾患Nの転写量テーブルまで、N個のテーブルがサーバ2のストレージ23に格納されている。疾患iの転写量テーブルTAiには、Xj-Yj-Xjの変異が当該疾患iと関連する遺伝子、当該Xj-Yj-Xjの変異の変異発生率、他の遺伝子で当該Xj-Yj-Xjの変異をもつものあるだけに対してそれぞれ当該Xj-Yj-Xjの遺伝子名/患者の転写量/健常者の転写量のセットの組のレコードが蓄積されている。この疾患毎の転写量テーブルは、後述する図20のRNA転写量から疾患のリスク値を算出するのに用いられる。 FIG. 17 is an example of a transcription amount table for each disease stored in the storage. As shown in FIG. 17, assuming that there are diseases 1 to N, N tables are stored in the storage23 of the server 2, from the transcription amount table for disease1 to the transcriptionamounttable for diseaseN. In the transcription amount table TAi for disease i, records of a gene associated with the mutation of Xj-Yj-Xj in the disease i, the mutation incidence rate ofthe mutation ...

図18Aは、DNA配列とRNA転写量の両方を用いて、検査対象者が罹る疾患リスクの一覧を表示する処理の一例を示すフローチャートである。図18Bは、図18Aの続きのフローチャートである。図18A及び図18Bのフローチャートは、図13の画面G3において、「DNA配列および転写量での診断」のラジオボタンRB1が選択された場合において、画面G3から画面G4への遷移する場合の処理の流れの一例である。以下の図18A~図20Bの処理は、端末1であれば端末1のプロセッサ16の処理であり、サーバ2であればサーバ2のプロセッサ26の処理であり、それぞれプロセッサ16、プロセッサ26について明示的に記載しない。Figure 18A is a flowchart showing an example of a process for displaying a list of disease risks of a test subject using both DNA sequence and RNA transcription amount. Figure 18B is a continuation of the flowchart in Figure 18A. The flowcharts in Figures 18A and 18B are an example of a process flow when transitioning from screen G3 to screen G4 when radio button RB1 for "Diagnosis using DNA sequence and transcription amount" is selected on screen G3 in Figure 13. The processes in the following Figures 18A to 20B are the processes of processor 16 of terminal 1 in the case of terminal 1, and the processes of processor 26 of server 2 in the case of server 2, and processor 16 and processor 26 are not explicitly described.

(ステップS110)端末1は、検査対象者のDNA配列とRNA転写量情報を受け付ける。具体的には例えば、図13の画面G3においてボックスB4においてDNA配列のファイルが選択され、ボックスB5においてRNA転写量情報のファイルが選択された場合に、端末1は、これらの検査対象者のDNA配列とRNA転写量情報を受け付ける。(Step S110) Terminal 1 accepts the DNA sequence and RNA transcription amount information of the test subject. Specifically, for example, when a DNA sequence file is selected in box B4 on screen G3 in FIG. 13 and a RNA transcription amount information file is selected in box B5, terminal 1 accepts the DNA sequence and RNA transcription amount information of these test subjects.

(ステップS120)そして端末1は、例えば図13の画面G3において送信ボタンB8が押された場合、ステップS110で受け付けたDNA配列とRNA転写量情報をサーバ2へ送信する。(Step S120) Then, for example, when the send button B8 on screen G3 in FIG. 13 is pressed, the terminal 1 sends the DNA sequence and RNA transcription amount information received in step S110 to the server 2.

(ステップS130)サーバ2は、DNA配列とRNA転写量情報を受信した場合、疾患インデックスiおよび疾患リスク表を初期化する。(Step S130) When server 2 receives the DNA sequence and RNA transcription amount information, it initializes the disease index i and the disease risk table.

(ステップS140)次にサーバ2は、X-Y-X配列インデックスjおよびリスク値を初期化する。(Step S140) Next, server 2 initializes the X-Y-X array index j and the risk value.

(ステップS150)次にサーバ2は、ストレージ23に記憶された、疾患iとそれに関連するX-Y-X配列のリストを、疾患iの遺伝子変異テーブルTAiから取得する。例えば、最初のループでは、疾患インデックスiがステップS130で1に初期化されているので、図16の疾患1の遺伝子変異テーブルTA1から変異後のX-Y-X配列のリストが取得される。 (Step S150) Next, the server 2 obtains a list of disease i and its associated X-Y-X sequences from the genetic mutation table TAi for disease i stored in the storage 23. For example, in the first loop, since the disease index i is initialized to 1 in step S130, a list of X-Y-X sequences after mutation is obtained from the genetic mutation table TA1 for disease 1 in FIG.

(ステップS160)次にサーバ2は、ストレージに記憶された疾患iに関連するX-Y-X配列のリストのj番目のXj-Yj-Xj配列を、検査対象者のDNA配列の対応する配列位置において検索する。 (Step S160) Next, the server 2 searches for the j-th Xj -Yj -Xj sequence in the list of XYX sequences associated with disease i stored in the storage, at the corresponding sequence position in the DNA sequence of the test subject.

(ステップS170)次にサーバ2は、対応する配列位置においてXj-Yj-Xj配列を検出したか否か判定する。 (Step S170) Next, the server 2 determines whether or not an Xj -Yj -Xj array has been detected in the corresponding array position.

(ステップS180)ステップS170で対応する配列位置においてXj-Yj-Xj配列を検出した場合、サーバ2は、ストレージ23に記憶された、疾患iの遺伝子変異テーブルTAiにおいて、j番目のXj-Yj-Xj配列の患者での変異発生率を取得する。 (Step S180) When an Xj -Yj -Xj sequence is detected at the corresponding sequence position in step S170, the server 2 acquires the mutation incidence rate of the j-th Xj -Yj -Xj sequence in patients in the gene mutation table TAi for the disease i stored in the storage 23.

(ステップS190)ステップS180に引き続いてサーバ2は、疾患iのリスク値に、得られたj番目のXj-Yj-Xj配列の変異発生率を加算する。そして処理がステップS240に移行する。 (Step S190) Following step S180, the server 2 adds the mutation incidence rate of the obtained j-th Xj -Yj -Xj sequence to the risk value of disease i, and then the process proceeds to step S240.

(ステップS200)ステップS170において対応する配列位置においてXj-Yj-Xj配列を検出していない場合、サーバ2は、対応する配列位置以外におけるXj-Yj-Xj配列を検索する。 (Step S200) If an Xj-Yj -Xj array is not found in the corresponding array position in step S170, the server 2 searches for an Xj-Yj-Xj array in an array position other than the corresponding array position.

(ステップS210)サーバ2は、対応する配列位置以外の位置にXj-Yj-Xj配列を検出したか否か判定する。 (Step S210) The server 2 determines whether or not an Xj -Yj -Xj array has been detected at a position other than the corresponding array position.

(ステップS220)ステップS210において対応する配列位置以外の位置にXj-Yj-Xj配列が検出された場合、検査対象者の転写量情報から検出したXj-Yj-Xj配列を持つ遺伝子の転写量を取得し、Xj-Yj-Xjの転写量に加算する。そしてステップS200に戻って、対応する配列位置以外におけるXj-Yj-Xj配列が、他にないか検索する。 (Step S220) If an Xj -Yj -Xj sequence is detected at a position other than the corresponding sequence position in step S210, the transcription amount of the gene having the detected Xj -Yj -Xj sequence is obtained from the transcription amount information of the test subject and added to the transcription amount of Xj -Yj -Xj . Then, returning to step S200, a search is made to see if there is any other Xj -Yj -Xj sequence other than the corresponding sequence position.

(ステップS230)ステップS210において対応する配列位置以外の位置にXj-Yj-Xj配列が検出されなかった場合、サーバ2は、ストレージ23から検出されたXj-Yj-Xj配列を持つ遺伝子の患者と健常者の総転写量情報を取得し、検査対象者の転写量との比較から、重みwjを算出し、疾患iの遺伝子変異テーブルTAiのj番目の変異発生率Sjを読み出し、j番目のXj-Yj-Xj配列のリスク寄与度をwjjとして推算し、疾患iのリスク値に、このリスク寄与度wjjを加算する。そして処理がステップS240に移行する。 (Step S230) If the Xj -Yj -Xj sequence is not detected at a position other than the corresponding sequence position in step S210, the server 2 obtains the total transcription amount information of the patient and the healthy person of the gene having the detected Xj -Yj -Xj sequence from the storage 23, calculates the weight wj from a comparison with the transcription amount of the test subject, reads the j-th mutation incidence rate Sj of the gene mutation table TAi of the disease i, estimates the risk contribution of the j-th Xj -Yj -Xj sequence as wj Sj , and adds this risk contribution wj Sj to the risk value of the disease i. Then, the process proceeds to step S240.

(ステップS240)次にサーバ2は、ストレージ23の疾患iの遺伝子変異テーブルTAiにおいて次のXj+1-Yj+1-Xj+1配列のレコードがあるか否か判定する。 (Step S240) Next, the server 2 judges whether or not there is a record of the next Xj+1 -Yj+1 -Xj+1 array in the gene mutation table TAi for the disease i in the storage 23.

(ステップS250)ステップS240においてストレージ23の疾患iの遺伝子変異テーブルTAiにおいて次のXj+1-Yj+1-Xj+1配列のレコードがある場合、X-Y-X配列インデックスjを1増やす。そして、処理がステップS160に戻って、ステップS160以降の処理が繰り返される。 (Step S250) In step S240, if there is a record of the next Xj+1 -Yj+1 -Xj+1 array in the gene mutation table TAi for the disease i in the storage 23, the X-Y-X array index j is incremented by 1. Then, the process returns to step S160, and the processes from step S160 onwards are repeated.

(ステップS260)ステップS240においてストレージ23の疾患iの遺伝子変異テーブルTAiにおいて次のXj+1-Yj+1-Xj+1配列のレコードがない場合、サーバ2は例えば疾患iの名称と、そのリスク値を、疾患リスク表に追加する。 (Step S260) If there is no record of the next Xj+1 -Yj+1 -Xj+1 array in the gene mutation table TAi for disease i in the storage 23 in step S240, the server 2 adds, for example, the name of disease i and its risk value to the disease risk table.

(ステップS270)次にサーバ2は、ストレージ23に次の疾患i+1の遺伝子変異テーブルがあるか否か判定する。(Step S270) Next, the server 2 determines whether or not the storage 23 contains a gene mutation table for the next disease i+1.

(ステップS280)ステップS270においてストレージ23に次の疾患i+1の遺伝子変異テーブルがあると判定された場合、サーバ2は疾患インデックスiを1増やす。そして、処理がステップS140に戻って、疾患i+1についてステップS140以降の処理が繰り返される。(Step S280) If it is determined in step S270 that the storage 23 contains a gene mutation table for the next disease i+1, the server 2 increments the disease index i by 1. Then, the process returns to step S140, and the processes from step S140 onwards are repeated for disease i+1.

(ステップS290)ステップS270においてストレージ23に次の疾患i+1の遺伝子変異テーブルがないと判定された場合、サーバ2は、検査対象者が罹るリスクがある疾患とそのリスク値を示した疾患リスク表の情報を端末2へ送信する。(Step S290) If it is determined in step S270 that there is no gene mutation table for the next disease i+1 in storage 23, server 2 transmits to terminal 2 information on a disease risk table showing diseases that the test subject is at risk of suffering from and their risk values.

(ステップS300)端末1は、サーバ2から情報を受信した場合、この情報を用いて、検査対象者に対する疾患リスク表の情報を表示制御する。これにより、例えば図13の画面G4がディスプレイ17に表示される。検査対象者についてそれぞれの疾患のリスク値が表示されるので、検査対象者がそれぞれの疾患のリスクを把握することができる。以上で本フローチャートの処理を終了する。(Step S300) When the terminal 1 receives information from the server 2, it uses this information to control the display of the information in the disease risk table for the test subject. As a result, for example, screen G4 in FIG. 13 is displayed on the display 17. The risk value for each disease for the test subject is displayed, allowing the test subject to understand the risk of each disease. This ends the processing of this flowchart.

図19は、DNA配列を用いて、検査対象者が罹る疾患リスクの一覧を表示する処理の一例を示すフローチャートである。図19のフローチャートは、図13の画面G3において、「DNA配列のみでの診断」のラジオボタンRB2が選択された場合において、画面G3から画面G4への遷移する場合の処理の流れの一例である。Figure 19 is a flowchart showing an example of a process for displaying a list of disease risks of a test subject using DNA sequences. The flowchart in Figure 19 is an example of the process flow when transitioning from screen G3 to screen G4 when radio button RB2 for "Diagnosis using DNA sequence only" is selected on screen G3 in Figure 13.

(ステップS410)端末1は、検査対象者のDNA配列を受け付ける。具体的には例えば、図13の画面G3においてボックスB6においてDNA配列のファイルが選択された場合、端末1は、この検査対象者のDNA配列を受け付ける。(Step S410) Terminal 1 accepts the DNA sequence of the test subject. Specifically, for example, when a DNA sequence file is selected in box B6 on screen G3 of FIG. 13, terminal 1 accepts the DNA sequence of this test subject.

(ステップS420)そして端末1は、例えば図13の画面G3において送信ボタンB8が押された場合、ステップS110で受け付けたDNA配列をサーバ2へ送信する。(Step S420) Then, for example, when the send button B8 on screen G3 in FIG. 13 is pressed, terminal 1 sends the DNA sequence received in step S110 to server 2.

(ステップS430)サーバ2は、DNA配列を受信した場合、疾患インデックスiおよび疾患リスク表を初期化する。(Step S430) When the server 2 receives a DNA sequence, it initializes the disease index i and the disease risk table.

(ステップS440)次にサーバ2は、X-Y-X配列インデックスjおよびリスク値を初期化する。(Step S440) Next, server 2 initializes the X-Y-X array index j and the risk value.

(ステップS450)次にサーバ2は、ストレージ23に記憶された、疾患iとそれに関連するX-Y-X配列のリストと対応する遺伝子位置のリストを、疾患iの遺伝子変異テーブルTAiから取得する。例えば、最初のループでは、疾患インデックスiがステップS430で1に初期化されているので、図12の疾患1の遺伝子変異テーブルTA1から変異後のX-Y-X配列のリストと対応する遺伝子位置のリストが取得される。 (Step S450) Next, the server 2 obtains a list of disease i and its associated X-Y-X sequences and a list of corresponding gene positions from the genetic mutation table TAi for disease i, which are stored in the storage 23. For example, in the first loop, since the disease index i is initialized to 1 in step S430, a list of X-Y-X sequences after mutation and a list of corresponding gene positions are obtained from the genetic mutation table TA1 for disease 1 in FIG.

(ステップS460)サーバ2は、ストレージ23に記憶された疾患iに関連するX-Y-X配列のリストのj番目のXj-Yj-Xj配列を、検査対象者のDNA配列の対応する遺伝子位置において検索する。 (Step S460) The server 2 searches for the j-th Xj -Yj -Xj sequence in the list of XYX sequences associated with disease i stored in the storage 23, at the corresponding gene position in the DNA sequence of the test subject.

(ステップS470)サーバ2は、対応する遺伝子位置においXj-Yj-Xj配列を検出したか否か判定する。ステップS470で対応する配列位置においてXj-Yj-Xj配列を検出されなかった場合、処理がステップS500に進む。 (Step S470) The server 2 determines whether or not the Xj-Yj -Xj sequence is detected at the corresponding gene position. If the Xj-Yj -Xj sequence is not detected at the corresponding sequence position in step S470, the process proceeds to step S500.

(ステップS480)ステップS470で対応する配列位置においてXj-Yj-Xj配列を検出した場合、サーバ2は、ストレージ23に記憶された、疾患iの遺伝子変異テーブルTAiにおいて、j番目のXj-Yj-Xj配列の患者での変異発生率を取得する。 (Step S480) When an Xj -Yj -Xj sequence is detected at the corresponding sequence position in step S470, the server 2 acquires the mutation incidence rate of the j-th Xj -Yj -Xj sequence in patients in the gene mutation table TAi for the disease i stored in the storage 23.

(ステップS490)サーバ2は、疾患iに関連するX-Y-X配列の変異発生率だけ、疾患iのリスク値を増量する。(Step S490) Server 2 increases the risk value of disease i by the mutation occurrence rate of the X-Y-X sequence associated with disease i.

(ステップS500)ステップS470で対応する配列位置においてXj-Yj-Xj配列を検出されなかった場合もしくはステップS490の処理の後に、サーバ2は、疾患iの遺伝子変異テーブルTAiにおいて次のXj+1-Yj+1-j+1配列のレコードがあるか否か判定する。 (Step S500) If the Xj -Yj -Xj sequence is not detected at the corresponding sequence position in step S470 or after the processing of step S490, the server 2 determines whether or not there is a record of the next Xj+1 -Yj+1- Xj+1 sequence in the gene mutation table TAi for disease i.

(ステップS510)ステップS500で疾患iの遺伝子変異テーブルTAiにおいて次のXj+1-Yj+1-j+1配列のレコードがあると判定された場合、サーバ2はX-Y-X配列インデックスjを1増やす。そして、処理がステップS460に戻って、X-Y-X配列インデックスjについてステップS460以降の処理を繰り返す。 (Step S510) If it is determined in step S500 that there is a record of the next Xj+1 -Yj+1- Xj+1 array in the gene mutation table TAi for disease i, the server 2 increments the X-Y-X array index j by 1. Then, the process returns to step S460, and the processes from step S460 onwards are repeated for the X-Y-X array index j.

(ステップS520)ステップS500で疾患iの遺伝子変異テーブルTAiにおいて次のXj+1-Yj+1-j+1配列のレコードがないと判定された場合、サーバ2は、疾患iの名称とそのリスク値を疾患リスク表に追加する。 (Step S520) If it is determined in step S500 that there is no record of the next Xj+1 -Yj+1- Xj+1 sequence in the gene mutation table TAi for disease i, the server 2 adds the name of disease i and its risk value to the disease risk table.

(ステップS530)次にサーバ2は、ストレージ23に次の疾患i+1の遺伝子変異テーブルTAiがあるか否か判定する。 (Step S530) Next, the server 2 judges whether or not the storage 23 contains the gene mutation table TAi for the next disease i+1.

(ステップS540)ステップS530において次の疾患i+1の遺伝子変異テーブルTAiがあると判定された場合、サーバ2は、疾患インデックスiを1増やす。そして、処理がステップ440に戻り、次の疾患i+1についてステップS440以降の処理が繰り返される。 (Step S540) If it is determined in step S530 that there is a gene mutation table TAi for the next disease i+1, the server 2 increments the disease index i by 1. Then, the process returns to step S440, and the processes from step S440 onwards are repeated for the next disease i+1.

(ステップS550)ステップS530において次の疾患i+1の遺伝子変異テーブルTAiがないと判定された場合、サーバ2は、検査対象者が罹るリスクがある疾患とそのリスク値を示した疾患リスク表の情報を端末1へ送信する。 (Step S550) If it is determined in step S530 that there is no genetic mutation table TAi for the next disease i+1, the server 2 transmits to the terminal 1 information on a disease risk table showing the diseases that the test subject is at risk of having and their risk values.

(ステップS560)端末1は、サーバ2から情報を受信した場合、この情報を用いて、検査対象者に対する疾患リスク表の情報を表示制御する。これにより、例えば図13の画面G4がディスプレイ17に表示される。検査対象者についてそれぞれの疾患のリスク値が表示されるので、検査対象者がそれぞれの疾患のリスクを把握することができる。以上で本フローチャートの処理を終了する。(Step S560) When the terminal 1 receives information from the server 2, it uses this information to control the display of the information in the disease risk table for the test subject. As a result, for example, screen G4 in FIG. 13 is displayed on the display 17. The risk value for each disease for the test subject is displayed, allowing the test subject to understand the risk of each disease. This ends the processing of this flowchart.

図20Aは、RNA転写量情報を用いて、検査対象者が罹る疾患リスクの一覧を表示する処理の一例を示すフローチャートである。図20Bは、図20Aの続きのフローチャートである。図20A及び図20Bのフローチャートは、図13の画面G3において、「転写量のみでの診断」のラジオボタンRB3が選択された場合において、画面G3から画面G4への遷移する場合の処理の流れの一例である。Figure 20A is a flowchart showing an example of a process for displaying a list of disease risks of a test subject using RNA transcription amount information. Figure 20B is a continuation of the flowchart in Figure 20A. The flowcharts in Figures 20A and 20B are an example of a process flow for transitioning from screen G3 to screen G4 when radio button RB3 for "Diagnosis based on transcription amount only" is selected on screen G3 in Figure 13.

(ステップS610)端末1は、検査対象者のRNA転写量情報を受け付ける。具体的には例えば、図13の画面G3においてボックスB7において検査対象者のRNA転写量情報のファイルが選択された場合に、端末1は、これらの検査対象者のRNA転写量情報を受け付ける。(Step S610) The terminal 1 accepts the RNA transcription amount information of the test subjects. Specifically, for example, when a file of the RNA transcription amount information of the test subjects is selected in box B7 on screen G3 of FIG. 13, the terminal 1 accepts the RNA transcription amount information of these test subjects.

(ステップS620)そして端末1は、例えば図13の画面G3において送信ボタンB8が押された場合、ステップS610で受け付けたRNA転写量情報をサーバ2へ送信する。(Step S620) Then, for example, when the send button B8 is pressed on screen G3 of FIG. 13, the terminal 1 sends the RNA transcription amount information received in step S610 to the server 2.

(ステップS630)サーバ2は、RNA転写量情報を受信した場合、疾患インデックスiおよび疾患リスク表を初期化する。(Step S630) When server 2 receives RNA transcription amount information, it initializes the disease index i and the disease risk table.

(ステップS640)次にサーバ2は、遺伝子インデックスjおよびリスク値を初期化する。ここで、遺伝子インデックスjは、図17に示すように、疾患iの転写量テーブルTBiにおいて、行方向のインデックスである。 (Step S640) Next, the server 2 initializes the gene index j and the risk value, where the gene index j is an index in the row direction in the transcription amount table TBi for the disease i, as shown in FIG.

(ステップS650)次にサーバ2は、ストレージ23に記憶された疾患iの転写量テーブルTBiを参照して、疾患iと関連するX-Y-X配列を持つ遺伝子リストと、当該X-Y-X配列を有する他の遺伝子のリストを取得する。例えば、疾患1について疾患1の転写量テーブルTB1を参照して、X1-Y1-X1への変異が見られる遺伝子A、X2-Y2-X2への変異が見られる遺伝子B、X3-Y3-X3への変異が見られる遺伝子C、…が「疾患iと関連するX-Y-X配列を持つ遺伝子リスト」として取得される。またそれとともに例えば、疾患1について疾患1の転写量テーブルTB1を参照して、X1-Y1-X1を持つ遺伝子名A’、X1-Y1-X1を持つ遺伝子名A’’、X2-Y2-X2を持つ遺伝子名B’、…が「X-Y-X配列を有する他の遺伝子のリスト」として取得される。 (Step S650) Next, the server 2 refers to the transcription amount table TBi for disease i stored in the storage 23 to obtain a list of genes having an X-Y-X sequence associated with disease i and a list of other genes having the X-Y-X sequence. For example, by referring to the transcription amount table TB1 for disease 1, gene A showing a mutation to X1 -Y1 -X1 , gene B showing a mutation to X2 -Y2 -X2 , gene C showing a mutation to X3 -Y3 -X3 , ... are obtained as a "list of genes having an X-Y-X sequence associated with disease i". In addition, for example, with respect to disease 1, by referring to the transcription amount table TB1 for disease 1, a gene name A' having X1 -Y1 -X1 , a gene name A'' having X1 -Y1 -X1 , a gene name B' having X2 -Y2 -X2 , ... are obtained as a "list of other genes having the X-Y-X sequence."

(ステップS660)次にサーバ2は、ストレージ23の疾患iの転写量テーブルTBiから、疾患iと関連する遺伝子でリストのj番目のXj-Yj-Xjへの変異が見られる遺伝子の患者と健常者の転写量を取得する。例えば、疾患1と関連する遺伝子でリストの1番目のX1-Y1-X1への変異が見られる遺伝子の患者と健常者の転写量が取得される。 (Step S660) Next, the server 2 obtains the transcription amounts of the gene associated with disease i, which is mutated to Xj -Yj -Xj at the jth position in the list, in patients and healthy subjects, from the transcription amounttable TB i for disease i in the storage 23. For example, the transcription amounts of the gene associated with disease 1, which is mutated to X1 -Y1 -X1 at the 1st position in the list, in patients and healthy subjects are obtained.

(ステップS670)次にサーバ2は、端末1から受信した、検査対象者の転写量情報から、j番目のXj-Yj-Xj配列を持つ遺伝子の転写量を取得する。 (Step S 670 ) Next, the server 2 obtains the transcription amount of the jth gene having the Xj -Yj -Xj sequence from the transcription amount information of the test subject received from the terminal 1 .

(ステップS680)次にサーバ2は、ステップS650で取得された他の遺伝子リストに他の遺伝子でXj-Yj-Xj配列を持つ遺伝子があるか否か判定する。例えば、i=1、j=1の場合、ストレージ23の疾患1の転写量テーブルTB1において、X1-Y1-X1を持つ遺伝子名A’、X1-Y1-X1を持つ遺伝子名A’’があるので、他の遺伝子リストに他の遺伝子でXj-Yj-Xj配列を持つ遺伝子があると判定される。ここで他の遺伝子リストに他の遺伝子でXj-Yj-Xj配列を持つ遺伝子がないと判定された場合、処理がステップS740に進む。 (Step S680) Next, the server 2 judges whether or not there is another gene having the Xj -Yj -Xj sequence in the other gene list acquired in step S650. For example, when i=1 and j=1, there is a gene name A' having X1 -Y1 -X1 and a gene name A'' having X1 -Y1 -X1 in the transcription amount table TB1 for disease 1 in the storage 23, so it is judged that there is another gene having the Xj -Yj -Xj sequence in the other gene list. If it is judged that there is no other gene having the Xj -Yj -Xj sequence in the other gene list, the process proceeds to step S740.

(ステップS690)ステップS680において他の遺伝子リストに他の遺伝子でXj-Yj-Xj配列を持つ遺伝子があると判定された場合、サーバ2は、インデックスkを初期化する。ここで、インデックスkは、図17に示すように、疾患iの転写量テーブルTBiにおいて、「他の遺伝子でX-Y-Xを持つもの1」という項目を起点とする列方向のインデックスである。 (Step S690) If it is determined in step S680 that the other gene list contains another gene having an Xj -Yj -Xj sequence, the server 2 initializes the index k. Here, the index k is a column-wise index starting from the item "Another gene having X-Y-X 1" in the transcription amount table TBi for disease i, as shown in FIG.

(ステップS700)ステップS690に続いて、サーバ2は、ストレージ23から、ステップS650で取得された他の遺伝子リストにおいて他の遺伝子でXj-Yj-Xj配列を持つk番目の遺伝子について患者と健常者の転写量を取得する。例えば、i=1
、j=1、k=1の場合、ストレージ23の疾患1の転写量テーブルTB1において、X1-Y1-X1を持つ1番目の遺伝子名A’の患者の転写量と健常者の転写量が取得される。サーバ2は、取得した患者の転写量を、Xj-Yj-Xj配列を持つ遺伝子の患者の転写量Tpに加算し、取得した健常者の転写量を、Xj-Yj-Xj配列を持つ遺伝子の健常者の転写量Tnに加算する。
(Step S700) Following step S690, the server 2 acquires from the storage 23 the transcription amounts of the patient and the healthy subject for the k-th gene having the Xj -Yj -Xj sequence in the other gene list acquired in step S650. For example, when i=1
, j=1, k=1, the transcription amount of the patient and the transcription amount of the healthy subject for the first gene name A' having X1 -Y1 -X1 are obtained in the transcription amount table TB1 for disease 1 in the storage 23. The server 2 adds the obtained transcription amount of the patient to the transcription amount Tp of the patient for the gene having the Xj -Yj -Xj sequence, and adds the obtained transcription amount of the healthy subject to the transcription amount Tn of the healthy subject for the gene having the Xj -Yj -Xj sequence.

(ステップS710)ステップS700に続いて、サーバ2は、検査対象者の転写量情報から他の遺伝子でXj-Yj-Xj配列を持つk番目の遺伝子の転写量を取得し、Xj-Yj-Xj配列を持つ遺伝子の検査対象者の転写量Tsに加算する。 (Step S710) Following step S700, the server 2 obtains the transcription amount of the kth gene having the Xj- Yj-Xj sequence among other genes from the transcription amount information of the test subject, and adds it to the transcription amount Ts of the test subject of the gene having the Xj-Yj-Xj sequence.

(ステップS720)サーバ2は、ステップS650で取得された他の遺伝子リストに次のXj-Yj-Xj配列を持つk+1番目の遺伝子のレコードがあるか否か判定する。 (Step S720) The server 2 determines whether or not there is a record of the k+1th gene having the next Xj -Yj -Xj sequence in the other gene list acquired in step S650.

(ステップS730)ステップS720において他の遺伝子リストに次のXj-Yj-Xj配列を持つk+1番目の遺伝子のレコードがあると判定された場合、サーバ2は、インデックスkを1増やす。そして、処理がステップS700に戻って、インデックスk+1についてステップS700以降の処理が繰り返される。 (Step S730) If it is determined in step S720 that the other gene list contains a record of the k+1th gene having the next Xj -Yj -Xj sequence, the server 2 increments the index k by 1. Then, the process returns to step S700, and the processes from step S700 onwards are repeated for the index k+1.

(ステップS740)ステップS680において他の遺伝子リストに他の遺伝子でXj-Yj-Xj配列を持つ遺伝子がないと判定された場合(ステップS680 NO)、またはステップS720において他の遺伝子リストに次のXj-Yj-Xj配列を持つk+1番目の遺伝子のレコードがないと判定された場合(ステップS720 NO)、サーバ2は、以下の処理を実行する。すなわちサーバ2は、患者と健常者の転写量Tp、Tnと検査対象者の転写量Tsとの比較から、重みwjを算出し、疾患iの転写量テーブルからj番目の変異発生率Sjを読み出し、j番目のXj-Yj-Xj配列のリスク寄与度をwjjとして推算し、疾患iのリスク値に、このリスク寄与度を加算する。ここで上述したように例えば、Ts≦Tnの場合、wj=0で、Tn<Ts<Tpの場合、wj=0.5で、Tp≦Tsの場合、wj=1が算出される。 (Step S740) If it is determined in step S680 that there is no other gene having the Xj -Yj -Xj sequence in the other gene list (step S680 NO), or if it is determined in step S720 that there is no record of the k+1th gene having the next Xj -Yj -Xj sequence in the other gene list (step S720 NO), the server 2 executes the following process. That is, the server 2 calculates the weight wj from a comparison of the transcription amounts Tp and Tn of the patient and healthy person with the transcription amount Ts of the test subject, reads out the jth mutation incidence rate Sj from the transcription amount table of disease i, estimates the risk contribution of the jth Xj -Yj -Xj sequence as wj Sj , and adds this risk contribution to the risk value of disease i. Here, as described above, for example, when Ts≦Tn, wj =0, when Tn<Ts<Tp, wj =0.5, and when Tp≦Ts, wj =1 is calculated.

(ステップS750)サーバ2は、ステップS650で取得された遺伝子リストにj+1番目の遺伝子のレコードがあるか否か判定する。(Step S750) Server 2 determines whether or not there is a record for the j+1th gene in the gene list obtained in step S650.

(ステップS760)ステップS750において遺伝子リストにj+1番目の遺伝子のレコードがあると判定された場合、サーバ2は、X-Y-X配列インデックスjを1増やす。そして処理がステップS660に戻って、X-Y-X配列インデックスj+1についてステップS660以降の処理が繰り返される。(Step S760) If it is determined in step S750 that the gene list contains a record for the j+1th gene, the server 2 increments the X-Y-X array index j by 1. Then, the process returns to step S660, and the processes from step S660 onwards are repeated for the X-Y-X array index j+1.

(ステップS770)ステップS750において遺伝子リストにj+1番目の遺伝子のレコードがないと判定された場合、サーバ2は、疾患iの名称とそのリスク値を疾患リスク表に追加する。(Step S770) If it is determined in step S750 that there is no record for the j+1th gene in the gene list, the server 2 adds the name of disease i and its risk value to the disease risk table.

(ステップS780)次にサーバ2は、ストレージ23に次の疾患i+1の遺伝子変異テーブルTAiがあるか否か判定する。 (Step S780) Next, the server 2 judges whether or not the storage 23 contains the gene mutation table TAi for the next disease i+1.

(ステップS790)ステップS780において次の疾患i+1の遺伝子変異テーブルTAiがあると判定された場合、サーバ2は、疾患インデックスiを1増やす。そして、処理がステップ640に戻り、次の疾患i+1についてステップS640以降の処理が繰り返される。 (Step S790) If it is determined in step S780 that there is a gene mutation table TAi for the next disease i+1, the server 2 increments the disease index i by 1. Then, the process returns to step S640, and the processes from step S640 onwards are repeated for the next disease i+1.

(ステップS800)ステップS780において次の疾患i+1の遺伝子変異テーブルTAiがないと判定された場合、サーバ2は、検査対象者が罹るリスクがある疾患とそのリスク値を示した疾患リスク表の情報を端末1へ送信する。 (Step S800) If it is determined in step S780 that there is no genetic mutation table TAi for the next disease i+1, the server 2 transmits to the terminal 1 information on a disease risk table showing the diseases that the test subject is at risk of having and their risk values.

(ステップS810)端末1は、サーバ2から情報を受信した場合、この情報を用いて、検査対象者に対する疾患リスク表の情報を表示制御する。これにより、例えば図13の画面G4がディスプレイ17に表示される。検査対象者についてそれぞれの疾患のリスク値が表示されるので、検査対象者がそれぞれの疾患のリスクを把握することができる。以上で本フローチャートの処理を終了する。(Step S810) When the terminal 1 receives information from the server 2, it uses this information to control the display of the information in the disease risk table for the test subject. As a result, for example, screen G4 in FIG. 13 is displayed on the display 17. The risk value for each disease for the test subject is displayed, allowing the test subject to understand the risk of each disease. This ends the processing of this flowchart.

以上、第2の実施形態に係る情報処理システムは、第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]から第2の式:X-Y-Xの塩基配列への特定の遺伝子位置における変異が対象の疾患に関与することを前提とする情報処理システムである。この第2の実施形態に係る情報処理システムは、検査対象者の遺伝子配列において、当該特定の遺伝子位置における前記第2の式:X-Y-Xの塩基配列への変異があるか否かの探索の実行、及び/または前記検査対象者の検体中の第2の式:X-Y-Xの塩基配列のRNAへの転写量の抽出の実行を行う実行部262と、実行部262による少なくとも一方の実行結果を用いて、前記対象の疾患に前記検査対象者が罹るリスクに関する情報を出力する出力部263と、を備える。As described above, the information processing system according to the second embodiment is an information processing system that assumes that a mutation at a specific genetic position from the first formula: X-Y-X-Y-X [wherein X and Y represent base sequences with two or more different bases. However, Y does not follow immediately after the last X, and Y does not appear immediately before the first X] to the base sequence of the second formula: X-Y-X is involved in the target disease. The information processing system according to the second embodiment includes an execution unit 262 that searches for whether or not there is a mutation in the base sequence of the second formula: X-Y-X at the specific genetic position in the genetic sequence of the test subject, and/or extracts the amount of transcription of the base sequence of the second formula: X-Y-X to RNA in the sample of the test subject, and an output unit 263 that outputs information regarding the risk of the test subject suffering from the target disease using at least one of the execution results by the execution unit 262.

この構成により、対象の疾患に検査対象者が罹るリスクに関する情報を取得することができるので、遺伝子変異に伴う疾患のリスクを把握することを容易化することができる。This configuration makes it possible to obtain information regarding the test subject's risk of contracting the target disease, making it easier to understand the risk of disease associated with genetic mutations.

また出力部263は、前記検査対象者の前記転写量と、健常者及び/または前記対象の疾患の患者の前記転写量とを比較し、当該比較結果及び/または前記探索の実行結果を用いて、前記対象の疾患に前記検査対象者が罹るリスクに関する情報を出力する。The output unit 263 also compares the transcription amount of the test subject with the transcription amount of healthy individuals and/or patients with the target disease, and outputs information regarding the risk of the test subject suffering from the target disease using the comparison results and/or the results of the search execution.

この構成により、検査対象者の転写量と、健常者及び/または対象の疾患の患者の前記転写量とを比較結果を用いて、対象の疾患に検査対象者が罹るリスクを推定することができる。With this configuration, the test subject's risk of contracting the target disease can be estimated using the results of comparing the transcription amount of the test subject with that of healthy individuals and/or patients with the target disease.

上記転写量の比較の具体的な例として、第2の実施形態に係る情報処理システムは、健常者及び/または前記対象の疾患の患者の検体中の第2の式:X-Y-Xの塩基配列のRNAへの転写量が記憶されているストレージ23を備える。そして出力部263は、ストレージ23を参照して検査対象者の転写量と、健常者及び/または前記対象の疾患の患者の前記転写量とを比較し、当該比較結果及び/または前記探索の実行結果を用いて、前記対象の疾患に前記検査対象者が罹るリスクに関する情報を出力する。As a specific example of the comparison of the transcription amounts, the information processing system according to the second embodiment includes a storage 23 in which the transcription amount of the base sequence of the second formula: X-Y-X to RNA in a sample of a healthy individual and/or a patient with the target disease is stored. The output unit 263 then refers to the storage 23 to compare the transcription amount of the test subject with the transcription amount of the healthy individual and/or the patient with the target disease, and outputs information regarding the risk of the test subject suffering from the target disease using the comparison result and/or the execution result of the search.

また実行部262における探索の実行の具体的な例として、前記対象の疾患に関与する遺伝子変異後の第2の式:X-Y-Xの塩基配列と、当該対象の疾患に関与する当該第2の式:X-Y-Xの塩基配列への変異が生じる遺伝子位置とが関連付けられて記憶されているストレージ23を備える。実行部262は、ストレージ23から第2の式:X-Y-Xの塩基配列と遺伝子位置とを読み出し、検査対象者の遺伝子配列において、当該読み出した遺伝子位置において当該読み出した前記第2の式:X-Y-Xの塩基配列への変異があるか否かの探索の実行を行う。As a specific example of the execution of the search in the execution unit 262, a storage 23 is provided in which the base sequence of the second formula: X-Y-X after a genetic mutation involved in the disease of the subject and the genetic position at which the mutation to the base sequence of the second formula: X-Y-X involved in the disease of the subject occur are stored in association with each other. The execution unit 262 reads out the base sequence of the second formula: X-Y-X and the genetic position from the storage 23, and executes a search to determine whether or not there is a mutation to the base sequence of the second formula: X-Y-X that has been read out at the genetic position that has been read out in the genetic sequence of the test subject.

また第2の式:X-Y-Xの塩基配列の前後の塩基配列の長さの合計は、40mer以上であることが好ましい。これにより、遺伝子変異が起こる確率が高い配列について、疾患に関与する遺伝子変異としてリスク推定の考慮に入れることができ、疾患のリスク推定の精度を担保することができる。
なお、図18A~図20Bでは、出力部は、対象の疾患に前記検査対象者が罹るリスクに関する情報を出力したが、これに限ったものではなく、遺伝子変異に関する情報を出力してもよい。ここで、遺伝子変異に関する情報は例えば、遺伝子変異の可能性もしくはリスクであってもよいし、遺伝子変異が将来起こり得ることを注意喚起する情報であってもよいし、第2の式:X-Y-Xの塩基配列への変異が起こる可能性もしくはリスクであってもよいし、第2の式:X-Y-Xの塩基配列への変異が起こり得ることを注意喚起する情報であってもよい。また遺伝子変異に関する情報は例えば、転写量順の第1の式:X-Y-X-Y-X及び/または第2の式:X-Y-Xの塩基配列に関する情報であってもよいし、転写量が基準値を超えるものだけ第1の式:X-Y-X-Y-X及び/または第2の式:X-Y-Xの塩基配列に関する情報が出力されてもよいし、予め決められた転写量の順位まで第1の式:X-Y-X-Y-X及び/または第2の式:X-Y-Xの塩基配列に関する情報であってもよい。
この場合、出力部は例えば、検査対象者の検体中の第2の式:X-Y-Xの塩基配列のRNAへの転写量が多いほど、遺伝子変異に関する情報の一例として「第2の式:X-Y-Xの塩基配列への変異が起こる可能性が高いことを示す情報」を出力してもよい。これにより、第2の式:X-Y-Xの塩基配列への変異が起こる可能性が分かるので、遺伝子変異が起こる可能性を把握することを容易化することができる。
In addition, the total length of the base sequences before and after the base sequence of the second formula: X-Y-X is preferably 40 mer or more. This allows sequences with a high probability of causing a gene mutation to be taken into consideration in risk estimation as a gene mutation involved in a disease, thereby ensuring the accuracy of risk estimation of the disease.
18A to 20B, the output unit outputs information on the risk of the test subject suffering from the target disease, but is not limited thereto, and may output information on genetic mutation. Here, the information on genetic mutation may be, for example, the possibility or risk of genetic mutation, information calling attention to the possibility of genetic mutation occurring in the future, the possibility or risk of mutation occurring in the base sequence of the second formula: X-Y-X, or information calling attention to the possibility of mutation occurring in the base sequence of the second formula: X-Y-X. Furthermore, the information on gene mutations may be, for example, information on the base sequences of the first formula: X-Y-X-Y-X and/or the second formula: X-Y-X in order of transcription amount, or information on the base sequences of the first formula: X-Y-X-Y-X and/or the second formula: X-Y-X may be output only for those whose transcription amount exceeds a reference value, or information on the base sequences of the first formula: X-Y-X-Y-X and/or the second formula: X-Y-X may be output up to a predetermined order of transcription amount.
In this case, the output unit may output, for example, "information indicating that the higher the transcription amount of the base sequence of the second formula: X-Y-X into RNA in the sample of the test subject, the higher the possibility of occurrence of a mutation in the base sequence of the second formula: X-Y-X" as an example of information regarding a genetic mutation. This makes it possible to know the possibility of occurrence of a mutation in the base sequence of the second formula: X-Y-X, and thus to easily grasp the possibility of occurrence of a genetic mutation.

なお、上述した実施形態で説明した情報処理システムSの少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、情報処理システムSの少なくとも一部の機能を実現するプログラムをフレキシブルディスクやCD-ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。At least a part of the information processing system S described in the above embodiment may be configured with hardware or software. When configured with software, a program that realizes at least a part of the functions of the information processing system S may be stored on a recording medium such as a flexible disk or CD-ROM, and may be read and executed by a computer. The recording medium is not limited to removable recording media such as magnetic disks and optical disks, but may also be fixed recording media such as a hard disk device or memory.

また、情報処理システムSの少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。In addition, a program that realizes at least a part of the functions of the information processing system S may be distributed via a communication line (including wireless communication) such as the Internet. Furthermore, the program may be encrypted, modulated, or compressed and distributed via a wired line or wireless line such as the Internet, or stored on a recording medium.

さらに、一つまたは複数の情報処理装置によって情報処理システムSを機能させてもよい。複数の情報処理装置を用いる場合、情報処理装置のうちの1つをコンピュータとし、当該コンピュータが所定のプログラムを実行することにより情報処理システムSの少なくとも1つの手段として機能が実現されてもよい。Furthermore, the information processing system S may be operated by one or more information processing devices. When multiple information processing devices are used, one of the information processing devices may be a computer, and the computer may execute a predetermined program to realize the function as at least one of the means of the information processing system S.

また、情報処理システムSの一部または全部の機能を、端末1で実行してもよい。In addition, some or all of the functions of the information processing system S may be executed by the terminal 1.

以上、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。As mentioned above, the present invention is not limited to the above-mentioned embodiment as it is, and in the implementation stage, the components can be modified and embodied without departing from the gist of the invention. Furthermore, various inventions can be formed by appropriately combining the multiple components disclosed in the above-mentioned embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, components from different embodiments may be appropriately combined.

1 端末
11 入力インタフェース
12 通信回路
13 ストレージ
14 メモリ
15 出力インタフェース
16 プロセッサ
17 ディスプレイ
2 サーバ
21 入力インタフェース
22 通信回路
23 ストレージ
24 メモリ
25 出力インタフェース
26 プロセッサ
261 抽出部
262 検索部
263 出力部
264 通信制御部
S 情報処理システム
Reference Signs List 1 Terminal 11 Input interface 12 Communication circuit 13 Storage 14 Memory 15 Output interface 16 Processor 17 Display 2 Server 21 Input interface 22 Communication circuit 23 Storage 24 Memory 25 Output interface 26 Processor 261 Extraction unit 262 Search unit 263 Output unit 264 Communication control unit S Information processing system

Claims (5)

Translated fromJapanese
第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]から第2の式:X-Y-Xの塩基配列への遺伝子変異に関する情報処理システムであって、
対象の疾患に対応する特定の遺伝子において第1の式:X-Y-X-Y-Xから第2の式:X-Y-Xの塩基配列への変異の出現が既知の場合、検査対象者の前記特定の遺伝子位置において、前記第2の式:X-Y-Xの塩基配列を検索し、前記検査対象者の前記特定の遺伝子位置において、前記第2の式:X-Y-Xの塩基配列が検出されなかった場合には、前記検査対象者の前記特定の遺伝子位置以外の位置において、前記第2の式:X-Y-Xの塩基配列を検索する実行部と、
前記実行部による検索の結果、前記検査対象者の前記特定の遺伝子位置において、前記第2の式:X-Y-Xの塩基配列が検出された場合には、前記特定の遺伝子位置における前記第2の式:X-Y-Xの塩基配列の前記対象の疾患の患者での変異発生率Pを用いて、前記検査対象者が前記対象の疾患に罹るリスクに関する情報を出力し、
前記実行部による検索の結果、前記検査対象者の前記特定の遺伝子位置において、前記第2の式:X-Y-Xの塩基配列を検出されなかった場合には、前記検査対象者の前記特定の遺伝子位置以外の位置において、前記第2の式:X-Y-Xの塩基配列が検出されるたびに、検出された前記第2の式:X-Y-Xの塩基配列を持つ遺伝子の転写量を、前記検査対象者の前記第2の式:X-Y-Xの転写量に加算することにより、前記検査対象者の前記第2の式:X-Y-Xの転写量を更新したのち、前記検査対象者の前記第2の式:X-Y-Xの転写量と、健常者および前記対象の疾患の患者の前記第2の式:X-Y-Xの転写量とを比較した結果に基づいて、変異発生率に乗じる重みwを決定し、前記特定の遺伝子位置における前記第2の式:X-Y-Xの塩基配列の前記対象の疾患の患者での変異発生率Pに前記重みwを乗じた値wPを用いて、前記検査対象者が前記対象の疾患に罹るリスクに関する情報を出力する出力部と、
を備える情報処理システム。
An information processing system for genetic mutation from a first formula: X-Y-X-Y-X [wherein X and Y represent base sequences with two or more different bases, provided that Y does not immediately follow the last X, and Y does not immediately precede the first X] to a second formula: X-Y-X,
an execution unit which searches for the base sequence of the second formula: X-Y-X-X at the specific gene position of a test subject when the occurrence of a mutation from the base sequence of the first formula: X-Y-X-Y-X to the base sequence of the second formula: X-Y-X-X is known in a specific gene corresponding to a target disease, and searches for the base sequence of the second formula: X-Y-X-X at a position other than the specific gene position of the test subject when the base sequence of the second formula: X-Y-X-X is not detected at the specific gene position of the test subject;
When the base sequence of the second formula: X-Y-X is detected at the specific gene position of the test subject as a result of the search by the execution unit, outputting information on the risk of the test subject suffering from the target disease using the mutation incidence rate P of the base sequence of the second formula: X-Y-X at the specific gene position in patients with the target disease,
an output unit which, when the base sequence of the second formula: X-Y-X is not detected at the specific gene position of the test subject as a result of the search by the execution unit, updates the transcription amount of the test subject by adding the detected transcription amount of the gene having the base sequence of the second formula: X-Y-X to the transcription amount of the second formula: X-Y-X of the test subject every time the base sequence of the second formula: X-Y-X is detected at a position other than the specific gene position of the test subject, and then determines a weight w to be multiplied by a mutation incidence rate based on a result of comparing the transcription amount of the second formula: X-Y-X of the test subject with the transcription amount of the second formula: X-Y-X of a healthy subject and a patient with the target disease, and outputs information on the risk of the test subject suffering from the target disease using a value wP obtained by multiplying the mutation incidence rate P of the base sequence of the second formula: X-Y-X at the specific gene position in the patient with the target disease by the weight w ;
An information processing system comprising:
前記対象の疾患に関与する遺伝子変異後の第2の式:X-Y-Xの塩基配列と、当該対象の疾患に関与する当該第2の式:X-Y-Xの塩基配列への変異が生じる遺伝子位置とが関連付けられて記憶されているストレージを備え、
前記実行部は、前記ストレージから前記第2の式:X-Y-Xの塩基配列と前記遺伝子位置とを読み出し、前記検査対象者の遺伝子配列において、当該読み出した遺伝子位置において当該読み出した前記第2の式:X-Y-Xの塩基配列への変異があるか否かの探索の実行を行う
請求項1に記載の情報処理システム。
A storage device is provided in which a base sequence of a second formula: X-Y-X after a gene mutation involved in a disease of the subject and a gene position at which a mutation occurs in the base sequence of the second formula: X-Y-X involved in the disease of the subject are associated and stored;
2. The information processing system according to claim 1, wherein the execution unit reads out the base sequence of the second formula: X-Y-X and the gene position from the storage, and executes a search for whether or not there is a mutation in the base sequence of the second formula: X-Y-X at the read gene position in the gene sequence of the test subject.
前記第2の式:X-Y-Xの塩基配列の前後の塩基配列の長さの合計は、40mer以上である
請求項1または2に記載の情報処理システム。
3. The information processing system according to claim 1, wherein the total length of the base sequences before and after the base sequence of the second formula: X-Y-X is 40 mer or more.
コンピュータが実行する情報処理方法であって、
第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]から第2の式:X-Y-Xの塩基配列への遺伝子変異に関する情報処理方法であって、
対象の疾患に対応する特定の遺伝子において第1の式:X-Y-X-Y-Xから第2の式:X-Y-Xの塩基配列への変異の出現が既知の場合、検査対象者の前記特定の遺伝子位置において、前記第2の式:X-Y-Xの塩基配列を検索し、前記検査対象者の前記特定の遺伝子位置において、前記第2の式:X-Y-Xの塩基配列が検出されなかった場合には、前記検査対象者の前記特定の遺伝子位置以外の位置において、前記第2の式:X-Y-Xの塩基配列を検索する実行工程と、
前記実行工程による検索の結果、前記検査対象者の前記特定の遺伝子位置において、前記第2の式:X-Y-Xの塩基配列が検出された場合には、前記特定の遺伝子位置における前記第2の式:X-Y-Xの塩基配列の前記対象の疾患の患者での変異発生率Pを用いて、前記検査対象者が前記対象の疾患に罹るリスクに関する情報を出力し、
前記実行行程による検索の結果、前記検査対象者の前記特定の遺伝子位置において、前記第2の式:X-Y-Xの塩基配列を検出されなかった場合には、前記検査対象者の前記特定の遺伝子位置以外の位置において、前記第2の式:X-Y-Xの塩基配列が検出されるたびに、検出された前記第2の式:X-Y-Xの塩基配列を持つ遺伝子の転写量を、前記検査対象者の前記第2の式:X-Y-Xの転写量に加算することにより、前記検査対象者の前記第2の式:X-Y-Xの転写量を更新したのち、前記検査対象者の前記第2の式:X-Y-Xの転写量と、健常者および前記対象の疾患の患者の前記第2の式:X-Y-Xの転写量とを比較した結果に基づいて、変異発生率に乗じる重みwを決定し、前記特定の遺伝子位置における前記第2の式:X-Y-Xの塩基配列の前記対象の疾患の患者での変異発生率Pに前記重みwを乗じた値wPを用いて、前記検査対象者が前記対象の疾患に罹るリスクに関する情報もしくは遺伝子変異に関する情報を出力する出力工程と、
を有する情報処理方法。
1. A computer-implemented information processing method, comprising:
1. A method for processing information on a genetic mutation from a first formula: X-Y-X-Y-X [wherein X and Y represent base sequences with two or more different bases, provided that Y does not immediately follow the last X, and Y does not immediately precede the first X] to a base sequence of a second formula: X-Y-X,
an execution step of searching for the base sequence of the second formula: X-Y-X-X at the specific gene position of the test subject when the occurrence of a mutation from the base sequence of the first formula: X-Y-X-Y-X to the base sequence of the second formula: X-Y-X is known in a specific gene corresponding to a target disease, and when the base sequence of the second formula: X-Y-X is not detected at the specific gene position of the test subject, searching for the base sequence of the second formula: X-Y-X at a position other than the specific gene position of the test subject;
When the base sequence of the second formula: X-Y-X is detected at the specific gene position of the test subject as a result of the search by the execution step, outputting information on the risk of the test subject suffering from the target disease using the mutation incidence rate P of the base sequence of the second formula: X-Y-X at the specific gene position in patients with the target disease,
When the base sequence of the second formula: X-Y-X is not detected at the specific gene position of the test subject as a result of the search by the execution step, every time the base sequence of the second formula: X-Y-X is detected at a position other than the specific gene position of the test subject, the transcription amount of the gene having the detected base sequence of the second formula: X-Y-X is added to the transcription amount of the second formula: X-Y-X of the test subject to calculate the transcription amount of the second formula: X-Y-X of the test subject. an output step of determining a weight w to be multiplied with a mutation incidence rate based on a result of comparing the transcription amount of the second formula: X-Y-X of the test subject with the transcription amount of the second formula: X-Y-X of a healthy subject and a patient with the target disease, and outputting information on a risk that the test subject will suffer from the target disease or information on gene mutations using a value wP obtained by multiplying a mutation incidence rate P of the base sequence of the second formula: X-Y-X at the specific gene position in a patient with the target disease by the weight w ;
An information processing method comprising the steps of:
第1の式:X-Y-X-Y-X[式中、X及びYは塩基数が2以上の異なる塩基配列を示す。但し、最後のXの直後にはYが続かず、最初のXの直前にはYが出現しない。]から第2の式:X-Y-Xの塩基配列への遺伝子変異に関するプログラムであって、コンピュータを、
対象の疾患に対応する特定の遺伝子において第1の式:X-Y-X-Y-Xから第2の式:X-Y-Xの塩基配列への変異の出現が既知の場合、検査対象者の前記特定の遺伝子位置において、前記第2の式:X-Y-Xの塩基配列を検索し、前記検査対象者の前記特定の遺伝子位置において、前記第2の式:X-Y-Xの塩基配列が検出されなかった場合には、前記検査対象者の前記特定の遺伝子位置以外の位置において、前記第2の式:X-Y-Xの塩基配列を検索する実行部と、
前記実行部による検索の結果、前記検査対象者の前記特定の遺伝子位置において、前記第2の式:X-Y-Xの塩基配列が検出された場合には、前記特定の遺伝子位置における前記第2の式:X-Y-Xの塩基配列の前記対象の疾患の患者での変異発生率Pを用いて、前記検査対象者が前記対象の疾患に罹るリスクに関する情報を出力し、
前記実行行程による検索の結果、前記検査対象者の前記特定の遺伝子位置において、前記第2の式:X-Y-Xの塩基配列を検出されなかった場合には、前記検査対象者の前記特定の遺伝子位置以外の位置において、前記第2の式:X-Y-Xの塩基配列が検出されるたびに、検出された前記第2の式:X-Y-Xの塩基配列を持つ遺伝子の転写量を、前記検査対象者の前記第2の式:X-Y-Xの転写量に加算することにより、前記検査対象者の前記第2の式:X-Y-Xの転写量を更新したのち、前記検査対象者の前記第2の式:X-Y-Xの転写量と、健常者および前記対象の疾患の患者の前記第2の式:X-Y-Xの転写量とを比較した結果に基づいて、変異発生率に乗じる重みwを決定し、前記特定の遺伝子位置における前記第2の式:X-Y-Xの塩基配列の前記対象の疾患の患者での変異発生率Pに前記重みwを乗じた値wPを用いて、前記検査対象者が前記対象の疾患に罹るリスクに関する情報もしくは遺伝子変異に関する情報を出力する出力部と、
として機能させるためのプログラム。
A program for gene mutation from a first formula: X-Y-X-Y-X [wherein X and Y represent base sequences with two or more different bases, provided that Y does not immediately follow the last X, and Y does not immediately precede the first X] to a base sequence of a second formula: X-Y-X, the program comprising:
an execution unit which searches for the base sequence of the second formula: X-Y-X-X at the specific gene position of a test subject when the occurrence of a mutation from the base sequence of the first formula: X-Y-X-Y-X to the base sequence of the second formula: X-Y-X-X is known in a specific gene corresponding to a target disease, and searches for the base sequence of the second formula: X-Y-X-X at a position other than the specific gene position of the test subject when the base sequence of the second formula: X-Y-X-X is not detected at the specific gene position of the test subject;
When the base sequence of the second formula: X-Y-X is detected at the specific gene position of the test subject as a result of the search by the execution unit, outputting information on the risk of the test subject suffering from the target disease using the mutation incidence rate P of the base sequence of the second formula: X-Y-X at the specific gene position in patients with the target disease,
When the base sequence of the second formula: X-Y-X is not detected at the specific gene position of the test subject as a result of the search by the execution step, every time the base sequence of the second formula: X-Y-X is detected at a position other than the specific gene position of the test subject, the transcription amount of the gene having the detected base sequence of the second formula: X-Y-X is added to the transcription amount of the second formula: X-Y-X of the test subject to calculate the transcription amount of the second formula: X-Y-X of the test subject. an output unit which, after updating, determines a weight w to be multiplied by a mutation incidence rate based on a result of comparing the transcription amount of the second formula: X-Y-X of the test subject with the transcription amount of the second formula: X-Y-X of a healthy subject and a patient with the target disease, and outputs information on a risk that the test subject will suffer from the target disease or information on gene mutations using a value wP obtained by multiplying a mutation incidence rate P of the base sequence of the second formula: X-Y-X at the specific gene position in a patient with the target disease by the weight w ;
A program to function as a
JP2020105587A2020-06-182020-06-18 Information processing system, information processing method, identification method and programActiveJP7570088B2 (en)

Priority Applications (2)

Application NumberPriority DateFiling DateTitle
JP2020105587AJP7570088B2 (en)2020-06-182020-06-18 Information processing system, information processing method, identification method and program
PCT/JP2021/022969WO2021256525A1 (en)2020-06-182021-06-17Information processing system, information processing method, identification method, and program

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
JP2020105587AJP7570088B2 (en)2020-06-182020-06-18 Information processing system, information processing method, identification method and program

Publications (3)

Publication NumberPublication Date
JP2021197100A JP2021197100A (en)2021-12-27
JP2021197100A5 JP2021197100A5 (en)2023-03-30
JP7570088B2true JP7570088B2 (en)2024-10-21

Family

ID=79195856

Family Applications (1)

Application NumberTitlePriority DateFiling Date
JP2020105587AActiveJP7570088B2 (en)2020-06-182020-06-18 Information processing system, information processing method, identification method and program

Country Status (2)

CountryLink
JP (1)JP7570088B2 (en)
WO (1)WO2021256525A1 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP2006518199A (en)2003-02-042006-08-10エヴォテック ニューロサイエンシス ゲゼルシャフト ミット ベシュレンクテル ハフツング Diagnostic and therapeutic use of SCN2B protein for neurodegenerative diseases
JP2016509833A (en)2013-02-142016-04-04ザ・リージエンツ・オブ・ザ・ユニバーシテイ・オブ・コロラド A method for predicting the risk of interstitial pneumonia
JP2018077547A (en)2015-03-162018-05-17国立大学法人東京農工大学Parallel processing apparatus, parallel processing method, and parallelization processing program
JP2018514187A (en)2015-03-042018-06-07ベラサイト インコーポレイテッド Method for assessing risk of disease onset or recurrence using expression level and sequence variant information
WO2018231771A1 (en)2017-06-132018-12-20Bostongene CorporationSystems and methods for generating, visualizing and classifying molecular functional profiles
JP2019003667A (en)2014-03-252019-01-10ファイブスリー ジェノミックス, エルエルシーFive3 Genomics, Llc System and method for RNA analysis in function verification of oncogene mutations

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP2006518199A (en)2003-02-042006-08-10エヴォテック ニューロサイエンシス ゲゼルシャフト ミット ベシュレンクテル ハフツング Diagnostic and therapeutic use of SCN2B protein for neurodegenerative diseases
JP2016509833A (en)2013-02-142016-04-04ザ・リージエンツ・オブ・ザ・ユニバーシテイ・オブ・コロラド A method for predicting the risk of interstitial pneumonia
JP2019003667A (en)2014-03-252019-01-10ファイブスリー ジェノミックス, エルエルシーFive3 Genomics, Llc System and method for RNA analysis in function verification of oncogene mutations
JP2018514187A (en)2015-03-042018-06-07ベラサイト インコーポレイテッド Method for assessing risk of disease onset or recurrence using expression level and sequence variant information
JP2018077547A (en)2015-03-162018-05-17国立大学法人東京農工大学Parallel processing apparatus, parallel processing method, and parallelization processing program
WO2018231771A1 (en)2017-06-132018-12-20Bostongene CorporationSystems and methods for generating, visualizing and classifying molecular functional profiles

Also Published As

Publication numberPublication date
WO2021256525A1 (en)2021-12-23
JP2021197100A (en)2021-12-27

Similar Documents

PublicationPublication DateTitle
Stahl et al.Bayesian inference analyses of the polygenic architecture of rheumatoid arthritis
Benner et al.High‐dimensional Cox models: the choice of penalty as part of the model building process
JP4678546B2 (en) RECOMMENDATION DEVICE AND METHOD, PROGRAM, AND RECORDING MEDIUM
Huang et al.Optimal combinations of diagnostic tests based on AUC
CN110838366A (en) Method and device for predicting disease risk
CN113373236B (en)Method for obtaining individual age of Chinese population
US8024129B2 (en)Method and apparatus for searching gene sequence
CN117438097B (en)Method and system for predicting recurrence risk after early liver cancer operation
JP7570088B2 (en) Information processing system, information processing method, identification method and program
JP5581864B2 (en) Information processing apparatus, information processing method, and program
CN118824552B (en) Brain age prediction method and device based on deep learning and metabolomics data
YuA frailty mixture cure model with application to hospital readmission cata
JP7365736B1 (en) Immune status prediction provision system, immune status data prediction method and program
Ibrahim et al.Development and validation of a simple risk model for predicting metabolic syndrome (MetS) in midlife: a cohort study
Lopes et al.Saliva-derived transcriptomic signature for gastric cancer detection using machine learning and leveraging publicly available datasets
CN113793683A (en) A PSA-based assisted decision-making method and system for prostate cancer
JP7599641B1 (en) Neoantigen prediction device, neoantigen prediction method, and program
CN115552234A (en) Cancer screening device and cancer screening method
WO2007145789A2 (en)Method and implementation of reliable consensus feature selection in biomedical discovery
JP7723012B2 (en) Information processing method, information processing device, and information processing program
JP4362290B2 (en) Haplotype analysis apparatus and program for causing computer to execute haplotype analysis method
Meijer et al.Model selection for high-dimensional models
KR102861995B1 (en)Method and apparatus for predicting the risk of sleep disorder
JP7730475B2 (en) Genetic characteristic estimation device, control method, and program
WO2019091771A1 (en)Method for simultaneous multivariate feature selection, feature generation, and sample clustering

Legal Events

DateCodeTitleDescription
A521Request for written amendment filed

Free format text:JAPANESE INTERMEDIATE CODE: A523

Effective date:20230322

A621Written request for application examination

Free format text:JAPANESE INTERMEDIATE CODE: A621

Effective date:20230322

A131Notification of reasons for refusal

Free format text:JAPANESE INTERMEDIATE CODE: A131

Effective date:20240507

A521Request for written amendment filed

Free format text:JAPANESE INTERMEDIATE CODE: A523

Effective date:20240704

TRDDDecision of grant or rejection written
A01Written decision to grant a patent or to grant a registration (utility model)

Free format text:JAPANESE INTERMEDIATE CODE: A01

Effective date:20240910

A61First payment of annual fees (during grant procedure)

Free format text:JAPANESE INTERMEDIATE CODE: A61

Effective date:20241001

R150Certificate of patent or registration of utility model

Ref document number:7570088

Country of ref document:JP

Free format text:JAPANESE INTERMEDIATE CODE: R150


[8]ページ先頭

©2009-2025 Movatter.jp