Movatterモバイル変換


[0]ホーム

URL:


JP2019028879A - Connectivity prediction method, apparatus, program, recording medium, and machine learning algorithm manufacturing method - Google Patents

Connectivity prediction method, apparatus, program, recording medium, and machine learning algorithm manufacturing method
Download PDF

Info

Publication number
JP2019028879A
JP2019028879AJP2017149996AJP2017149996AJP2019028879AJP 2019028879 AJP2019028879 AJP 2019028879AJP 2017149996 AJP2017149996 AJP 2017149996AJP 2017149996 AJP2017149996 AJP 2017149996AJP 2019028879 AJP2019028879 AJP 2019028879A
Authority
JP
Japan
Prior art keywords
dimensional structure
predicted
biopolymer
vector
ligand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017149996A
Other languages
Japanese (ja)
Other versions
JP7048065B2 (en
Inventor
浩太 笠原
Kota Kasahara
浩太 笠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ritsumeikan Trust
Original Assignee
Ritsumeikan Trust
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ritsumeikan TrustfiledCriticalRitsumeikan Trust
Priority to JP2017149996ApriorityCriticalpatent/JP7048065B2/en
Publication of JP2019028879ApublicationCriticalpatent/JP2019028879A/en
Application grantedgrantedCritical
Publication of JP7048065B2publicationCriticalpatent/JP7048065B2/en
Activelegal-statusCriticalCurrent
Anticipated expirationlegal-statusCritical

Links

Landscapes

Abstract

Translated fromJapanese

【課題】得られる予測精度が高く演算速度が向上した、結合性予測方法を提供する。【解決手段】標的の生体高分子の指定と、結合性予測対象の化合物の立体構造とを取得するステップS11と、生体高分子の立体構造を蓄積した立体構造データベースから、指定に対応する生体高分子の立体構造を取得するステップS12と、取得した立体構造に基づいて、生体高分子と化合物との複合体の予測立体構造を生成するステップS13と、生成した予測立体構造を、生体高分子の残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンと照合し、相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換するステップS14と、機械学習アルゴリズムを用いて予測立体構造ベクトルを判別することによって、生体高分子の立体構造と化合物の立体構造との結合性を予測するステップS15と、を含む。【選択図】図11Provided is a connectivity prediction method with high prediction accuracy and improved calculation speed. A step S11 for obtaining a target biopolymer designation and a three-dimensional structure of a compound for which a binding property is predicted, and a three-dimensional structure database in which the three-dimensional structure of the biopolymer is accumulated, Step S12 for acquiring the three-dimensional structure of the molecule, Step S13 for generating a predicted three-dimensional structure of the complex of the biopolymer and the compound based on the acquired three-dimensional structure, and the generated three-dimensional structure of the biopolymer A step S14 of collating with a plurality of interaction patterns defined on the basis of statistics of the spatial arrangement distribution of ligand atoms located around the residue, and converting them into predicted three-dimensional structure vectors representing the collation results with the interaction patterns; Predicting the connectivity between the 3D structure of a biopolymer and the 3D structure of a compound by discriminating the predicted 3D structure vector using a learning algorithm It includes a step S15, the. [Selection] Figure 11

Description

Translated fromJapanese

本発明は、標的とする生体高分子の立体構造と化合物の立体構造との結合性を予測する方法、装置、プログラム、記録媒体、および結合性の予測に使用する機械学習アルゴリズムの製造方法に関する。  The present invention relates to a method, an apparatus, a program, a recording medium, and a method for manufacturing a machine learning algorithm used for predicting the binding between a target three-dimensional structure of a biopolymer and a three-dimensional structure of a compound.

現在、新規の医薬を開発するためには、非常に長い期間と莫大な費用がかかっている。そのため、創薬の分野においては、医薬品の開発を効率化することを目的として、薬物の候補となる化合物を探索または最適化する種々の方法が模索されている。そのような方法の1つとして、コンピュータ・シミュレーションにより、標的となる生体高分子(例えば、タンパク質)と結合するリガンドのスクリーニングを行う方法(インシリコスクリーニング)が研究されている。コンピュータ・シミュレーションにおいて行われる、ドッキングシミュレーションは、タンパク質および化合物の立体構造の情報に基づいて複合体の安定構造をコンピュータ上で予測するものである。  Currently, developing a new medicine takes a very long period of time and enormous costs. Therefore, in the field of drug discovery, various methods for searching or optimizing compounds that are drug candidates are being sought for the purpose of improving the efficiency of drug development. As one of such methods, a method (in silico screening) for screening a ligand that binds to a target biopolymer (eg, protein) by computer simulation has been studied. The docking simulation performed in the computer simulation is to predict the stable structure of the complex on the computer based on the information of the three-dimensional structure of the protein and the compound.

薬物の候補となる標的に結合する化合物をコンピュータ・シミュレーションにより探索する方法としては、例えば、分子動力学法などを使用したものが存在する。そのような標的生体分子に結合する化合物の候補を予測する手法としては、下記特許文献1に記載の方法などが挙げられる。  As a method for searching for a compound that binds to a drug candidate target by computer simulation, for example, there is a method using a molecular dynamics method or the like. Examples of a method for predicting a candidate for a compound that binds to such a target biomolecule include the method described in Patent Document 1 below.

特許文献1には、タンパク質を含む標的生体分子と低分子化合物との結合性を予測するプログラムおよび支援方法が開示されている。特許文献1に記載のプログラムおよび支援方法は、量子化学計算などを用いた第1〜第3シミュレーションを組み合わせる手法であり、標的生体分子の活性を制御する化合物の候補を、より正確に予測することが可能となる。  Patent Document 1 discloses a program and a support method for predicting the binding between a target biomolecule including a protein and a low molecular weight compound. The program and the support method described in Patent Document 1 are a method that combines the first to third simulations using quantum chemical calculation and the like, and more accurately predict a candidate for a compound that controls the activity of a target biomolecule. Is possible.

特開2016−166159号公報Japanese Patent Laid-Open No. 2006-166159

特許文献1に記載のプログラムおよび支援方法では、タンパク質および低分子化合物の配置の座標データから、量子化学計算により相互作用エネルギー(結合自由エネルギーのエンタルピー項)を算出している。しかしながら、量子化学計算により相互作用エネルギーの計算を精密に行うためには、演算能力が高いワークステーションやスーパコンピュータが必要とされ、シミュレーションに比較的長い時間を要するという問題がある。また、結合性を予測する対象の化合物の数が増加するほど、シミュレーションに要する時間も長期化するという問題がある。  In the program and the support method described in Patent Document 1, interaction energy (enthalpy term of binding free energy) is calculated from the coordinate data of the arrangement of proteins and low-molecular compounds by quantum chemical calculation. However, in order to accurately calculate the interaction energy by quantum chemical calculation, a workstation and a super computer with high computing power are required, and there is a problem that a relatively long time is required for the simulation. Moreover, there is a problem that the time required for the simulation becomes longer as the number of compounds for which the binding property is predicted increases.

本発明の目的は、標的とする生体高分子の立体構造と化合物の立体構造との結合性について、得られる予測精度が高く演算速度が向上した、結合性予測方法、装置、プログラム、記録媒体、および結合性の予測に使用する機械学習アルゴリズムの製造方法を提供することにある。  An object of the present invention is to provide a connectivity prediction method, apparatus, program, recording medium, which has high prediction accuracy and improved calculation speed, with respect to the connectivity between the target three-dimensional structure of the biopolymer and the three-dimensional structure of the compound. Another object of the present invention is to provide a method of manufacturing a machine learning algorithm used for predicting connectivity.

上記目的を達成するための本発明は、以下に示す態様を含む。
(項1)
標的の生体高分子の指定と、結合性予測対象の化合物の立体構造とを取得するステップと、
生体高分子の立体構造を蓄積した立体構造データベースから、前記指定に対応する生体高分子の立体構造を取得するステップと、
取得した前記生体高分子の立体構造と前記化合物の立体構造とに基づいて、前記生体高分子と前記化合物との複合体の予測立体構造を生成するステップと、
生成した前記予測立体構造を、生体高分子の残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換するステップと、
変換した前記予測立体構造ベクトルを機械学習アルゴリズムに入力し、前記機械学習アルゴリズムを用いて前記予測立体構造ベクトルを判別することによって、前記生体高分子の立体構造と前記化合物の立体構造との結合性を予測するステップと、
を含む方法。
(項2)
前記機械学習アルゴリズムの学習に用いられる訓練データが、残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースに基づいて生成されている、項1に記載の方法。
(項3)
前記相互作用パターンデータベースが、
前記立体構造データベースから、生体高分子とリガンドとの複合体の立体構造を取得するステップと、
前記立体構造データベースから取得した前記複合体の前記立体構造を、残基周辺に位置するリガンド原子の空間配置情報へ変換するステップと、
前記立体構造を取得するステップと、前記空間配置情報へ変換するステップとを繰り返し行うことにより、残基周辺に位置するリガンド原子の空間配置分布の統計を取得するステップと、
前記空間配置分布の統計に基づいて、複数の相互作用パターンを定義するステップと、
を含む方法により生成されている、項1または2に記載の方法。
(項A)
前記機械学習アルゴリズムが、ニューラルネットワーク構造の深層学習アルゴリズムである、項1から3のいずれかに記載の方法。
(項B)
結合性予測対象の前記化合物の立体構造が、理論的に求められた立体構造を含む、項Aに記載の方法。
(項C)
前記生体高分子が、タンパク質、核酸(DNA、RNA)または多糖である、項1から3およびAからBのいずれかに記載の方法。
(項D)
前記残基が、アミノ酸残基、ヌクレオチド残基、および単糖残基からなる群から選択されるいずれかの物質である、項1から3およびAからCのいずれかに記載の方法。
(項E)
結合性予測対象の前記化合物の立体構造を、前記立体構造データベースから取得する、項1から3およびAからDのいずれかに記載の方法。
(項F)
前記立体構造データベースが蛋白質構造データバンクである、項1から3およびAからEのいずれかに記載の方法。
(項4)
標的の生体高分子の指定と、結合性予測対象の化合物の立体構造とを取得する予測対象取得手段と、
生体高分子の立体構造を蓄積した立体構造データベースから、前記指定に対応する生体高分子の立体構造を取得する立体構造取得手段と、
取得した前記生体高分子の立体構造と前記化合物の立体構造とに基づいて、前記生体高分子と前記化合物との複合体の予測立体構造を生成する予測構造生成手段と、
生成した前記予測立体構造を、生体高分子の残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換する予測ベクトル変換手段と、
変換した前記予測立体構造ベクトルを機械学習アルゴリズムに入力し、前記機械学習アルゴリズムを用いて前記予測立体構造ベクトルを判別することによって、前記生体高分子の立体構造と前記化合物の立体構造との結合性を予測する結合性予測手段と、
を備える装置。
(項5)
コンピュータに、
標的の生体高分子の指定と、結合性予測対象の化合物の立体構造とを取得する予測対象取得機能と、
生体高分子の立体構造を蓄積した立体構造データベースから、前記指定に対応する生体高分子の立体構造を取得する立体構造取得機能と、
取得した前記生体高分子の立体構造と前記化合物の立体構造とに基づいて、前記生体高分子と前記化合物との複合体の予測立体構造を生成する予測構造生成機能と、
生成した前記予測立体構造を、生体高分子の残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換する予測ベクトル変換機能と、
変換した前記予測立体構造ベクトルを機械学習アルゴリズムに入力し、前記機械学習アルゴリズムを用いて前記予測立体構造ベクトルを判別することによって、前記生体高分子の立体構造と前記化合物の立体構造との結合性を予測する結合性予測機能と、
を実現させるプログラム。
(項6)
項5に記載のプログラムを記録した、コンピュータ読み取り可能な非一時的な有体の記録媒体。
(項7)
生体高分子の立体構造を蓄積した立体構造データベースから、生体高分子とリガンドとの複合体の立体構造を取得するステップと、
前記立体構造データベースから取得した前記複合体の前記立体構造を、生体高分子の残基周辺に位置するリガンド原子の空間配置情報へ変換するステップと、
前記空間配置情報を、残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す空間配置ベクトルへ変換するステップと、
前記立体構造データベースから取得した前記複合体の前記立体構造を、前記生体高分子の立体構造と前記リガンドの立体構造とに分割するステップと、
分割した前記生体高分子の立体構造と前記リガンドの立体構造とに基づいて、前記生体高分子と前記リガンドとの複合体の予測立体構造を生成するステップと、
生成した前記予測立体構造を前記相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換するステップと、
前記予測立体構造ベクトルと前記空間配置ベクトルとを訓練データとして、機械学習アルゴリズムを学習させるステップと、
を含む、機械学習アルゴリズムの製造方法。
(項8)
前記機械学習アルゴリズムを学習させるステップが、前記空間配置ベクトルを正例として、前記予測立体構造ベクトルについて正例または負例を示すラベルを決定し、前記予測立体構造ベクトルを入力層とし前記ラベルを出力層として、機械学習アルゴリズムを学習させるステップである、項7に記載の機械学習アルゴリズムの製造方法。
(項9)
前記相互作用パターンデータベースが、
前記立体構造データベースから、生体高分子とリガンドとの複合体の立体構造を取得するステップと、
前記立体構造データベースから取得した前記複合体の前記立体構造を、残基周辺に位置するリガンド原子の空間配置情報へ変換するステップと、
前記立体構造を取得するステップと、前記空間配置情報へ変換するステップとを繰り返し行うことにより、残基周辺に位置するリガンド原子の空間配置分布の統計を取得するステップと、
前記空間配置分布の統計に基づいて、複数の相互作用パターンを定義するステップと、
を含む方法により生成されている、項7または8に記載の機械学習アルゴリズムの製造方法。
(項10)
生体高分子の立体構造を蓄積した立体構造データベースから、生体高分子とリガンドとの複合体の立体構造を取得する複合体取得手段と、
前記立体構造データベースから取得した前記複合体の前記立体構造を、生体高分子の残基周辺に位置するリガンド原子の空間配置情報へ変換する空間情報変換手段と、
前記空間配置情報を、残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す空間配置ベクトルへ変換する空間ベクトル変換手段と、
前記立体構造データベースから取得した前記複合体の前記立体構造を、前記生体高分子の立体構造と前記リガンドの立体構造とに分割する複合体分割手段と、
分割した前記生体高分子の立体構造と前記リガンドの立体構造とに基づいて、前記生体高分子と前記リガンドとの複合体の予測立体構造を生成する予測構造生成手段と、
生成した前記予測立体構造を前記相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換する予測ベクトル変換手段と、
前記予測立体構造ベクトルと前記空間配置ベクトルとを訓練データとして、機械学習アルゴリズムを学習させる学習手段と、
を備える、機械学習アルゴリズムの製造装置。
(項11)
コンピュータに、
生体高分子の立体構造を蓄積した立体構造データベースから、生体高分子とリガンドとの複合体の立体構造を取得する複合体取得機能と、
前記立体構造データベースから取得した前記複合体の前記立体構造を、生体高分子の残基周辺に位置するリガンド原子の空間配置情報へ変換する空間情報変換機能と、
前記空間配置情報を、残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す空間配置ベクトルへ変換する空間ベクトル変換機能と、
前記立体構造データベースから取得した前記複合体の前記立体構造を、前記生体高分子の立体構造と前記リガンドの立体構造とに分割する複合体分割機能と、
分割した前記生体高分子の立体構造と前記リガンドの立体構造とに基づいて、前記生体高分子と前記リガンドとの複合体の予測立体構造を生成する予測構造生成機能と、
生成した前記予測立体構造を前記相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換する予測ベクトル変換機能と、
前記予測立体構造ベクトルと前記空間配置ベクトルとを訓練データとして、機械学習アルゴリズムを学習させる学習機能と、
を実現させるプログラム。
(項12)
項11に記載のプログラムを記録した、コンピュータ読み取り可能な非一時的な有体の記録媒体。
The present invention for achieving the above object includes the following embodiments.
(Claim 1)
Obtaining a target biopolymer designation and the three-dimensional structure of the compound for which the binding is predicted;
Obtaining a three-dimensional structure of the biopolymer corresponding to the designation from a three-dimensional structure database storing the three-dimensional structure of the biopolymer;
Generating a predicted three-dimensional structure of a complex of the biopolymer and the compound based on the obtained three-dimensional structure of the biopolymer and the three-dimensional structure of the compound;
The generated predicted three-dimensional structure is collated with an interaction pattern database including a plurality of interaction patterns defined on the basis of statistics of spatial arrangement distribution of ligand atoms located around the residue of the biopolymer, and the interaction Converting to a predicted three-dimensional structure vector representing a matching result with a pattern;
The converted predicted three-dimensional structure vector is input to a machine learning algorithm, and the predicted three-dimensional structure vector is discriminated using the machine learning algorithm, thereby connecting the three-dimensional structure of the biopolymer and the three-dimensional structure of the compound. Predicting
Including methods.
(Section 2)
Training data used for learning of the machine learning algorithm is generated based on an interaction pattern database including a plurality of interaction patterns defined based on statistics of spatial arrangement distribution of ligand atoms located around residues. Item 2. The method according to Item 1.
(Section 3)
The interaction pattern database is
Obtaining a three-dimensional structure of a complex of a biopolymer and a ligand from the three-dimensional structure database;
Converting the three-dimensional structure of the complex obtained from the three-dimensional structure database into spatial arrangement information of ligand atoms located around the residue;
Obtaining statistics of spatial arrangement distribution of ligand atoms located in the vicinity of residues by repeatedly obtaining the three-dimensional structure and converting to the spatial arrangement information; and
Defining a plurality of interaction patterns based on statistics of the spatial distribution;
Item 3. The method according to Item 1 or 2, wherein the method is generated by a method comprising:
(Section A)
Item 4. The method according to any one of Items 1 to 3, wherein the machine learning algorithm is a deep learning algorithm having a neural network structure.
(Section B)
Item 3. The method according to Item A, wherein the three-dimensional structure of the compound to be predicted for binding includes a theoretically obtained three-dimensional structure.
(Section C)
Item 6. The method according to any one of Items 1 to 3 and A to B, wherein the biopolymer is a protein, a nucleic acid (DNA, RNA), or a polysaccharide.
(Section D)
Item 10. The method according to any one of Items 1 to 3 and A to C, wherein the residue is any substance selected from the group consisting of an amino acid residue, a nucleotide residue, and a monosaccharide residue.
(Section E)
Item 5. The method according to any one of Items 1 to 3 and A to D, wherein the three-dimensional structure of the compound to be predicted for binding is obtained from the three-dimensional structure database.
(Section F)
Item 10. The method according to any one of Items 1 to 3 and A to E, wherein the three-dimensional structure database is a protein structure data bank.
(Section 4)
Prediction target acquisition means for acquiring the target biopolymer designation and the three-dimensional structure of the binding prediction target compound;
Three-dimensional structure acquisition means for acquiring a three-dimensional structure of a biopolymer corresponding to the designation from a three-dimensional structure database in which the three-dimensional structure of the biopolymer is accumulated;
A predicted structure generating means for generating a predicted three-dimensional structure of a complex of the biopolymer and the compound based on the acquired three-dimensional structure of the biopolymer and the three-dimensional structure of the compound;
The generated predicted three-dimensional structure is collated with an interaction pattern database including a plurality of interaction patterns defined on the basis of statistics of spatial arrangement distribution of ligand atoms located around the residue of the biopolymer, and the interaction Predicted vector conversion means for converting into a predicted three-dimensional structure vector representing a matching result with a pattern;
The converted predicted three-dimensional structure vector is input to a machine learning algorithm, and the predicted three-dimensional structure vector is discriminated using the machine learning algorithm, thereby connecting the three-dimensional structure of the biopolymer and the three-dimensional structure of the compound. A connectivity prediction means for predicting
A device comprising:
(Section 5)
On the computer,
Prediction target acquisition function for acquiring the target biopolymer designation and the three-dimensional structure of the binding prediction target compound;
A three-dimensional structure acquisition function for acquiring a three-dimensional structure of a biopolymer corresponding to the designation from a three-dimensional structure database storing the three-dimensional structure of the biopolymer;
A predicted structure generation function for generating a predicted three-dimensional structure of a complex of the biopolymer and the compound based on the acquired three-dimensional structure of the biopolymer and the three-dimensional structure of the compound;
The generated predicted three-dimensional structure is collated with an interaction pattern database including a plurality of interaction patterns defined on the basis of statistics of spatial arrangement distribution of ligand atoms located around the residue of the biopolymer, and the interaction A predicted vector conversion function for converting into a predicted three-dimensional structure vector representing a matching result with a pattern;
The converted predicted three-dimensional structure vector is input to a machine learning algorithm, and the predicted three-dimensional structure vector is discriminated using the machine learning algorithm, thereby connecting the three-dimensional structure of the biopolymer and the three-dimensional structure of the compound. A connectivity prediction function that predicts
A program that realizes
(Claim 6)
A computer-readable non-transitory tangible recording medium on which the program according to Item 5 is recorded.
(Claim 7)
Obtaining a three-dimensional structure of a complex of a biopolymer and a ligand from a three-dimensional structure database accumulating the three-dimensional structure of the biopolymer;
Converting the three-dimensional structure of the complex obtained from the three-dimensional structure database into spatial arrangement information of ligand atoms located around biopolymer residues;
The spatial arrangement information is collated with an interaction pattern database including a plurality of interaction patterns defined based on statistics of spatial arrangement distribution of ligand atoms located around the residue, and the collation result with the interaction pattern is obtained. Converting to a spatial layout vector representing;
Dividing the three-dimensional structure of the complex obtained from the three-dimensional structure database into a three-dimensional structure of the biopolymer and a three-dimensional structure of the ligand;
Generating a predicted three-dimensional structure of a complex of the biopolymer and the ligand based on the three-dimensional structure of the biopolymer and the three-dimensional structure of the ligand,
Collating the generated predicted three-dimensional structure with the interaction pattern database, and converting the predicted three-dimensional structure vector into a predicted three-dimensional structure vector representing a matching result with the interaction pattern;
Learning the machine learning algorithm using the predicted three-dimensional structure vector and the spatial arrangement vector as training data;
A method for manufacturing a machine learning algorithm.
(Section 8)
The step of learning the machine learning algorithm determines a label indicating a positive example or a negative example for the predicted three-dimensional structure vector using the spatial arrangement vector as a positive example, and outputs the label using the predicted three-dimensional structure vector as an input layer Item 8. The method of manufacturing a machine learning algorithm according to Item 7, which is a step of learning a machine learning algorithm as a layer.
(Claim 9)
The interaction pattern database is
Obtaining a three-dimensional structure of a complex of a biopolymer and a ligand from the three-dimensional structure database;
Converting the three-dimensional structure of the complex obtained from the three-dimensional structure database into spatial arrangement information of ligand atoms located around the residue;
Obtaining statistics of spatial arrangement distribution of ligand atoms located in the vicinity of residues by repeatedly obtaining the three-dimensional structure and converting to the spatial arrangement information; and
Defining a plurality of interaction patterns based on statistics of the spatial distribution;
Item 9. A method for manufacturing a machine learning algorithm according to Item 7 or 8, which is generated by a method including:
(Section 10)
A complex acquisition means for acquiring a three-dimensional structure of a complex of a biopolymer and a ligand from a three-dimensional structure database storing the three-dimensional structure of the biopolymer;
Spatial information conversion means for converting the three-dimensional structure of the complex acquired from the three-dimensional structure database into spatial arrangement information of ligand atoms located in the vicinity of the residue of the biopolymer;
The spatial arrangement information is collated with an interaction pattern database including a plurality of interaction patterns defined based on statistics of spatial arrangement distribution of ligand atoms located around the residue, and the collation result with the interaction pattern is obtained. Space vector conversion means for converting into a space arrangement vector to be represented;
A complex dividing means for dividing the three-dimensional structure of the complex obtained from the three-dimensional structure database into a three-dimensional structure of the biopolymer and a three-dimensional structure of the ligand;
A predicted structure generating means for generating a predicted three-dimensional structure of a complex of the biopolymer and the ligand based on the three-dimensional structure of the biopolymer and the three-dimensional structure of the ligand,
A predicted vector conversion unit that compares the generated predicted three-dimensional structure with the interaction pattern database and converts the predicted three-dimensional structure vector into a predicted three-dimensional structure vector that represents a matching result with the interaction pattern;
Learning means for learning a machine learning algorithm using the predicted three-dimensional structure vector and the spatial arrangement vector as training data;
A machine learning algorithm manufacturing apparatus comprising:
(Item 11)
On the computer,
A complex acquisition function for acquiring a three-dimensional structure of a complex of a biopolymer and a ligand from a three-dimensional structure database storing the three-dimensional structure of the biopolymer;
A spatial information conversion function for converting the three-dimensional structure of the complex obtained from the three-dimensional structure database into spatial arrangement information of ligand atoms located around a residue of a biopolymer;
The spatial arrangement information is collated with an interaction pattern database including a plurality of interaction patterns defined based on statistics of spatial arrangement distribution of ligand atoms located around the residue, and the collation result with the interaction pattern is obtained. A space vector conversion function for converting into a space arrangement vector to be represented;
A complex dividing function for dividing the three-dimensional structure of the complex obtained from the three-dimensional structure database into the three-dimensional structure of the biopolymer and the three-dimensional structure of the ligand;
A predicted structure generation function for generating a predicted three-dimensional structure of a complex of the biopolymer and the ligand based on the three-dimensional structure of the biopolymer and the three-dimensional structure of the ligand,
A predicted vector conversion function for matching the generated predicted three-dimensional structure with the interaction pattern database and converting the predicted three-dimensional structure vector into a predicted three-dimensional structure vector representing a matching result with the interaction pattern;
A learning function for learning a machine learning algorithm using the predicted three-dimensional structure vector and the spatial arrangement vector as training data;
A program that realizes
(Clause 12)
Item 12. A computer-readable non-transitory tangible recording medium on which the program according to Item 11 is recorded.

本発明によると、得られる予測精度が高く演算速度が向上した、結合性予測方法、装置、プログラム、記録媒体、および結合性の予測に使用する機械学習アルゴリズムの製造方法を提供することができる。  According to the present invention, it is possible to provide a connectivity prediction method, apparatus, program, recording medium, and method for manufacturing a machine learning algorithm used for connectivity prediction, with high prediction accuracy and improved computation speed.

本発明の実施の形態に係る結合性予測システムの概略構成図である。It is a schematic block diagram of the connectivity prediction system which concerns on embodiment of this invention.ユーザ側装置のハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware constitutions of a user side apparatus.相互作用パターンデータベースの作成手順を示すフローチャートである。It is a flowchart which shows the preparation procedure of an interaction pattern database.相互作用パターンデータベース作成処理の詳細を説明するための模式図である。It is a schematic diagram for demonstrating the detail of an interaction pattern database creation process.複合体の立体構造をアミノ酸周辺のリガンド原子の空間配置情報へ変換する手順を説明するための模式図である。It is a schematic diagram for demonstrating the procedure which converts the three-dimensional structure of a composite_body | complex to the spatial arrangement information of the ligand atom around an amino acid.深層学習装置の機能を説明するためのブロック図である。It is a block diagram for demonstrating the function of a deep learning apparatus.深層学習処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of a deep learning process.深層学習処理の詳細を説明するための模式図である。It is a schematic diagram for demonstrating the detail of a deep learning process.ニューラルネットワークによる学習処理の詳細を説明するための模式図である。It is a schematic diagram for demonstrating the detail of the learning process by a neural network.結合性予測装置の機能を説明するためのブロック図である。It is a block diagram for demonstrating the function of a connectivity prediction apparatus.結合性予測処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of a connectivity prediction process.結合性予測処理の詳細を説明するための模式図である。It is a schematic diagram for demonstrating the detail of a connectivity prediction process.

以下、本発明の実施の形態を、添付の図面を参照して詳細に説明する。なお、以下の説明および図面において、同じ符号は同じまたは類似の構成要素を示すこととし、よって、同じまたは類似の構成要素に関する説明を省略する。  Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description and drawings, the same reference numerals indicate the same or similar components, and thus descriptions of the same or similar components are omitted.

以下に説明する本発明の実施の形態では、標的のタンパク質の立体構造と化合物の立体構造との結合性を、ニューラルネットワーク構造の深層学習アルゴリズムに基づいて予測する場合を一例として説明する。結合性の予測に先立って、相互作用パターンデータベースと学習済みの深層学習アルゴリズムとが予め作成されている。  In the embodiment of the present invention described below, a case where the connectivity between a target protein three-dimensional structure and a compound three-dimensional structure is predicted based on a deep learning algorithm having a neural network structure will be described as an example. Prior to predicting connectivity, an interaction pattern database and a learned deep learning algorithm are created in advance.

タンパク質の立体構造は、公知の蛋白質構造データバンク(PDB: Protein Data Bank、URL https://pdbj.org/、以下、単に蛋白質構造データバンクと記載する)から取得される。蛋白質構造データバンクは、核磁気共鳴法、X線結晶構造解析法等により実験的に確認されている種々のタンパク質の立体構造を、国際的に統一化されたフォーマットで記述して記録したデータベースである。例えば蛋白質構造データバンクでは、「pdbフォーマット」と呼ばれる形式で、立体構造が記述されている。pdbフォーマットでは、1行毎に情報が記述されており、1行に原子ひとつのX,YおよびZ座標が記載されている。  The three-dimensional structure of the protein is obtained from a known protein structure data bank (PDB: Protein Data Bank, URL https://pdbj.org/, hereinafter simply referred to as protein structure data bank). The protein structure data bank is a database that records and records the three-dimensional structures of various proteins that have been experimentally confirmed by nuclear magnetic resonance, X-ray crystal structure analysis, etc., in an internationally unified format. is there. For example, in the protein structure data bank, the three-dimensional structure is described in a format called “pdb format”. In the pdb format, information is described for each line, and the X, Y, and Z coordinates of one atom are described for each line.

結合性を予測する対象である化合物は、本実施形態では低分子化合物である。低分子化合物の分子量は特に制限されないが、例えば300〜800程度である。  In the present embodiment, the compound for which the binding property is predicted is a low-molecular compound. The molecular weight of the low molecular compound is not particularly limited, but is about 300 to 800, for example.

タンパク質と化合物との複合体の立体構造は、相互作用パターンデータベースと照合することにより、相互作用パターンとの照合結果を表すベクトル情報へ変換される。変換されたベクトル情報は深層学習アルゴリズムに入力され、予測結果として、標的のタンパク質の立体構造と化合物の立体構造との結合性が出力される。  The three-dimensional structure of the complex of the protein and the compound is converted into vector information representing the matching result with the interaction pattern by matching with the interaction pattern database. The converted vector information is input to the deep learning algorithm, and as a prediction result, the connectivity between the three-dimensional structure of the target protein and the three-dimensional structure of the compound is output.

相互作用パターンデータベースは、複数の相互作用パターンをデータベースとして記録しており、所定の手順にて予め作成されている。相互作用パターンは、アミノ酸の周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義されている。  The interaction pattern database records a plurality of interaction patterns as a database, and is created in advance by a predetermined procedure. The interaction pattern is defined based on the statistics of the spatial distribution of ligand atoms located around the amino acid.

ニューラルネットワーク構造の深層学習アルゴリズムは、訓練データ(または教師データとも呼ぶ)を用いた学習ステップにより予め学習されている。  A deep learning algorithm having a neural network structure is learned in advance by a learning step using training data (or also called teacher data).

[構成の概要]
図1は、本発明の実施の形態に係る結合性予測システムの概略構成図である。本発明の実施の形態に係る結合性予測システムは、ユーザ側装置100(100A,100B)と、データサーバ200とを備える。ユーザ側装置100とデータサーバ200とはネットワーク99を通じて接続されている。任意の構成として、結合性予測システムは、ネットワーク99を通じて接続されるアプリケーションサーバ300をさらに備えることができる。
[Configuration overview]
FIG. 1 is a schematic configuration diagram of a connectivity prediction system according to an embodiment of the present invention. The connectivity predicting system according to the embodiment of the present invention includes a user apparatus 100 (100A, 100B) and a data server 200. The user side device 100 and the data server 200 are connected through a network 99. As an optional configuration, the connectivity prediction system may further include an application server 300 connected through the network 99.

ユーザ側装置100は相互作用パターンデータベース110を備え、訓練データを用いた深層学習処理時には、深層学習装置100Aとして動作し、学習済みの深層学習アルゴリズムを用いた結合性予測処理時には、結合性予測装置100Bとして動作する。ユーザ側装置100は、例えば汎用コンピュータで構成されており、後述するフローチャートに基づいて、深層学習処理および結合性予測処理を行う。相互作用パターンデータベース110は、深層学習処理および結合性予測処理の両方において用いられる。  The user-side device 100 includes an interaction pattern database 110, which operates as a deep learning device 100A during deep learning processing using training data, and a connectivity prediction device during connectivity prediction processing using a learned deep learning algorithm. Operates as 100B. The user side device 100 is configured by, for example, a general-purpose computer, and performs a deep learning process and a connectivity prediction process based on a flowchart described later. The interaction pattern database 110 is used in both the deep learning process and the connectivity prediction process.

データサーバ200は立体構造データベース210を備える。立体構造データベース210には、実験的に確認された種々のタンパク質の立体構造が所定のフォーマットで記述されてデータベースとして記録されている。本実施形態では、立体構造データベース210は、上記した公知の蛋白質構造データバンクであり、以下の説明において所定の記述フォーマットとは、上記した「pdbフォーマット」を意味する。  The data server 200 includes a three-dimensional structure database 210. In the three-dimensional structure database 210, three-dimensional structures of various proteins confirmed experimentally are described in a predetermined format and recorded as a database. In the present embodiment, the three-dimensional structure database 210 is the above-described known protein structure data bank, and in the following description, the predetermined description format means the above-mentioned “pdb format”.

[ハードウェア構成]
図2は、ユーザ側装置のハードウェア構成を示すブロック図である。ユーザ側装置100(100A,100B)は、処理部10(10A,10B)と、入力部16と、出力部17とを備える。
[Hardware configuration]
FIG. 2 is a block diagram illustrating a hardware configuration of the user device. The user-side device 100 (100A, 100B) includes a processing unit 10 (10A, 10B), an input unit 16, and an output unit 17.

処理部10は、後述するデータ処理を行うCPU(Central Processing Unit)11と、データ処理の作業領域に使用するメモリ12と、後述するプログラムおよび処理データを記録する記録部13と、各部の間でデータを伝送するバス14と、外部機器とのデータの入出力を行うインタフェース部15とを備えている。入力部16および出力部17は、処理部10に接続されている。例示的には、入力部16はキーボードまたはマウス等の入力装置であり、出力部17は液晶ディスプレイ等の表示装置である。  The processing unit 10 includes a CPU (Central Processing Unit) 11 that performs data processing (to be described later), a memory 12 that is used as a data processing work area, a recording unit 13 that records programs and processing data (to be described later), and each unit. A bus 14 for transmitting data and an interface unit 15 for inputting / outputting data to / from an external device are provided. The input unit 16 and the output unit 17 are connected to the processing unit 10. Illustratively, the input unit 16 is an input device such as a keyboard or a mouse, and the output unit 17 is a display device such as a liquid crystal display.

処理部10は、以下の図3、図7および図11で説明する各ステップの処理を行うために、本発明に係るプログラムおよび深層学習アルゴリズムを、例えば実行形式(例えばプログラミング言語からコンパイラにより変換されて生成される)で記録部13に予め記録している。処理部10は、記録部13に記録したプログラムおよび深層学習アルゴリズムを使用して処理を行う。  The processing unit 10 performs, for example, execution of a program and a deep learning algorithm according to the present invention (for example, converted from a programming language into a compiler by a compiler) in order to perform the processing of each step described in FIG. 3, FIG. 7 and FIG. Is recorded in advance in the recording unit 13. The processing unit 10 performs processing using the program and the deep learning algorithm recorded in the recording unit 13.

なお、プログラムおよび学習後の深層学習アルゴリズムは、例えばDVD−ROMやUSBメモリ等の、コンピュータ読み取り可能であって非一時的な有形の記録媒体98から記録部13にインストールされてもよいし、別所に配置されたアプリケーションサーバ300(図1を参照)からネットワーク99を介して記録部13にインストールされてもよい。  The program and the deep learning algorithm after learning may be installed in the recording unit 13 from a computer-readable non-transitory tangible recording medium 98 such as a DVD-ROM or a USB memory. May be installed in the recording unit 13 via the network 99 from the application server 300 (see FIG. 1) disposed in the network.

以下の説明においては、特に断らない限り、処理部10が行う処理は、記録部13またはメモリ12に格納されたプログラムおよび深層学習アルゴリズムに基づいて、CPU11が行う処理を意味する。CPU11はメモリ12を作業領域として必要なデータ(処理途中の中間データ等)を一時記憶し、記録部13に演算結果等の長期保存するデータを適宜記録する。  In the following description, unless otherwise specified, the processing performed by the processing unit 10 means processing performed by the CPU 11 based on a program stored in the recording unit 13 or the memory 12 and a deep learning algorithm. The CPU 11 temporarily stores necessary data (such as intermediate data during processing) using the memory 12 as a work area, and appropriately records data to be stored for a long period of time, such as calculation results, in the recording unit 13.

[機能ブロックおよび処理手順]
以下ではまず、深層学習処理および結合性予測処理の両方において用いる相互作用パターンデータベースの作成方法について、図3〜図5を参照して説明する。次に、訓練データを用いた深層学習アルゴリズムの学習方法について、図6〜図9を参照して説明し、学習済みの深層学習アルゴリズムを用いた結合性の予測方法について、図10〜図12を参照して説明する。
[Function blocks and processing procedures]
In the following, first, a method for creating an interaction pattern database used in both the deep learning process and the connectivity prediction process will be described with reference to FIGS. Next, the learning method of the deep learning algorithm using the training data will be described with reference to FIGS. 6 to 9, and the connectivity prediction method using the learned deep learning algorithm will be described with reference to FIGS. The description will be given with reference.

・相互作用パターンデータベースの作成
図3は、相互作用パターンデータベースの作成手順を示すフローチャートであり、図4は、相互作用パターンデータベース作成処理の詳細を説明するための模式図である。図5は、複合体の立体構造をアミノ酸周辺のリガンド原子の空間配置情報へ変換する手順を説明するための模式図である。
Creation of Interaction Pattern Database FIG. 3 is a flowchart showing the creation procedure of the interaction pattern database, and FIG. 4 is a schematic diagram for explaining the details of the interaction pattern database creation processing. FIG. 5 is a schematic diagram for explaining a procedure for converting the three-dimensional structure of the complex into the spatial arrangement information of ligand atoms around the amino acid.

本実施形態では、図3に示す手順に沿って相互作用パターンデータベース110を予め作成しておき、ユーザ側装置100の記録部13に予め記録しておく。以下のステップS91〜ステップS94の処理は、入力部16からのユーザの動作指示に基づいて、ユーザ側装置100の処理部10が行うことができる。  In the present embodiment, the interaction pattern database 110 is created in advance according to the procedure shown in FIG. 3 and is recorded in advance in the recording unit 13 of the user side device 100. The processing of the following steps S91 to S94 can be performed by the processing unit 10 of the user side device 100 based on a user operation instruction from the input unit 16.

ステップS91において、処理部10は、立体構造データベース210から、タンパク質とリガンドとの複合体の立体構造を取得する。複合体の立体構造は所定の記述フォーマット(すなわち、上記した「pdbフォーマット」)で記録されている。  In step S91, the processing unit 10 acquires the three-dimensional structure of the complex of the protein and the ligand from the three-dimensional structure database 210. The three-dimensional structure of the complex is recorded in a predetermined description format (that is, the “pdb format” described above).

ステップS92において、処理部10は、立体構造データベース210から取得した複合体の立体構造を、アミノ酸周辺のリガンド原子の空間配置情報へ変換する。所定の記述フォーマットから変換されたリガンド原子の空間配置パターンの一例を図4(a)に示す。図4(a)に示す例では、アミノ酸原子41の周囲に位置するリガンド原子42の空間配置パターンの一例として、3種類の空間配置パターンが例示されている。図中、アミノ酸原子41を灰色の球体で表し、リガンド原子42を白色の球体で表す。  In step S92, the processing unit 10 converts the three-dimensional structure of the complex acquired from the three-dimensional structure database 210 into the spatial arrangement information of ligand atoms around the amino acid. An example of a spatial arrangement pattern of ligand atoms converted from a predetermined description format is shown in FIG. In the example shown in FIG. 4A, three types of spatial arrangement patterns are illustrated as examples of the spatial arrangement patterns of the ligand atoms 42 located around the amino acid atoms 41. In the figure, amino acid atoms 41 are represented by gray spheres, and ligand atoms 42 are represented by white spheres.

図5の模式図を参照して、複合体の立体構造をアミノ酸周辺のリガンド原子の空間配置情報へ変換する手順の一例を、具体的に説明する。本実施形態では、あるアミノ酸を構成する例えば原子3つについて、その周辺に存在するある種のリガンド原子の空間配置分布を求める。例えば、図5(a)の左側に示す立体構造がPDBファイル1に記述されており、図5(a)の右側に示す立体構造がPDBファイル2に記述されているケースを考える。まず、PDBファイル1について、以下のステップS921〜S923の処理を行う。  With reference to the schematic diagram of FIG. 5, an example of a procedure for converting the three-dimensional structure of the complex into the spatial arrangement information of ligand atoms around the amino acid will be specifically described. In the present embodiment, for example, for three atoms constituting a certain amino acid, the spatial arrangement distribution of a certain kind of ligand atom existing in the vicinity thereof is obtained. For example, consider a case where the three-dimensional structure shown on the left side of FIG. 5A is described in the PDB file 1 and the three-dimensional structure shown on the right side of FIG. First, the following steps S921 to S923 are performed on the PDB file 1.

ステップS921において、PDBファイルに記述されている立体構造の中から、相互作用しているタンパク質の3原子と、リガンドの1原子のペアとを抽出する。抽出した結果の構造を図5(b)にそれぞれ示す。  In step S921, 3 atoms of interacting protein and 1 atom pair of ligand are extracted from the three-dimensional structure described in the PDB file. The extracted structure is shown in FIG.

ステップS922において、抽出した構造を回転して向きを揃える。向きを揃えた結果の構造を図5(c)にそれぞれ示す。この図5(c)は図4(a)に相当する。  In step S922, the extracted structure is rotated and aligned. FIG. 5 (c) shows the resulting structure with the orientations aligned. FIG. 5C corresponds to FIG.

ステップS923において、向きが揃えられた複数の構造について、原子の種類が同じ構造を重ね合わせる。重ね合わせた結果を図5(d)に示す。例えば、図5(c)の左端に示す構造と図5(c)の右端に示す構造とは、原子の種類が同じであるので、これら構造を重ね合わせることにより、図5(d)の左側に示す構造を得る。  In step S923, the structures having the same kind of atoms are superimposed on the plurality of structures having the same orientation. The superimposed result is shown in FIG. For example, since the structure shown at the left end of FIG. 5C and the structure shown at the right end of FIG. 5C are the same type of atoms, the structures shown in FIG. The structure shown in is obtained.

ステップS93において、処理部10は、ステップS91に示す立体構造の取得とステップS92に示す空間配置情報への変換とを繰り返し行うことにより、複数の複合体の立体構造について、リガンド原子の空間配置情報を複数取得し、アミノ酸周辺のリガンド原子の空間配置分布の統計を取得する。得られた空間配置分布の一例を図4(b)に示す。  In step S93, the processing unit 10 repeatedly obtains the three-dimensional structure shown in step S91 and converts it into the spatial arrangement information shown in step S92, so that the spatial arrangement information of the ligand atoms is obtained for the three-dimensional structure of the plurality of complexes. To obtain the statistics of the spatial distribution of ligand atoms around amino acids. An example of the obtained spatial arrangement distribution is shown in FIG.

図5の模式図を参照して説明すると、PDBファイル2について、上記したステップS921〜S923の処理を行う。同様の処理を、立体構造データベース210から取得した複合体の立体構造の全てのPDBファイルについて行うことにより、4つの原子種類の組合せの数に相当する数の、空間配置分布が得られる。得られる空間配置分布は、図4(b)に例示されるとおりである。以後、後述するように、得られた空間配置分布のそれぞれについて、混合ガウス分布へのフィッティングを行う。  If it demonstrates with reference to the schematic diagram of FIG. 5, the process of above-described step S921-S923 will be performed about PDB file 2. FIG. By performing the same process for all the PDB files of the three-dimensional structure of the complex acquired from the three-dimensional structure database 210, the number of spatial arrangement distributions corresponding to the number of combinations of the four atomic types can be obtained. The obtained spatial arrangement distribution is as illustrated in FIG. Thereafter, as will be described later, the obtained spatial arrangement distribution is fitted to a mixed Gaussian distribution.

ステップS94において、処理部10は、空間配置分布の統計に基づいて相互作用パターンを定義し、相互作用パターンデータベース110を作成する。  In step S94, the processing unit 10 defines an interaction pattern based on the statistics of the spatial arrangement distribution, and creates an interaction pattern database 110.

図4(c)を参照して、相互作用パターンデータベース110の作成方法を説明する。例えば、破線1で囲む空間領域にリガンド原子42が配置されている空間配置のパターンを、「相互作用パターン1」として定義する。同様に、破線2で囲む空間領域にリガンド原子42が配置されている空間配置のパターンを、「相互作用パターン2」と定義し、破線3,4,5で囲む空間領域のそれぞれにリガンド原子42が配置されているそれぞれの空間配置のパターンを、「相互作用パターン3」、「相互作用パターン4」、「相互作用パターン5」とそれぞれ定義し、合計N種類(Nは自然数)の相互作用パターンを定義する。定義した相互作用パターン1から相互作用パターンNのそれぞれを、対応するリガンド原子の空間配置情報と対応付けて、相互作用パターンデータベース110として記録部13に記録し、相互作用パターンデータベース110を作成する。  A method for creating the interaction pattern database 110 will be described with reference to FIG. For example, a spatial arrangement pattern in which ligand atoms 42 are arranged in a spatial region surrounded by a broken line 1 is defined as “interaction pattern 1”. Similarly, the spatial arrangement pattern in which the ligand atoms 42 are arranged in the spatial region surrounded by the broken line 2 is defined as “interaction pattern 2”, and the ligand atoms 42 are respectively defined in the spatial regions surrounded by the broken lines 3, 4, and 5. Are defined as “interaction pattern 3”, “interaction pattern 4”, and “interaction pattern 5”, respectively, and a total of N types of interaction patterns (N is a natural number) Define Each defined interaction pattern 1 to interaction pattern N is recorded in the recording unit 13 as the interaction pattern database 110 in association with the corresponding spatial arrangement information of the ligand atoms, and the interaction pattern database 110 is created.

これにより、或る化合物について、アミノ酸残基の周辺に位置するリガンド原子の空間配置情報が与えられると、この空間配置情報を相互作用パターンデータベース110と照合することにより、照合した化合物のリガンド原子の空間配置が、合計N種類の相互作用パターンのうちどの相互作用パターンに該当するのかを決定することが可能となる。  Thus, when spatial arrangement information of a ligand atom located around an amino acid residue is given for a certain compound, this spatial arrangement information is collated with the interaction pattern database 110 to obtain the ligand atom of the collated compound. It is possible to determine which interaction pattern corresponds to the spatial arrangement among a total of N types of interaction patterns.

ここで、相互作用パターンデータベース110の作成に用いた立体構造データベース210は、実験的に確認された種々のタンパク質の立体構造を記録したデータベースである。したがって、相互作用パターンデータベース110との照合により、或る化合物についてリガンド原子の空間配置が「相互作用パターン1」に「該当する」と判断された場合、その空間配置は、リガンド原子がアミノ酸の周辺において実際に取り得る空間配置であり、「相互作用パターン1」であること、すなわち、図4(c)でいう破線1で囲む空間領域にリガンド原子が実際に配置可能であることを意味する。  Here, the three-dimensional structure database 210 used to create the interaction pattern database 110 is a database in which three-dimensional structures of various proteins confirmed experimentally are recorded. Therefore, when it is determined by collation with the interaction pattern database 110 that the spatial arrangement of the ligand atom is “corresponding” to “interaction pattern 1” for a certain compound, the spatial arrangement of the ligand atom is around the amino acid. In FIG. 4C, it means “interaction pattern 1”, that is, it means that ligand atoms can actually be arranged in the space region surrounded by the broken line 1 in FIG.

図4(c)を参照して、相互作用パターンを定義する方法について説明する。相互作用パターンの定義には変分ベイズ推定の手法を用いる。本実施形態では、あるアミノ酸を構成する例えば原子3つについて、その周辺に存在するある種のリガンド原子の空間分布を混合ガウス分布として表現する。例えばアミノ酸におけるO-C-Oの周辺のリガンドC原子の空間分布をひとつの混合ガウス分布とし、アミノ酸におけるO-C-Nの周辺のリガンドC原子の空間分布を別の混合ガウス分布とする。すなわち原子種の組み合わせの数だけ、混合ガウス分布が存在する(この数をMとする)。なお原子種の定義は単純に元素のみでなく、sp2炭素やsp3炭素などの化学的性質を区別する。本実施形態ではSYBYL原子タイプを用いる。混合ガウス分布はガウス分布の線形和であり、すなわちガウス分布をG(μ,σ)とすると、混合ガウス分布はΣπG(μ,σ)で表される。ここで、k=1,2,・・・Kであり、Kはひとつの混合ガウス分布を構成するガウス分布の個数を意味する。π、μ、σ、の値のK個の組合せを求め、それぞれのガウス分布を相互作用パターンとして定義する。Kの値は空間分布によって異なり(つまりO-C-OとCの空間分布と、O-C-NとCの空間分布で異なる)この値は変分ベイズ法によって自動的に推定される。これをM個の空間分布について繰り返すことで様々な原子の種類での相互作用パターンを定義する。相互作用パターンを定義する方法のより詳細な手順については、本発明者らによる文献「Kasahara K, Kinoshita K, “Landscape of Protein-Small ligand Binding Modes”, 2016, Protein Science 25(9):1659-71」を参照されたい。With reference to FIG.4 (c), the method of defining an interaction pattern is demonstrated. Variational Bayesian estimation is used to define the interaction pattern. In the present embodiment, for example, three atoms constituting a certain amino acid, the spatial distribution of a certain kind of ligand atom existing in the vicinity thereof is expressed as a mixed Gaussian distribution. For example, the spatial distribution of ligand C atoms around O—C—O in amino acids is one mixed Gaussian distribution, and the spatial distribution of ligand C atoms around O—C—N in amino acids is another mixed Gaussian distribution. That is, there are mixed Gaussian distributions as many as the number of combinations of atomic species (this number is M). In addition, the definition of the atomic species is not only a simple element but also a chemical property such as sp2 carbon or sp3 carbon. In this embodiment, the SYBYL atom type is used. The mixed Gaussian distribution is a linear sum of Gaussian distributions, that is, when the Gaussian distribution is G (μ, σ), the mixed Gaussian distribution is represented by Σπk G (μk , σk ). Here, k = 1, 2,... K, and K means the number of Gaussian distributions constituting one mixed Gaussian distribution. K combinations of values of πk , μk , and σk are obtained, and each Gaussian distribution is defined as an interaction pattern. The value of K differs depending on the spatial distribution (that is, the spatial distribution of O—C—O and C and the spatial distribution of O—C—N and C), and this value is automatically estimated by the variational Bayes method. This is repeated for M spatial distributions to define interaction patterns for various atom types. For a more detailed procedure on how to define the interaction pattern, see the literature “Kasahara K, Kinoshita K,“ Landscape of Protein-Small Ligand Binding Modes ”, 2016, Protein Science 25 (9): 1659- See 71 ”.

・深層学習処理
図6は、深層学習装置100Aの機能を説明するためのブロック図である。深層学習装置100Aの処理部10Aは、複合体取得部101と、空間情報変換部102と、空間ベクトル変換部103と、複合体分割部104と、予測構造生成部105と、予測ベクトル変換部106と、深層学習部107と、を備える。これらの機能ブロックは、コンピュータに深層学習処理を実行させるプログラムを、処理部10Aの記録部13にインストールし、このプログラムをCPU11が実行することにより実現される。
Deep Learning Processing FIG. 6 is a block diagram for explaining functions of the deep learning device 100A. The processing unit 10A of the deep learning device 100A includes a complex acquisition unit 101, a spatial information conversion unit 102, a space vector conversion unit 103, a complex division unit 104, a prediction structure generation unit 105, and a prediction vector conversion unit 106. And a deep learning unit 107. These functional blocks are realized by installing a program for causing the computer to execute the deep learning process in the recording unit 13 of the processing unit 10A and executing the program by the CPU 11.

相互作用パターンデータベース110は、処理部10Aの記録部13に予め記録されている。深層学習部107が学習させる、学習前または学習途中の深層学習アルゴリズムは、処理部10Aの記録部13に予め記録されている。深層学習装置100Aの出力である、深層学習処理による学習済みの深層学習アルゴリズム108は、処理部10Aの記録部13に記録される。  The interaction pattern database 110 is recorded in advance in the recording unit 13 of the processing unit 10A. The deep learning algorithm that the deep learning unit 107 learns before learning or during learning is recorded in advance in the recording unit 13 of the processing unit 10A. The deep learning algorithm 108 that has been learned by the deep learning process and is the output of the deep learning device 100A is recorded in the recording unit 13 of the processing unit 10A.

図7は、深層学習処理の手順を示すフローチャートであり、図8は、深層学習処理の詳細を説明するための模式図である。  FIG. 7 is a flowchart showing the procedure of the deep learning process, and FIG. 8 is a schematic diagram for explaining the details of the deep learning process.

深層学習装置100Aの処理部10Aは、図7に示す処理を行う。図6に示す各機能ブロックを用いて説明すると、ステップS1の処理は複合体取得部101が行う。ステップS2の処理は空間情報変換部102が行い、ステップS3の処理は空間ベクトル変換部103が行う。ステップS4の処理は複合体分割部104が行い、ステップS5の処理は予測構造生成部105が行い、ステップS6の処理は予測ベクトル変換部106が行う。ステップS7の処理は深層学習部107が行う。  The processing unit 10A of the deep learning device 100A performs the process shown in FIG. If it demonstrates using each functional block shown in FIG. 6, the complex acquisition part 101 will perform the process of step S1. The processing in step S2 is performed by the space information conversion unit 102, and the processing in step S3 is performed by the space vector conversion unit 103. The process of step S4 is performed by the complex dividing unit 104, the process of step S5 is performed by the predicted structure generating unit 105, and the process of step S6 is performed by the predicted vector converting unit 106. The deep learning unit 107 performs the process in step S7.

なお、ステップS1〜ステップS6の処理は、深層学習に用いる訓練データを準備するステップであり、このうちステップS2〜ステップS3の処理が、正例として用いる訓練データを準備するステップである。ステップS4〜ステップS6の処理によって準備される訓練データは、正例として用いる訓練データと負例として用いる訓練データとが混在している訓練データである。  In addition, the process of step S1-step S6 is a step which prepares the training data used for deep learning, and the process of step S2-step S3 is a step which prepares the training data used as a positive example among these. The training data prepared by the processes in steps S4 to S6 is training data in which training data used as a positive example and training data used as a negative example are mixed.

ステップS1において、処理部10Aは、立体構造データベース210から、タンパク質とリガンドとの複合体の立体構造を取得する。立体構造データベース210には、実験的に確認された種々のタンパク質の立体構造が所定の記述フォーマットで記録されており、処理部10Aは、深層学習アルゴリズムの訓練に用いる複合体の立体構造を複数取得する。例示的には、取得する複合体の立体構造は、約3,000種類である。  In step S <b> 1, the processing unit 10 </ b> A acquires the three-dimensional structure of the complex of protein and ligand from the three-dimensional structure database 210. In the three-dimensional structure database 210, three-dimensional structures of various proteins confirmed experimentally are recorded in a predetermined description format, and the processing unit 10A acquires a plurality of three-dimensional structures of the complex used for training of the deep learning algorithm. To do. Illustratively, the three-dimensional structure of the complex to be obtained is about 3,000 types.

ステップS2において、処理部10Aは、立体構造データベース210から取得した複合体の立体構造を、アミノ酸周辺のリガンド原子の空間配置情報へ変換する。所定の記述フォーマットから変換されたリガンド原子の空間配置パターンの一例を図8(a)に示す。図8(a)に示す例では、アミノ酸原子41の周囲に位置するリガンド原子42の空間配置パターンの一例として、3種類の空間配置パターンが例示されている。本ステップS2の処理は、相互作用パターンデータベース110を作成する際のステップS92と同じである。  In step S2, the processing unit 10A converts the three-dimensional structure of the complex acquired from the three-dimensional structure database 210 into the spatial arrangement information of ligand atoms around the amino acid. An example of a spatial arrangement pattern of ligand atoms converted from a predetermined description format is shown in FIG. In the example shown in FIG. 8A, three types of spatial arrangement patterns are illustrated as an example of the spatial arrangement pattern of the ligand atoms 42 positioned around the amino acid atoms 41. The processing in this step S2 is the same as that in step S92 when creating the interaction pattern database 110.

処理部10Aは、ステップS1において取得した複数の複合体の立体構造のそれぞれについて、ステップS2に示す空間配置情報への変換を繰り返し行う。  The processing unit 10A repeatedly performs conversion into the spatial arrangement information shown in step S2 for each of the three-dimensional structures of the plurality of complexes acquired in step S1.

ステップS3において、処理部10Aは、リガンド原子の空間配置情報を相互作用パターンデータベース110と照合し、リガンド原子の空間配置情報を空間配置ベクトルへ変換する。例えば図8(b)の左図に示す例では、リガンド原子42の空間配置は「相互作用パターン2」に合致し、右図に示す例では、リガンド原子42の空間配置は「相互作用パターン4」に合致する。  In step S3, the processing unit 10A compares the spatial arrangement information of the ligand atoms with the interaction pattern database 110, and converts the spatial arrangement information of the ligand atoms into a spatial arrangement vector. For example, in the example shown in the left diagram of FIG. 8B, the spatial arrangement of the ligand atoms 42 matches the “interaction pattern 2”, and in the example shown in the right diagram, the spatial arrangement of the ligand atoms 42 is “interaction pattern 4”. ".

空間配置情報に示されている各リガンド原子のそれぞれについて、このような相互作用パターンデータベース110との照合処理を行うことにより、相互作用パターンとの照合結果を表す空間配置ベクトル51を取得する。ここで、ステップS3において取得した空間配置ベクトル51は、実験的に確認された種々のタンパク質の立体構造を記録した立体構造データベース210から生成されていることから、空間配置ベクトル51は、アミノ酸の周辺に位置するリガンド原子が実際に取り得る正しい空間配置(正例)を示している。  Each of the ligand atoms indicated in the spatial arrangement information is collated with the interaction pattern database 110, thereby obtaining a spatial arrangement vector 51 representing the collation result with the interaction pattern. Here, since the spatial arrangement vector 51 acquired in step S3 is generated from the three-dimensional structure database 210 in which the three-dimensional structures of various proteins confirmed experimentally are recorded, The correct spatial arrangement (positive example) that the ligand atom located at can actually take is shown.

処理部10Aは、ステップS2において得られた複数の空間配置情報のそれぞれについて、リガンド原子の空間配置情報を空間配置ベクトル51へ変換することにより、図8(c)に例示する複数の空間配置ベクトル51を取得する。これら複数の空間配置ベクトル51はすべて、アミノ酸原子41の周囲においてリガンド原子42が取り得る正しい空間配置を示しているので、ラベル値52に正例を意味する値を付して記録される。本実施形態では、正例を意味する値として、値「1」またはBoolean値「True」を使用し、負例を意味する値として、値「0」またはBoolean値「False」を使用する。  The processing unit 10A converts the spatial arrangement information of the ligand atoms into the spatial arrangement vector 51 for each of the plurality of spatial arrangement information obtained in step S2, thereby a plurality of spatial arrangement vectors illustrated in FIG. 8C. 51 is obtained. All of the plurality of spatial arrangement vectors 51 indicate correct spatial arrangements that can be taken by the ligand atoms 42 around the amino acid atoms 41. Therefore, the label value 52 is recorded with a value meaning a positive example. In the present embodiment, a value “1” or a Boolean value “True” is used as a value meaning a positive example, and a value “0” or a Boolean value “False” is used as a value meaning a negative example.

図8(c)を参照して、空間配置ベクトル51を具体的に説明する。例えば空間配置ベクトル51が7次元の整数ベクトル「0103000」で表されている場合を例にとる。この例では、2次元目の値が「1」であり、4次元目の値が「3」であり、1次元目、3次元目、5次元目、6次元目、および7次元目の値が「0」である。したがって、例示する空間配置ベクトル51は、「相互作用パターン2」で表される位置に存在するリガンド原子が存在するペアが1つあり、「相互作用パターン4」で表される位置にリガンド原子が存在するペアが3つあり、「相互作用パターン1、3、5、6、7」で表される位置には、リガンド原子42が位置していないことを意味している。  With reference to FIG.8 (c), the space arrangement vector 51 is demonstrated concretely. For example, a case where the spatial arrangement vector 51 is represented by a 7-dimensional integer vector “0103000” is taken as an example. In this example, the value of the second dimension is “1”, the value of the fourth dimension is “3”, the values of the first dimension, the third dimension, the fifth dimension, the sixth dimension, and the seventh dimension. Is “0”. Therefore, in the illustrated spatial arrangement vector 51, there is one pair in which a ligand atom exists at the position represented by “interaction pattern 2”, and the ligand atom is present at the position represented by “interaction pattern 4”. There are three existing pairs, which means that the ligand atom 42 is not located at the position represented by “interaction pattern 1, 3, 5, 6, 7”.

ステップS4において、処理部10Aは、ステップS1において立体構造データベース210から取得した複合体の立体構造を、タンパク質の立体構造とリガンドの立体構造とに分割する。例えば立体構造がpdbフォーマットで記述されている本実施形態では、行中の識別子「TER」により、タンパク質の立体構造を記載した行とリガンドの立体構造を記載した行との区切りが判別される。よって、pdbファイル中のこのように判別された区切り位置においてpdbファイルを分割することにより、タンパク質の立体構造とリガンドの立体構造とが分割される。  In step S4, the processing unit 10A divides the three-dimensional structure of the complex acquired from the three-dimensional structure database 210 in step S1 into a protein three-dimensional structure and a ligand three-dimensional structure. For example, in the present embodiment in which the three-dimensional structure is described in the pdb format, the partition between the line describing the three-dimensional structure of the protein and the line describing the three-dimensional structure of the ligand is discriminated by the identifier “TER” in the line. Therefore, by dividing the pdb file at the separation positions determined in this way in the pdb file, the protein three-dimensional structure and the ligand three-dimensional structure are divided.

ステップS5において、処理部10Aは、分割した立体構造に基づいて、タンパク質とリガンドとの複合体の予測立体構造を生成する。本実施形態では、例えば分子モデリングシミュレーションソフトウェアであるAutoDockを用いて、複合体の立体構造を複数予測する。複合体の予測された立体構造は、所定の記述フォーマットで記録されている。このような複合体の立体構造を予測する処理を、ステップS1において取得した複数の複合体の立体構造に対して行う。例示的には、AutoDockにより予測されるドッキング構造の候補は、約13,000種類である。このステップS5の時点において取得される、複数の複合体の予測立体構造は、正しい予測構造(正例)と誤った予測構造(負例)とを含んでいる。  In step S <b> 5, the processing unit 10 </ b> A generates a predicted three-dimensional structure of the protein / ligand complex based on the divided three-dimensional structure. In the present embodiment, for example, a plurality of three-dimensional structures of a complex are predicted using AutoDock, which is molecular modeling simulation software. The predicted three-dimensional structure of the complex is recorded in a predetermined description format. The process of predicting the three-dimensional structure of such a complex is performed on the three-dimensional structures of the plurality of complexes acquired in step S1. Illustratively, there are approximately 13,000 docking structure candidates predicted by AutoDock. The predicted three-dimensional structures of a plurality of complexes acquired at the time of step S5 include a correct predicted structure (positive example) and an incorrect predicted structure (negative example).

ステップS6において、処理部10Aは、ステップS5において生成した複合体の予測立体構造を相互作用パターンデータベース110と照合し、複合体の予測立体構造を予測立体構造ベクトルへ変換する。  In step S6, the processing unit 10A compares the predicted three-dimensional structure of the complex generated in step S5 with the interaction pattern database 110, and converts the predicted three-dimensional structure of the complex into a predicted three-dimensional structure vector.

ステップS3と同様に、予測立体構造に示されている各リガンド原子のそれぞれについて、図8(b)に例示する相互作用パターンデータベース110との照合処理を行うことにより、相互作用パターンとの照合結果を表す予測立体構造ベクトル53を取得する。  As in step S3, each of the ligand atoms shown in the predicted three-dimensional structure is collated with the interaction pattern database 110 illustrated in FIG. 8B, thereby collating the interaction pattern. Is obtained.

処理部10Aは、ステップS5において得られた複合体の複数の立体構造のそれぞれについて、予測立体構造を予測立体構造ベクトル53へ変換することにより、図8(d)に例示する複数の予測立体構造ベクトル53を取得する。この時点では、予測立体構造ベクトル53には、正例または負例を示すラベル値54は付されていない。予測立体構造ベクトル53のラベル値54は、後述するステップS7において、ステップS3において取得した空間配置ベクトル51と対比することにより、正例または負例が示される。  The processing unit 10A converts the predicted three-dimensional structure into the predicted three-dimensional structure vector 53 for each of the plurality of three-dimensional structures of the complex obtained in step S5, whereby a plurality of predicted three-dimensional structures illustrated in FIG. Vector 53 is obtained. At this time, the predicted three-dimensional structure vector 53 is not attached with a label value 54 indicating a positive example or a negative example. A positive value or a negative example is shown by comparing the label value 54 of the predicted three-dimensional structure vector 53 with the spatial arrangement vector 51 acquired in step S3 in step S7 described later.

ステップS7において、処理部10Aは、ステップS3において取得した空間配置ベクトル51と、ステップS6において取得した予測立体構造ベクトル53とを訓練データとして、深層学習アルゴリズムを学習させる。  In step S7, the processing unit 10A causes the deep learning algorithm to be learned using the spatial arrangement vector 51 acquired in step S3 and the predicted three-dimensional structure vector 53 acquired in step S6 as training data.

図9は、ニューラルネットワークによる学習処理の詳細を説明するための模式図である。深層学習タイプのニューラルネットワークとは、図9に示すニューラルネットワーク60のように、入力層61aと、出力層61bと、入力層61aおよび出力層61bの間の中間層61cとを備え、中間層61cが複数の層で構成されているニューラルネットワークである。深層学習タイプの場合、中間層61cを構成する層の数は、例えば5層以上とすることができる。  FIG. 9 is a schematic diagram for explaining the details of the learning process by the neural network. As in the neural network 60 shown in FIG. 9, the deep learning type neural network includes an input layer 61a, an output layer 61b, and an intermediate layer 61c between the input layer 61a and the output layer 61b. Is a neural network composed of a plurality of layers. In the case of the deep learning type, the number of layers constituting the intermediate layer 61c can be, for example, 5 or more.

ニューラルネットワーク60では、層状に配置された複数のノード62が、隣接する層間においてのみ結合されている。これにより、情報が入力側の層61aから出力側の層61bに、図中矢印Dに示す一方向のみに伝播する。入力層61aのノード数は、例えば相互作用パターンのパターン数Nに対応している。  In the neural network 60, a plurality of nodes 62 arranged in layers are coupled only between adjacent layers. As a result, information propagates from the input-side layer 61a to the output-side layer 61b only in one direction indicated by the arrow D in the figure. The number of nodes in the input layer 61a corresponds to, for example, the number N of interaction patterns.

隣接する層間を結合する複数のノード62間のそれぞれには、結合重みw(またはシナプスウェイトとも呼ぶ)と呼ばれる係数が設定されている。ニューラルネットワークの学習とは、訓練データを入力することにより、例えば誤差逆伝播法(バックプロパゲーション法)に基づくアルゴリズムを用いて、この結合重みwを最適なものに更新する処理である。ニューラルネットワークによる深層学習は、例えば公知のソフトウェアツールキットを用いて行うことができる。  A coefficient called a connection weight w (or also called a synapse weight) is set between each of the plurality of nodes 62 that connect adjacent layers. The learning of the neural network is a process of updating the connection weight w to an optimum one by inputting training data, for example, using an algorithm based on an error back propagation method (back propagation method). The deep learning by the neural network can be performed using, for example, a known software tool kit.

まず、処理部10Aは、正例のみで構成されている複数の空間配置ベクトル51と、正例および負例が混在している複数の予測立体構造ベクトル53とを対比することにより、複数の予測立体構造ベクトル53のそれぞれについて、ラベル値54を判定して記録する。正例を示す予測立体構造ベクトル53にはラベル値54に値「1」を付して記録し、負例を示す予測立体構造ベクトル53にはラベル値54に値「0」を付して記録する。  First, the processing unit 10A compares a plurality of spatial arrangement vectors 51 configured by only positive examples with a plurality of predicted three-dimensional structure vectors 53 in which positive examples and negative examples are mixed to generate a plurality of predictions. For each of the three-dimensional structure vectors 53, a label value 54 is determined and recorded. The predicted three-dimensional structure vector 53 indicating the positive example is recorded with the value “1” added to the label value 54, and the predicted three-dimensional structure vector 53 indicating the negative example is recorded with the label value 54 added with the value “0”. To do.

次に、処理部10Aは、図9に示すように、深層学習アルゴリズムを構成するニューラルネットワーク構造60の入力層61aに、空間配置ベクトル51または予測立体構造ベクトル53のベクトル情報を入力し、ニューラルネットワーク構造60の出力層61bに、入力層61aに入力したベクトル情報に対応するラベル値を入力する。  Next, as shown in FIG. 9, the processing unit 10A inputs the vector information of the spatial arrangement vector 51 or the predicted three-dimensional structure vector 53 to the input layer 61a of the neural network structure 60 constituting the deep learning algorithm, and the neural network A label value corresponding to the vector information input to the input layer 61a is input to the output layer 61b of the structure 60.

このような学習処理を、複数の空間配置ベクトル51または予測立体構造ベクトル53に対して再帰的に繰り返し行うことにより、結合重みwを最適なものに更新する。最適化された結合重みwとニューラルネットワーク60とを含む学習済みの深層学習アルゴリズム108は、記録部13に記録される。  Such a learning process is recursively repeated for a plurality of spatial arrangement vectors 51 or predicted three-dimensional structure vectors 53 to update the connection weight w to an optimum one. The learned deep learning algorithm 108 including the optimized connection weight w and the neural network 60 is recorded in the recording unit 13.

・結合性予測処理
図10は、結合性予測装置100Bの機能を説明するためのブロック図である。結合性予測装置100Bの処理部10Bは、予測対象取得部111と、立体構造取得部112と、予測構造生成部113と、予測ベクトル変換部114と、結合性予測部115と、を備える。これらの機能ブロックは、コンピュータに結合性予測処理を実行させるプログラムを、処理部10Bの記録部13にインストールし、このプログラムをCPU11が実行することにより実現される。
FIG. 10 is a block diagram for explaining functions of the connectivity predicting apparatus 100B. The processing unit 10B of the connectivity predicting apparatus 100B includes a prediction target acquiring unit 111, a three-dimensional structure acquiring unit 112, a predicted structure generating unit 113, a predicted vector converting unit 114, and a connectivity predicting unit 115. These functional blocks are realized by installing a program for causing the computer to execute the connectivity prediction process in the recording unit 13 of the processing unit 10B and executing the program by the CPU 11.

相互作用パターンデータベース110は、処理部10Bの記録部13に予め記録されている。結合性予測処理に使用する学習済みの深層学習アルゴリズム108は、深層学習装置100Aにおいて学習されたものを使用する。  The interaction pattern database 110 is recorded in advance in the recording unit 13 of the processing unit 10B. As the learned deep learning algorithm 108 used for the connectivity prediction process, an algorithm learned by the deep learning device 100A is used.

図11は、結合性予測処理の手順を示すフローチャートであり、図12は、結合性予測処理の詳細を説明するための模式図である。  FIG. 11 is a flowchart showing the procedure of the connectivity prediction process, and FIG. 12 is a schematic diagram for explaining the details of the connectivity prediction process.

結合性予測装置100Bの処理部10Bは、図11に示す処理を行う。図10に示す各機能ブロックを用いて説明すると、ステップS11の処理は予測対象取得部111が行い、ステップS12の処理は立体構造取得部112が行う。ステップS13の処理は予測構造生成部113が行い、ステップS14の処理は予測ベクトル変換部114が行う。ステップS15の処理は結合性予測部115が行う。  The processing unit 10B of the connectivity predicting apparatus 100B performs the process shown in FIG. If it demonstrates using each function block shown in FIG. 10, the process of step S11 will be performed by the prediction object acquisition part 111, and the process of step S12 will be performed by the three-dimensional structure acquisition part 112. FIG. The process of step S13 is performed by the prediction structure generation unit 113, and the process of step S14 is performed by the prediction vector conversion unit 114. The connectivity predicting unit 115 performs the process of step S15.

ステップS11において、処理部10Bは、標的とするタンパク質の指定と、結合性を予測する対象である化合物の立体構造とを取得する。本実施形態では、結合性を予測する対象である化合物の立体構造は、実験的に確認されている立体構造である。  In step S <b> 11, the processing unit 10 </ b> B acquires designation of a target protein and a three-dimensional structure of a compound that is a target for predicting binding properties. In the present embodiment, the three-dimensional structure of the compound for which the binding property is predicted is a three-dimensional structure that has been experimentally confirmed.

標的とするタンパク質の指定は、入力部16を介してユーザから処理部10Bに入力される。結合性の予測対象である化合物の立体構造も、例えば入力部16を介してユーザから入力される。あるいは、結合性の予測対象である化合物の立体構造は予め記録部13に記録されており、入力部16を介してユーザが指定することにより、処理部10Bでの処理に供される。  The designation of the target protein is input from the user to the processing unit 10B via the input unit 16. The three-dimensional structure of the compound that is the target of the binding property is also input from the user via the input unit 16, for example. Alternatively, the three-dimensional structure of the compound that is the target of predicting the binding property is recorded in the recording unit 13 in advance, and is supplied to the processing in the processing unit 10B when specified by the user via the input unit 16.

ステップS12において、処理部10Bは、立体構造データベース210から、ステップS11において指定されたタンパク質の立体構造を取得する。  In step S12, the processing unit 10B acquires the three-dimensional structure of the protein specified in step S11 from the three-dimensional structure database 210.

ステップS13において、処理部10Bは、ステップS12において取得した、標的とするタンパク質の立体構造と、ステップS11において取得した、結合性を予測する対象である化合物の立体構造とに基づいて、タンパク質と化合物との複合体の予測立体構造を生成する。  In step S13, the processing unit 10B determines that the protein and the compound are based on the three-dimensional structure of the target protein acquired in step S12 and the three-dimensional structure of the compound that is the target for predicting the binding acquired in step S11. And generate a predicted three-dimensional structure of the complex.

深層学習処理を行う際のステップS5と同様に、本実施形態では、例えば分子モデリングシミュレーションソフトウェアであるAutoDockを用いて、複合体の立体構造を複数予測する。複合体の予測された立体構造は、所定の記述フォーマットで記録されている。  Similar to step S5 when performing deep learning processing, in this embodiment, a plurality of three-dimensional structures of the complex are predicted using, for example, AutoDock, which is molecular modeling simulation software. The predicted three-dimensional structure of the complex is recorded in a predetermined description format.

ステップS14において、処理部10Bは、ステップS13において生成した複合体の予測立体構造を相互作用パターンデータベース110と照合し、複合体の予測立体構造を予測立体構造ベクトルへ変換する。  In step S14, the processing unit 10B compares the predicted three-dimensional structure of the complex generated in step S13 with the interaction pattern database 110, and converts the predicted three-dimensional structure of the complex into a predicted three-dimensional structure vector.

深層学習処理を行う際のステップS6と同様に、予測立体構造に示されている各リガンド原子のそれぞれについて、図8(b)に例示する相互作用パターンデータベース110との照合処理を行うことにより、相互作用パターンとの照合結果を表す予測立体構造ベクトル55を取得する。  Similarly to step S6 when performing the deep learning process, by performing a collation process with the interaction pattern database 110 illustrated in FIG. 8B for each of the ligand atoms shown in the predicted three-dimensional structure, A predicted three-dimensional structure vector 55 representing a result of matching with the interaction pattern is acquired.

処理部10Bは、ステップS13において得られた複合体の複数の立体構造のそれぞれについて、予測立体構造を予測立体構造ベクトル55へ変換することにより、図12に例示する複数の予測立体構造ベクトル55を取得する。  The processing unit 10B converts the predicted three-dimensional structure into the predicted three-dimensional structure vector 55 for each of the plurality of three-dimensional structures of the complex obtained in step S13, thereby obtaining the plurality of predicted three-dimensional structure vectors 55 illustrated in FIG. get.

ステップS15において、処理部10Bは、ステップS14において取得した予測立体構造ベクトル55を、学習済みの深層学習アルゴリズム108に入力し、標的とするタンパク質の立体構造と、予測対象である化合物の立体構造との結合性を予測する。  In step S15, the processing unit 10B inputs the predicted three-dimensional structure vector 55 acquired in step S14 to the learned deep learning algorithm 108, the target protein three-dimensional structure, and the three-dimensional structure of the compound to be predicted. Predicts connectivity.

処理部10Bは、学習済みの深層学習アルゴリズム108を構成するニューラルネットワーク構造60の入力層61aに、予測立体構造ベクトル55のベクトル情報を入力する。ニューラルネットワーク構造60の出力層61bには、入力層61aに入力したベクトル情報に対応するラベル値56が出力される。ここで、ラベル値56に値「1」が付されている予測立体構造ベクトル55は、実際に存在することが可能であると判定されたリガンド原子の空間配置であり、ラベル値56に値「0」が付されている予測立体構造ベクトル55は、実際に存在することが不可能であると判定されたリガンド原子の空間配置である。  The processing unit 10B inputs the vector information of the predicted three-dimensional structure vector 55 to the input layer 61a of the neural network structure 60 constituting the learned deep learning algorithm 108. A label value 56 corresponding to the vector information input to the input layer 61a is output to the output layer 61b of the neural network structure 60. Here, the predicted three-dimensional structure vector 55 in which the value “1” is attached to the label value 56 is a spatial arrangement of ligand atoms determined to actually exist, and the value “ The predicted three-dimensional structure vector 55 to which “0” is attached is the spatial arrangement of ligand atoms determined to be impossible to actually exist.

処理部10Bは、予測立体構造ベクトル55とラベル値56との複数のペアを含む予測結果116のうち、例えばラベル値56に値「1」が付されているペアの予測立体構造ベクトル55を、ユーザへの出力として出力部17に出力する。あるいは、出力部17への出力に代えて、予測結果116を記録部13に記録してもよい。  The processing unit 10B, for example, of the prediction results 116 including a plurality of pairs of the predicted three-dimensional structure vector 55 and the label value 56, for example, the predicted three-dimensional structure vector 55 of the pair in which the value “1” is attached to the label value 56, It outputs to the output part 17 as an output to a user. Alternatively, the prediction result 116 may be recorded in the recording unit 13 in place of the output to the output unit 17.

以上、本発明によると、得られる予測精度が高く演算速度が向上した、結合性予測方法、装置、プログラム、記録媒体、および結合性の予測に使用する機械学習アルゴリズムの製造方法を提供することができる。  As described above, according to the present invention, it is possible to provide a connectivity prediction method, apparatus, program, recording medium, and method for manufacturing a machine learning algorithm used for connectivity prediction, with high prediction accuracy and improved calculation speed. it can.

標的とするタンパク質の立体構造と低分子化合物の立体構造との結合性を予測する従来の方法では、タンパク質および低分子化合物の配置の座標データから、量子化学計算により相互作用エネルギーを算出している。これに対し、本発明による結合性の予測方法では、空間内に位置する原子の配置パターンの確率分布との差(すなわち、相互作用パターンデータベースとの照合)によって予測を行うので、量子化学計算による複雑なエネルギー計算が不要となり、シミュレーション速度を向上させることができる。また、本発明による結合性の予測方法によると、相互作用パターンデータベースとの照合により、原子の空間配置パターンはベクトル化されるので、ニューラルネットワークを用いた深層学習アルゴリズムへの適用に適した形式となる。  In the conventional method for predicting the binding between the target protein's three-dimensional structure and the low-molecular compound's three-dimensional structure, the interaction energy is calculated by quantum chemical calculation from the coordinate data of the protein and low-molecular compound configuration. . On the other hand, in the method for predicting connectivity according to the present invention, prediction is performed based on the difference from the probability distribution of the arrangement pattern of atoms located in the space (that is, collation with the interaction pattern database). Complex energy calculation is not required, and simulation speed can be improved. Further, according to the connectivity prediction method of the present invention, the spatial arrangement pattern of atoms is vectorized by collating with the interaction pattern database, so that the format suitable for application to a deep learning algorithm using a neural network Become.

また、本発明による結合性の予測方法によると、AutoDock等の分子モデリングシミュレーションソフトウェアにより得られる予測構造を元に、さらに上記した確率分布による評価を加えることができるので、予測精度を向上させることができる。例示的には、予測精度は約90%以上である。  In addition, according to the method for predicting connectivity according to the present invention, it is possible to add evaluation based on the above probability distribution based on the predicted structure obtained by molecular modeling simulation software such as AutoDock, so that the prediction accuracy can be improved. it can. Illustratively, the prediction accuracy is about 90% or more.

[付記事項]
以上、本発明を特定の実施の形態によって説明したが、本発明は上記した実施の形態に限定されるものではない。
[Additional Notes]
As mentioned above, although this invention was demonstrated by specific embodiment, this invention is not limited to above-described embodiment.

上記実施の形態では、タンパク質を標的として化合物との結合性を予測しているが、タンパク質に代えて、核酸(DNA、RNA)、多糖等の生体高分子を使用してもよい。  In the above embodiment, the binding property to a compound is predicted using a protein as a target. However, a biopolymer such as a nucleic acid (DNA, RNA) or polysaccharide may be used instead of the protein.

上記実施の形態では、アミノ酸の周辺に位置するリガンド原子の空間配置分布の統計に基づいて相互作用パターンを定義しているが、リガンド原子の空間配置は、アミノ酸残基の周辺に位置するものに限られず、ヌクレオチド残基の周辺、単糖残基の周辺等に位置するものであってもよい。  In the above embodiment, the interaction pattern is defined based on the statistics of the spatial arrangement distribution of the ligand atoms located around the amino acids, but the spatial arrangement of the ligand atoms is located around the amino acid residues. It is not limited, and may be located around nucleotide residues, around monosaccharide residues, and the like.

上記実施の形態では、タンパク質の立体構造を蛋白質構造データバンクから取得しているが、タンパク質等の生体高分子の立体構造を蓄積したデータベースであれば、蛋白質構造データバンク以外の他のデータベースであってもよい。或いは、公共のデータベースである蛋白質構造データバンクを使用せず、例えば、自社内で研究段階にある未公開のタンパク質の立体構造を蓄積したプライベートなデータベースを、自社内または自研究所内のサーバに予め作成しておき、このプライベートなデータベースからタンパク質の立体構造を取得してもよい。  In the above embodiment, the three-dimensional structure of the protein is obtained from the protein structure data bank. However, any database other than the protein structure data bank may be used as long as it is a database that accumulates three-dimensional structures of biopolymers such as proteins. May be. Alternatively, without using the protein structure data bank, which is a public database, for example, a private database that stores the three-dimensional structure of unpublished proteins in the research stage in-house is stored in advance on a server in the company or in its own laboratory. A three-dimensional structure of the protein may be acquired from this private database.

上記実施の形態では、機械学習アルゴリズムとしてニューラルネットワーク構造の深層学習アルゴリズムを用いているが、機械学習アルゴリズムはこれに限定されず、例えばサポートベクターマシン、ランダムフォレスト等の種々の機械学習アルゴリズムを用いることができる。  In the above embodiment, a deep learning algorithm having a neural network structure is used as the machine learning algorithm. However, the machine learning algorithm is not limited to this, and various machine learning algorithms such as a support vector machine and a random forest are used. Can do.

上記実施の形態では、結合性を予測する対象である化合物の立体構造は、入力部16を介してユーザから取得、または予め記録部13に記録されている立体構造を使用しているが、結合性予測対象の化合物の立体構造を取得する態様はこれに限らず、例えば、入力部16を介して対象とする化合物がユーザから指定され、蛋白質構造データバンク等の立体構造データベースから、指定に対応する化合物の立体構造を取得してもよい。  In the above embodiment, the three-dimensional structure of the compound for which the binding property is to be predicted is acquired from the user via the input unit 16 or is recorded in the recording unit 13 in advance. The mode of acquiring the three-dimensional structure of the target compound of the sex prediction is not limited to this. For example, the target compound is designated by the user via the input unit 16 and corresponds to the designation from the three-dimensional structure database such as the protein structure data bank. The three-dimensional structure of the compound to be obtained may be acquired.

上記実施の形態では、結合性を予測する対象である化合物の立体構造は、実験的に確認されている立体構造であるが、結合性を予測する対象である化合物の立体構造は、理論的に求められた立体構造であってもよい。  In the above embodiment, the three-dimensional structure of the compound for which the binding property is predicted is a three-dimensional structure that has been experimentally confirmed, but the three-dimensional structure of the compound for which the binding property is predicted is theoretically The required three-dimensional structure may be used.

上記実施の形態では、例えば分子モデリングシミュレーションソフトウェアであるAutoDockを用いて、複合体の立体構造を予測しているが、複合体の立体構造を予測するためのソフトウェアはAutoDockに限定されず、公知の種々の分子モデリングシミュレーションソフトウェアを用いることができる。  In the above embodiment, for example, the three-dimensional structure of a complex is predicted using AutoDock, which is molecular modeling simulation software. However, the software for predicting the three-dimensional structure of a complex is not limited to AutoDock, and is known in the art. Various molecular modeling simulation software can be used.

上記実施の形態では、処理部10は一体の装置として実現されているが、処理部10は一体の装置である必要はなく、CPU11、メモリ12、記録部13等が別所に配置され、これらがネットワークで接続されていてもよい。処理部10と、入力部16と、出力部17とについても、一ヶ所に配置される必要は必ずしもなく、それぞれ別所に配置されて互いにネットワークで通信可能に接続されていてもよい。  In the above embodiment, the processing unit 10 is realized as an integrated device. However, the processing unit 10 does not have to be an integrated device, and the CPU 11, the memory 12, the recording unit 13, and the like are arranged in different places. It may be connected via a network. The processing unit 10, the input unit 16, and the output unit 17 are not necessarily arranged in one place, and may be arranged in different places and connected to each other via a network.

上記実施の形態では、処理部10A,10Bの各機能ブロックは単一のCPU11で実行されているが、これら各機能ブロックは単一のCPU11で実行される必要は必ずしもなく、複数のCPUで分散して処理されてもよい。  In the above embodiment, each functional block of the processing units 10A and 10B is executed by a single CPU 11. However, each functional block does not necessarily need to be executed by a single CPU 11, and is distributed by a plurality of CPUs. May be processed.

上記実施の形態では、深層学習処理100Aにおいて、相互作用パターンデータベース110および学習前または学習途中の深層学習アルゴリズムは、処理部10Aの記録部13に予め記録されているが、これらは外部のサーバ(例えば、図1に示すアプリケーションサーバ300)に記録されて、ネットワーク99を介して処理部10Aに取り込まれてもよい。同様に、上記実施の形態では、結合性予測装置100Bにおいて、相互作用パターンデータベース110および学習済みの深層学習アルゴリズム108は、処理部10Bの記録部13に予め記録されているが、これらも外部のサーバ(例えば、図1に示すアプリケーションサーバ300)に記録されて、ネットワーク99を介して処理部10Aに取り込まれてもよい。  In the above embodiment, in the deep learning process 100A, the interaction pattern database 110 and the deep learning algorithm before learning or during learning are recorded in advance in the recording unit 13 of the processing unit 10A. For example, it may be recorded in the application server 300) shown in FIG. 1 and taken into the processing unit 10A via the network 99. Similarly, in the above embodiment, in the connectivity predicting apparatus 100B, the interaction pattern database 110 and the learned deep learning algorithm 108 are recorded in advance in the recording unit 13 of the processing unit 10B. It may be recorded in a server (for example, the application server 300 shown in FIG. 1) and taken into the processing unit 10A via the network 99.

上記実施の形態では、入力部16はキーボードまたはマウス等の入力装置で実現され、出力部17は液晶ディスプレイ等の表示装置で実現されているが、入力部16と出力部17とを一体化してタッチパネル式の表示装置として構成してもよい。  In the above embodiment, the input unit 16 is realized by an input device such as a keyboard or a mouse, and the output unit 17 is realized by a display device such as a liquid crystal display, but the input unit 16 and the output unit 17 are integrated. You may comprise as a touchscreen type display apparatus.

10(10A,10B) 処理部
11 CPU
12 メモリ
13 記録部
14 バス
15 インタフェース部
16 入力部
17 出力部
41 アミノ酸原子
42 リガンド原子
51 空間配置ベクトル
52 ラベル値
53 予測立体構造ベクトル
54 ラベル値
55 予測立体構造ベクトル
56 ラベル値
60 ニューラルネットワーク
61a 入力層
61b 出力層
61c 中間層
62 ノード
98 記録媒体
99 ネットワーク
100 ユーザ側装置
100A 深層学習装置
100B 結合性予測装置
101 複合体取得部
102 空間情報変換部
103 空間ベクトル変換部
104 複合体分割部
105 予測構造生成部
106 予測ベクトル変換部
107 深層学習部
108 深層学習アルゴリズム
110 相互作用パターンデータベース
111 予測対象取得部
112 立体構造取得部
113 予測構造生成部
114 予測ベクトル変換部
115 結合性予測部
116 予測結果
200 データサーバ
210 立体構造データベース
300 アプリケーションサーバ
10 (10A, 10B) Processing unit 11 CPU
12 Memory 13 Recording unit 14 Bus 15 Interface unit 16 Input unit 17 Output unit 41 Amino acid atom 42 Ligand atom 51 Spatial arrangement vector 52 Label value 53 Predicted solid structure vector 54 Label value 55 Predicted solid structure vector 56 Label value 60 Neural network 61a Input Layer 61b Output layer 61c Intermediate layer 62 Node 98 Recording medium 99 Network 100 User side device 100A Deep learning device 100B Connectivity prediction device 101 Complex acquisition unit 102 Spatial information conversion unit 103 Spatial vector conversion unit 104 Complex division unit 105 Prediction structure Generation unit 106 Prediction vector conversion unit 107 Deep learning unit 108 Deep learning algorithm 110 Interaction pattern database 111 Prediction target acquisition unit 112 Three-dimensional structure acquisition unit 113 Prediction structure generation unit 114 Prediction vector Conversion unit 115 Connectivity prediction unit 116 Prediction result 200 Data server 210 Three-dimensional structure database 300 Application server

Claims (12)

Translated fromJapanese
標的の生体高分子の指定と、結合性予測対象の化合物の立体構造とを取得するステップと、
生体高分子の立体構造を蓄積した立体構造データベースから、前記指定に対応する生体高分子の立体構造を取得するステップと、
取得した前記生体高分子の立体構造と前記化合物の立体構造とに基づいて、前記生体高分子と前記化合物との複合体の予測立体構造を生成するステップと、
生成した前記予測立体構造を、生体高分子の残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換するステップと、
変換した前記予測立体構造ベクトルを機械学習アルゴリズムに入力し、前記機械学習アルゴリズムを用いて前記予測立体構造ベクトルを判別することによって、前記生体高分子の立体構造と前記化合物の立体構造との結合性を予測するステップと、
を含む方法。
Obtaining a target biopolymer designation and the three-dimensional structure of the compound for which the binding is predicted;
Obtaining a three-dimensional structure of the biopolymer corresponding to the designation from a three-dimensional structure database storing the three-dimensional structure of the biopolymer;
Generating a predicted three-dimensional structure of a complex of the biopolymer and the compound based on the obtained three-dimensional structure of the biopolymer and the three-dimensional structure of the compound;
The generated predicted three-dimensional structure is collated with an interaction pattern database including a plurality of interaction patterns defined on the basis of statistics of spatial arrangement distribution of ligand atoms located around the residue of the biopolymer, and the interaction Converting to a predicted three-dimensional structure vector representing a matching result with a pattern;
The converted predicted three-dimensional structure vector is input to a machine learning algorithm, and the predicted three-dimensional structure vector is discriminated using the machine learning algorithm, thereby connecting the three-dimensional structure of the biopolymer and the three-dimensional structure of the compound. Predicting
Including methods.
前記機械学習アルゴリズムの学習に用いられる訓練データが、残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースに基づいて生成されている、請求項1に記載の方法。  Training data used for learning of the machine learning algorithm is generated based on an interaction pattern database including a plurality of interaction patterns defined based on statistics of spatial arrangement distribution of ligand atoms located around residues. The method of claim 1. 前記相互作用パターンデータベースが、
前記立体構造データベースから、生体高分子とリガンドとの複合体の立体構造を取得するステップと、
前記立体構造データベースから取得した前記複合体の前記立体構造を、残基周辺に位置するリガンド原子の空間配置情報へ変換するステップと、
前記立体構造を取得するステップと、前記空間配置情報へ変換するステップとを繰り返し行うことにより、残基周辺に位置するリガンド原子の空間配置分布の統計を取得するステップと、
前記空間配置分布の統計に基づいて、複数の相互作用パターンを定義するステップと、
を含む方法により生成されている、請求項1または2に記載の方法。
The interaction pattern database is
Obtaining a three-dimensional structure of a complex of a biopolymer and a ligand from the three-dimensional structure database;
Converting the three-dimensional structure of the complex obtained from the three-dimensional structure database into spatial arrangement information of ligand atoms located around the residue;
Obtaining statistics of spatial arrangement distribution of ligand atoms located in the vicinity of residues by repeatedly obtaining the three-dimensional structure and converting to the spatial arrangement information; and
Defining a plurality of interaction patterns based on statistics of the spatial distribution;
The method according to claim 1, wherein the method is produced by a method comprising:
標的の生体高分子の指定と、結合性予測対象の化合物の立体構造とを取得する予測対象取得手段と、
生体高分子の立体構造を蓄積した立体構造データベースから、前記指定に対応する生体高分子の立体構造を取得する立体構造取得手段と、
取得した前記生体高分子の立体構造と前記化合物の立体構造とに基づいて、前記生体高分子と前記化合物との複合体の予測立体構造を生成する予測構造生成手段と、
生成した前記予測立体構造を、生体高分子の残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換する予測ベクトル変換手段と、
変換した前記予測立体構造ベクトルを機械学習アルゴリズムに入力し、前記機械学習アルゴリズムを用いて前記予測立体構造ベクトルを判別することによって、前記生体高分子の立体構造と前記化合物の立体構造との結合性を予測する結合性予測手段と、
を備える装置。
Prediction target acquisition means for acquiring the target biopolymer designation and the three-dimensional structure of the binding prediction target compound;
Three-dimensional structure acquisition means for acquiring a three-dimensional structure of a biopolymer corresponding to the designation from a three-dimensional structure database in which the three-dimensional structure of the biopolymer is accumulated;
A predicted structure generating means for generating a predicted three-dimensional structure of a complex of the biopolymer and the compound based on the acquired three-dimensional structure of the biopolymer and the three-dimensional structure of the compound;
The generated predicted three-dimensional structure is collated with an interaction pattern database including a plurality of interaction patterns defined on the basis of statistics of spatial arrangement distribution of ligand atoms located around the residue of the biopolymer, and the interaction Predicted vector conversion means for converting into a predicted three-dimensional structure vector representing a matching result with a pattern;
The converted predicted three-dimensional structure vector is input to a machine learning algorithm, and the predicted three-dimensional structure vector is discriminated using the machine learning algorithm, thereby connecting the three-dimensional structure of the biopolymer and the three-dimensional structure of the compound. A connectivity prediction means for predicting
A device comprising:
コンピュータに、
標的の生体高分子の指定と、結合性予測対象の化合物の立体構造とを取得する予測対象取得機能と、
生体高分子の立体構造を蓄積した立体構造データベースから、前記指定に対応する生体高分子の立体構造を取得する立体構造取得機能と、
取得した前記生体高分子の立体構造と前記化合物の立体構造とに基づいて、前記生体高分子と前記化合物との複合体の予測立体構造を生成する予測構造生成機能と、
生成した前記予測立体構造を、生体高分子の残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換する予測ベクトル変換機能と、
変換した前記予測立体構造ベクトルを機械学習アルゴリズムに入力し、前記機械学習アルゴリズムを用いて前記予測立体構造ベクトルを判別することによって、前記生体高分子の立体構造と前記化合物の立体構造との結合性を予測する結合性予測機能と、
を実現させるプログラム。
On the computer,
Prediction target acquisition function for acquiring the target biopolymer designation and the three-dimensional structure of the binding prediction target compound;
A three-dimensional structure acquisition function for acquiring a three-dimensional structure of a biopolymer corresponding to the designation from a three-dimensional structure database storing the three-dimensional structure of the biopolymer;
A predicted structure generation function for generating a predicted three-dimensional structure of a complex of the biopolymer and the compound based on the acquired three-dimensional structure of the biopolymer and the three-dimensional structure of the compound;
The generated predicted three-dimensional structure is collated with an interaction pattern database including a plurality of interaction patterns defined on the basis of statistics of spatial arrangement distribution of ligand atoms located around the residue of the biopolymer, and the interaction A predicted vector conversion function for converting into a predicted three-dimensional structure vector representing a matching result with a pattern;
The converted predicted three-dimensional structure vector is input to a machine learning algorithm, and the predicted three-dimensional structure vector is discriminated using the machine learning algorithm, thereby connecting the three-dimensional structure of the biopolymer and the three-dimensional structure of the compound. A connectivity prediction function that predicts
A program that realizes
請求項5に記載のプログラムを記録した、コンピュータ読み取り可能な非一時的な有体の記録媒体。  A computer-readable non-transitory tangible recording medium on which the program according to claim 5 is recorded. 生体高分子の立体構造を蓄積した立体構造データベースから、生体高分子とリガンドとの複合体の立体構造を取得するステップと、
前記立体構造データベースから取得した前記複合体の前記立体構造を、生体高分子の残基周辺に位置するリガンド原子の空間配置情報へ変換するステップと、
前記空間配置情報を、残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す空間配置ベクトルへ変換するステップと、
前記立体構造データベースから取得した前記複合体の前記立体構造を、前記生体高分子の立体構造と前記リガンドの立体構造とに分割するステップと、
分割した前記生体高分子の立体構造と前記リガンドの立体構造とに基づいて、前記生体高分子と前記リガンドとの複合体の予測立体構造を生成するステップと、
生成した前記予測立体構造を前記相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換するステップと、
前記予測立体構造ベクトルと前記空間配置ベクトルとを訓練データとして、機械学習アルゴリズムを学習させるステップと、
を含む、機械学習アルゴリズムの製造方法。
Obtaining a three-dimensional structure of a complex of a biopolymer and a ligand from a three-dimensional structure database accumulating the three-dimensional structure of the biopolymer;
Converting the three-dimensional structure of the complex obtained from the three-dimensional structure database into spatial arrangement information of ligand atoms located around biopolymer residues;
The spatial arrangement information is collated with an interaction pattern database including a plurality of interaction patterns defined based on statistics of spatial arrangement distribution of ligand atoms located around the residue, and the collation result with the interaction pattern is obtained. Converting to a spatial layout vector representing;
Dividing the three-dimensional structure of the complex obtained from the three-dimensional structure database into a three-dimensional structure of the biopolymer and a three-dimensional structure of the ligand;
Generating a predicted three-dimensional structure of a complex of the biopolymer and the ligand based on the three-dimensional structure of the biopolymer and the three-dimensional structure of the ligand,
Collating the generated predicted three-dimensional structure with the interaction pattern database, and converting the predicted three-dimensional structure vector into a predicted three-dimensional structure vector representing a matching result with the interaction pattern;
Learning the machine learning algorithm using the predicted three-dimensional structure vector and the spatial arrangement vector as training data;
A method for manufacturing a machine learning algorithm.
前記機械学習アルゴリズムを学習させるステップが、前記空間配置ベクトルを正例として、前記予測立体構造ベクトルについて正例または負例を示すラベルを決定し、前記予測立体構造ベクトルを入力層とし前記ラベルを出力層として、機械学習アルゴリズムを学習させるステップである、請求項7に記載の機械学習アルゴリズムの製造方法。  The step of learning the machine learning algorithm determines a label indicating a positive example or a negative example for the predicted three-dimensional structure vector using the spatial arrangement vector as a positive example, and outputs the label using the predicted three-dimensional structure vector as an input layer The method of manufacturing a machine learning algorithm according to claim 7, which is a step of learning a machine learning algorithm as a layer. 前記相互作用パターンデータベースが、
前記立体構造データベースから、生体高分子とリガンドとの複合体の立体構造を取得するステップと、
前記立体構造データベースから取得した前記複合体の前記立体構造を、残基周辺に位置するリガンド原子の空間配置情報へ変換するステップと、
前記立体構造を取得するステップと、前記空間配置情報へ変換するステップとを繰り返し行うことにより、残基周辺に位置するリガンド原子の空間配置分布の統計を取得するステップと、
前記空間配置分布の統計に基づいて、複数の相互作用パターンを定義するステップと、
を含む方法により生成されている、請求項7または8に記載の機械学習アルゴリズムの製造方法。
The interaction pattern database is
Obtaining a three-dimensional structure of a complex of a biopolymer and a ligand from the three-dimensional structure database;
Converting the three-dimensional structure of the complex obtained from the three-dimensional structure database into spatial arrangement information of ligand atoms located around the residue;
Obtaining statistics of spatial arrangement distribution of ligand atoms located in the vicinity of residues by repeatedly obtaining the three-dimensional structure and converting to the spatial arrangement information; and
Defining a plurality of interaction patterns based on statistics of the spatial distribution;
The method of manufacturing a machine learning algorithm according to claim 7 or 8, wherein the machine learning algorithm is generated by a method including:
生体高分子の立体構造を蓄積した立体構造データベースから、生体高分子とリガンドとの複合体の立体構造を取得する複合体取得手段と、
前記立体構造データベースから取得した前記複合体の前記立体構造を、生体高分子の残基周辺に位置するリガンド原子の空間配置情報へ変換する空間情報変換手段と、
前記空間配置情報を、残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す空間配置ベクトルへ変換する空間ベクトル変換手段と、
前記立体構造データベースから取得した前記複合体の前記立体構造を、前記生体高分子の立体構造と前記リガンドの立体構造とに分割する複合体分割手段と、
分割した前記生体高分子の立体構造と前記リガンドの立体構造とに基づいて、前記生体高分子と前記リガンドとの複合体の予測立体構造を生成する予測構造生成手段と、
生成した前記予測立体構造を前記相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換する予測ベクトル変換手段と、
前記予測立体構造ベクトルと前記空間配置ベクトルとを訓練データとして、機械学習アルゴリズムを学習させる学習手段と、
を備える、機械学習アルゴリズムの製造装置。
A complex acquisition means for acquiring a three-dimensional structure of a complex of a biopolymer and a ligand from a three-dimensional structure database storing the three-dimensional structure of the biopolymer;
Spatial information conversion means for converting the three-dimensional structure of the complex acquired from the three-dimensional structure database into spatial arrangement information of ligand atoms located in the vicinity of the residue of the biopolymer;
The spatial arrangement information is collated with an interaction pattern database including a plurality of interaction patterns defined based on statistics of spatial arrangement distribution of ligand atoms located around the residue, and the collation result with the interaction pattern is obtained. Space vector conversion means for converting into a space arrangement vector to be represented;
A complex dividing means for dividing the three-dimensional structure of the complex obtained from the three-dimensional structure database into a three-dimensional structure of the biopolymer and a three-dimensional structure of the ligand;
A predicted structure generating means for generating a predicted three-dimensional structure of a complex of the biopolymer and the ligand based on the three-dimensional structure of the biopolymer and the three-dimensional structure of the ligand,
A predicted vector conversion unit that compares the generated predicted three-dimensional structure with the interaction pattern database and converts the predicted three-dimensional structure vector into a predicted three-dimensional structure vector that represents a matching result with the interaction pattern;
Learning means for learning a machine learning algorithm using the predicted three-dimensional structure vector and the spatial arrangement vector as training data;
A machine learning algorithm manufacturing apparatus comprising:
コンピュータに、
生体高分子の立体構造を蓄積した立体構造データベースから、生体高分子とリガンドとの複合体の立体構造を取得する複合体取得機能と、
前記立体構造データベースから取得した前記複合体の前記立体構造を、生体高分子の残基周辺に位置するリガンド原子の空間配置情報へ変換する空間情報変換機能と、
前記空間配置情報を、残基周辺に位置するリガンド原子の空間配置分布の統計に基づいて定義された複数の相互作用パターンを含む相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す空間配置ベクトルへ変換する空間ベクトル変換機能と、
前記立体構造データベースから取得した前記複合体の前記立体構造を、前記生体高分子の立体構造と前記リガンドの立体構造とに分割する複合体分割機能と、
分割した前記生体高分子の立体構造と前記リガンドの立体構造とに基づいて、前記生体高分子と前記リガンドとの複合体の予測立体構造を生成する予測構造生成機能と、
生成した前記予測立体構造を前記相互作用パターンデータベースと照合し、前記相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換する予測ベクトル変換機能と、
前記予測立体構造ベクトルと前記空間配置ベクトルとを訓練データとして、機械学習アルゴリズムを学習させる学習機能と、
を実現させるプログラム。
On the computer,
A complex acquisition function for acquiring a three-dimensional structure of a complex of a biopolymer and a ligand from a three-dimensional structure database storing the three-dimensional structure of the biopolymer;
A spatial information conversion function for converting the three-dimensional structure of the complex obtained from the three-dimensional structure database into spatial arrangement information of ligand atoms located around a residue of a biopolymer;
The spatial arrangement information is collated with an interaction pattern database including a plurality of interaction patterns defined based on statistics of spatial arrangement distribution of ligand atoms located around the residue, and the collation result with the interaction pattern is obtained. A space vector conversion function for converting into a space arrangement vector to be represented;
A complex dividing function for dividing the three-dimensional structure of the complex obtained from the three-dimensional structure database into the three-dimensional structure of the biopolymer and the three-dimensional structure of the ligand;
A predicted structure generation function for generating a predicted three-dimensional structure of a complex of the biopolymer and the ligand based on the three-dimensional structure of the biopolymer and the three-dimensional structure of the ligand,
A predicted vector conversion function for matching the generated predicted three-dimensional structure with the interaction pattern database and converting the predicted three-dimensional structure vector into a predicted three-dimensional structure vector representing a matching result with the interaction pattern;
A learning function for learning a machine learning algorithm using the predicted three-dimensional structure vector and the spatial arrangement vector as training data;
A program that realizes
請求項11に記載のプログラムを記録した、コンピュータ読み取り可能な非一時的な有体の記録媒体。  A computer-readable non-transitory tangible recording medium on which the program according to claim 11 is recorded.
JP2017149996A2017-08-022017-08-02 How to learn connectivity prediction methods, devices, programs, recording media, and machine learning algorithmsActiveJP7048065B2 (en)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
JP2017149996AJP7048065B2 (en)2017-08-022017-08-02 How to learn connectivity prediction methods, devices, programs, recording media, and machine learning algorithms

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
JP2017149996AJP7048065B2 (en)2017-08-022017-08-02 How to learn connectivity prediction methods, devices, programs, recording media, and machine learning algorithms

Publications (2)

Publication NumberPublication Date
JP2019028879Atrue JP2019028879A (en)2019-02-21
JP7048065B2 JP7048065B2 (en)2022-04-05

Family

ID=65478599

Family Applications (1)

Application NumberTitlePriority DateFiling Date
JP2017149996AActiveJP7048065B2 (en)2017-08-022017-08-02 How to learn connectivity prediction methods, devices, programs, recording media, and machine learning algorithms

Country Status (1)

CountryLink
JP (1)JP7048065B2 (en)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JPWO2020203551A1 (en)*2019-03-292020-10-08
JPWO2020213417A1 (en)*2019-04-162020-10-22
WO2021095742A1 (en)2019-11-122021-05-20昭和電工マテリアルズ株式会社Input data generation system, input data generation method, and input data generation program
WO2021095725A1 (en)2019-11-112021-05-20昭和電工マテリアルズ株式会社Information processing system, information processing method, and information processing program
WO2021095722A1 (en)2019-11-112021-05-20昭和電工マテリアルズ株式会社Information processing system, information processing method, and information processing program
JPWO2021106706A1 (en)*2019-11-282021-06-03
WO2021166634A1 (en)2020-02-182021-08-26昭和電工マテリアルズ株式会社Information processing system, information processing method, and information processing program
WO2021262792A1 (en)*2020-06-242021-12-30Sri InternationalUnsupervised invertible physics-based vector representation for molecules
JP2022078924A (en)*2020-11-132022-05-25国立大学法人東京工業大学Device, method, program, and system for processing information
WO2022113945A1 (en)2020-11-272022-06-02昭和電工マテリアルズ株式会社Information processing system, information processing method, and information processing program
JP2022531295A (en)*2019-05-022022-07-06ボード オブ リージェンツ,ザ ユニバーシティ オブ テキサス システム Systems and methods for increasing the stability of synthetic proteins
JP2022532009A (en)*2020-04-092022-07-13▲騰▼▲訊▼科技(深▲セン▼)有限公司 Molecular binding site detection methods, devices, electronic devices and computer programs
JP2022137148A (en)*2020-11-132022-09-21アヘッド・バイオコンピューティング株式会社Device, method, program, and system for processing information
WO2022225008A1 (en)2021-04-232022-10-27昭和電工マテリアルズ株式会社Characteristics prediction system, characteristics prediction method, and characteristic prediction program
WO2022225009A1 (en)2021-04-232022-10-27昭和電工マテリアルズ株式会社Property prediction system, property prediction method, and property prediction program
WO2024116360A1 (en)2022-11-302024-06-06Tres Alchemix株式会社Prediction device, prediction method, and prediction program
WO2024262347A1 (en)*2023-06-212024-12-26ソニーグループ株式会社Information processing device, information processing system, and information processing method

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
KR102799856B1 (en)*2023-07-282025-05-02주식회사 아론티어Method for predicting protein-ligand interaction using rotein-ligand interaction prediction model

Citations (3)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP2007011752A (en)*2005-06-302007-01-18Kyoto Univ Data processing apparatus, data processing program, computer-readable recording medium storing the same, and data processing method
CN102930181A (en)*2012-11-072013-02-13四川大学Protein-ligand affinity predicting method based on molecule descriptors
JP2017520868A (en)*2014-05-052017-07-27アトムワイズ,インコーポレイテッド Binding affinity prediction system and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP2007011752A (en)*2005-06-302007-01-18Kyoto Univ Data processing apparatus, data processing program, computer-readable recording medium storing the same, and data processing method
CN102930181A (en)*2012-11-072013-02-13四川大学Protein-ligand affinity predicting method based on molecule descriptors
JP2017520868A (en)*2014-05-052017-07-27アトムワイズ,インコーポレイテッド Binding affinity prediction system and method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KOTA, K ET AL.: "Ligand-binding site prediction of proteins based on known fragment-fragment interactions", BIOINFORMATICS, vol. 26, no. 12, JPN6021032128, 2010, pages 1493 - 1499, ISSN: 0004571845*
笠原 浩太, 外1名: "既知複合体立体構造の知識に基づいたタンパク質-リガンド結合様式予測手法の開発", ケモインフォティクス討論会予稿集, JPN6021032127, 2008, pages 1 - 2, ISSN: 0004571844*

Cited By (41)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JPWO2020203551A1 (en)*2019-03-292020-10-08
WO2020203551A1 (en)*2019-03-292020-10-08富士フイルム株式会社Feature quantity calculating method, feature quantity calculating program and feature quantity calculating device, screening method, screening program and screening device, compound creating method, compound creating program and compound creating device
JP7317104B2 (en)2019-03-292023-07-28富士フイルム株式会社 feature quantity calculation method, feature quantity calculation program, non-temporary recording medium, and feature quantity calculation device, screening method, screening program, non-temporary recording medium, and screening device, compound creation method, compound creation program, recording medium, and Compound creation device
EP3951785A4 (en)*2019-03-292022-06-15FUJIFILM Corporation METHOD, PROGRAM AND APPARATUS FOR CALCULATING FEATURE QUANTITIES, METHOD FOR CALCULATING A FEATURE VALUE, SCREENING METHOD, SCREENING PROGRAM AND SCREENING APPARATUS, METHOD FOR MAKING A CONNECTION, METHOD FOR MAKING A CONNECTION AND DEVICE FOR MAKING A CONNECTION
US12249406B2 (en)2019-03-292025-03-11Fujifilm CorporationFeature quantity calculating method, feature quantity calculating program, and feature quantity calculating device, screening method, screening program, and screening device, compound creating method, compound creating program, and compound creating device
JPWO2020213417A1 (en)*2019-04-162020-10-22
WO2020213417A1 (en)*2019-04-162020-10-22富士フイルム株式会社Feature value calculation method, feature value calculation program, feature value calculation device, screening method, screening program, and compound creation method
JP2022531295A (en)*2019-05-022022-07-06ボード オブ リージェンツ,ザ ユニバーシティ オブ テキサス システム Systems and methods for increasing the stability of synthetic proteins
JP7387760B2 (en)2019-05-022023-11-28ボード オブ リージェンツ,ザ ユニバーシティ オブ テキサス システム Systems and methods for increasing the stability of synthetic proteins
KR20220092899A (en)2019-11-112022-07-04쇼와덴코머티리얼즈가부시끼가이샤 Information processing system, information processing method, and information processing program
CN114730350A (en)*2019-11-112022-07-08昭和电工材料株式会社Information processing system, information processing method, and information processing program
WO2021095722A1 (en)2019-11-112021-05-20昭和電工マテリアルズ株式会社Information processing system, information processing method, and information processing program
WO2021095725A1 (en)2019-11-112021-05-20昭和電工マテリアルズ株式会社Information processing system, information processing method, and information processing program
KR20220092551A (en)2019-11-112022-07-01쇼와덴코머티리얼즈가부시끼가이샤 Information processing system, information processing method, and information processing program
KR20220097922A (en)2019-11-122022-07-08쇼와덴코머티리얼즈가부시끼가이샤 Input data generating system, input data generating method, and input data generating program
WO2021095742A1 (en)2019-11-122021-05-20昭和電工マテリアルズ株式会社Input data generation system, input data generation method, and input data generation program
JPWO2021106706A1 (en)*2019-11-282021-06-03
WO2021166634A1 (en)2020-02-182021-08-26昭和電工マテリアルズ株式会社Information processing system, information processing method, and information processing program
KR20220143050A (en)2020-02-182022-10-24쇼와덴코머티리얼즈가부시끼가이샤 Information processing system, information processing method, and information processing program
JP7246813B2 (en)2020-04-092023-03-28▲騰▼▲訊▼科技(深▲セン▼)有限公司 Molecular binding site detection method, device, electronic device and computer program
JP2022532009A (en)*2020-04-092022-07-13▲騰▼▲訊▼科技(深▲セン▼)有限公司 Molecular binding site detection methods, devices, electronic devices and computer programs
WO2021262792A1 (en)*2020-06-242021-12-30Sri InternationalUnsupervised invertible physics-based vector representation for molecules
JP2023541737A (en)*2020-06-242023-10-04エスアールアイ インターナショナル Unsupervised, reversible physics-based vector representation of molecules
JP2022078924A (en)*2020-11-132022-05-25国立大学法人東京工業大学Device, method, program, and system for processing information
JP7125575B2 (en)2020-11-132022-08-25アヘッド・バイオコンピューティング株式会社 Information processing device, information processing method, information processing program, and information processing system
US12278001B2 (en)2020-11-132025-04-15Ahead Biocomputing, Co. Ltd.Information processing device, information processing method, recording medium recording information processing program, and information processing system
JP7626466B2 (en)2020-11-132025-02-04アヘッド・バイオコンピューティング株式会社 Information processing device, information processing method, information processing program, and information processing system
JP2022137148A (en)*2020-11-132022-09-21アヘッド・バイオコンピューティング株式会社Device, method, program, and system for processing information
WO2022113945A1 (en)2020-11-272022-06-02昭和電工マテリアルズ株式会社Information processing system, information processing method, and information processing program
KR20230110584A (en)2020-11-272023-07-24가부시끼가이샤 레조낙 Information processing system, information processing method, and information processing program
WO2022225008A1 (en)2021-04-232022-10-27昭和電工マテリアルズ株式会社Characteristics prediction system, characteristics prediction method, and characteristic prediction program
KR20230175227A (en)2021-04-232023-12-29가부시끼가이샤 레조낙 Property prediction system, property prediction method, and property prediction program
KR20240000515A (en)2021-04-232024-01-02가부시끼가이샤 레조낙 Property prediction system, property prediction method, and property prediction program
JP2022167397A (en)*2021-04-232022-11-04昭和電工マテリアルズ株式会社Characteristic prediction system, characteristic prediction method and characteristic prediction program
WO2022225009A1 (en)2021-04-232022-10-27昭和電工マテリアルズ株式会社Property prediction system, property prediction method, and property prediction program
JP2022167395A (en)*2021-04-232022-11-04昭和電工マテリアルズ株式会社Characteristic prediction system, characteristic prediction method and characteristic prediction program
JP7707626B2 (en)2021-04-232025-07-15株式会社レゾナック Characteristic prediction system, characteristic prediction method, and characteristic prediction program
JP7732224B2 (en)2021-04-232025-09-02株式会社レゾナック Characteristic prediction system, characteristic prediction method, and characteristic prediction program
WO2024116360A1 (en)2022-11-302024-06-06Tres Alchemix株式会社Prediction device, prediction method, and prediction program
EP4629144A1 (en)2022-11-302025-10-08Tres Alchemix Co., Ltd.Prediction device, prediction method, and prediction program
WO2024262347A1 (en)*2023-06-212024-12-26ソニーグループ株式会社Information processing device, information processing system, and information processing method

Also Published As

Publication numberPublication date
JP7048065B2 (en)2022-04-05

Similar Documents

PublicationPublication DateTitle
JP7048065B2 (en) How to learn connectivity prediction methods, devices, programs, recording media, and machine learning algorithms
US11037345B2 (en)Systems and methods for processing computational workflows
Zahiri et al.Computational prediction of protein–protein interaction networks: algorithms and resources
Wang et al.Reconstruct high-resolution 3D genome structures for diverse cell-types using FLAMINGO
Calvo et al.PITAGORAS-PSP: Including domain knowledge in a multi-objective approach for protein structure prediction
Trinh et al.Minimal trap spaces of logical models are maximal siphons of their Petri net encoding
Caldonazzo Garbelini et al.Sequence motif finder using memetic algorithm
Gil et al.Expressive reusable workflow templates
Thomas et al.Parallel protein folding with STAPL
Dehghani et al.Enhancement of protein β-sheet topology prediction using maximum weight disjoint path cover
Mukherjee et al.AI in Bioinformatics and Genomics
Pareek et al.Revolutionizing Drug Design with Artificial Intelligence: A Comprehensive Review of Techniques, Applications, and Case Studies
Tran et al.A distributed data mining framework accelerated with graphics processing units
Caragea et al.Machine learning in computational biology
González-Álvarez et al.A hybrid MPI/OpenMP parallel implementation of NSGA-II for finding patterns in protein sequences
González-DomínguezFast and accurate multiple sequence alignment with msaprobs-mpi
Pettifer et al.Grid and UTOPIA: an integrated approach to enacting and visualising in silico experiments in the life sciences
Gubała et al.Semantic integration for model-based life science applications
Castillo et al.GITIRBio: a semantic and distributed service oriented-architecture for bioinformatics pipeline
Oliver et al.3D-based RNA function prediction tools in rnaglib
CN115132277B (en) Compound library processing method, device, equipment, storage medium and program product
Yu et al.ezBioNet: A modeling and simulation system for analyzing biological reaction networks
SinghIntroduction to Phylogeny
Swain et al.Modeling gene-regulatory networks using evolutionary algorithms and distributed computing
González-Álvarez et al.Parallelizing and optimizing a hybrid differential evolution with Pareto tournaments for discovering motifs in DNA sequences

Legal Events

DateCodeTitleDescription
A621Written request for application examination

Free format text:JAPANESE INTERMEDIATE CODE: A621

Effective date:20200625

A131Notification of reasons for refusal

Free format text:JAPANESE INTERMEDIATE CODE: A131

Effective date:20210817

A521Request for written amendment filed

Free format text:JAPANESE INTERMEDIATE CODE: A523

Effective date:20211008

TRDDDecision of grant or rejection written
A01Written decision to grant a patent or to grant a registration (utility model)

Free format text:JAPANESE INTERMEDIATE CODE: A01

Effective date:20220215

A61First payment of annual fees (during grant procedure)

Free format text:JAPANESE INTERMEDIATE CODE: A61

Effective date:20220316

R150Certificate of patent or registration of utility model

Ref document number:7048065

Country of ref document:JP

Free format text:JAPANESE INTERMEDIATE CODE: R150

R250Receipt of annual fees

Free format text:JAPANESE INTERMEDIATE CODE: R250


[8]ページ先頭

©2009-2025 Movatter.jp