














本発明は、情報システムに発生したトラブルの原因を突き止めて解決するトラブルシュート支援技術に関する。The present invention relates to a troubleshooting support technique for ascertaining and solving the cause of a trouble occurring in an information system.
情報システムのトラブルシュートにおいては、特開平6-222963号公報(特許文献1)及び特開平2-91739号公報(特許文献2)に記載されるように、エージェントなどにより収集されたリソース性能情報をグラフ形式や表形式で提示する支援技術が提案されている。そして、システム管理者は、表示されたリソースの振る舞いから、トラブルの原因となっている箇所を究明する。このとき、システム管理者は、自らの経験及び勘に頼って、トラブル原因究明の起点となるリソースに関連するリソースの性能情報を順次辿りつつ参照し、トラブルと関連がある振る舞いがあるか否かを1つずつ確認する必要がある。
しかしながら、情報システムが大規模になると、相互に関連するリソースの数も膨大となるため、システム管理者の経験及び勘に頼るトラブルシュートでは、トラブルに関連するリソースを特定する作業に多大な工数がかかってしまう。また、システム管理者が、特定のリソースに関連するリソースがどれであるか把握していないと、的確なトラブルシュートを行うことができない。さらに、システム管理者の経験及び勘に頼るトラブルシュートであるため、経験が不足するシステム管理者では、簡単にトラブルの原因究明及びその解決を図ることができない。However, since the number of resources related to each other becomes enormous when the information system becomes large, troubleshooting that relies on the experience and intuition of the system administrator takes a great deal of work to identify the resources related to the trouble. It will take. Moreover, unless the system administrator knows which resources are related to a specific resource, accurate troubleshooting cannot be performed. Furthermore, since the troubleshooting depends on the experience and intuition of the system administrator, the system administrator who has insufficient experience cannot easily investigate the cause of the trouble and solve it.
そこで、本発明は従来の問題点に鑑み、トラブル原因究明の起点となるリソース情報に関連する各リソース情報について、起点リソース情報に対する関連度を考慮して性能情報を提示することで、トラブルシュートを容易ならしめることを目的とする。Therefore, in view of the conventional problems, the present invention presents performance information for each resource information related to the resource information that is the starting point for investigating the cause of the trouble, taking into consideration the degree of relevance to the starting resource information, thereby troubleshooting. The purpose is to make it easy.
このトラブルシュート支援技術では、相互に関連するリソース情報が定義された関連情報データベースと、情報システムを構築する各機器において定期的に収集された性能情報が格納された性能情報データベースと、が備えられる。ここで、リソース情報は、少なくとも、リソース名及びその詳細情報名を含んで構成される。また、性能情報は、少なくとも、収集日時,リソース名及びその詳細情報名並びに性能値を含んで構成される。そして、トラブル原因究明の起点となるリソース名及びその詳細情報名並びに日時を付属情報とした起動指示があると、関連情報データベースを参照し、付属情報のリソース名及びその詳細情報名により特定されるリソース情報及びこれに関係するリソース情報を抽出する。リソース情報が抽出されると、性能情報データベースを参照し、付属情報の日時を起点とした所定期間の範囲内で、各リソース情報に関する性能情報を取得し、その性能値の平均値及び標準偏差を算出する。その後、各リソース情報に関する性能情報について、付属情報の日時における性能値と平均値及び標準偏差との関係から、付属情報のリソース名及びその詳細情報名により特定されるリソース情報との関連影響度を判定し、関連影響度が同一の性能情報ごとにサムネイルを提示する。This troubleshooting support technology includes a related information database in which resource information related to each other is defined, and a performance information database in which performance information periodically collected in each device constituting the information system is stored. . Here, the resource information includes at least a resource name and its detailed information name. The performance information includes at least a collection date and time, a resource name and its detailed information name, and a performance value. Then, when there is a start instruction with the resource name and its detailed information name and date and time as the attached information as the starting point for investigating the cause of the trouble, it is identified by referring to the related information database and by the resource name and the detailed information name of the attached information Resource information and related resource information are extracted. Once the resource information is extracted, the performance information database is referred to, and the performance information related to each resource information is acquired within a predetermined period starting from the date and time of the attached information, and the average value and standard deviation of the performance values are obtained. calculate. After that, for the performance information related to each resource information, the relationship between the resource value of the attached information and the resource information specified by the detailed information name is calculated from the relationship between the performance value at the date and time of the attached information and the average value and standard deviation Determine and present a thumbnail for each piece of performance information with the same degree of related influence.
このトラブルシュート支援技術によれば、システム管理者は、自らの経験及び勘に頼らなくとも、提示されたサムネイルからトラブル原因となっている可能性が高いリソースを特定することができる。また、付属情報により特定されるリソース情報に関連するリソース情報は、関連情報データベースを参照して自動的に抽出されるため、システム管理者が特定のリソースに関連するリソースがどれであるか把握する必要がなく、的確なトラブルシュートを行うことができる。さらに、リソース評価結果がサムネイルとして提示されるため、経験が不足するシステム管理者であっても、簡単にトラブル原因究明及びその解決を図ることができる。よって、トラブルシュートに関するシステム管理者の負荷を軽減できると共に、システム管理者によらないトラブルシュートを行うことができる。According to this troubleshooting support technology, the system administrator can specify a resource that is likely to cause a trouble from the presented thumbnail without relying on his own experience and intuition. In addition, resource information related to the resource information specified by the attached information is automatically extracted with reference to the related information database, so the system administrator knows which resource is related to the specific resource. There is no need, and accurate troubleshooting can be performed. Furthermore, since the resource evaluation result is presented as a thumbnail, even a system administrator who lacks experience can easily investigate the cause of the trouble and solve it. Therefore, it is possible to reduce the load on the system administrator related to troubleshooting, and to perform troubleshooting not depending on the system administrator.
10 トラブルシュート支援装置
10A 性能情報収集部
10B リソース情報抽出部
10C リソース評価部
10D 評価結果提示部
10E 一覧リスト
10F 評価リスト
12 リソース関連情報データベース
14 リソース構成情報データベース
16 性能情報データベース
18 一時保存データベース
20 サーバ
22 エージェント
30 管理コンソールDESCRIPTION OF
以下、添付された図面を参照して本発明を詳述する。
図1は、本発明を具現化したトラブルシュート支援装置の一実施形態を示す。
トラブルシュート支援装置10は、コンピュータからなる管理サーバにより構築され、インターネット,LAN(Local Area Network),WAN(Wide Area Network)などのネットワークを介して、情報システムを構築する各機器に接続される。各機器としては、例えば、OS(Operating System),ミドルウエア及びDBMS(DataBase Management System)などを備えたサーバ20を適用することができる。また、トラブルシュート支援装置10は、ネットワークを介して、情報システムに発生したトラブルの原因究明を行う管理コンソール30と接続される。Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.
FIG. 1 shows an embodiment of a troubleshooting support apparatus embodying the present invention.
The
各サーバ20には、サーバ名,リソース名及びその詳細情報名,性能値からなる性能情報を定期的に収集し、ネットワークを介して、トラブルシュート支援装置10へと送信するエージェント22が組み込まれる。ここで、性能値としては、例えば、サーバ20のCPU(Central Processing Unit),メモリ,ディスクの使用状況、サーバ20の上で動作するプロセスの稼動状況などを適用することができる。Each
トラブルシュート支援装置10には、リソース関連情報DB(データベース)12,リソース構成情報DB14,性能情報DB16及び一時保存DB18が備えられる。リソース関連情報DB12は、少なくともリソース名及びその詳細情報名からなるリソース情報について、相互に関連するリソース情報が定義されるものである。具体的には、リソース関連情報DB12には、図2に示すように、サーバが属するグループ名,サーバ名,リソース名及びその詳細情報名からなるリソース情報と、これに関連するリソース情報(以下「関連リソース情報」という)と、が関連付けられて格納される。リソース構成情報DB14は、管理対象たるリソースの構成が定義されるものであって、図3に示すように、リソース情報と、評価対象たる性能情報がトラブル原因となっている可能性を数値で表現する関連度ポイントと、が関連付けられて格納される。性能情報DB16は、サーバに組み込まれたエージェントから送信された性能情報を保存するものであって、図4に示すように、性能情報の収集日時と、性能情報と、が関連付けられて順次格納される。一時保存DB18は、応答速度を向上させるために設けられ、図5に示すように、性能情報の収集開始日時及び収集終了日時,サーバ名,リソース名及びその詳細情報名,評価結果を示す関連影響度並びに関連度ポイントが関連付けられて格納される。また、一時保存DB18には、エージェントから送信された性能情報として、その収集日時,サーバ名,リソース名及びその詳細情報名並びに性能値が関連付けられて格納される。The
トラブルシュート支援装置10は、インストールされたトラブルシュート支援プログラムを実行することで、性能情報収集部10A,リソース情報抽出部10B,リソース評価部10C及び評価結果提示部10Dを夫々具現化する。性能情報収集部10Aは、エージェント22からの性能情報を受信したときに、その収集日時と性能情報とを関連付けて性能情報DB16に順次格納する。リソース情報抽出部10Bは、管理コンソール30から起動指示があったときに、リソース関連情報DB12及びリソース構成情報DB14を参照し、トラブル原因究明の起点となるリソース情報及びこれに関連するリソース情報を抽出した一覧リスト10Eを作成する。リソース評価部10Cは、性能情報DB16を参照し、一覧リスト10Eに登録された各リソース情報に関する性能情報を取得して、評価リスト10Fを作成する。また、リソース評価部10Cは、評価リスト10Fを用いて、各リソース情報について、トラブル原因究明の起点となるリソース情報との関連性を評価し、その評価結果を一時保存DB18に格納する。評価結果提示部10Dは、一時保存DB18を参照し、管理コンソール30に対してリソース情報の評価結果を提示する。The
なお、リソース情報抽出部10Bにより、リソース情報を抽出するステップ並びにリソース情報抽出手段が具現化される。また、リソース評価部10Cにより、性能情報を取得するステップ,平均値及び標準偏差を算出するステップ,関連影響度を判定するステップ,関連度ポイントを更新するステップ,関連影響度が最大の性能情報のリソース情報を追加するステップ,一時保存データベースに格納するステップ,性能情報取得手段,統計手段並びに影響度判定手段が具現化される。さらに、評価結果提示部10Dにより、サムネイルを提示するステップ,サムネイルに関する性能情報のグラフなどを提示するステップ並びにサムネイル提示手段が具現化される。Note that the resource
図6は、性能情報収集部10Aにおいて、エージェント22からの性能情報を受信したことを契機として実行される性能情報収集処理を示す。
ステップ1(図では「S1」と略記する。以下同様)では、性能情報の収集日時と性能情報を関連付けて性能情報DB16に順次格納する。
図7及び図8は、リソース情報抽出部10Bにおいて、管理コンソール30から、トラブル原因究明の起点となるリソース名及びその詳細情報名並びに日時を付属情報とした起動指示があったことを契機として実行されるリソース情報抽出処理を示す。なお、付属情報には、後述する「拡張抽出モードI」及び「拡張抽出モードII」を選択しているか否かを示すフラグなどが含まれる。FIG. 6 shows a performance information collection process executed when the performance
In step 1 (abbreviated as “S1” in the figure, the same applies hereinafter), the performance information collection date and performance information are associated with each other and stored in the
7 and 8 are executed when the resource
ステップ11では、起動指示に係る付属情報が変更されたか否か、即ち、前回の起動指示に係る付属情報のリソース名及びその詳細情報名並びに日時の少なくとも1つが変更されたか否かを判定する。そして、付属情報が変更されていればステップ12へと進む(Yes)。一方、付属情報が変更されていなければステップ26へと進み(No)、評価結果提示部10Dに対して提示を指示する。In step 11, it is determined whether or not the attached information related to the start instruction has been changed, that is, whether or not at least one of the resource name, the detailed information name, and the date / time of the attached information related to the previous start instruction has been changed. If the attached information has been changed, the process proceeds to step 12 (Yes). On the other hand, if the attached information has not been changed, the process proceeds to Step 26 (No), and the presentation is instructed to the evaluation
ステップ12では、リソース関連情報DB12を参照し、付属情報のリソース名及びその詳細情報名により特定されるリソース情報をすべて取得する。
ステップ13では、図9に示すように、ステップ12で取得した各リソース情報のうち、サーバ名,リソース名及びその詳細情報名を関連付けて一覧リスト10Eに順次格納する。なお、一覧リスト10Eには、サーバ名,リソース名及びその詳細情報が同一のデータを重複して格納しないようにする(以下同様)。In
In step 13, as shown in FIG. 9, among the resource information acquired in
ステップ14では、リソース関連情報DB12を参照し、一覧リスト10Eに格納されたサーバ名,リソース名及びその詳細情報名により特定されるリソース情報と関連する関連リソース情報を取得する。なお、関連リソース情報は、第1回目の処理では1番目のリソース情報に関連するもの、第2回目の処理では2番目のリソース情報に関連するものというように順次取得される。In
ステップ15では、ステップ14で取得した各関連リソース情報のうち、サーバ名,リソース名及びその詳細情報名を関連付けて一覧リスト10Eに順次格納する。
ステップ16では、一覧リスト10Eに格納されたすべてのリソース情報を処理したか否かを判定する。そして、すべてのリソース情報を処理したならばステップ17へと進む一方(Yes)、すべてのリソース情報を処理していなければステップ14へと戻る(No)。In step 15, among the related resource information acquired in
In
ステップ17では、付属情報のリソース名により特定されるリソースがあるサーバのすべてのリソースを抽出対象とする「拡張抽出モードI」が選択されているか否かを判定する。そして、「拡張抽出モードI」が選択されていればステップ18へと進む一方(Yes)、「拡張選択モードI」が選択されていなければステップ21へと進む(No)。
ステップ18では、リソース構成情報DB14を参照し、付属情報のリソース名により特定されるリソースがあるサーバ名を取得する。In step 17, it is determined whether or not “extended extraction mode I” for extracting all resources of the server having the resource specified by the resource name of the attached information is selected. If “extended extraction mode I” is selected, the process proceeds to step 18 (Yes), while if “extended selection mode I” is not selected, the process proceeds to step 21 (No).
In
ステップ19では、リソース関連情報DB12を参照し、ステップ18で取得したサーバ名により特定されるサーバに関するリソース情報をすべて取得する。
ステップ20では、ステップ19で取得した各リソース情報のうち、サーバ名,リソース名及びその詳細情報名を関連付けて一覧リスト10Eに順次格納する。
ステップ21では、付属情報のリソース名により特定されるリソースがあるサーバのグループに属する他のサーバのすべてのリソースを抽出対象とする「拡張抽出モードII」が選択されているか否かを判定する。そして、「拡張抽出モードII」が選択されていればステップ22へと進む一方(Yes)、「拡張抽出モードII」が選択されていなければステップ25へと進む(No)。In step 19, the resource related
In
In step 21, it is determined whether or not “extended extraction mode II” in which all resources of other servers belonging to the group of servers with the resource specified by the resource name of the attached information are selected is selected. If “extended extraction mode II” is selected, the process proceeds to step 22 (Yes), while if “extended extraction mode II” is not selected, the process proceeds to step 25 (No).
ステップ22では、リソース構成情報DB14を参照し、付属情報のリソース名により特定されるリソースがあるサーバのグループ名を取得する。
ステップ23では、リソース関連情報DB12を参照し、ステップ22で取得したグループ名により特定されるグループに属する他のサーバのリソース情報をすべて取得する。
ステップ24では、ステップ23で取得した各リソース情報のうち、サーバ名,リソース名及びその詳細情報名を関連付けて一覧リスト10Eに順次格納する。In
In step 23, the resource related
In step 24, among the resource information acquired in step 23, the server name, the resource name, and the detailed information name thereof are associated with each other and sequentially stored in the
ステップ25では、一覧リスト10E及び付属情報の日時をリソース評価部10Cに引き渡す。
図10及び図11は、リソース評価部10Cにおいて、リソース情報抽出部10Bから一覧リスト10E及び付属情報の日時が引き渡されたことを契機として実行されるリソース評価処理を示す。In step 25, the
FIGS. 10 and 11 show resource evaluation processing that is executed in the
ステップ31では、一覧リスト10Eから、関連付けられたサーバ名,リソース名及びその詳細情報名を順次取り出す。なお、サーバ名,リソース名及びその詳細情報名は、第1回目の処理では1番目のもの、第2回目の処理では2番目のものというように順次取得される。
ステップ32では、性能情報DB16を参照し、付属情報の日時から24時間(所定時間)の範囲内で、ステップ31で取得されたサーバ名,リソース名及びその詳細情報名により特定されるリソース情報に関する性能情報をすべて取得する。In step 31, the associated server name, resource name, and detailed information name are sequentially extracted from the
In step 32, the
ステップ33では、図12に示すように、ステップ32で取得した各性能情報の性能値について、収集開始日時と収集終了日時とを関連付けて評価リスト10Fに順次格納する。
ステップ34では、付属情報の日時を起点とした異なる時間間隔、例えば、1時間,12時間及び24時間の各時間間隔で、評価リスト10Fに格納された性能値の平均値μ及び標準偏差σを夫々算出する。In step 33, as shown in FIG. 12, the performance value of each piece of performance information acquired in step 32 is sequentially stored in the
In step 34, the average value μ and the standard deviation σ of the performance values stored in the
ステップ35では、評価リスト10Fを参照し、付属情報の日時における性能値f(t)を取得する。
ステップ36では、ステップ32で取得した各性能情報について、f(t)がμ±σの範囲内にあるか否か、即ち、μ-σ≦f(t)≦μ+σであるか否かを判定する。そして、f(t)がμ±σの範囲内にあればステップ37へと進み(Yes)、関連影響度がC(弱)であると判定した後、ステップ42へと進む。ここで、「関連影響度」とは、評価対象たる性能情報がトラブル原因となっている可能性を示す指標であって、本実施形態では、「A(強)」,「B(中)」及び「C(弱)」の3段階で表現される。なお、関連影響度としては、A~Cの3段階に限らず、公知の統計手法を適用して4段階以上で表現するようにしてもよい。一方、f(t)がμ±σの範囲内になければステップ38へと進む(No)。In step 35, the performance value f (t) at the date and time of the attached information is acquired by referring to the
In step 36, for each piece of performance information acquired in step 32, it is determined whether f (t) is within the range of μ ± σ, that is, whether μ−σ ≦ f (t) ≦ μ + σ. To do. If f (t) is within the range of μ ± σ, the process proceeds to step 37 (Yes), and after determining that the related influence is C (weak), the process proceeds to step 42. Here, the “relevant influence degree” is an index indicating the possibility that the performance information to be evaluated causes a trouble. In this embodiment, “A (strong)”, “B (medium)”. And “C (weak)”. The related influence level is not limited to three levels A to C, and may be expressed in four or more levels by applying a known statistical method. On the other hand, if f (t) is not in the range of μ ± σ, the process proceeds to step 38 (No).
ステップ38では、ステップ32で取得した各性能情報について、f(t)がμ±2σの範囲内にあるか否か、即ち、μ-2σ≦f(t)≦μ+2σであるか否かを判定する。そして、f(t)がμ±2σの範囲内にあればステップ39へと進み(Yes)、関連影響度がB(中)であると判定した後、ステップ42へと進む。一方、f(t)がμ±2σの範囲内になければステップ40へと進み(No)、関連影響度がA(強)であると判定した後、ステップ41へと進む。In step 38, for each piece of performance information acquired in step 32, it is determined whether f (t) is within the range of μ ± 2σ, that is, whether μ−2σ ≦ f (t) ≦ μ + 2σ. To do. If f (t) is within the range of μ ± 2σ, the process proceeds to step 39 (Yes), and after determining that the related influence is B (medium), the process proceeds to step 42. On the other hand, if f (t) is not within the range of μ ± 2σ, the process proceeds to step 40 (No), and after determining that the related influence is A (strong), the process proceeds to step 41.
ステップ41では、リソース関連情報DB12に、トラブル原因究明の起点となるリソース情報と関連影響度Aのリソース情報とを関連付けたリソース関連定義を追加する。
ステップ42では、各時間間隔で評価された性能情報のうち、関連影響度が最大のもの、即ち、関連影響度がA>B>Cの順番で最も高いものを採択する。
ステップ43では、ステップ42で採択された性能情報の関連影響度に基づいて、リソース構成情報DB14の関連度ポイントを適宜更新する。即ち、関連影響度がA~Cに応じて、夫々、関連度ポイントを+1,±0,-1する。In step 41, a resource relation definition that associates the resource information that becomes the starting point for investigating the cause of the trouble and the resource information of the relation influence degree A is added to the resource
In step 42, the performance information evaluated at each time interval is selected with the highest degree of related influence, that is, the highest degree of related influence in the order of A>B> C.
In step 43, the relevance point of the resource
ステップ44では、性能情報の収集開始日時,収集終了日時,サーバ名,リソース名及びその詳細情報名,関連影響度,関連度ポイント並びに性能値を関連付けて一時保存DB18に格納する。
ステップ45では、評価リスト10Fをクリアする。
ステップ46では、一覧リスト10Eの最後まで処理したか否かを判定する。そして、一覧リスト10Eの最後まで処理したならばステップ47へと進む一方(Yes)、一覧リスト10Eの最後まで処理していなければステップ31へと戻る(No)。In step 44, the performance information collection start date / time, collection end date / time, server name, resource name and its detailed information name, related influence degree, relevance point, and performance value are associated and stored in the
In step 45, the
In step 46, it is determined whether or not processing has been completed up to the end of the
ステップ47では、評価結果提示部10Dに対して提示を指示する。
図13は、評価結果提示部10Dにおいて、リソース情報抽出部10B又はリソース評価部10Cから提示指示があったことを契機として実行される評価結果提示処理を示す。
ステップ51では、一時保存DB18から関連影響度Aの性能情報をすべて読み込み、各性能情報について、その詳細を示すグラフ及び概要を示すサムネイルを夫々作成する。In step 47, the evaluation
FIG. 13 shows an evaluation result presentation process executed in response to a presentation instruction from the resource
In step 51, all the performance information of the related influence degree A is read from the
ステップ52では、ステップ51で作成したサムネイルについて、その性能情報の関連度ポイントが大きいものから小さいものへ降順に並べ替える。
ステップ53では、図14に示すように、関連影響度Aのサムネイル一覧,トラブル原因究明の起点となるリソース名及びその詳細情報名並びに収集開始日時及び収集終了日時を表示するための評価結果提示画面を作成する。なお、評価結果提示画面には、サムネイル一覧を横方向にスクロールするためのボタン,任意の関連影響度のサムネイル一覧を表示させるための評価タブが含まれる。In step 52, the thumbnails created in step 51 are rearranged in descending order from the largest relevance point of the performance information to the smallest.
In step 53, as shown in FIG. 14, an evaluation result presenting screen for displaying a list of thumbnails of the related influence degree A, a resource name as a starting point for investigating the cause of the trouble, a detailed information name thereof, a collection start date and time, and a collection end date and time. Create Note that the evaluation result presentation screen includes a button for scrolling the thumbnail list in the horizontal direction and an evaluation tab for displaying a thumbnail list of any relevant influence degree.
ステップ54では、管理コンソール30に評価結果提示画面を転送する。
ステップ55では、管理コンソール30において、評価結果提示終了指示がなされたか否かを判定する。そして、評価結果提示終了指示がなされたならばトラブルシュート処理を終了する一方(Yes)、評価結果提示終了指示がなされていなければステップ56へと進む(No)。In step 54, the evaluation result presentation screen is transferred to the
In step 55, the
ステップ56では、管理コンソール30において、評価タブの切替操作がなされたか否かを判定する。そして、評価タブの切替操作がなされたならばステップ57へと進む一方(Yes)、評価タブの切替操作がなされていなければステップ58へと進む(No)。
ステップ57では、一時保存DB18から評価タブに応じた関連影響度の性能情報をすべて読み込み、各性能情報について、その詳細を示すグラフ及び概要を示すサムネイルを夫々作成する。その後、ステップ52へと戻る。In step 56, the
In step 57, all the performance information of the related influence degree according to the evaluation tab is read from the
ステップ58では、例えば、ダブルクリックなどの操作を介して、サムネイル一覧からサムネイルが選択されたか否かを判定する。そして、サムネイルが選択されたならばステップ59へと進む一方(Yes)、サムネイルが選択されていなければステップ55へと戻る(No)。
ステップ59では、図15に示すように、ステップ58で選択されたサムネイルに関する性能情報のグラフを提示するための詳細情報提示画面を作成する。なお、詳細情報提示画面には、リソースの従属関係を階層形式で表わすツリー型ディレクトリ構造,グラフに関する性能情報のリソース名及びその詳細情報名並びに表示期間,これをトラブル原因究明の起点としてトラブルシュートをさらに続行するための日時指定,トラブルシュートボタン並びに拡張抽出モード指定ボックスが含まれる。In step 58, for example, it is determined whether or not a thumbnail has been selected from the thumbnail list through an operation such as double-clicking. If a thumbnail has been selected, the process proceeds to step 59 (Yes), while if a thumbnail has not been selected, the process returns to step 55 (No).
In step 59, as shown in FIG. 15, a detailed information presentation screen for presenting a graph of performance information related to the thumbnail selected in step 58 is created. On the detailed information presentation screen, a tree-type directory structure that shows the resource dependency in a hierarchical format, the resource name of the performance information related to the graph, its detailed information name and display period, and troubleshooting using this as the starting point for investigating the cause of the trouble It also includes a date and time specification for continuing, a troubleshooting button, and an extended extraction mode specification box.
ステップ60では、管理コンソール30に詳細情報提示画面を転送する。そして、管理コンソール30において、日時及び拡張抽出モードを指定してトラブルシュートボタンが押されると、リソース名及びその詳細情報名,日時並びに拡張抽出モードフラグを付属情報とした起動指示がトラブルシュート支援装置に送信される。これにより、トラブル原因を絞り込むことができる。In step 60, the detailed information presentation screen is transferred to the
このトラブルシュート支援装置10によれば、サーバ20に組み込まれたエージェント22からの性能情報を受信すると、その収集日時と性能情報とを関連付けて性能情報DB16に順次格納される。このため、性能情報DB16には、定期的に収集されたサーバ20の性能情報が時系列で蓄積されることとなる。
一方、管理コンソール30から、トラブル原因究明の起点となるリソース名及びその詳細情報名並びに日時を付属情報とした起動指示があると、リソース関連情報DB12から付属情報により特定されるリソース情報及びこれに関連する関連リソース情報が抽出される。即ち、相互に関連するリソース情報をリソース関連情報DB12に定義しておけば、トラブル原因究明の起点を指示するだけで、その起点におけるリソース情報及び関連リソース情報が自動的に抽出される。このとき、抽出対象を拡大させる「拡張抽出モードI」,「拡張抽出モードII」が選択されていると、付属情報のリソース名により特定されるリソースがあるサーバ20に関するリソース情報及びそのサーバ20が属するグループの他のサーバ20におけるリソース情報も夫々抽出される。このため、時間をかけてもトラブル原因究明精度を向上させることを目的とし、広範囲のリソース情報に対してトラブルシュート作業を要望するシステム管理者にも対応することができる。According to the
On the other hand, if there is an activation instruction from the
そして、抽出された各リソース情報について、付属情報の日時を起点とした24時間の範囲内で、性能情報DB16から性能情報が取得され、その性能値の平均値μ及び標準偏差σが算出される。その後、各リソース情報について、付属情報の日時における性能情報の性能値f(t)と平均値μ及びσとの関係から、トラブル原因究明の起点となるリソース情報との関連影響度が判定され、その関連影響度が同一の性能情報ごとに、その概要を示すサムネイル一覧が提示される。ここで、サムネイルは、異なる時間間隔で算出された平均値μ及び標準偏差σを用いて判定された各影響関連度のうち、関連影響度が最大のものに基づいて採択された性能情報から作成されるので、トラブル原因となっている可能性が高いもののみを提示することができる。Then, for each extracted resource information, the performance information is acquired from the
従って、システム管理者は、自らの経験及び勘に頼らなくとも、管理コンソール30に表示されたサムネイル一覧から、トラブル原因となっている可能性が高いリソースを特定することができる。また、付属情報により特定されるリソース情報に関連する関連リソース情報は、リソース関連情報DB12を参照して自動的に抽出されるため、システム管理者が特定のリソースに関連するリソースがどれであるか把握する必要がなく、的確なトラブルシュートを行うことができる。さらに、リソース評価結果がサムネイル一覧として提示されるため、経験が不足するシステム管理者であっても、簡単にトラブル原因究明及びその解決を図ることができる。よって、トラブルシュートに関するシステム管理者の負担を軽減できると共に、システム管理者によらないトラブルシュートを行うことができる。Therefore, the system administrator can identify a resource that is likely to cause a trouble from the thumbnail list displayed on the
サムネイル一覧では、関連影響度に応じて更新されるポイントが大きいものから小さいものへ降順に並べ替えられたサムネイルが提示されるので、トラブル原因となっている可能性が高いリソースに対する着目度を向上させることができる。また、サムネイル一覧では、関連影響度が最大のリソースに関するサムネイルが初期提示され、操作者の指示に応じた関連影響度のものが切替提示されるため、トラブル原因となっている可能性が高いリソースから評価することができる。さらに、サムネイル一覧においてサムネイルを選択すると、性能情報のグラフ,リソース名及びその詳細情報名並びに収集期間が提示されるので、リソースの詳細な評価を行うことができる。In the thumbnail list, thumbnails that are sorted in descending order from large to small are displayed according to the degree of related influence, so the degree of attention to resources that are likely to cause trouble is improved. Can be made. In addition, in the thumbnail list, thumbnails related to resources with the highest degree of related influence are initially presented, and those with the related influence degree according to the operator's instructions are switched and presented, so resources that are likely to cause trouble Can be evaluated from. Further, when a thumbnail is selected in the thumbnail list, a performance information graph, a resource name and its detailed information name, and a collection period are presented, so that a detailed evaluation of the resource can be performed.
関連影響度が最大の性能情報のリソース情報は、付属情報と関連付けてリソース関連情報DB12に追加されるため、情報システムの構成変更,リソース追加などがあったときにも、次回以降のトラブルシュートにおいてこれを評価対象とすることができる。
さらに、評価結果提示画面及び詳細情報提示画面は、一時保存DB18に蓄積されるデータに基づいて作成されるため、例えば、提示対象が変更されても、短時間でその提示を行うことができる。Since the resource information of the performance information with the maximum degree of related influence is added to the resource related
Furthermore, since the evaluation result presentation screen and the detailed information presentation screen are created based on the data stored in the
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2008/063264WO2010010621A1 (en) | 2008-07-24 | 2008-07-24 | Troubleshooting support program, troubleshooting support method, and troubleshooting support device |
| JP2010521564AJP5267564B2 (en) | 2008-07-24 | 2008-07-24 | Output program, output method, output device, troubleshooting support program, troubleshooting support method, and troubleshooting support device |
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2008/063264WO2010010621A1 (en) | 2008-07-24 | 2008-07-24 | Troubleshooting support program, troubleshooting support method, and troubleshooting support device |
| Publication Number | Publication Date |
|---|---|
| WO2010010621A1true WO2010010621A1 (en) | 2010-01-28 |
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/JP2008/063264CeasedWO2010010621A1 (en) | 2008-07-24 | 2008-07-24 | Troubleshooting support program, troubleshooting support method, and troubleshooting support device |
| Country | Link |
|---|---|
| JP (1) | JP5267564B2 (en) |
| WO (1) | WO2010010621A1 (en) |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2018131147A1 (en)* | 2017-01-13 | 2018-07-19 | 株式会社日立製作所 | Management system, management device, and management method |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004362144A (en)* | 2003-06-03 | 2004-12-24 | Hitachi Ltd | Operation management method, execution device, and processing program |
| JP2005141663A (en)* | 2003-11-10 | 2005-06-02 | Hitachi Ltd | Event log analysis support device, event log display method |
| JP2006011902A (en)* | 2004-06-28 | 2006-01-12 | Hitachi Ltd | Operation management support system and performance information display method |
| JP2006127274A (en)* | 2004-10-29 | 2006-05-18 | Fujitsu Ltd | SYSTEM MANAGEMENT INFORMATION DISPLAY PROGRAM, SYSTEM MANAGEMENT INFORMATION DISPLAY DEVICE, SYSTEM MANAGEMENT INFORMATION DISPLAY METHOD, AND OPERATION MANAGEMENT SYSTEM |
| JP2006146668A (en)* | 2004-11-22 | 2006-06-08 | Ntt Data Corp | Operation management support apparatus and operation management support program |
| JP2007520806A (en)* | 2004-01-08 | 2007-07-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Method, system, data processing system and computer program for monitoring system performance and communicating detailed system performance data via an advanced graphical user interface (method for multidimensional visual correlation of system management data ) |
| JP2008065668A (en)* | 2006-09-08 | 2008-03-21 | Internatl Business Mach Corp <Ibm> | Technology for supporting detection of fault generation causing place |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3818901B2 (en)* | 2000-12-21 | 2006-09-06 | 富士通株式会社 | Recording medium, network monitoring apparatus, and program |
| JP2003208413A (en)* | 2002-01-17 | 2003-07-25 | Fujitsu Ltd | Computer system for centrally managing asset information |
| JP2004355061A (en)* | 2003-05-27 | 2004-12-16 | Hitachi Ltd | Analysis system |
| JP4516306B2 (en)* | 2003-11-28 | 2010-08-04 | 株式会社日立製作所 | How to collect storage network performance information |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004362144A (en)* | 2003-06-03 | 2004-12-24 | Hitachi Ltd | Operation management method, execution device, and processing program |
| JP2005141663A (en)* | 2003-11-10 | 2005-06-02 | Hitachi Ltd | Event log analysis support device, event log display method |
| JP2007520806A (en)* | 2004-01-08 | 2007-07-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Method, system, data processing system and computer program for monitoring system performance and communicating detailed system performance data via an advanced graphical user interface (method for multidimensional visual correlation of system management data ) |
| JP2006011902A (en)* | 2004-06-28 | 2006-01-12 | Hitachi Ltd | Operation management support system and performance information display method |
| JP2006127274A (en)* | 2004-10-29 | 2006-05-18 | Fujitsu Ltd | SYSTEM MANAGEMENT INFORMATION DISPLAY PROGRAM, SYSTEM MANAGEMENT INFORMATION DISPLAY DEVICE, SYSTEM MANAGEMENT INFORMATION DISPLAY METHOD, AND OPERATION MANAGEMENT SYSTEM |
| JP2006146668A (en)* | 2004-11-22 | 2006-06-08 | Ntt Data Corp | Operation management support apparatus and operation management support program |
| JP2008065668A (en)* | 2006-09-08 | 2008-03-21 | Internatl Business Mach Corp <Ibm> | Technology for supporting detection of fault generation causing place |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2018131147A1 (en)* | 2017-01-13 | 2018-07-19 | 株式会社日立製作所 | Management system, management device, and management method |
| JPWO2018131147A1 (en)* | 2017-01-13 | 2019-02-28 | 株式会社日立製作所 | Management system, management apparatus, and management method |
| Publication number | Publication date |
|---|---|
| JPWO2010010621A1 (en) | 2012-01-05 |
| JP5267564B2 (en) | 2013-08-21 |
| Publication | Publication Date | Title |
|---|---|---|
| US11144528B2 (en) | Event time selection output techniques | |
| EP3165982B1 (en) | An event analysis apparatus, an event analysis method, and an event analysis program | |
| CN112380473B (en) | Data acquisition and synchronization method, device, equipment and storage medium | |
| US11477263B2 (en) | Identifying un-deployed features of an application | |
| US8140919B2 (en) | Display of data used for system performance analysis | |
| CN108369550B (en) | Real-time alteration of data from different sources | |
| US10216862B1 (en) | Predictive estimation for ingestion, performance and utilization in a data indexing and query system | |
| CN108600779B (en) | A method and device for operating a target object based on video content | |
| JP4928848B2 (en) | Message converter in computer system integrated management environment. | |
| JP2010061178A (en) | Information processor, information retrieval system, information processing method, and program | |
| JP5711677B2 (en) | Monitoring information analyzing apparatus and method | |
| JP2009217455A (en) | Information processor, information processing program, and method | |
| JP5267564B2 (en) | Output program, output method, output device, troubleshooting support program, troubleshooting support method, and troubleshooting support device | |
| JP2016115024A (en) | Facility management assistance device and program | |
| US8239782B2 (en) | Data processing system and method of data entry | |
| WO2019167340A1 (en) | Report generating system and program | |
| JP5528388B2 (en) | Information recommendation apparatus, method and program | |
| CN116955065A (en) | Buried point identification generation method, electronic device, and computer-readable storage medium | |
| JP5076290B2 (en) | Operation management rule diversion device, operation management rule diversion method, and program | |
| JP2008305289A (en) | How to find applications | |
| CN111767693A (en) | Information processing apparatus, information processing method, and computer-readable recording medium | |
| JP4420804B2 (en) | Log income management system, method, and program | |
| JP2010211750A (en) | System and method for managing environment information | |
| JP2006185185A (en) | Experience score management system and method, program | |
| CN119248263A (en) | Page processing method and device, electronic device and storage medium |
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application | Ref document number:08791516 Country of ref document:EP Kind code of ref document:A1 | |
| WWE | Wipo information: entry into national phase | Ref document number:2010521564 Country of ref document:JP | |
| NENP | Non-entry into the national phase | Ref country code:DE | |
| 122 | Ep: pct application non-entry in european phase | Ref document number:08791516 Country of ref document:EP Kind code of ref document:A1 |