(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】2019145873
(43)【公開日】20190829
(54)【発明の名称】監視装置および監視方法
(51)【国際特許分類】
   H04L 12/26 20060101AFI20190802BHJP
   H04L 12/70 20130101ALI20190802BHJP
【FI】
   !H04L12/26
   !H04L12/70 100Z
【審査請求】未請求
【請求項の数】2
【出願形態】OL
【全頁数】9
(21)【出願番号】2018025347
(22)【出願日】20180215
(71)【出願人】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
【住所又は居所】東京都千代田区大手町一丁目5番1号
(74)【代理人】
【識別番号】110001807
【氏名又は名称】特許業務法人磯野国際特許商標事務所
(72)【発明者】
【氏名】大谷 未稚
【住所又は居所】東京都千代田区大手町一丁目5番1号 日本電信電話株式会社内
(72)【発明者】
【氏名】山越 恭子
【住所又は居所】東京都千代田区大手町一丁目5番1号 日本電信電話株式会社内
(72)【発明者】
【氏名】坂田 浩亮
【住所又は居所】東京都千代田区大手町一丁目5番1号 日本電信電話株式会社内
(72)【発明者】
【氏名】中村 瑞人
【住所又は居所】東京都千代田区大手町一丁目5番1号 日本電信電話株式会社内
【テーマコード(参考)】
5K030
【Fターム(参考)】
5K030GA11
5K030HC01
5K030HD02
5K030JA10
5K030JA11
5K030KX30
5K030MA04
5K030MB04
5K030MC07
5K030MC09
(57)【要約】
【課題】ネットワーク上で動作するサービスの保守負担を低減する。
【解決手段】ネットワーク上で動作するサービスを監視し、ネットワークの通信品質を測定するための測定値が所定の閾値を超えた場合にはアラームを出力する監視装置1であって、測定値の所定期間に亘る累積値を、サービスを利用するユーザごとに算出する累積値算出部14と、算出した累積値、および、ユーザごとに規定されたSLA(Service Level Agreement)から算出した目標値に基づいて閾値を算出する閾値算出部17と、を備える、ことを特徴とする。
【選択図】図1
【特許請求の範囲】
【請求項1】
ネットワーク上で動作するサービスを監視し、前記ネットワークの通信品質を測定するための測定値が所定の閾値を超えた場合にはアラームを出力する監視装置であって、
前記測定値の所定期間に亘る累積値を、前記サービスを利用するユーザごとに算出する累積値算出部と、
前記算出した累積値、および、前記ユーザごとに規定されたSLA(Service Level Agreement)から算出した目標値に基づいて、前記ユーザのSLA順守状況を判定するSLA順守状況判定部と、
前記SLA順守状況の判定結果に応じて、前記ユーザごとに前記閾値を算出する閾値算出部と、を備える、
ことを特徴とする監視装置。
【請求項2】
ネットワーク上で動作するサービスを監視し、前記ネットワークの通信品質を測定するための測定値が所定の閾値を超えた場合にはアラームを出力する監視装置における監視方法であって、
前記監視装置が、
前記測定値の所定期間に亘る累積値を、前記サービスを利用するユーザごとに算出するステップと、
前記算出した累積値、および、前記ユーザごとに規定されたSLAから算出した目標値に基づいて、前記ユーザのSLA順守状況を判定するステップと、
前記SLA順守状況の判定結果に応じて、前記ユーザごとに前記閾値を算出するステップと、を実行する、
ことを特徴とする監視方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、監視装置および監視方法に関する。
【背景技術】
【0002】
ユーザに提供するネットワーク上で動作するサービスを運用する際、ネットワーク上の装置異常などによって通信の品質劣化を検知する技術が重要である。従来では、例えば、通信の遅延やロス率を定期的に測定し、測定値が閾値を超えた場合に品質劣化を示すアラームを出力する技術が知られている。ここで、閾値については、例えば、経験則から固定の閾値を設定する(例えば、特許文献1参照)、日々の時間帯に応じた閾値を設定する、所定期間内の測定値から将来を予測して閾値を設定する、などの手法が知られている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2005−136805号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
同じサービスを利用するユーザごとにさまざまなSLA(Service Level Agreement)が設定されている。このため、ユーザごとのSLAの順守状況によって、品質劣化に対する対応要否が異なる。しかし、特許文献1の技術を含む従来技術では、品質劣化に関して、どのユーザに対しても同じ判定をしてしまう。このため、特定のユーザに対して本来不要なアラームが出力される場合がある。その結果、サービスを保守するオペレータに不要な稼働が発生し、保守負担が増大するという問題がある。
【0005】
このような背景に鑑みて、本発明は、ネットワーク上で動作するサービスの保守負担を低減することを課題とする。
【課題を解決するための手段】
【0006】
前記した課題を解決するため、請求項1に記載の発明は、ネットワーク上で動作するサービスを監視し、前記ネットワークの通信品質を測定するための測定値が所定の閾値を超えた場合にはアラームを出力する監視装置であって、前記測定値の所定期間に亘る累積値を、前記サービスを利用するユーザごとに算出する累積値算出部と、前記算出した累積値、および、前記ユーザごとに規定されたSLA(Service Level Agreement)から算出した目標値に基づいて、前記ユーザのSLA順守状況を判定するSLA順守状況判定部と、前記SLA順守状況の判定結果に応じて、前記ユーザごとに前記閾値を算出する閾値算出部と、を備える、ことを特徴とする。
【0007】
また、請求項2に記載の発明は、ネットワーク上で動作するサービスを監視し、前記ネットワークの通信品質を測定するための測定値が所定の閾値を超えた場合にはアラームを出力する監視装置における監視方法であって、前記監視装置が、前記測定値の所定期間に亘る累積値を、前記サービスを利用するユーザごとに算出するステップと、前記算出した累積値、および、前記ユーザごとに規定されたSLAから算出した目標値に基づいて、前記ユーザのSLA順守状況を判定するステップと、前記SLA順守状況の判定結果に応じて、前記ユーザごとに前記閾値を算出するステップと、を実行する、ことを特徴とする。
【0008】
請求項1,2に記載の発明によれば、監視装置が、サービスを利用するユーザのSLA順守状況に応じて、通信品質を判定するための閾値を動的に変更することができる。よって、監視装置は、SLA順守できない可能性が高い場合にアラームを出力することができる。その結果、SLA順守できない可能性が高いわけではなくともアラームを出力してしまうことによるオペレータの稼働を省略することができる。
したがって、ネットワーク上で動作するサービスの保守負担を低減することができる。
【発明の効果】
【0009】
本発明によれば、ネットワーク上で動作するサービスの保守負担を低減することができる。
【図面の簡単な説明】
【0010】
【図1】本実施形態の監視装置を含むシステムの機能構成図である。
【図2】品質劣化判定処理を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、図面を参照して本発明を実施するための形態(以下、「本実施形態」という)について説明する。
【0012】
≪構成≫
図1に示すように、本実施形態の監視装置1を含むシステムは、監視装置1と、オペレータ端末2と、装置3a〜3cと、EMS(Element Management System)4とを備える。
監視装置1は、ネットワーク上で動作するサービスを監視する。監視装置1の詳細は後記する。
【0013】
オペレータ端末2は、監視装置1の上位装置となる管理コンソールである。オペレータ端末2は、例えば、ネットワーク上で動作するサービスを保守するオペレータ(保守者)が用いる。
【0014】
装置3a〜3cは、ネットワーク上に配置されている機器であり、例えば、ルータやブリッジなどの中継装置であったり、ネットワーク上で動作するサービスを提供するサーバであったりする。
EMS4は、装置3a〜3cを管理する装置である。
【0015】
装置3a〜3cを含むネットワーク上の機器間では、サービスを実現するためのパケットが転送されている。監視装置1は、サービスに関する所定データを装置3a〜3cから収集し、収集したデータを解析することにより、装置3a〜3cを監視することができる。このとき、図1に示すように、監視装置1は、装置3a,3bから直接データを収集することもできるし、装置3cからデータを収集するEMS4を介して、装置3cからデータを収集することもできる。
【0016】
監視装置1は、入出力部、処理部、記憶部といったハードウェアを備えており、処理部の具体例となるCPUが、記憶部の具体例となるメモリ上に読み込んだプログラムを実行することにより、本実施形態の方法を実現する。
【0017】
図1に示すように、監視装置1は、品質測定部11と、閾値比較部12と、アラーム送信部13と、累積値算出部14と、目標値算出部15と、SLA順守状況判定部16と、閾値算出部17と、テーブルT1〜T3とを有する。テーブルT1〜T3は、監視装置1の記憶部に記憶されている。
【0018】
品質測定部11は、装置3a〜3cを含むネットワーク上の機器から収集したデータから、通信品質を判定するための測定値を測定する。測定値としては、例えば、通信の遅延量や、通信のロス率があるが、これらに限定されない。また、測定値は、サービスを利用するユーザごとに測定される。例えば、装置3a〜3cを含むネットワーク上の機器間で転送されるパケットのヘッダ情報を、装置3a〜3cから品質測定部11に通知することで、品質測定部11は、測定値に対応するユーザを特定することができる。
【0019】
閾値比較部12は、品質測定部11が測定した測定値と所定の閾値とを比較し、測定値が所定の閾値を超えたか否かを判定する。閾値比較部12は、テーブルT1を参照して当該判定をする。テーブルT1は、品質情報と、閾値情報とを格納している。品質情報は、品質測定部11が測定した測定値の履歴を示す情報であり、所定の測定時刻ごとに(例:5分ごと)測定された測定値の集合である。品質情報は、ユーザごとに生成されている。品質測定部11は、新たに測定した測定値をテーブルT1に登録することで、テーブルT1の閾値情報を更新することができる。
【0020】
閾値情報は、閾値比較部12による通信品質判定用の閾値の履歴を示す情報である。閾値情報は、ユーザごとに生成されている。閾値比較部12が判定する際に用いる閾値は、最新の閾値である。
【0021】
アラーム送信部13は、閾値比較部12による判定の結果、測定値が閾値を超えたことを示すアラームをオペレータ端末2に送信する。
【0022】
累積値算出部14は、品質測定部11が測定した測定値に対して、所定期間(例:1ヶ月間)に亘る累積値を算出する。累積値は、サービスを利用するユーザごとに算出される。所定期間は、例えば、当該期間の開始タイミング(例:毎月1日の午前0時)および終了タイミング(例:毎月の月末日の午後11時59分59秒)を指定し、指定した終了タイミングを次の所定期間の開始タイミングに指定することで設定することができる。
【0023】
目標値算出部15は、累積値算出部14が算出した累積値の上限として機能する目標値を算出する。目標値は、サービスを利用するユーザごとに算出される。目標値算出部15は、テーブルT2を参照して、当該目標値を算出する。テーブルT2は、SLA情報を格納している。SLA情報は、ユーザがサービスを利用する際に規定されたSLAを示す情報であり、例えば、月の累積遅延時間や、月の累積ロス率を示す。SLA情報は、ユーザごとに規定されている。また、目標値は、SLA情報が示す値よりも十分に小さい値として設定される。
【0024】
SLA順守状況判定部16は、累積値算出部14が算出した累積値、および、目標値算出部15が算出した累積値に基づいて、ユーザのSLA順守状況を判定する。
閾値算出部17は、品質測定部11が通信品質を判定するための閾値を算出する。閾値は、サービスを利用するユーザごとに算出される。SLA順守状況判定部16が、テーブルT3を参照して、ユーザのSLA順守状況を判定し、閾値算出部17が、SLA順守状況の判定結果に応じて当該閾値を算出する。テーブルT3は、累積値情報と、目標値情報とを格納している。累積値情報は、累積値算出部14が算出した累積値の履歴を示す情報であり、所定の時期ごと(例:1日ごと)に算出された累積値の集合である。累積値情報は、ユーザごとに生成されている。
【0025】
目標値情報は、目標値算出部15が算出した目標値を示す情報である。目標値情報は、ユーザごとに生成されている。ユーザごとに設定された目標値は、ユーザがSLAを確実に順守できることを保証する値であり、固定値である。
【0026】
SLA順守状況判定部16は、テーブルT3内の累積値情報と目標値情報とを用いて、ユーザのSLA順守状況を判定することができる。例えば、累積値が目標値に極めて近い値を示す場合には、当該ユーザがSLAを順守できない可能性があると判定することができる。閾値算出部17は、SLA順守状況に応じて、閾値比較部12の判定用の閾値を変更することができる。閾値算出部17は、変更した閾値をテーブルT1に登録することで、テーブルT1の閾値情報を更新することができる。
【0027】
≪処理≫
次に、本実施形態の監視装置1が実行する処理について説明する。監視装置1が実行する処理は、品質劣化検知処理および閾値算出処理である。品質劣化検知処理は、すでに説明した従来技術による処理であって、品質測定部11が測定した測定値が閾値を超えているか否かを閾値比較部12が判定し、超えていた場合、アラーム送信部13がアラームを出力する、という処理である。
以下、閾値算出処理について、図2を参照して説明する。
【0028】
閾値算出処理は、所定のタイミング(例えば、測定値の測定時刻と同じ時刻)を迎えると開始する。また、ユーザごとの目標値は予め設定されており、テーブルT3の目標値情報として登録されている。また、ユーザごとに規定されたSLAは予め設定されており、テーブルT2のSLA情報として登録されている。
【0029】
まず、監視装置1は、品質測定部11によって、ネットワークの通信品質を測定する(ステップS1)。具体的には、品質測定部11が、装置3a〜3cを含むネットワーク上の機器から収集したデータから、通信品質を判定するための測定値を測定する(ステップS1)。測定値は、サービスを利用するユーザごとに測定される。品質測定部11は、測定した測定値をテーブルT1に格納し、テーブルT1内の品質情報を更新することができる。
【0030】
次に、監視装置1は、累積値算出部14によって、所定期間に亘る測定値の累積値を算出する(ステップS2)。具体的には、累積値算出部14は、開始タイミングおよび終了タイミングを指定した所定期間におけるすでに算出した累積値に、今回測定された測定値を加算することで、現時点での累積値を算出する。累積値は、ユーザごとに算出される。累積値算出部14は、算出した累積値をテーブルT3に格納し、テーブルT3内の累積値情報を更新することができる。
【0031】
次に、監視装置1は、SLA順守状況判定部16によって、測定した測定値のユーザのSLA順守状況を判定する(ステップS3)。具体的には、SLA順守状況判定部16は、累積値算出部14が算出した累積値でありテーブルT3内の累積値情報が示す累積値と、目標値算出部15が算出した目標値でありテーブルT3内の目標値情報が示す、該当ユーザの目標値とを用いて、ユーザが、当該ユーザに規定されているSLAを順守できるか否かを判定する。
【0032】
例えば、SLA順守状況判定部16は、目標値と累積値との差分(絶対値)が第1の判定値以下となる場合には、SLAを順守できなくなる可能性が高い(SLA順守不良)と判定することができる。第1の判定値は、例えば、累積値の所定期間の残り時間、つまり、現時点から終了タイミングまでの残り時間に応じて適宜変動させることができる。目標値と累積値との差分に代えて、累積値と目標値との比を用いてもよい。
【0033】
また、SLA順守状況判定部16は、目標値と累積値との差分(絶対値)が第2の判定値(>第1の判定値)以上となる場合には、SLAを順守できなくなる可能性が低い(SLA順守良好)と判定することができる。第2の判定値は、例えば、累積値の所定期間の残り時間、つまり、現時点から終了タイミングまでの残り時間に応じて適宜変動させることができる。
また、SLA順守状況判定部16は、目標値と累積値との差分(絶対値)が第1の判定値と第2の判定値との間となる場合には、SLAを順守できなくなる可能性が中程度(SLA順守普通)と判定することができる。
【0034】
次に、監視装置1は、閾値算出部17によって、SLA順守状況の判定結果に応じて、閾値を算出する(ステップS4)。例えば、SLA順守不良であった場合は、閾値算出部17は、閾値を下げる。これにより、アラーム送信部13によるアラーム出力の契機を増大させ、ユーザに注意喚起することができる。なお、SLA順守不良であったときの閾値の下げ幅は、動的に決定することができる。例えば、累積値が極めて大きくSLA順守不良が顕著となる場合は、閾値の下げ幅を大きくすることが好ましい。
【0035】
また、例えば、SLA順守良好であった場合は、閾値算出部17は、閾値を上げる。これにより、アラーム送信部13による本来不要なアラーム出力を低減することができる。また、例えば、SLA順守普通であった場合は、閾値算出部17は、閾値を維持する。
【0036】
閾値算出部17は、算出した閾値を、テーブルT1に格納し、閾値情報を更新する。閾値比較部12は、品質劣化検知処理において、更新された閾値情報の閾値を用いて、品質測定部11が測定した測定値に対する判定をする。
図2の閾値算出処理によれば、累積値と目標値とに応じて閾値を動的に変更させることができる。
【0037】
本実施形態によれば、監視装置1が、サービスを利用するユーザのSLA順守状況に応じて、通信品質を判定するための閾値を動的に変更することができる。よって、監視装置1は、SLA順守できない可能性が高い場合にアラームを出力することができる。その結果、SLA順守できない可能性が高いわけではなくともアラームを出力してしまうことによるオペレータの稼働を省略することができる。
したがって、ネットワーク上で動作するサービスの保守負担を低減することができる。
【0038】
≪その他≫
(a):累積値算出部14が累積値を算出する際の所定期間について、さまざまな設定方法をとることができる。例えば、現時点を当該期間の終了タイミングとして指定し、現時点から当該期間分遡った時点を、当該期間の開始タイミングとして指定することもできる。
【0039】
(b):品質測定部11が測定値を測定した後の、閾値比較部12による判定は、閾値算出部17が元々算出していた閾値を用いた判定であってもよいし、累積値算出部14が算出した累積値および目標値を用いて閾値算出部17が新たに算出した閾値を用いた判定であってもよい。
【0040】
本実施形態で説明した種々の技術を適宜組み合わせた技術を実現することもできる。
本実施形態で説明したソフトウェアをハードウェアとして実現することもでき、ハードウェアをソフトウェアとして実現することもできる。
その他、ハードウェア、ソフトウェア、フローチャートなどについて、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
【符号の説明】
【0041】
1 監視装置
2 オペレータ端末
11 品質測定部
12 判定部
13 アラーム送信部
14 累積値算出部
15 目標値算出部
16 SLA順守状況判定部
17 閾値算出部
【図1】
【図2】