機械学習を用いた異常検知について解説します

2021年12月22日 17:30

近年では、機械学習アプローチの異常検知システムの開発が進められています。
機械学習システムを用いた異常検知の手法には、どのようなものがあるのでしょうか？

今回は「機械学習」をテーマに、異常検知手法について紹介していきます。

クリスマスまでの期間に、窓を毎日ひとつずつ開けていく「アドベントカレンダー」。
今年はそんなアドベントカレンダーにちなみ、株式会社トライエッティングの公式noteにて、「人工知能」、「機械学習」、「働き方」などをテーマとする様々な記事を、クリスマスまでの平日毎日投稿します。

異常検知とは

異常検知とは、正常ではないと定義したデータパターンについて、データマイニングを利用し識別することを意味します。異常検知の代表的な手法としては、外れ値検知と変化点検知があります。

機械学習を用いた異常検知とは

機械学習は、AIの1つの要素技術であり、コンピューターに大量のデータを入力し、データに潜むパターンやルールを発見させる技術です。機械学習を用いた異常検知とは、多くの学習データを用意し、その中で正常ではない振る舞いをするようなデータの検知を、分類、確率分布予測、再構成、データ間距離などの問題として解く技術です。

機械学習を用いた異常検知を導入すると解決できる課題

1. 人件費の削減
人が行う目視検査は、検査員が多いほど人件費がかかってしまいます。しかし、外観検査システムを導入することで、人件費を大幅に削減できるようになります。
外観検査システムを使うにはソフトウェア、ハードウェアが必要となるとはいえ、検査員を雇って目視検査するより低コストになる場合が多いです。

2. ヒューマンエラーの予防
人の検査では、不良品や不正な振る舞いを見逃してしまうなど、どうしてもヒューマンエラーを防ぐことはできません。
しかし、機械学習、ディープラーニングを検査に用いることで、目視検査と比べてより高い精度で異常を検知できるだけでなく、ヒューマンエラーによる異常も検知できるようになります。

3. 業務の属人化予防
多くの製造業の外観検査現場では、熟練検査員による属人的な作業が問題になっています。経験やそれに基づくノウハウを持った熟練検査員とは違い新人検査員は不良を見逃してしまう可能性があるなど、個人間での検知精度にばらつきが見られます。特定の個人しか行えない業務は、致命的な問題が生じる可能性があります。そこで、システムを導入して経験やノウハウに依存せず異常検知を行うことで、業務の属人化を予防することができます。

異常検知の手法

外れ値検知
外れ値検知とは、統計パターンから外れた異常値を抽出する手法です。たとえば、攻撃検知やネットワーク障害検知などへ応用されます。

変化点検知
変化点検知とは、時系列データの急激な変化の開始地点を検出し、異常の兆候を早期に検知する方法です。東証株価指数の変化点検出やSNSからの話題出現検知などへ応用されます。

機械学習を使った異常検知手法

ホテリング理論
ホテリング理論とは、データが正規分布に従うときに、外れ値（異常値）を検出する手法です。ホテリング理論は、異常検知において基礎的な手法として周知されています。

k近傍法
k近傍法とは、分類タスクにおいて予測したいデータに特徴が近いk個のデータの属するクラスから、データのクラスを決定するアルゴリズムです。ただし、k近傍法ではすべての要素までの距離を計算する必要があるため、データが大きくなるほど膨大な数の計算が必要となり、データ量が制限されてしまうなどの欠点があります。

ナイーブベイズ
ナイーブベイズは、分類問題を解くためのモデルで、確率論の定理であるベイズの定理を基にしています。
計算量が少なく処理が高速であるため、大規模データにも対応できる上、非常にシンプルで現実世界の複雑な問題に対してもうまく機能します。一方で、入力する特徴量が独立であると仮定しなければならないという制約があります。

サポートベクターマシン
サポートベクターマシン（SVM）とは、2つのクラスを特徴量空間上で分離する線形関数（超平面）を求めるアルゴリズムです。アルゴリズムです。少ないデータ量でも正しく分離しやすいというメリットがあります。

ロジスティック回帰
ロジスティック回帰は分類問題を解くモデルです。入力が与えられた時、その入力がどのクラスに分類されるかだけでなく、どれくらいの確率で分類されるかを出力します。例えば2クラス分類では、このモデルはある事象が発生する確率を予測し、50%より確率が大きければ、「ある事象が発生する」というクラスに分類し、そうでなければ「ある事象が発生しない」というクラスに分類します。

ニューラルネットワーク
ニューラルネットワークとは、人間の脳神経系のニューロンから着想を得た数理モデルであるニューロンを組み合わせて層状のネットワークにしたモデルです。このニューラルネットワークを巨大化・複雑化することで、様々なタスクにおいて高い性能が発揮されることがわかってきました。FFNN（Feed Forward Neural Network：順伝播型ニューラルネットワーク）では、層は基本的に入力層、隠れ層、出力層に分けられます。データを入力層に入力し、順に値を隠れ層に伝播させ、最後に出力層に値を伝播させることで値を導出します。

機械学習を使った異常検知の例

スパム検知
機械学習を用いた異常検知の例として、迷惑メールなどのスパム検知やクレジットカードの不正使用検知などが挙げられます。スパムメールは、自動的に迷惑メールフォルダーに振り分けられていくことがありますが、これは迷惑メールで利用されがちな単語を学習し分類します。

医療診断
医療業界では、患者の健康を守るために、患者の健康状態に関するさまざまなデータを集めています。複雑な患者データの分析のために機械学習が用いられます。

弊社サービス「UMWELT」をちょこっとだけ宣伝

TRYETINGのUMWELTはコードを書くことなくドラッグ＆ドロップの操作のみでAI構築ができます。そのため、AIシステムを社内に導入するために新たにデータサイエンティストを雇う必要はありません。
UMWELTは学習コスト、人的コストが最小限に抑えられ、さらに業界最低⽔準の⽉額利⽤料で導入できることも魅力です。手軽に社内システムをAI化するなら、TRYETINGのUMWELTをご検討ください。

SNSやマガジンはこちら
▼Twitter

Tweets by Tryetingoficial

▼マガジン
「アドベントカレンダー2021」

「TRYETINGの制度とカルチャー」

illustrations by Storyset

当社では事業拡大に伴い、さまざまなポジションで人材を募集しています。トライエッティングが気になった方は、採用サイトからぜひお問い合わせください！

採用サイト