ニューラルネットワークとは、人間の脳の神経回路を模した数理モデルのことです。
この記事では、膨大なデータ分析(解析)を行うためにAI導入を検討中の方に向けて、ニューラルネットワークの仕組みや活用事例などを紹介します。ニューラルネットワークの関連用語についても解説します。業務改善やコスト削減にぜひ役立ててください。
「ニューラルネットワーク(neural network)」とは、人間の脳の神経回路の構造を数学的に表現する手法です。脳内の神経細胞である「ニューロン(neuron)」を語源とし、主に音声や画像などのパターンを認識する際に活用されます。
また、ニューラルネットワークは機械学習やディープラーニング(深層学習)に関連して引き合いに出されることが多くありますが、その違いについては記事の後半でくわしく解説します。
ここからは、ニューラルネットワークの具体的な仕組みを解説します。
一般的なニューラルネットワークは、情報が入力される「入力層」、情報が発信される「出力層」、その中間にある「隠れ層」の3層で構成されています。
なかでもニューラルネットワークの肝となるのが、入力されたデータに対してさまざまな計算を行う隠れ層です。隠れ層をいくつも持つことで、より複雑な問題にも対処できるようになります。
脳内の情報の伝わりやすさは、ニューロン同士を結ぶ「シナプス」の結合強度によって変化します。ニューラルネットワークではこの強度を「重み」と表現し、正しい出力結果を得るためには入力されたデータに対して重みを最適化していくことが大切です。
重みの最適化には、重みを軽くしたり重くしたりしながら出力結果を正解に近づけて調整する「勾配法」が用いられます。
ニューラルネットワークにおける学習の目標は、出力層で人間が望む結果を出すことです。人間が望む「正解」を目指して、重みの付け方を調整するなど自力で微調整を繰り返します。
ニューラルネットワークにはいくつかの種類があります。
種類 | 特徴 |
---|---|
ディープニューラルネットワーク(DNN) |
ニューラルネットワークを多層化したモデル |
畳み込みニューラルネットワーク(CNN) |
いくつかの個性的な層を持ち、主に画像認識に用いられるモデル |
再帰型ニューラルネットワーク(RNN) |
時系列データなどを扱うことができ、自然言語処理の分野で期待されているモデル |
敵対的生成ネットワーク(GAN) |
生成モデルの一種 存在しないデータの生成や、特徴に合わせた変換が可能 |
オートエンコーダ(自己符号化器) |
深層学習の父、ジェフリー・ヒントン教授が提唱したモデル 主に異常検知システムなどに用いられる |
それぞれの特徴については、以下で詳しく解説します。
現在最も広く利用されている深層学習モデルで、ニューラルネットワークを多層に重ねたものです。ニューラルネットワークは3層のみなので単純な問題しか解決できませんが、多層化することでより複雑な問題にも対処できるようになります。
「畳み込み層」や「プーリング層」と呼ばれる個性的な層を持ちます。主に画像認識に用いられ、類似する画像を検索することや、画像の状況を解析して文章を生成するなどの活用事例が知られています。また、自然言語処理でも利用され、一定の評価を得ているモデルです。
文章などの連続的なデータや時系列データを扱うことができ、自然言語処理の分野で期待されているモデルです。たとえば、音声認識で音声の意味を理解するために必要な前後の時系列データを処理できます。
生成モデルの一種で、近年注目を集めるモデルです。データの真贋を見抜く「Discriminator」と、ディスクリミネータが見間違えるようなデータを生成する「Generator」によって構成されます。両者のいたちごっこの繰り返しにより、本物と見分けがつかないほどのデータが作成されます。
データの特徴を学習することで存在しないデータを生成することや、特徴に合わせて変換することが可能です。たとえば顔の画像データから、実際には存在しない人物の画像を作成することができます。
※GANについて詳しくはこちらをご覧ください。
「深層学習の父」と呼ばれるジェフリー・ヒントン教授が2006年に提唱したモデルで、入力層と出力層のデータが同じになるように処理が行われます。このオートエンコーダをいくつも重ね合わせた構造がディープラーニングなので、どちらも同じ仕組みになっています。オートエンコーダは主に異常検知システムやデータのノイズ除去などに用いられます。
代表的なニューラルネットワークの学習手法を3つ紹介します。
Dropout法とは、一度学習したネットワークの一部をわざと忘れさせる学習手法です。人間の脳と同じように、何度も忘れては学習するということを繰り返します。
確率的勾配降下法(SGD)は、「正解」のデータに近いほうへ少しずつ調整していく手法です。正解に近い確率が高い方向を導き出し、ゴールへ少しずつ近づいていくようなイメージで学習を進めます。
誤差逆伝播法は現在最も主流な学習手法のひとつです。正解のデータと実際に出力されたデータに生じた誤差情報を利用し、ネットワーク全体を学習します。
ニューラルネットワークと機械学習、ディープラーニング(深層学習)は混同されることが少なくありません。それぞれの違いや、関係性について解説します。
ニューラルネットワーク・機械学習・ディープラーニングの関係
機械学習はAIのデータ学習手法の一種です。この手法を用いてAIに膨大な量のデータを学習させると、人間と同じような判断や思考をさせることが可能になります。機械学習には様々な種類のアルゴリズム(計算方法)が含まれており、ニューラルネットワークもその一つです。
ディープラーニング(深層学習)は機械学習で用いられる代表的な学習手法で、ニューラルネットワークを応用したものです。ニューラルネットワークの隠れ層を増やし多層化したことで、より複雑な問題を解決できます。
ニューラルネットワークに関する記述で、しばしば話題にあがる「パーセプトロン」と「マルチパーセプトロン」について解説します。
1943年に提案された形式ニューロンを用いて、1958年にローゼンブラットが提案したニューラルネットワークのモデルです。第一次AIブームを牽引した存在ですが、パーセプトロンでは学習できない問題が多いとわかると流行は下火に向かってしまいました。
第二次AIブームを牽引したのがマルチレイヤーパーセプトロンです。入力層と出力層の間に「隠れ層」を取り入れ、多層構造とすることで、パーセプトロンと比べより多くの問題を処理できるようになりました。
ここからは、実際にニューラルネットワークを活用した事例を紹介します。
Google翻訳は、2016年に「Googleニューラル機械翻訳システム(GNMT; Google Neural Machine Translation system」と呼ばれるニューラルネットワークを用いた新しい機械翻訳技術を導入しました。文章全体を「ひとつの文」として把握することでより自然な翻訳が可能となりました。この技術により翻訳エラーを従来の55~85%削減できたと発表されています。
自動運転車の開発において、ニューラルネットワークを用いた「画面認識システム」が使用されています。運転する際、目の前にある障害だけでなく死角にいる歩行者の動きに注意する必要があり、広い視野で素早い判断を下す必要があります。画面認識システムは歩行者や障害物までの距離をリアルタイムに計算するため、人間の目では見落としてしまいそうな情報を正確にキャッチすることができます。事故を未然に防ぎ安全に走行するために欠かせないシステムです。
医療の分野では内視鏡検査における画像診断でニューラルネットワークが活用されています。たとえば、内視鏡画像から胃がんを検出できるシステムが開発されています。胃がん治療には早期発見が重要とされていますが、内視鏡による検査の見逃し率は5~25%と言われていました。
ニューラルネットワークを活用したシステムによって、6mm以上の胃がんを約98%の精度で発見することができたと発表されています。解析スピードも速く、今後さらに実用化が進むことが期待されます。
ニューラルネットワークを活用した「AIマッチング」の開発が進められているマッチングアプリもあります。年齢や年収といった条件を機械的に検索するだけでは見つけられない相手とのマッチングをサポートしてくれます。趣味や性格、今までのマッチング歴など様々なデータから相手を割り出すため、気の合う相手と出会いやすくなると予想されます。
国内の大手通信事業者が提供する人型ロボット・Pepperには、「内分泌型多層ニューラルネットワーク」と呼ばれる特殊なモデルが用いられています。これは、人間が刺激に対してホルモンを分泌して感情を形成する仕組みをモデル化したものです。このモデルにより、それまでは難しいとされていた細やかな感情を表現することに成功しています。
国内の空港での入国手続きにもニューラルネットワークが活用されています。ニューラルネットワーク技術を活用した顔認証ゲートを導入し、パスポートと入国ゲートで撮影した顔写真を照合することで本人確認を行っています。以前までの自動ゲートは、専用のリーダーにパスポートと自分の指紋を読み込ませる仕組みでした。指紋の事前登録が必要な上に、指紋が読み取れなくなってしまうなど工数が多くかかっていました。顔認証システムを搭載したゲートではそういった手間を大幅に削減できます。また、老化や化粧による顔の変化も認識可能です。
ニューラルネットワークは、人間の脳の構造を模した数理モデルです。人間と同じように学習を繰り返すことで使用者が望む「正解」を発信でき、主に画像や音声といったデータのパターン認識に活用されています。
扱うには専門の知識や技術が必要になるため、社内で人材確保が難しい場合は外部会社への委託も選択肢に入れておくことがおすすめです。
EAGLYSでは世界レベルの技術力を持つエンジニアが構想策定から協働してアイデアを具現化し、顧客要件に最適なモデルを設計しています。AIに関して広範な知識を持っているので、お気軽にご相談ください。