Facebook x

ジャンル

AI関連 2024.01.18
x hatenabookmark

ニュースの先読みに役立つ!「AI」「LLM」関係キーワードと業界イメージ

執筆: Qbook編集部

ライター

ニュースの先読みに役立つ!「AI」「LLM」関係キーワードと業界イメージ

ここ数年で急速に話題になることが増えたAI(人工知能:Artificial Intelligence)。次世代を担う重要なテクノロジーの一つとして劇的なスピードで進化と普及を続けており、今後、必須のツールとなるでしょう。そこで今回、AIに関連する用語のうち、ニュース等を読み解くとき押さえておきたいものと現在の状況をまとめてみました。

もくじ
  1. まず、押さえておきたいAI用語
  2. これから注目されそうなAI用語
  3. AI業界をニュース目線で概観
  4. まとめ

1.まず、押さえておきたいAI用語

現在のAIブームともいわれる状況でよく使われている用語をまとめました。

機械学習(ML:Machine Learning)

機械学習は、コンピュータがデータから学習してパターンやルールを抽出し、予測や判断をする技術です。AI(人工知能)のなかでも基礎的で中核をなすものの一つです。現在では、画像認識や音声認識、予測分析などに広く利用されています。

機械学習には「教師あり学習」と「教師なし学習」、「強化学習」など種類があり、「教師あり学習」は、入力データと正解データ(ラベル)からコンピュータがモデルを学習して、新しい入力データに対して正解を予測する技術です。「分類問題」などを解くのに使われます。

「教師なし学習」は、入力データのみを学習して、コンピュータがデータの構造やパターンを発見し、モデルを構築する技術です。「強化学習」は、エージェントが環境と相互作用しながら、報酬を最大化する行動を学習する手法で、対戦ゲームやロボットの制御などに応用されている事例などがよく報道されます。

深層学習(DL:Deep Learning)

深層学習(ディープラーニング)は多層からなる人工のニューラルネットワーク(Neural Network)を用いて高度な学習を行う方法で、機械学習の一種です。

ニューラルネットワークは人間の脳の神経回路の構造を数学的に表現したものです。ディープラーニングは画像認識や自然言語処理など、様々な分野で大規模なデータを扱う際に優れた性能を発揮し、話題になりました。

畳み込みニューラルネットワーク(CNN、ConvNet:Convolutional Neural Network)はとくに画像認識において高い性能を発揮し、再帰型ニューラルネットワーク(回帰型ニューラルネットワーク、循環ニューラルネットワーク)(RNN:Recurrent Neural Network)は時系列データの処理が得意とされています。

大規模言語モデル(LLM:Language Model with Latent Retrieval)

大規模言語モデルは、自然言語処理において非常に高い性能を発揮します。「ChatGPT」や「Bard」など、ここ数年の大規模言語モデルは、莫大な量のテキストデータを学習し、膨大なパラメータをもつニューラルネットワークで構成されています。

そのため、文章生成や質問応答などを自然にチャットのように受け答えすることができ、一気にブームとなりました。LLMは、企画の「壁打ち」や文章生成、文章補完、テキストデータの分類など、様々な自然言語処理タスクに応用されています。

現在、LLMはトランスフォーマー(Transformer)を基盤としたモデルが主流です。

トランスフォーマー(Transformer)

トランスフォーマーは、2017年6月にGoogleが提案した深層学習モデルです。自己注意メカニズム(Self-Attention)を用いて、入力データの位置に依存しない並列処理が可能です。そのため大規模なデータセットを扱うことができ、従来のRNNより長い文脈をとらえることができます。トレーニング時間が短縮できるメリットもあります。

トランスフォーマーは、機械翻訳や要約など、自然言語処理の有力な技術として幅広く活用されており、BERT(Bidirectional Encoder Representations from Transformers)やGPT(Generative Pre-trained Transformer)といった大規模言語モデルの基盤としても使用されています。

GPT(Generative Pre-trained Transformer)

GPT(Generative Pre-trained Transformer)とは、OpenAIが開発した大規模言語モデルです。GPTシリーズは、GPT、GPT-2、GPT-3、GPT-4と進化しており、その性能は高く評価されています。

GPTはかなり大規模なテキストデータを用いて事前学習しており、文の生成力が優れており、表現力が豊かです。文章の流暢さや文脈に基づいた応答を生成することができるため、多くの人々に驚きをもって迎え入れられました。現在、チャットボットや自動作文、文章の校正などに広く利用されています。

ちなみに、大規模言語モデルの精度に直結するといわれるパラメータ数ですが、GPTは2018年発表時に1.1億、2019年のGPT-2が15億で、GPT-3.5が1750億と急激に増え、GPT-4は非公開ですが、5000億を超えるといわれています。

自然言語処理(NLP:Natural Language Processing)

自然言語処理(NLP)は、簡単にいえば、人間が使用する自然言語をコンピュータが理解し、さらに生成する技術のことです。AIと人間がやり取りをするのが「言葉」であるため、ますます注目されるようになると予測できます。

自然言語処理には、形態素解析、構文解析、意味解析、文章生成といった関連キーワードがあり、すでに検索エンジンや音声認識、翻訳、など、様々な分野で活用されると同時に、AIの基盤技術として進化を続けています。

GAN(Generative adversarial networks)

GAN(敵対的生成ネットワーク)は、生成器(Generator)と識別器(Discriminator)の敵対的な関係をもつ2つのネットワークで構成される生成モデルです。ポイントは相互に競い合いながら学習を進めていき、真のデータ(本物)に似たデータ(偽物)の生成を行えることです。画像生成やデータ補完といった分野で高い成果をあげています。

そのため、GANはディープフェイク(Deep Fake)画像・動画作成に利用され広まった一面があります。国内や海外でディープフェイクを悪用した犯罪が多発しています。中には、ディープフェイク技術で別人になりすましてオンライン面接を受ける、といった事例も発生しています。

GANで作られた痕跡を消してしまう技術GANprintR(GAN-fingerprint Removal)も発表されており、これは検知AIの性能を下げると考えられています。今後、技術的にはディープフェイク(Deep Fake)画像・動画を見破る難易度は高くなると予想でき、対抗技術がどう進歩するか注目されます。

2.これから注目されそうなAI用語

これから注目を集めそうなAI用語をいくつか紹介しましょう。

XAI(eXplainable AI:説明可能なAI)

XAIとは、「eXplainable AI」の名の通り、説明可能なAIのことです。AIが意思決定したことや予測した結果を人間が理解できる形で説明する技術の総称です。AIはどのようにして結果を生成しているのかがブラックボックス化されることが問題となるケースで、XAIを用いて説明することで信頼性や透明性を高めることができると考えられます。

医療診断や金融取引といった重要な判断を行う場面で有用であると考えられると同時に、AIの生成する回答がどう生成されたか知りたい場面でもXAIは役立つ可能性が高いでしょう。

BERT(Bidirectional Encoder Representations from Transformers)

BERTは、Googleによって開発された自然言語処理モデルの一つです。Transformerを基盤にしています。自然言語処理に高い性能を発揮する意図をもって開発されたようです。BERTは、文章の前後の文脈を考慮して双方向のエンコードを使用することで、文章の意味を正確に理解できるとされており注目を集めました。

転移学習(Transfer Learning)

転移学習は、あるタスクで学習されたモデルの知識を他のタスクに適用する機械学習の領域です。転移学習することで、新しいタスクでも似た学習を利用して短期間で高い性能を実現できます。データ量の不足も補えるため、学習の効率もあがります。画像認識や自然言語処理など、様々な分野で応用されていくと考えられます。

ニューラルアーキテクチャサーチ(NAS:Neural Architecture Search)

ニューラルアーキテクチャサーチ(NAS)は、機械学習やディープラーニングのモデル構造やパラメータを自動的に最適化する技術のことです。

これまではモデルの設計や調整は人手で行われていましたが、NASはAIが自動的に最適なモデル構造を探索できます。画像認識や音声処理といった分野で活用されています。

3.AI業界をニュース目線で概観

ここでは主に生成AIにテーマを絞って、2022年末から2023年前半で話題になった企業を中心にAI業界を概観してみたいと思います。生成AIを作る「開発」、AIの動作に必要な「半導体」、そして、生成AIを広める「プラットフォーマー」の3方向から見てみましょう。

なお、ここでは、AIの技術的な観点よりも報道ベースで「よく見かける」「今後話題になりそうだ」という予測的な視点で概観していますので、その点をあらかじめご承知おきください。

開発は「OpenAI」に注目

これからしばらくの間は、2022年11月にAIチャットボット「ChatGPT」を公開し、現在、ブームともいる状況を作り出しているOpenAIを中心に話題が展開していくと考えていいと思います。

OpenAIはもともと非営利AI研究機関でしたが、2019年に営利企業を設立し、Microsoftから出資を受けています。2023年1月には100億ドル(約1.3兆円)の出資となりました。この一連の動きが業界や報道の動きを刺激することになったと思います。MicrosoftはOpenAIからChatGPTなどのライセンスを独占的に供与されています。

DeepMind Technologiesからも目が離せません。同社はゲーム領域でも研究を進めており、なかでも囲碁AI「AlphaGo」や自己学習する人工知能「DQN(Deep Q-Network)」などで知られています。なお同社は2014年にGoogle(Alphabet)によって買収されています。

ちなみに「DQN」には日本のネット界隈では特別な意味がありますが、開発者のDemis Hassabis氏はどうやらその意味を知っていると一部で噂されています。

他にもロシアのYandex、テキストから画像を作成する「Midjourney(AI名も社名も同じ)」、「Stable Diffusion」を開発するStability AIなども注目です。

AI関連の半導体は「NVIDIA」が牽引?

AIの半導体市場で圧倒的なのが、GPU開発を得意とするNVIDIAです。2021年には、Microsoftと開発した自然言語生成モデル「MT-NLG(Megatron-Turing Natural Language Generation)」を公開しました。

なお、NVIDIAはMicrosoftとゲーム機「初代X-BOX」(2002年)でもタッグを組んでいます。

プラットフォーマーは「四つ巴」?

生成AIのプラットフォーマーとして、2023年時点で注目を集めているのはMicrosoftでしょう。2019年からOpenAIに出資し、2022年にはNVIDIAと提携。「Bing」に「GPT-4」を組み込んだり、「Azure OpenAI Service」をスタートさせたり、さらには「Windows Copilot」「Micorosoft365 Copilot」など生成AI関連の製品を次々に市場に投入しています。

動きを見せ始めているのがGoogle(Alphabet)。Transformer技術を駆使して、「Bard」を導入しており、今後、Microsoft同様の展開をするといわれています。

Facebook、InstagramのMetaのMeta AI Researchは2022年5月に「Open Pre-trained Transformer(OPT-175B)」をリリースし、オープンソース化しています。1750億パラメータのAI言語モデルということもあり、大きな話題となりました。

そして、2023年2月には、「AWS」のAmazonは、AIスタートアップのHugging Faceとの提携を拡大すると発表しました。生成AIの開発にAWSが活用され、さらにAWSの顧客はAIツールにアクセスできるようになります。

AI.png

エンドユーザーはプラットフォーマーを介してAIを利用するケースが多いと思いますから、Google(Alphabet)、Amazon、Meta、MicrosoftのサービスにどうAIが組み込まれていくかで「未来の風景」が変わっていくと考えられます。

まとめ

このように見てくると、生成AIのプラットフォーマーと目されるのは、Google(Alphabet)、Amazon、Meta、Microsoftと、いわゆる「GAFAM」からAppleを除いただけの状況です。その意味ではAppleの動向からも目が離せません。

しかし、AIの分野は急速に進化しており、新たな技術や手法が常に登場しているため、どこでどうプレイヤーの交代が発生するか予期できない状況になっていると思います。

AIの発展は、私たちの生活やビジネスに様々な影響を及ぼします。今後の動きをしっかりキャッチアップして柔軟に使いこなしていきたいところです。

AI関連
x hatenabookmark

執筆: Qbook編集部

ライター

バルテス株式会社 Qbook編集部。 ソフトウェアテストや品質向上に関する記事を執筆しています。