
広がりを見せ続けるAIブームの中、特に重要な存在として注目されているのが「生成AI」です。
ここでは、生成AIの特徴や種類、得意なことや苦手なこと、仕組みや具体的なサービス名、ビジネスにおける活用手法などをご紹介します。
1. 生成AI(ジェネレーティブAI)とは?
生成AI(Generative AI:ジェネレーティブAI)とは、学習済みのデータをそのまま返すのではなく、指示に応じて多種多様なコンテンツを生成できるAIのことです。ディープラーニングと呼ばれる、AI自らがデータの重要ポイント(特徴量)を見つけて学習を進める手法を主に利用しており、従来のAIでは困難だったクリエイティブな生成物を生み出せるのが特徴です。
話題を呼んだテキスト生成AI「ChatGPT」や画像生成AIサービス「Stable Diffusion」の登場もあり、近年はビジネスへ活用される事例も増えています。
2. 生成AIの種類
生成AIは、作成できるコンテンツの形式により、大きく4種類に分類できます。
2.1. 画像生成
画像生成AIは、希望するイメージを文章で入力するだけで指示に応じた画像を生成できるAIです。「Stable Diffusion」や「DALL・E2」が代表的なサービスで、Brazeのメディアライブラリ内にあるAI画像ジェネレーターでも「DALL・E2」を利用しています。
2.2. テキスト生成
テキスト生成AIは、文章による質問や指示(プロンプト)に合わせて、文脈に沿ったテキストを生成できるAIです。「ChatGPT」を筆頭に、国産の小説執筆支援サービス「AI のべりすと」や、画像生成にも対応する「Novel AI」などが存在します。Googleが開発した「Bard」もテキスト生成AIの一種です。
2.3. 音声生成
音声生成AIは、文章による指示と参考となる音源を与えることで、新たな音声データを生み出せるAIです。例えば、あるナレーターの声を学習させた後に任意のテキストを入力すると、その声に似た音声でテキストが読み上げられます。代表的なサービスには、Metaの高性能音声用AIモデル「Voicebox」や、音声合成市場シェアNo.1をうたう「AITalk」が挙げられます。
2.4. 動画生成
動画生成AIは、テキストや参考にしてほしいビデオからイメージに近い動画を新たに生み出せるAIです。AIによる動画の生成は画像やテキストなどほかのコンテンツと比べて難易度が高く、まだまた発展途上の域にあります。しかし最近では、画像生成AI「Stable Diffusion」の中に動画生成AIが試験的に登場するなどの動きもあり、今後の展開が注目されています。
3. 生成AIが得意なこと
生成AIは、得意なことと苦手なことが明確に分かれているのが特徴です。得意なこととしては次の3つのアクションがあり、それぞれビジネスへの活用可能性を秘めています。
3.1. 定型業務の効率化
パターン化された業務の効率化は、生成AIが最も得意とする領域の一つです。社内連絡に用いる文章の作成を半自動化したり、顧客からの問い合わせへの返答を24時間自動生成するチャットボットを構築したりと、定型作業の労力やコストを大きく削減できます。
3.2. クリエイティブな提案の補助
生成AIは、通常のAIでは難しいクリエイティブな提案を得意としています。例えば、「○○のコストがかさんで悩んでいる。効率化できる部分を5つ指摘してほしい」などとChatGPTに入力すると、独自の視点からアドバイスを受けられます。思考をまとめるための壁打ちやブレインストーミングの相手として優秀です。
3.3. コンテンツの作成
生成AIは通常、数秒から数十秒程度の時間でテキストや画像を生み出します。サービスのキャッチコピーや顧客へのプッシュ通知の文章を考えたり、パンフレットの表紙や商品のパッケージ案を作成したりといった時間のかかる作業も、生成AIなら一瞬です。「100種類のアイキャッチ画像案を準備させて、ベストなものを選ぶ」といった活用も可能となります。
4. 生成AIが苦手なこと
一方、生成AIは、人間の心に寄り添うような、感情や情緒にまつわる作業は苦手としています。生成AIの回答は確率論に基づいており、仮にそれらしい返答をしたとしても、そこに心や知能があるわけではないからです。また、生成AIは人間のような常識を持たないため、まったく的外れなコンテンツを生み出すこともあります。
人間と同等の心や知能を持たないAIは、専門用語で「弱いAI」と呼ばれます。2023年時点で世の中に登場しているAIは、すべてこの「弱いAI」です。その特徴やビジネス上の注意点については、以下の記事も併せてご確認ください。
【関連記事】
>>弱いAI?強いAI?それぞれの違いやシンギュラリティとの関係性を解説
5. 生成AIの仕組み

生成AIの仕組みはサービスごとに異なりますが、ここでは代表的なモデルをご紹介します。
5.1. VAE
VAE(Variational Autoencoder:変分オートエンコーダー)は、画像生成に用いられるモデルです。ディープラーニングを採用しており、学習させたデータに似た特徴を持つ画像を生み出しやすいのが特徴です。ただし、次に挙げる「GAN」に比べると鮮明さに欠ける画像が生成されやすい欠点を持ちます。
5.2. GAN
GAN(Generative Adversarial Network:敵対的生成ネットワーク)も画像の生成AIに採用されるモデルです。こちらもディープラーニングが用いられていますが、VAEとは生成過程が異なり、2種類のネットワークを内部で競わせて(敵対させて)鮮明な生成物を提供します。
しかし、GANも完璧なモデルではなく、似た画像ばかりを生成してしまう「モード崩壊」と呼ばれる現象を抱えています。そのため、VAEとのお互いの短所を補い合うモデルとして「VAEGAN」という仕組みも登場しています。
5.3. 拡散モデル
拡散モデル(Diffusion Model)は、Brazeの画像生成機能で利用される「DALL・E2」にも採用されている人気モデルです。画像に故意にノイズをプラスし、そのノイズを取り除く過程(再構築する過程)を学習することで、高品質な生成物を生み出しています。
5.4. GPT-3
GPT-3は、アメリカのOpenAI社が開発した言語モデルです。ChatGPTに搭載されており、2023年7月時点では「GPT-4」まで登場しています。莫大なテキストデータで訓練されており、質問文への回答や文章の要約などの高度な作業もこなせるのが特徴です。精度にはまだまだ不安があるものの、プログラミング言語によるコード記述も行えるなど、そのポテンシャルは計り知れないものがあります。
6. 生成AIサービスの例
続いて、近年注目を集めている生成AIの人気サービスを確認しましょう。
6.1. Stable Diffusion
AI画像生成サービスの代表ともいえる存在が、このStable Diffusionです。AI研究企業「Stability AI」が2022年8月ごろに公開した画像生成AIで、オープンソースで提供されたことから、現在のAIイラストブームの火付け役となりました。例えば、「こちらを向いて笑っているパンダ」のようにテキストを入力するだけでイメージに近い画像を生成できる画期的なサービスです。
6.2. ChatGPT
話題のテキスト生成AI「ChatGPT」も生成AIサービスの代表格の一つです。OpenAI社が2022年11月に提供をはじめ、わずか2ヵ月で月間アクティブユーザーが1億人に到達するなど、驚異的な早さで人々に浸透しました。その背景には、「○○をしてください」などと自然言語で入力するだけで誰でも扱えるハードルの低さがあります。最近では公的機関や政府による活用も進んでおり、今後も利用者が増加していくと予想されます。
6.3. Whisper
WhisperはChatGPTと同じOpenAI社が提供するAI文字起こしサービスです。テキストにしたい音声データを与えると、AIが分析を進めて文章として出力してくれます。非常に便利なサービスですが、現在はChatGPTのようにブラウザから簡単に扱える形式では提供されておらず、利用までのハードルが高いのが難点です。
6.4. Catchy
Catchyは「国内最大級のAIライティングアシスタントツール」を掲げる文章生成サービスです。ChatGPTを利用するサービスの一つで、キャッチコピーの作成、LINEの返信、仕事の悩み相談、YouTubeの企画提案など、全100種類以上もの文章生成ツールが用意されています。自分でChatGPTの活用方法を学ぶことなく、シーンに合ったツールを選ぶだけで、そのシーンにふさわしい文章を作成できる手軽さが魅力です。
7. 生成AIをビジネスに活用する手法
続いて、生成AIをビジネスに活用する手法を3種類ご紹介します。
7.1. 自動応答チャットボット
自動応答チャットボットは、生成AIにより業務効率化を実現する手法の代表例です。顧客が入力した質問文に対して一般的な回答を自動で生成することで、顧客には24時間すぐに疑問を解決できる利便性を、従業員には深夜労働の少ない働きやすい職場を提供できます。
7.2. コンテンツ生成の補助
前述の通り、コンテンツの作成は生成AIが得意とする作業の一つです。しかし実際のところ、AIの生成物はまだまだクオリティに問題があるケースが少なくありません。
そこでおすすめなのが、コンテンツ生成の補助、たたき台としての活用です。「こういった方向性のイラストがほしい」「このようなテイストの文章が必要」など、作成者と視点を共有する際のイメージ例に用いることで、質の高い成果物を受け取りやすくなります。
7.3. 将来予測によるビジネス戦略立案のサポート
生成AIでは、与えられた過去データをもとにした将来の高精度な予測も可能です。代表的な活用例として「購買予測」が挙げられます。ユーザーの属性や過去の購買履歴などの情報から、次にどの商品をどのタイミングで購入する可能性が高いかを推測できます。予測に応じて在庫管理やマーケティングを最適化することで、限られたリソースを有効活用できます。
【関連記事】
>>AIによる購買予測とは?導入メリットや課題について徹底解説
8. Brazeの生成AIでマーケティングを強化しよう
Brazeでは、利用者のマーケティング活動を力強く支援するために、2022年5月からいち早く生成AIの活用を進めています。2023年7月現在では、以下を含めたAI機能を提供中です。
ChatGPTを用いた文章作成機能「AI コピーライティング アシスタント」
DALL-E 2による「AI画像ジェネレーター」
ユーザーの購買可能性や予測の精度を100段階で確認できる「購買予測AI」
AIがセグメント化したユーザーに対してAIが作成した画像&文章でパーソナライズされた通知を送るなど、マーケティング作業の大部分を効率化できます。ぜひ、ビジネスでのAI活用の第一歩としてBrazeの利用をご検討ください。
>>Brazeは ChatGPT をはじめとした AI活用を進めています
9. まとめ
この記事では、生成AIの特徴や種類、得意なことや苦手なこと、仕組みやサービス例、ビジネスにおける活用方法などをご紹介しました。
生成AIは、従来のAIよりもクリエイティブなコンテンツを生成できるAIです。独創的な文章や画像を素早く生み出してくれますが、一方では人の心や感情に寄り添うことを苦手とするなどの欠点もあります。
ビジネスでの活用を成功させるためには、何もかもを生成AIに任せるのではなく、長所と短所を理解したうえで取り扱うことが、今後しばらくは求められるでしょう。
