チャットボットと生成AIの違いについて解説
2024.9.26
Contents
お役立ちコンテンツ
AIは、近年注目を集めている革新的な技術です。現代社会において、AIは画像認識や音声認識など、さまざまなシーンで活躍しています。
一見、万能のように思えるAIですが、実際にはできることと苦手なことが存在します。AIを導入する際は、想定しているタスクが可能か否かを、しっかりと検証しましょう。
本記事ではAIにできることと苦手なこと、開発プロセス、活用するためのポイントなどを解説しました。AIの導入を検討している方に有益な情報ですので、ぜひ参考にしてください。
AIとは「Artificial Intelligence」の略称で、日本語では人工知能を意味します。そして人工知能とは、「知能や知性を人工的に再現する技術」を指しています。
AIの大きな特徴は、人間のように自己学習能力を持っていることです。また人工知能としての十分な性能を発揮させるためには、用途に特化した学習を繰り返し行わせ、タスクをこなす能力を習得させる必要があります。
AIは自ら学んで知識を蓄えることで、認識や予測、判断、提案などが可能になります。学習ができていないAIは、何も知らない赤ん坊も同然のため、満足にタスクを処理できません。
そのため、前述したように、AIを構築するときは大量のデータを学ばせ、成長させる必要があります。このトレーニングが「機械学習(Machine Learning)」です。機械学習はAIが「知能や知性を人工的に再現する技術」を身に付けるための重要なプロセスといえるでしょう。
機械学習は、以下の3種類が存在します。
教師あり学習では、人間がAIに「正解」を与えて学習させます。学習の手法には次の2つがあるので、活用方法に合わせて選択しましょう。
目的 | 正解があるデータから、パターンや関係性を見つける学習をする→データの予測や分類ができるようになる |
---|---|
学習データ | 正解ラベルを付けたデータ |
学習の一例 | スパムメールのパターンを学習:受信メールからスパムメールを識別する |
学習の一例 | スパムメールのパターンを学習:受信メールからスパムメールを識別する 画像から犬の特徴を学習:動物の画像から犬の写真を分類する 過去の天気のパターンを学習:雨雲の動きから降水確率を予測する 企業の月次売上のパターンを学習:今後の売上傾向を予測する |
活用の一例 | 画像認識:監視カメラ、画像診断 言語処理:翻訳、商品レビューの感情分析 価格予測:株価、住宅予測 人員予測:店舗の人員配置 |
メリット | 予測精度が高い |
デメリット | 大量のデータが必要 |
質が高く正確なデータが必要 | データの作成に時間とコストがかかる |
教師なし学習は、AIに「正解」を与えずに学習させる方法です。
目的 | 正解がないデータから、特徴やパターンを見つける学習をする→データの構造や類似性を理解できるようになる |
---|---|
学習データ | 正解ラベルがないデータ |
学習の一例 | クラスタリング:さまざまな年代の顔写真を学習→シワや表情などの特徴から年代別に分類する次元削減:「国語・英語・理科・数学」の4次元のテストデータを「文系科目・理系科目」の2次元のデータに削減→比較して「文系が得意」と判断する |
活用の一例 | クラスタリング:購買履歴や閲覧履歴などから顧客を分類言語処理:レビューの意味やトピックから情報を分類異常検知:正常なパターンを学習して当てはまらない異常を検知 |
メリット | データにラベル付けをする必要がない正解に囚われず新しいパターンや関係性を発見できる |
デメリット | 正解との比較ができないデータが偏っていると誤った結果を出すことがある |
強化学習では、人間がAIに「行動の仕方(選択肢)」を教え、報酬として「結果に対するスコア」を用意します。AIは行動の仕方に基づいてタスクを繰り返し、結果に対するスコアがより高くなる方法を学習していきます。
目的 | タスクを何度も繰り返す→「より大きなスコアを得る方法」を選択できるようになる |
---|---|
学習データ | データがなくても学習を始められる |
学習・活用の一例 | ゲーム:ゲームを繰り返す→高いスコアを出す方法を学習する株式売買:売買の判断を繰り返す→より大きい利益を生む売買を検討できるようになる自動運転:運転の訓練を繰り返す→運転の精度を高められる |
メリット | 新しい環境を与えてもAIが自分でデータを集めて学習するロボット制御などの複雑なタスクに対応できる |
デメリット | 学習に時間がかかる予想外の結果が出ることもある |
機械学習を行うためのアルゴリズムの一つに「ディープラーニング(Deep Learning;深層学習)」があります。これは人間の学習能力をコンピューターで再現するための手法で、実際に脳内の神経回路をモデルにした仕組みが使われています。
ディープラーニングは3つの層に分かれた構造です。それぞれの層には役割があり、順番に処理して解析結果を出力します。
ディープラーニングは処理の層が多い(深い)ため、より複雑な処理や判断が可能です。またディープラーニングで機械学習を行ったAIは、他の手法を用いたAIに比べて、より高いパフォーマンスを発揮できるといわれています。
現代のAIにできることは多種多様です。
実際に、AIはどのようなシーンで活躍しているのでしょうか。以下では、現代のAIができることについて、4つを解説します。
画像認識とは、AIが画像を見て「どこに何があるのか」「何が写っているのか」を識別する技術です。
この技術を応用した事例には、以下のようなものがあります。
医療画像診断 | 認識対象:レントゲンやエコー、MRIなどの画像活用例:がんなどさまざまな病変の発見や状態の確認 |
---|---|
顔認証システム | 認識対象:カメラに映った人物の顔活用例:ドアやスマートフォンのロック解除、顔写真との照会 |
外観検査 | 認識対象:工場で検品する製品や部品の表面活用例:異物の付着や汚れ、傷や欠けなどの発見 |
物流管理 | 認識対象:段ボールの数量やラベルの表記、作業者の動き活用例:検品や仕分けなどの物流管理、動線の改善 |
在庫管理 | 認識対象:商品陳列棚の撮影画像活用例:在庫や欠品状況の判断 |
またAIによる画像認識技術は進歩し続けており、人物の状態・心理を表情や瞳孔などの手掛かりから判別したり、画像に移っている人物がどのような行動をしているのかを認識したりできる段階まで到達しています。
音声認識と自然言語処理は、組み合わせて使用されることが多い機能です。それぞれの機能は次のようなタスクを実行できます。
これらの技術を使った事例には、以下のようなものがあります。
音声アシスタント | 人間との対話、言葉での指示によるタスクの実行(スマートフォンのアプリ操作など) |
---|---|
翻訳ツール | 人間の言葉をテキストに変換し、翻訳して出力(会議や海外旅行中に交わされる会話の翻訳、動画の翻訳など) |
コールセンターの自動応答 | ユーザーの音声から問い合わせ内容を解析し、タスクを実行(テキストの作成や用意された返答など) |
議事録作成 | 会議や取材の録音データをテキストに変換し、議事録を作成 |
データ分析と予測では、AIが多くののデータの中から関係性や傾向を見つけて「これから起きること」を予測します。かつては「ベテランの勘」が頼りだった業務なども、現代ではAIの予測能力を使うことで、誰もが同じように判断できるようになりました。
AIによるデータ分析と予測は、以下のような場面で使われています。
需要予測 | 市場の動向や仕入れ状況といったデータを分析し、適切な生産タイミングや原材料の供給時期などを予測 |
---|---|
マーケティング分析 | 顧客情報やアクセス履歴など多種多様なデータを分析し、市場のニーズを予測 |
売上予測 | 過去の売上や市場、製品データから需要パターンを把握し、具体的な売上高などを予測 |
故障予測 | 工場の設備やOA機器の計測データなどを分析し、故障の発生を事前に予測 |
「生成AI」と呼ばれるAIは、学習したデータをベースとして、デジタルコンテンツなどを作れます。人間が入力するプロンプト(文章による指示)を工夫することで、出力結果の調整も可能です。
以下は生成AIが作れるものの一例です。
基本的に、AIの開発プロセスは以下のように行われます。
以下では、これらのプロセスを一つずつ解説します。
AIを開発する際は、機械学習に使用する「データの収集」と「前処理」が必要です。
AIの開発は、データ収集と前処理が、全体工数の7~8割を占めるといわれています。時間と手間がかかる作業ですが、学習データの内容がAIの性能に直結するため、質・量ともに十分なデータを用意しましょう。
AIの学習には、それぞれの用途に応じた学習データが必要です。自社の保有データはもちろん、公的機関の公開データ、Webスクレイピング(Webサイトにアクセスし、大量のデータを自動的に抽出する技術)で抽出したデータの利用も効果的です。
収集したデータは、以下の3つに分類しておきます。
訓練データ | AIが特徴やパターンなどを学ぶためのデータ |
---|---|
検証データ | 学習中のAIの性能を評価するためのデータ |
テストデータ | 学習を終えたAIの最終チェックをするためのデータ |
収集したデータは、そのまま機械学習に使えるわけではありません。ほとんどのデータは情報が足りない、エラーがある、形式が異なるなどの問題があるからです。データの前処理とは、AIが機械学習で使えるように、収集したデータを加工することです。
前処理は以下のような流れで行われます。
データクレンジング | 不足している値や異常値の補完、修正、削除などを行う |
---|---|
データの統合 | スケーリング(データの値を特定の範囲に変換)エンコーディング(テキストを数値データに変換)次元削減(データが持つ特徴の数を減らす)特徴選択(AIの目的と関連が強い特徴を選択する) |
データの変換 | 正規化(データの範囲や基準を一定の枠内に整える)汎化(データをさまざまな分野に応用できるようにする) |
データの水増し | 個々のデータをさまざまな方法で変換し、総量を増やす(例)画像データ:回転、拡大・縮小など |
データの収集と前処理が終わったら、AIがどのように学習していくのかを決めます。この過程が「モデルの設計」です
モデルの設計が終了したら、実際の「学習プロセス」に入っていきます。
モデルの設計は次の手順で行います。
アルゴリズムの選択 | AIの目的や用途に応じてアルゴリズムを選択する(例)画像認識:畳み込みニューラルネットワーク(CNN)音声認識と自然言語処理:回帰型ニューラルネットワーク(RNN)データ分析と予測:線形回帰コンテンツ生成:敵対的生成ネットワーク (GAN) |
---|---|
ハイパーパラメータの設定 | アルゴリズムの細かい設定をする(例)バッチサイズ(AIに一度に与えるデータ量)エポック数(学習のデータセットを繰り返す回数)イテレーション数(1エポックの間に学習する回数) |
評価指標 | モデルの精度を評価する指標を設定する(例)適合率再現率F1スコア(適合率と再現率をまとめて評価するための指標) |
概念実証(PoC) | 設計したAIモデルの効果や実現の可能性を検証する |
モデルの設計が終わったら、前述した学習方法とアルゴリズムを用いて、学習プロセスを進めます。
学習プロセスは「答え合わせ→正解を出力できるようパラメータを調整」の流れを繰り返します。以下は画像認識AIの例です。
学習 | 一例 |
---|---|
事前に収集・前処理をした「訓練データ」をAIに与える | AIに犬の画像を与える |
AIが出力した答えと正解の誤差に対し、パラメータの調整を行う | AIが出力した「猫」という回答に対し「犬」と答えられるように調整する |
AIが出力した「猫」という回答に対し「犬」と答えられるように調整する
学習が終わったAIには、きちんと動き、期待通りの性能を持っているのかを確認するための検証を行います。動作に関する問題の有無を確認する他、実務におけるオペレーションのチェックも必要です。
検証後はAIにファインチューニングを施し、特定のニーズに合うようカスタマイズします。
検証とは「データの収集と前処理」で用意したテストデータを用いて、精度や汎化性能(※)などを評価することです。なお汎化性能とは、初めて見たデータに対して、正確な予測や対応をする能力を指します。
検証のステップは以下の通りです。
ファインチューニングは、学習プロセスを終えたAIに「追加学習」をさせることです。具体的には、用途やニーズに応じた特定のデータを使って学習させ、AIを調整します。
基本的にファインチューニングでの学習方法も、機械学習と同じ「答え合わせ→正解を出力できるようパラメータを調整」の繰り返しです。
これにより、AIは目的の言語や業界、タスクなどに特化し、より精度の高い回答を出力できるようになります。特に、専門性が高いジャンルや特殊なタスクの場合、ファインチューニングはとても効果的です。
前述の通り、AIは学習を積むことで、画像や音声の認識、データ生成などのタスクが可能になります。しかし、学習すれば何でもできるわけではありません。
以下では、AIには苦手とされている3点を解説します。
クリエイティブな発想とは、直感のひらめきや経験から生まれる、全く新しいアイデアを指します。人間が行う楽曲や小説、絵画などの創作活動は、このクリエイティブな発想によるものです。
一方で、既存のデータを基に学習を積むAIは「新しいものを生み出す」のが苦手です。
AIも文章や絵を生成できます。しかし、その出力結果はAIが過去のデータを組み合わせて生成したものであり、厳密にいえばクリエイティブな発想の産物ではありません。
AIの判断や決定は、全て学習プロセスで覚えたデータに基づいています。そこに道徳観や倫理観といった人間の意思決定に加味されるような要素は含まれません。
もし学習データの中に、偏見や差別などを含んだものがあったとしても、AIはそのまま学んでしまいます。AIが倫理に反する判断をしないよう、人間が学習データを検討し、問題のある要因を修正していくことが大切です。
またAIには感情もありません。生成AIが、喜んだり、ユーザーを慰めたりするような回答を出力しても、それは学習したデータに基づく反応に過ぎません。
心を込めた行動や気配りが必要な場面での対応は、現状AIにとって代わることのできない領域といえるでしょう。
AIは曖昧な状況で判断をするのが苦手です。
「だいたい」「これくらい」など明確な答えがない言葉や「あれ」「これ」などの指示語は、AIにとって理解が難しいです。またAIはデータを分析して「合理的か否か」で判断するため、合理的ではない答えを出すのも苦手とされています。
そもそも、AIは大量のデータを学習し、その蓄積から判断や選択をします。従って、学習データが少ないイレギュラー対応や、パーソナライズな判断も不得意といえるでしょう。
開発したAIは、ただ動かせばよいというわけではありません。ポイントを踏まえた、効果的な活用が大切です。
以下では、AIを効果的に活用するポイントとして、次の3点について解説していきます。
AIを効果的に活用するためには、導入段階で明確な目標を定めるとともに、期待値を調整しておくことが肝心です。
AIを導入する際は、明確で分かりやすい目標の設定が大切です。「AIで何とかしたい」といった曖昧なものではなく「AIで何をどうしたいのか」が客観的に分かるように設定しましょう。
例えば、「業務効率化を図りたい」なら、誰の担当業務をどのように効率化するのかを明確にした上で、AIに何をさせられるのか考えていきます。以下はその一例です。
目標設定が曖昧だと、AIの導入そのものが目的になったり、用途を不必要な範囲にまで広げたりしがちです。すると導入の過程で問題が発生しても、リカバリーが困難な段階に進むまで気付けない可能性もあります。
期待値とは「一回の行動や選択によって確率的に得られる結果の平均値」を指します。実際の結果が期待値より大きければ満足、小さければ期待外れです。
AIの導入における期待値は「AIがどのようなことをしてくれるのか」という関係者の期待感に置き換えられます。個人の業務を効率化するためのAI導入なら、期待値を「残業ゼロ」とする人もいれば「50%削減できればよい」「30%なら上出来」などと考える人もいるでしょう。
しかし、以下の表のように期待値がバラバラの状態でAIの導入が進むと、期待外れ=失敗と捉える人が出てしまいます。
期待値 | AIの能力 | 状態 |
---|---|---|
残業ゼロ | 30%削減 | 過度な期待を抱いている |
50%削減 | AIの能力と期待値のミスマッチ | |
30%削減 | AIの能力と期待値がつり合っている |
そのためAI導入の際は、関係者にAIの能力を説明し、過度な期待やミスマッチを調整する必要があります。
前述した通り、AIは機械学習を経ることで、それぞれの用途に応じたタスクをこなせるようになります。AIの能力は、機械学習の際に使った学習データに左右されるため、高品質なデータを数多く収集するのが肝心です。
質の良いデータと判断される基準の一つに「特徴量」があります。特徴量とは、データに含まれる特徴や特性を数値化したものです。
正確で特徴量が多い学習データは、AIの精度を高めます。一方で、特徴量の精度が低いデータで学習したAIは、タスク処理の精度が上がらず、利用価値が低くなってしまうこともありえます。
また繰り返しになりますが、AIを導入するだけで終わらせることなく、質の高いデータを用いて、継続的に学習を続けさせることも、有効に活用するポイントです。
AIを導入する際は、かかるコストと得られる効果のバランスを考慮する必要があります。思ったような成果を得られず、導入費用が無駄になったと感じることのないよう、しっかりと精査しましょう。
よく使われるコストと効果のバランスを示す指標には「費用対効果」や「ROI(Return On Investment;投資収益率)」があります。それぞれの特徴は以下の通りです。
計算方法 | 指標 | 判断基準 | |
費用対効果 | 効果 − 費用 | 金額で表す | 数字が大きいほど「収益性が高い」と判断できる |
ROI(投資収益率) | 利益 ÷ 費用 × 100 | 利益率で表す |
コストに対する効果が見込めない場合は、必要経費や生産性の見直し、導入の再検討などを行います。
本記事では、AIにできることと苦手なこと、開発プロセスや活用のためのポイントなどを解説しました。
AIは、機械学習やディープラーニングを通して大量のデータを学ぶことで、複雑なタスクをこなせるようになります。ただし、AIは決して万能ではなく、得意な分野と苦手な分野があります。そのような特性を踏まえて適切に活用できれば、人間の能力や企業の業務負荷をAIが補完し、さまざまな課題解決に役立ってくれるでしょう。
amie AIチャットボットは、ユーザーの悩みに寄り添うこと、欲しい情報の選択を手助けすることを本質として開発されました。正答率を追い求めるAIチャットボットが多い中、amieは「問題が解決できた回数」に重きを置いています。
amieは学習したデータをそのまま、回答候補として出力します。回答を自動生成しないため、事実とは異なる情報を出力することはありません。また複数の回答を提示するため、ユーザーはその中から自分の意志で選択できます。
その他にも、amieには以下の特徴があります。
社内のドキュメントやWebサイトから学習して回答するため、既存の資産を活用可能
視覚的に分かりやすいよう、回答候補をサムネイル化して出力
ファイル自体がPDF化されており、回答部分のダウンロードが可能
情報の正確性が高いチャットボットをお探しの際は、ぜひWebサイトをご覧ください。