メニュー

ナレッジベースボットの原理

RAGとは何ですか?

ナレッジベ-スの一連の技術は、学術界でRAG (Retrieval-Augmented Generation) という専門用語で知られています。これは情報検索メカニズムとAIモデルを組み合わせた革新的な手法です。

RAGには「外付けナレッジベ-ス」という一般的な呼び方もあります。「外付け」とは、AIの大規模モデルとは分離されているという意味です。分離されていない場合は、モデルの微調整となり、それは別の話になります。

 

RAGの原理

RAGの原理は実にシンプルです。モデルが回答を生成する際、直接生成するのではなく、まず知識ベースを参照してから生成します。簡単に言えば、持ち込み可の試験(RAG)と持ち込み不可の試験(直接生成する)の違いです。

プロセス的には、ほとんどのRAGは以下の3ステップに分けられます:

  1. ナレッジベ-スの作成
    1. データ入力(ファイルのアップロード)
    2. データ処理(分割+ベクトル化)
    3. データ保存(ベクトルデータベースに保存)
  2. ナレッジベ-スの照会
    1. データ検索(ベクトル検索)
    2. データ処理(再ランク付け)
    3. データ出力(関連性の高いものを選択)
  3. AIが生成した回答

簡単に言えば、巨大なデータを多くの小さな断片に分割し、AIが質問応答を行う際に、関連性の高い断片を検索し、それらの断片の内容に基づいて回答を生成します。これにより、AIは大量のデータを処理する必要がなく、少量のデータだけで済むため、速度が向上し、コストが削減されます。

しかし、明らかな欠点もあります。それは文脈を無視した解釈です。AIは部分的なデータしか得られず、全体像を把握できないため、これはRAGの本質的な弱点です。

 

RAGの鍵

RAGの本質は文脈を無視した解釈なので、どのように分割し、どのように選択するかが回答の質を決定します。このプロセス全体において、AIの役割は実際には非常に小さいです。重要なのは第1ステップと第2ステップ、つまりデータ処理データ検索です

データ処理の鍵はスライスの方法にあります。302.AIは非常に豊富なスライス設定を提供しており、詳細はこの記事をご覧ください

データ検索の鍵は関連性の高い内容をいかに見つけるかです。302.AIは二重検索メカニズムを採用しており、まずベクトル検索で粗い検索を行い、次に再ランク付けアルゴリズム(rerank)で精密な検索を行い、最後に大規模モデルに出力することで、精度を大幅に向上させています。

 

GraphRAG

GraphRAGは、マイクロソフトが提案した新しいRAG技術です。その原理は、データ入力段階でデータ処理段階にAIによるグラフ化処理を行い、AIにデータを理解させ、データの意味的な関連性を確立することで、検索精度を大幅に向上させることです。

GraphRAGの本質は、既存のデータを基にAIが新しいデータを生成することです。この新しいデータは知識グラフの構築によって実現され、情報のより良い組織化と保存だけでなく、AI検索時により智能的にデータ間の関係を識別し推論することを可能にします。この方法は情報検索の正確性と効率を効果的に向上させ、複雑なクエリを処理する際のシステムのパフォーマンスを向上させます。さらに、GraphRAGのグラフ化処理は、データ内の隠れたパターンやトレンドを発見するのに役立ち、ユーザーにより深い洞察と意思決定支援を提供します。

GraphRAGにも欠点がないわけではありません。第一に、データ入力プロセスでAI処理が必要なため、コストがかかります。第二に、従来のRAGよりも遅くなります。なぜなら、グラフ検索のプロセスがより複雑になるからです。

302.AIは現在、GraphRAGのナレッジベ-ス接続とAPI接続を独占的に提供しており、コードはNano-GraphRAGをベースに開発され、よりライトウェイトになっています。

 

まとめ

ナレッジベ-スの原理は、AIが先に照会してから回答することです。そのため、関連性の高い断片をいかに検索するかがナレッジベ-スの最も核心的な部分となります。302.AIは従来のRAGとGraphRAGの2つのモードを提供しており、ニーズに応じて選択することができます。

前の
ナレッジベースボットの紹介
ナレッジベースボットの作成
最近変更された: 2024-09-19