CVS は、自信に満ちた誤った回答を許容できない企業のために構築されたハイブリッド RAG エンジンです。取り込み、ルーティング、検索、棄権 — すべての段階が、信頼するしかない文章ではなく、監査可能なエビデンスを生み出すように設計されています。
CVS は、お客様の知識がすでに存在する場所 — SharePoint、Google Drive、Confluence、S3、オンプレミスのファイルサーバー — に直接接続し、トリプル OCR とビジョンによってあらゆる形式を解析いたします:PDF、スキャン文書、DOCX、PPTX、XLSX、画像。表、図、ページアンカーは解析後も損なわれずに保持されるため、元のエビデンスは後から言い換えられることなく、そのまま返却できます。
スマートチャンキングは、固定幅での盲目的な分割ではなく、意味的に一貫した断片を生成いたします。各チャンクはエンティティ、メタデータ、文書の差分、時間軸の事実で拡充され、複数レイヤーのインデックスに同時に書き込まれます:意味的想起のための pgvector ストア、厳密な用語のための BM25F 全文インデックス、関係性のための Neo4j 時間軸ナレッジグラフ、加えてメタデータと時間軸のインデックス。1回の処理で、5つの検索面を構築いたします。
すべての質問が完全な推論実行を必要とするわけではありません。中央のインテントルーターが各クエリを分類し、4つのレーンのいずれかへ振り分けます:即時かつゼロトークンのキャッシュヒット、標準的な高速ハイブリッド検索、複数文書の深層合成、または質問を有向非巡回グラフ(DAG)のサブクエリへ分解するウルトラ推論経路です。
このトークン節約型のカスケードにより、単純な質問が高価な LLM を起動させることはなく、真に困難な複数文書の質問には完全な分解処理が適用されます。その結果、予測可能なレイテンシ、予測可能なコスト、そしてクエリごとのトークンの想定外がなくなります — カスケードだけで、ナイーブな RAG と比較して LLM コストを85〜95%削減いたします。
CVS は5つのリトリーバーを同時に実行いたします — ベクトル検索、ナレッジグラフ探索、BM25F 全文検索、時間軸検索、メタデータフィルタリング。それぞれがコーパスを異なる視点で捉えるため、異なるエビデンスを捕捉いたします:意味、関係性、厳密な用語、時間的有効性、構造化された属性。単一のリトリーバーが完璧である必要はありません。
それぞれのランク付けされた出力は Reciprocal Rank Fusion(k=60)で統合され、その後クロスエンコーダーが統合済みの候補をリランキングして、回答ビルダーのための厳選されたエビデンスセットを構成いたします。これが、CVS が、基本的な RAG や Copilot のような単一リトリーバーシステムで典型的な67〜73%に対し、94.7%の回答精度を達成する理由です。
検索の後、CVS は回答する前に1つの問いを立てます:エビデンスは十分か。十分であれば、インライン出典付きで回答し、改ざん検知可能な監査ログにそのやり取りを記録いたします。十分でなければ、もっともらしく聞こえる回答を捏造するのではなく、率直に棄権いたします — これこそが、ほとんどのエンタープライズ RAG の試験導入を失敗させる単一の挙動を回避する振る舞いです。
棄権は行き止まりではありません。未回答の質問は指定された分野の専門家へルーティングされ、その検証済みの回答が取り込まれ、ナレッジベースがパッチされて、次の人は即座に回答を得られます。本番環境では、これにより通常の RAG のおよそ19%に対し、ハルシネーション率を2%未満まで抑えます。
最も難解な仕様書、または最も頻繁にエスカレーションされるクエリをお持ちください。エンドツーエンドでエビデンスの経路を、そしてベースが知らない場合に何が起こるかを正確にお見せいたします。