CVS テクノロジー — ハイブリッド RAG、5つの並列リトリーバー、RRF 統合と棄権

取り込み

5段階の取り込みパイプラインが、1つの文書を検索可能なエビデンスに変えます。

CVS は、お客様の知識がすでに存在する場所 — SharePoint、Google Drive、Confluence、S3、オンプレミスのファイルサーバー — に直接接続し、トリプル OCR とビジョンによってあらゆる形式を解析いたします：PDF、スキャン文書、DOCX、PPTX、XLSX、画像。表、図、ページアンカーは解析後も損なわれずに保持されるため、元のエビデンスは後から言い換えられることなく、そのまま返却できます。

スマートチャンキングは、固定幅での盲目的な分割ではなく、意味的に一貫した断片を生成いたします。各チャンクはエンティティ、メタデータ、文書の差分、時間軸の事実で拡充され、複数レイヤーのインデックスに同時に書き込まれます：意味的想起のための pgvector ストア、厳密な用語のための BM25F 全文インデックス、関係性のための Neo4j 時間軸ナレッジグラフ、加えてメタデータと時間軸のインデックス。1回の処理で、5つの検索面を構築いたします。

SharePoint、Google Drive、Confluence、S3、ローカルファイル共有向けのコネクター — コピー＆ペーストによる移行は不要
PDF、スキャン PDF、DOCX、PPTX、XLSX、画像にわたるトリプル OCR とビジョン拡充
表、図、ページアンカーを第一級のエビデンスとして保持するセマンティックチャンキング
pgvector、BM25F、Neo4j 時間軸ナレッジグラフ、メタデータ、時間軸ストアへの複数レイヤーインデックス化

**5段階の取り込みパイプラインが、1つの文書を検索可能なエビデンスに変えます。.** CVS は、お客様の知識がすでに存在する場所 — SharePoint、Google Drive、Confluence、S3、オンプレミスのファイルサーバー — に直接接続し、トリプル OCR とビジョンによってあらゆる形式を解析いたします：PDF、スキャン文書、DOCX、PPTX、XLSX、画像。表、図、ページアンカーは解析後も損なわれずに保持されるため、元のエビデンスは後から言い換えられることなく、そのまま返却できます。

ルーティング

インテントルーターが、各クエリを回答可能な最も低コストな経路へ送ります。

すべての質問が完全な推論実行を必要とするわけではありません。中央のインテントルーターが各クエリを分類し、4つのレーンのいずれかへ振り分けます：即時かつゼロトークンのキャッシュヒット、標準的な高速ハイブリッド検索、複数文書の深層合成、または質問を有向非巡回グラフ（DAG）のサブクエリへ分解するウルトラ推論経路です。

このトークン節約型のカスケードにより、単純な質問が高価な LLM を起動させることはなく、真に困難な複数文書の質問には完全な分解処理が適用されます。その結果、予測可能なレイテンシ、予測可能なコスト、そしてクエリごとのトークンの想定外がなくなります — カスケードだけで、ナイーブな RAG と比較して LLM コストを85〜95%削減いたします。

インスタントレーン：繰り返しの質問や簡単に回答できる質問のためのゼロトークンキャッシュ
スタンダードレーン：日常的な質問の大多数に対応する高速ハイブリッド検索
ディープレーン：1つの情報源では不十分な場合の複数文書合成
ウルトラレーン：複雑な質問を監査可能なサブステップへ分解する分解 DAG

**インテントルーターが、各クエリを回答可能な最も低コストな経路へ送ります。.** すべての質問が完全な推論実行を必要とするわけではありません。中央のインテントルーターが各クエリを分類し、4つのレーンのいずれかへ振り分けます：即時かつゼロトークンのキャッシュヒット、標準的な高速ハイブリッド検索、複数文書の深層合成、または質問を有向非巡回グラフ（DAG）のサブクエリへ分解するウルトラ推論経路です。

検索

5つの並列リトリーバー、RRF で統合、クロスエンコーダーでリランキング。

CVS は5つのリトリーバーを同時に実行いたします — ベクトル検索、ナレッジグラフ探索、BM25F 全文検索、時間軸検索、メタデータフィルタリング。それぞれがコーパスを異なる視点で捉えるため、異なるエビデンスを捕捉いたします：意味、関係性、厳密な用語、時間的有効性、構造化された属性。単一のリトリーバーが完璧である必要はありません。

それぞれのランク付けされた出力は Reciprocal Rank Fusion（k=60）で統合され、その後クロスエンコーダーが統合済みの候補をリランキングして、回答ビルダーのための厳選されたエビデンスセットを構成いたします。これが、CVS が、基本的な RAG や Copilot のような単一リトリーバーシステムで典型的な67〜73%に対し、94.7%の回答精度を達成する理由です。

ベクトル（pgvector）+ Neo4j ナレッジグラフ + BM25F + 時間軸 + メタデータを、すべて並列で実行
Reciprocal Rank Fusion（k=60）が5つの独立したランキングを1つのコンセンサスに統合
クロスエンコーダーリランキングが、回答生成の前に最終的なエビデンスセットを精緻化
単一リトリーバーシステムの67〜73%に対し、94.7%の回答精度

**5つの並列リトリーバー、RRF で統合、クロスエンコーダーでリランキング。.** CVS は5つのリトリーバーを同時に実行いたします — ベクトル検索、ナレッジグラフ探索、BM25F 全文検索、時間軸検索、メタデータフィルタリング。それぞれがコーパスを異なる視点で捉えるため、異なるエビデンスを捕捉いたします：意味、関係性、厳密な用語、時間的有効性、構造化された属性。単一のリトリーバーが完璧である必要はありません。

棄権

アドバーサリアル棄権：システムは、自らが知らないときを知っています。

検索の後、CVS は回答する前に1つの問いを立てます：エビデンスは十分か。十分であれば、インライン出典付きで回答し、改ざん検知可能な監査ログにそのやり取りを記録いたします。十分でなければ、もっともらしく聞こえる回答を捏造するのではなく、率直に棄権いたします — これこそが、ほとんどのエンタープライズ RAG の試験導入を失敗させる単一の挙動を回避する振る舞いです。

棄権は行き止まりではありません。未回答の質問は指定された分野の専門家へルーティングされ、その検証済みの回答が取り込まれ、ナレッジベースがパッチされて、次の人は即座に回答を得られます。本番環境では、これにより通常の RAG のおよそ19%に対し、ハルシネーション率を2%未満まで抑えます。

信頼度ゲートが、回答が生成される前にエビデンスの十分性を評価
十分なエビデンス → 出典付き回答に加え、完全な監査ログエントリー
不十分なエビデンス → 明確な棄権、その後エキスパートへのエスカレーション
取り込まれたエキスパートの回答がベースをパッチ — 通常の RAG の約19%に対し、ハルシネーション率2%未満

**アドバーサリアル棄権：システムは、自らが知らないときを知っています。.** 検索の後、CVS は回答する前に1つの問いを立てます：エビデンスは十分か。十分であれば、インライン出典付きで回答し、改ざん検知可能な監査ログにそのやり取りを記録いたします。十分でなければ、もっともらしく聞こえる回答を捏造するのではなく、率直に棄権いたします — これこそが、ほとんどのエンタープライズ RAG の試験導入を失敗させる単一の挙動を回避する振る舞いです。

文書が、検証済みで出典付きの回答になるまで。

5段階の取り込みパイプラインが、1つの文書を検索可能なエビデンスに変えます。

インテントルーターが、各クエリを回答可能な最も低コストな経路へ送ります。

5つの並列リトリーバー、RRF で統合、クロスエンコーダーでリランキング。

アドバーサリアル棄権：システムは、自らが知らないときを知っています。

お客様の最も難しい質問で CVS をお試しください。