- Published on
AWS 企業級 RAG 系統架構全覽 (2026 進階指南)
Table of Contents
如果你覺得 RAG (檢索增強生成) 就只是「把 PDF 切碎 變成向量存進資料庫 搜尋前三筆給大腦回答」,那你可能還停留在 2023 年。
到了 2026 年,企業級的 RAG 面臨的問題早就不只是「找不找得到資料」,而是**「資料長短不一怎麼辦?」、「圖表和表格文字解析錯位怎麼辦?」、「被向量搜尋出來的冷門名詞其實根本文不對題怎麼辦?」**
今天,我們要拋開玩具等級的 PoC (概念驗證),來看看在 AWS 上,如何建構一個真正能扛住刁鑽問題的「Advanced RAG (進階檢索增強生成)」架構。
The Advanced RAG Pipeline 佈局
要解決上述那些「找不到、找錯、答非所問」的問題,現在的 RAG 架構會在這三個階段重兵看守:資料攝取 (Ingestion)、檢索路由 (Retrieval Routing),以及生成與驗證 (Generation & Evaluation)。
圖說:2026 AWS 進階 RAG 企業級資料流
第一關:用 AWS Textract 洗刷「髒資料」
很多 RAG 系統回答得爛,根本不是 LLM 的問題,而是你餵給它的 PDF 文字早就黏在一起了。 在處理商業合約、財報這類充滿表格和雙欄排版的文件時,你可以使用 Amazon Textract。它能精準識別出「什麼是表格、什麼是段落標題」,再把這些結構化特徵當作 Metadata 打包。接著透過 AWS Glue 或是 SageMaker 的腳本,進行階層式切塊 (Hierarchical Chunking)。讓「大標題」掛在「小段落」的脖子上一起存進資料庫,這樣 LLM 檢索時就不會迷失上下文。
第二關:雙平台向量資料庫爭霸戰 (OpenSearch vs pgvector)
到了 2026 年,向量庫有兩個主流選擇:
- Amazon OpenSearch Service (Serverless):專業搜索引擎。 如果你有幾千萬筆資料,而且你需要「關鍵字 (BM25) + 向量語意 (Vector)」的混合檢索 (Hybrid Search),OpenSearch 是不二之選。
- Amazon Aurora PostgreSQL (pgvector):開發者最愛。 對大部分原本就用 Relational Database (RDB) 的企業來說,直接在 PostgreSQL 開啟 pgvector 擴充套件,是最省事的。所有商業邏輯和權限控管不用在兩個系統間來回同步。
第三關:檢索後處理 – Re-ranking 與 Contextual Compression
單純的向量距離最近,有機會只是「字面意思像」但「邏輯不相關」。進階作法是:我們讓資料庫先粗暴地撈出 20 筆相關資料,然後交給一個專門打分數的小模型 (Re-ranker),請它根據「使用者的問題」重新打分排序(通常在 Bedrock 上,用較小且快的 Nova 2 Lite 或 Cohere Rerank 來做)。只留下分數最高的前 5 筆,再丟給主模型 (Nova 2 Pro) 組合回答。這能大幅降低延遲並減少 LLM 的幻覺。
為什麼 RAG 會開始被 Agentic RAG 取代?
傳統的 RAG 是「單向道」(檢索 回答),但 Agentic RAG 賦予了模型「路由 (Routing) 與修正能力」。 當用戶問:「這季業績如何?對比去年呢?」
Agent 會自己判斷:這句話要拆成兩部分。第一部分我去查 RAG 向量庫抓這季報告;第二部分我去下 SQL 查資料庫的去年營收。然後大腦再把它組合。這才是 2026 年企業真正需要的智慧型檢索。
RAG 的照妖鏡:評估 (Evaluation) 特徵化
過去我們測試 RAG 能不能上線,都是工程師自己輸入五個問題,看模型有沒有亂講話。現在 Bedrock 已經內建了強大的 RAG Evaluation 機制。
它會把你現有 RAG 系統的結果餵給一個裁判模型 (LLM-as-a-judge),然後給出三個殘酷的分數:
- Context Relevance (關聯性):你資料庫撈出來的文章,到底跟問題有沒有關係?(檢驗向量庫好壞)
- Faithfulness (忠誠度):你的模型回答有沒有「憑空捏造」資料庫裡沒有的東西?(檢驗模型有沒有幻覺)
- Correctness (準確性):這通常需要你提供測試標準集 (Ground Truth),讓系統判斷答案對不對。
小結
當你的 RAG 架構變得如此龐大:文件解析、切塊、抓 Embeddings、存進 OpenSearch、再弄一個 Re-ranker... 你會發現,要維護這整套 Pipeline 簡直是維運工程師的夢魘。
AWS 當然聽到了大家的哀嚎。下一篇,我們將介紹 RAG 開發者的救星:Amazon Bedrock Knowledge Bases 以及 2025 年底剛推出的超級破壞者 Amazon S3 Vectors,看看 AWS 是怎麼讓這個複雜的架構變成「無腦一鍵部署」。