- Published on
Amazon Knowledge Bases 深度實戰:結合 S3 Vectors 重塑檢索架構
上一篇文章我們看到,要打造一個能扛住真實商業挑戰的「進階 RAG」架構,需要串接一堆服務:Textract 拆解檔案、Glue 切塊整理、還要在 OpenSearch 建立向量資料庫...。對 DevOps 工程師來說,維護這些 Pipeline 的日常就是:跑版報錯、資料庫 OOM、或是被向量庫的超高月費帳單嚇到。
到了 2026 年,AWS 送給開發者兩份解決這場惡夢的禮物:Amazon Bedrock Knowledge Bases (全託管知識庫),以及讓窮開發者也能玩得起向量檢索的 Amazon S3 Vectors。
什麼是 Amazon Bedrock Knowledge Bases?
講白了,它就是把上一篇文章提到的那套「資料獲取 切塊 轉向量 存檔 檢索 API」全部幫你包成一個黑盒子服務。
過去你要寫幾百行 Python 腳本掛在 Lambda 上每天定時跑;現在,你只需要把 PDF、Word、Excel(甚至 2025 年底支援的圖片等多模態資料)丟進一個 AWS S3 Bucket。
接著,只要在 AWS Console 上點幾下滑鼠:
- 指定來源 S3 Bucket。
- 選擇你要的 Embeddings 模型(例如 Titan Text Embeddings)。
- 選擇你的向量庫 (Vector Store)。
然後按下 **Sync (同步)**按鈕,AWS 就會在背景幫你把剩下的髒活全部處理完。當用戶來問問題時,你直接呼叫 API 就可以拿到精準的相關段落,不需要再理會「切幾塊才合理」、「餘弦相似度演算法怎麼算」這類頭痛問題。
S3 Vectors:破壞市場規則的窮人核武
我們剛剛提到「在前端點選你的向量庫」。在以前,選項不外乎是 OpenSearch Serverless、Pinecone 先行者或是 RDS PostgreSQL (pgvector)。
在企業級部署中,這些專業向量庫的月租費往往是幾百美金起跳,而且不論你那天空不空閒,機器開著就是要收錢。
但在 2025 年底 re:Invent 大會上,AWS 丟出了一個震撼彈:Amazon S3 Vectors。
圖說:S3 Vectors 將昂貴的向量資料庫變成隨付隨用的物件儲存層機制
S3 一直是「冷儲存雲端硬碟」的代名詞,便宜又耐用。現在,AWS 直接把**「原生向量索引 (Native Vector Indexing)」**的功能內建到了 S3 裡面!
這代表什麼? 這代表你不需要再開一台專門的「向量資料庫伺服器」!你可以把幾萬筆 Embedding 矩陣直接像是存圖片一樣放在 S3 向量桶 (Vector Buckets) 中,S3 會自己在後台幫你建好 HNSW 索引。 當 Knowledge Bases 去檢索時,幾乎是標準 S3 取決的成本,能省下接近 80% 到 90% 的向量庫維運費用。
這對於中小型專案、或是極少變動的靜態知識庫來說,絕對是第一首選。
🚧 決策時間:什麼時候還是得用 OpenSearch?
雖然 S3 Vectors 便宜到不可思議,但它還是有極限的。如果你的系統要求: 1. 極致的毫秒級延遲 (Sub-millisecond Latency)。 2. 需要把「內文搜尋 (BM25 Keywords)」和「向量搜尋功能 (Vector Search)」做高強度的混合檢索 (Hybrid Search)。 3. 你的知識庫文件每秒都在瘋狂更新。 那這時候,專業的 Amazon OpenSearch Managed Cluster 仍然是企業最好的防守線。
GraphRAG 與未來的可能性
有趣的是,AWS 並沒有止步於此。我們在 2026 前半年的趨勢中看到,如果資料之間彼此有複雜的人事時地網狀關聯(例如偵查辦案記錄、供應鏈上下游關係),單純的向量距離就不夠用了。
為此,Bedrock Knowledge Bases 現在更可結合 Amazon Neptune Analytics。系統會在背景幫你把文件的實體 (Entity) 抽出來變成一張「知識圖譜」,當你在查詢時,這就是最先進的 GraphRAG。
為什麼需要升級?
你發現了嗎?我們談的 RAG,越往後越強調 AI 自己有能力把資訊關聯與決策。 那如果我們讓這些 AI 去呼叫公司的內部系統,或是主動發信提醒負責人呢?
這就是我們最後一塊拼圖:下一篇,也將是本系列的壓軸(Bonus 篇章),我們將探討 AWS Agentic RAG 與未來的主流——多智能體協作 (Multi-Agent Workflows)!