wen aidev

Embedding 向量化費用計算機

一次比較 6 大廠商建庫成本 × 每月增量 × 12 個月 TCO

輸入文件總數與每月新增量,即時比較 OpenAI、Voyage、Cohere、Jina、Google、Mistral 2026 最新定價的 RAG 知識庫建庫費用,並對照 MTEB 品質分數,找出最划算方案。

用量設定
文件總數10,000
10025 萬50 萬
每篇平均字數800
1005,00010,000
文件語言(影響 token 換算)
每月新增比例5%
不更新50%全更新
計費模式
總 token ≈ 12,800,00012.8M)
每月新增 ≈ 640,000 tokens
顯示模型(點擊開關)
text-embedding-3-smallOpenAI
text-embedding-3-largeOpenAI
voyage-4-liteVoyage
voyage-4Voyage
embed-v4Cohere
embed-multilingual-v3Cohere
jina-embeddings-v3Jina
text-embedding-004Google
mistral-embedMistral
本次用量最划算方案
voyage-4-liteVoyage免費額度
免費額度剩 187M tokens
建庫(一次)
NT$0.00
每月增量
NT$0.42
/月
12 個月 TCO
NT$5
維度:512
MTEB:64
單價:$0.02/1M
  • 建庫(一次)NT$0.00
    月增量NT$0.42/月
    12M TCONT$5
    向量維度512
    API 單價$0.02/1M
    免費額度200M tokens
  • 建庫(一次)NT$8
    月增量NT$0.42/月
    12M TCONT$13
    向量維度1,536
    API 單價$0.02/1M
  • 建庫(一次)NT$8
    月增量NT$0.42/月
    12M TCONT$13
    向量維度1,024
    API 單價$0.02/1M
  • 建庫(一次)NT$0.00
    月增量NT$1/月
    12M TCONT$15
    向量維度1,024
    API 單價$0.06/1M
    免費額度200M tokens
  • 建庫(一次)NT$42
    月增量NT$2/月
    12M TCONT$67
    向量維度1,024
    API 單價$0.1/1M
  • 建庫(一次)NT$42
    月增量NT$2/月
    12M TCONT$67
    向量維度768
    API 單價$0.1/1M
  • 建庫(一次)NT$42
    月增量NT$2/月
    12M TCONT$67
    向量維度1,024
    API 單價$0.1/1M
  • 建庫(一次)NT$50
    月增量NT$2/月
    12M TCONT$80
    向量維度1,536
    API 單價$0.12/1M
  • 建庫(一次)NT$54
    月增量NT$3/月
    12M TCONT$87
    向量維度3,072
    API 單價$0.13/1M
12 個月累積費用趨勢
👆 點擊放大圖表
匯率 1 USD = 32.5 TWD(參考值)。 定價來源:各家官網 2026-06。MTEB 分數為 April 2026 榜單近似值, 僅供參考,實際分數依語言與任務有差異。Voyage 200M 免費額度每帳號一次。

什麼是 Embedding 向量化費用?一句話定義

Embedding 費用是把你的文件(文字)送進 API 轉成數值向量的費用,通常按「每百萬 token(1M tokens)」計費。在 RAG 知識庫場景,這筆費用分兩塊:一次性建庫費用(把全部文件向量化)與每月增量費用(新增或更新的文件持續向量化)。

Embedding 費用怎麼算?文件數 × 字數 × token 單價公式

計算公式很直觀:

總 token = 文件總數 × 每篇平均字數 × 每字 token 係數
建庫費用 = 總 token / 1,000,000 × 模型單價(USD/1M)× 匯率(TWD)

• 中文:每字 ≈ 1.6 token
• 英文:每字 ≈ 0.75 token

例如:10,000 篇文件 × 每篇 800 中文字 × 1.6 token/字 = 1,280 萬 tokens。 用 text-embedding-3-small($0.02/1M)建庫費用 ≈ NT$8.3,非常便宜。

OpenAI / Voyage / Cohere / Jina / Google / Mistral 價格比較(2026)

以下為 2026 年 6 月各家官網現役模型定價,按每百萬 token 由低到高排序:

模型廠商USD/1MBatch 折扣維度MTEB 約分免費額度
text-embedding-3-smallOpenAI$0.02-50%1,53662.3
voyage-4-liteVoyage$0.02-33%51264.0200M tokens
jina-embeddings-v3Jina$0.021,02464.5
voyage-4Voyage$0.06-33%1,02465.5200M tokens
cohere embed-multilingual-v3Cohere$0.10-33%1,02464.0
text-embedding-004Google$0.1076863.0Gemini 免費層
mistral-embedMistral$0.101,02458.0
cohere embed-v4Cohere$0.12-33%1,53665.2
text-embedding-3-largeOpenAI$0.13-50%3,07264.6

一次性建庫費用 vs 每月增量成本:RAG 建庫費用怎麼拆

多數 RAG 專案的費用拆解是:初始建庫(一次性)約佔前幾個月費用的 80%,之後每月只需為新增/修改的文件重新 Embedding。月增量比例(預設 5%)代表每月有 5% 的文件需要更新向量,一般企業知識庫在這個範圍很正常。

Batch API 折扣與 200M 免費額度:怎麼把 embedding 費用壓更低

Voyage 200M 免費額度:每個帳號首 200M tokens 完全免費,以中文文件計,相當於前 12.5 萬篇 800 字文件免費向量化,中小型知識庫初始建庫可能完全不用付費。

OpenAI Batch API -50%:把建庫任務用 Batch 方式提交,費用砍半。代價是非同步,最長 24 小時才完成,對「離線一次性建庫」完全沒影響。

MTEB 品質分數對照:費用最低不一定最划算

MTEB(Massive Text Embedding Benchmark)是學術界最常用的 embedding 綜合評分,分數高代表語意搜尋精度更好。費用便宜(如 $0.02/1M)的模型 MTEB 分數普遍在 62–64,中高階模型($0.06–0.12)則在 64–66 左右。對多數繁體中文 RAG 場景,text-embedding-3-small 或 voyage-4-lite 的分數已足夠好,除非你的場景需要精準法律/醫療語意搜尋才建議升級。

什麼時候自架開源模型比 API 便宜?

當每月增量 token 超過約 1,200 萬以上(約 75 萬篇 1,000 字中文文件),API 計費開始累積,自架開源模型(如 BGE-M3、GTE-large)的固定 VPS 月費(約 NT$1,300–2,600)可能比 API 更划算。本工具的「12 個月 TCO」圖表可以直接看到長期趨勢。

常見問題 FAQ

Embedding 費用通常佔 RAG 總成本的多少?

通常很小。Embedding 是一次性把文件向量化的費用,多數 RAG 的長期成本由「每次查詢的 LLM 回答」與「向量資料庫託管」主導。以本工具實算,1 萬篇文件用 text-embedding-3-small 建庫往往只要幾十元台幣;真正會持續燒錢的是 LLM 生成與 vector DB,建議三者一起估。

OpenAI、Voyage、Cohere、Jina 哪家 embedding 最便宜?

以 2026 年 6 月官網定價,最低價一檔落在 voyage-4-lite、jina-embeddings-v3、text-embedding-3-small(約 $0.02 / 1M tokens)。但 Voyage 提供 200M 免費額度(相當於前 200 萬篇中文文件免費)、Cohere embed-v4 品質分數較高。最划算與否取決於你的文件量與對品質的要求,直接在計算機輸入你的數字最準。

中文文件的 embedding token 怎麼算?

中文一個字約等於 1.5~1.6 個 token(比英文耗 token),英文一個單詞約 0.75~1 個 token。本工具讓你選語言後自動換算:文件總數 × 每篇平均字數 × 每字 token 係數 = 總 token,再乘以各模型每百萬 token 單價得到建庫費用。

初始建庫和每月維護費用哪個高?

初始建庫是一次性大筆、每月增量是小額持續。除非你每月新增的文件量極大(例如每月新增超過初始庫的 8~10%),否則 12 個月內初始建庫成本通常仍高於累積的增量成本。本工具的「12 個月 TCO」分頁會用折線圖畫出兩者的長期趨勢,一眼看懂持有成本。

Batch API 折扣可以省多少 embedding 費用?

OpenAI Batch API 約 5 折、Voyage / Cohere 的 batch 約打 67 折(省 33%),代價是非即時(最長數小時~12 小時才回結果)。對「一次性大量建庫」這種不趕時間的場景非常划算;對「使用者即時查詢」則不適用。本工具的計費模式切換可直接看到折扣後數字。

延伸閱讀

相關工具

想把這件事真正落地?

這個工具幫你估算了方向。若你需要 RAG 知識庫建置 的實際導入、開發與整合, wen aidev 提供從評估、開發到上線的一條龍協作。

☕ 這個工具完全免費。覺得好用的話,歡迎支持我持續維護與更新。

贊助支持