部落格

打造智慧系統
設計系列

從 LLM 基礎到推論基礎設施——建構與部署生產級 AI 系統的實戰指南。

學習路線

閱讀路線圖

LLM Foundations

依照章節順序探索這 5 篇文章。你可以從第一篇開始，也可以直接跳到任何節點。

篇章

階段

從第一篇開始

章節

直接點擊任一章節即可跳轉閱讀。

5篇章

01Foundations
大型語言模型到底在做什麼
你在某個 AI 應用裡打了一段話，幾秒鐘後螢幕上跑出好幾段文字——流暢、有條理，讀起來像某個很懂的人寫的。這種事現在大家都習以為常了。但如果你打算在這些系統上面蓋東西，真正該理解的是：從你按下送出到那些文字出現，中間到底發生了什麼。
2026年3月21日
02Foundations
提示詞、上下文窗口，以及你如何與 LLM 對話
上一篇裡，我們丟了一句話給 LLM——「幫我規劃一趟赫爾辛基(Helsinki)之旅」——然後拿到一份細節滿滿的行程表：餐廳名、交通路線、一日遊安排。讀起來很順，看起來也合理，但好幾個細節事後被證實是錯的。模型沒壞，只是輸入沒給它什麼限制條件可以依循。
2026年3月21日
03Foundations
為什麼 LLM 需要幫助 — 幻覺、Grounding，以及系統設計的必要性
大型語言模型能產出流暢又自信的文字。而這份自信，正是問題所在。模型可以把一筆已經下架的房源、一個上一季才變動的稅率、一則三年前的學校評分，講得頭頭是道。它沒有任何機制去查核——本來就不是為查核設計的。它的工作是根據訓練資料預測下一個最合理的 token，而合理不等於正確。
2026年3月21日
04Foundations
AI 助理、AI Agent，以及兩者之間的一切
一個有用的 AI 系統，關鍵不在於它被稱為助理還是 Agent，而在於它對下一步擁有多少控制權。
2026年3月21日
05Foundations
AI 驅動的客戶支援 — 從聊天機器人到智慧型系統
客戶支援是很適合收束基礎概念的範例，因為一則訊息可能同時需要檢索、工具使用、記憶、路由和核准邊界。
2026年3月21日

閱讀路線圖

Building AI Systems

依照章節順序探索這 7 篇文章。你可以從第一篇開始，也可以直接跳到任何節點。

篇章

階段

從第一篇開始

章節

直接點擊任一章節即可跳轉閱讀。

7篇章

閱讀路線圖

Document & Multimodal Intelligence

依照章節順序探索這 3 篇文章。你可以從第一篇開始，也可以直接跳到任何節點。

篇章

階段

從第一篇開始

章節

直接點擊任一章節即可跳轉閱讀。

3篇章

閱讀路線圖

LLM Inference Infrastructure

依照章節順序探索這 6 篇文章。你可以從第一篇開始，也可以直接跳到任何節點。

篇章

階段

從第一篇開始

章節

直接點擊任一章節即可跳轉閱讀。

6篇章

打造智慧系統
設計系列

學習路線

LLM 基礎

打造 AI 系統

文件與多模態智慧

LLM 推論基礎設施

LLM Foundations

大型語言模型到底在做什麼

提示詞、上下文窗口，以及你如何與 LLM 對話

為什麼 LLM 需要幫助 — 幻覺、Grounding，以及系統設計的必要性

AI 助理、AI Agent，以及兩者之間的一切

AI 驅動的客戶支援 — 從聊天機器人到智慧型系統

Building AI Systems

從模型到複合式 AI 系統

可靠的 LLM 流程與控制邏輯

以 RAG 進行基礎化：AI 系統如何在回答之前檢索佐證

記憶、狀態與知識：別再把所有東西都叫做「記憶」

助理、工作流程與代理：為適當的自主層級而設計

實務中的代理迴圈：ReAct、工具與失敗模式

當 RAG 不夠用時：快取增強生成（CAG）、混合檢索與工作記憶

Document & Multimodal Intelligence

超越 OCR 的文件智慧（Document Intelligence）：版面分析、表格與證據重建

多模態證據系統：視覺語言模型（VLM）、圖像基礎化（Figure Grounding）與跨模態檢索（Cross-Modal Retrieval）

打造旅行 Copilot：端到端架構、核准閘門（Approval Gate）與稽核能力（Auditability）

LLM Inference Infrastructure

呼叫 API 之後發生了什麼事

連續批次處理：用一張 GPU 服務大量請求

分頁式 KV 快取：LLM 推論服務的 GPU 記憶體管理

預填充-解碼解耦：將推論的兩個階段分開

前綴感知路由：考量快取狀態的請求分配

MoE 分片：混合專家模型的平行化策略