跳到主要內容

Personal Blog · 個人部落格

記錄思考,
沉澱知識。

這裡是我的數位花園,寫技術筆記、讀書心得,還有生活裡值得記錄的事。

21 篇文章
4 個分類
21 篇
最新 DevOps 與環境

跨儲存庫自動化:用 GitHub Actions 將 A 專案部署到 B 專案的 GitHub Pages (綁定自訂網域)

手把手教你如何使用 GitHub Actions 將 A 儲存庫的靜態網頁自動部署到 B 儲存庫的 GitHub Pages,並綁定 example.com 自訂網域。

#GitHub#GitHub Actions#GitHub Pages#CI/CD#DevOps
閱讀全文
程式語言

Pydantic 入門:用型別註解打造 Python 的執行期資料驗證

從 Java/JavaScript 開發者的視角理解 Pydantic,涵蓋核心概念、常用功能,以及它為何成為 FastAPI 與 LLM structured output 的基石。

#Python#Pydantic#FastAPI#LLM
程式語言

從全域污染到 import:CommonJS 與 ESM 的由來、差別與未來

為什麼 Node 用 require,瀏覽器卻用 import?為什麼有些套件叫 .mjs,有些叫 .cjs?這些混亂的根源,是 JavaScript 模組系統一段橫跨十幾年的演進史。本文從沒有模組的年代講起,用實際程式碼對照 CommonJS 與 ESM 的差別,再說清楚為什麼 ESM 是未來。

#JavaScript#CommonJS#ESM#ES Modules#Node.js#模組系統
AI 原理與協定

不同專家處理,怎麼還拼得出通順的句子?拆解 MoE 的真正運作

MoE 把一句話分給不同專家處理,那拼回來怎麼還會通順?這其實是個誤會——根本沒有「拼句子」這一步。本文用最白話的方式講清楚 MoE 怎麼把字一個一個吐出來,順帶戳破「MoE 一定比較快」這個被簡化過頭的說法。

#LLM#MoE#Transformer#模型架構#推理
AI 原理與協定

ReAct:讓語言模型邊想邊做,而不是閉著眼睛猜

為什麼語言模型會自信地編出一個錯答案?因為它只會「想」,碰不到外面的世界。ReAct(Reason + Act)把推理和行動交織成一個迴圈:想一步、做一步、看一步。本文用一段實際的 trace 和一個最小可跑的 Python 迴圈,講清楚 ReAct 的原理,以及它和今天 AI agent 的關係。

#ReAct#AI Agent#LLM#Reasoning#Tool Use#Chain-of-Thought
DevOps 與環境

Cloudflare Workers 怎麼做到沒有冷啟動:Edge Computing 的運作原理與 Container 的分界

一般 serverless 的 Container 冷啟動要幾百毫秒,Cloudflare Workers 幾乎是零。差別不在它最佳化得多好,而在它根本沒用 Container。本文拆解 V8 Isolate 的隔離模型、edge 網路怎麼把程式碼跑在離你最近的城市,以及它跟 Container 的本質分界與未來走向。

#Cloudflare#Edge Computing#Serverless#V8#架構
AI 原理與協定

Temperature、Top-K、Top-P:三個參數,其實在管同一件事

同樣的提問,為什麼模型每次回答都不一樣?因為它不是在「想答案」,而是在抽籤。Temperature、Top-K、Top-P 這三個參數,控制的就是這場抽籤怎麼抽——本文用一個具體例子把它們講清楚。

#LLM#Sampling#生成式 AI
AI 原理與協定

Dense、MoE、Hybrid:Transformer 的 FFN 有三種長法

DeepSeek-V3 寫著 671B 總參數、只啟動 37B;Snowflake Arctic 是 480B 總量、17B active。同樣叫 Transformer,差在哪?答案不在注意力,而在每一層的 FFN——本文拆解 Dense、MoE、與兩種 Hybrid 的結構差異。

#LLM#Transformer#MoE#模型架構
AI 原理與協定

Harmony vs ChatML:兩代對話協定差在哪

很多人預設開源模型都吃 ChatML,但 OpenAI 為推理設計的 Harmony 是另一套協定。本文拆解兩者的世代差異——多 channel、角色階層、控制 token——以及為什麼你用 OpenAI-compatible API 呼叫時根本碰不到這層。

#LLM#Harmony#ChatML#API