TOON 是什麼?為什麼它可能會成為未來 LLM 的標準資料格式?
JSON 是否已經不夠用了?
在與大型語言模型(LLM)互動時,我們常常把大量 JSON 結構化資料塞進 Prompt 裡。然而:
-
重複的 key
-
大量的引號、逗點、括號
-
冗長的巢狀結構
這些都會 消耗大量 Token,導致成本上升、模型上下文不足、甚至解析失敗。
因此,2025 年出現了一種新的資料格式 ——
👉 TOON(Token-Oriented Object Notation),它的目的非常明確:
專門為 LLM 設計,幫你節省 30%~60% Token!
TOON 是什麼?
TOON 全名 Token-Oriented Object Notation
是一種「為大語言模型量身設計的資料格式」。
它保留 JSON 的資料模型(Object、Array、Type),
但換了一種語法,特別針對 LLM 的 tokenizer 壓縮設計。
💡 TOON 語法特色
-
去除大量引號
{},[],, -
改用縮排表達層級
-
使用 [N] 陣列長度標註
-
使用
{fields}給模型清楚 schema -
可直接做 表格式陣列(tabular arrays)
-
可 無損轉回 JSON
🔍 TOON 語法快速看
user
id: 123
name: "Alice"
age: 30
orders [2] {id, product, price}
1, "Keyboard", 40.5
2, "Mouse", 30.0
👉 上面這段 JSON 寫法需要 514 Tokens,
轉成 TOON 之後只需 292 Tokens
轉成 TOON 之後只需 292 Tokens
⚠️ 什麼時候不適合用 TOON?
-
資料結構 高度不規則或深度巢狀
-
僅傳輸/儲存資料,不是拿給 LLM 看
-
延遲極度敏感的 API(轉換 JSON→TOON 時仍有 overhead)
| 使用場景(非常符合你要寫的領域) | 為什麼 TOON 有優勢 |
|---|---|
| LLM Prompt / Pipeline | Token 減少、結構清楚 |
| Agent / Function Calling | Schema 明確、模型不容易亂解析 |
| RAG(檢索式生成) | 檢索結果常很大,TOON 能節省輸入上下文 |
| Web / Server | Next.js / FastAPI 可在送 LLM 前轉換 JSON→TOON |
| 區塊鏈 / 智能合約描述 | LLM 更能解析 state / transaction |
留言
張貼留言