TOON 是什麼?為什麼它可能會成為未來 LLM 的標準資料格式?

 JSON 是否已經不夠用了?

在與大型語言模型(LLM)互動時,我們常常把大量 JSON 結構化資料塞進 Prompt 裡。然而:

  • 重複的 key

  • 大量的引號、逗點、括號

  • 冗長的巢狀結構

這些都會 消耗大量 Token,導致成本上升、模型上下文不足、甚至解析失敗。

因此,2025 年出現了一種新的資料格式 ——
👉 TOON(Token-Oriented Object Notation),它的目的非常明確:
專門為 LLM 設計,幫你節省 30%~60% Token!


TOON 是什麼?

TOON 全名 Token-Oriented Object Notation
是一種「為大語言模型量身設計的資料格式」。

它保留 JSON 的資料模型(Object、Array、Type),
但換了一種語法,特別針對 LLM 的 tokenizer 壓縮設計


💡 TOON 語法特色

  • 去除大量引號 {}, [], ,

  • 改用縮排表達層級

  • 使用 [N] 陣列長度標註

  • 使用 {fields} 給模型清楚 schema

  • 可直接做 表格式陣列(tabular arrays)

  • 無損轉回 JSON

🔍 TOON 語法快速看
user
  id: 123
  name: "Alice"
  age: 30

orders [2] {id, product, price}
  1, "Keyboard", 40.5
  2, "Mouse", 30.0

👉 上面這段 JSON 寫法需要 514 Tokens
轉成 TOON 之後只需 292 Tokens


⚠️ 什麼時候不適合用 TOON?

  • 資料結構 高度不規則或深度巢狀

  • 僅傳輸/儲存資料,不是拿給 LLM 看

  • 延遲極度敏感的 API(轉換 JSON→TOON 時仍有 overhead)


使用場景(非常符合你要寫的領域) 為什麼 TOON 有優勢
LLM Prompt / Pipeline Token 減少、結構清楚
Agent / Function Calling Schema 明確、模型不容易亂解析
RAG(檢索式生成) 檢索結果常很大,TOON 能節省輸入上下文
Web / Server Next.js / FastAPI 可在送 LLM 前轉換 JSON→TOON
區塊鏈 / 智能合約描述 LLM 更能解析 state / transaction

留言

熱門文章