第三视点

quantization (LLM)

发表于 2026-06-14 更新于 2026-06-22 分类于 LLM

简要介绍典型quantization方式

发表于 2026-06-13 分类于 LLM

简要介绍语义缓存的基本原理，这是一个更偏业务侧的Technic，通常要结合具体场景制定策略。

发表于 2026-06-13 分类于 LLM

简要介绍投机解码的原理，源自Google 2023的paper

发表于 2026-03-29 更新于 2026-06-13 分类于 LLM

简要介绍发文时间点上中国配置vscode claude plugin+claude code cli的最佳实践。这种方法除了没法开/thinking之外（需要LLM api provider日后支持）没有什么缺陷。

发表于 2025-10-21 分类于 LLM

简要介绍KVCache

发表于 2025-10-21 分类于 LLM

简要介绍BBPE的核心思路，这是LLM（LLaMA，Qwen，etc.）普遍使用的初始化词表的方法

发表于 2025-10-20 更新于 2025-10-21 分类于 LLM

发表于 2025-10-13 更新于 2025-10-21 分类于 LLM

回顾Qwen系列

发表于 2025-10-12 更新于 2025-10-15 分类于 LLM

重点回顾LLaMA系的重要节点，很多trick都是老朋友了

发表于 2025-10-12 分类于 LLM

简介QLoRA核心概念