简要介绍语义缓存的基本原理,这是一个更偏业务侧的Technic,通常要结合具体场景制定策略。
speculative decoding
发表于
分类于
LLM
VSC Claude in CN
简要介绍发文时间点上中国配置vscode claude plugin+claude code cli的最佳实践。这种方法除了没法开/thinking之外(需要LLM api provider日后支持)没有什么缺陷。
KVCache
发表于
分类于
LLM
简要介绍KVCache
BBPE
发表于
分类于
LLM
简要介绍BBPE的核心思路,这是LLM(LLaMA,Qwen,etc.)普遍使用的初始化词表的方法
BGE-M3
简要介绍BGE(BAAI General Embedding)-M3的技术方案
papers-Qwen系列
回顾Qwen系列
papers-LLaMA系列
重点回顾LLaMA系的重要节点,很多trick都是老朋友了
QLoRA
发表于
分类于
LLM