回顾Qwen系列
papers-LLaMA系列
重点回顾LLaMA系的重要节点,很多trick都是老朋友了
QLoRA
发表于
分类于
LLM
Papers-GPT3&RLHF
Scaling law
发表于
分类于
LLM
简单介绍Scaling law
PEFT框架性指南
发表于
分类于
LLM
目前LLM微调基本就是指Parameter Efficient Finetuning(PEFT),其特点就是与传统概念的全量FT不同,只更新(添加)极少量的参数。PEFT方法非常多,这里给出一个整体框架。
当前LLM的tool use风格
发表于
分类于
LLM
简要说明目前的LLM使用tools的风格,目前tool selection基本完全不需要developer介入,和早期的风格有所差异。
Temperature
发表于
分类于
LLM
简介temperature意义,并给出示例
MCP
简介MCP(Model Context Protocol)
LLM api聚合平台
发表于
分类于
LLM
简单介绍LLM聚合平台