写给未来的自己
起始页
新手广场
深度学习
大语言模型
观点
旅行
关于作者
订阅
深度学习
Deep learning, learning deep.
使用LLAMA.CPP推演百川13B大语言模型
脱离PyTorch,使用C++实现百川大语言模型的高效推理。
Guanaco的秘密QLoRA
Guannaco说低精度也能获得好效果
LoRA撬动大语言模型的杠杆
大语言模型与下游任务的高效桥接方法。
Grounding DINO开集物体检测
DINO
DETR基于Transformer的目标检测
GPT的一生
State of GPT是由OpenAI的Andrej Karpathy在Microsoft Build 2023上发表的演讲。其中详细介绍了GPT模型的生成过程,含金量极高,推荐阅读。