AI
LLaMA 3的Rust实现
借助Candle中LLaMA 3的高质量Rust代码,可以帮助我们更直观地理解大羊驼架构、注意力与推演缓存机制。
通往终极人工智能的一道隐秘裂缝
借助Candle中LLaMA 3的高质量Rust代码,可以帮助我们更直观地理解大羊驼架构、注意力与推演缓存机制。
Repeat penalty的作用与实现。
GPT有几种?
脱离PyTorch,使用C++实现百川大语言模型的高效推理。
Guannaco说低精度也能获得好效果
大语言模型与下游任务的高效桥接方法。
State of GPT是由OpenAI的Andrej Karpathy在Microsoft Build 2023上发表的演讲。其中详细介绍了GPT模型的生成过程,含金量极高,推荐阅读。
Alpaca,羊驼家族中最正统的名字,曾经的中文互联网网红。
Vicuna是什么,以及如何获取与转换权重。
什么是LLaMA,如何获取权重文件以及HuggingFace格式转换。