起始页
新手广场
精选文章
关于作者
Sign in
Subscribe
大语言模型
通往终极人工智能的一道隐秘裂缝
通用文本语义特征提取模型GTE-QWEN
执着于输出下一个Token的大语言模型,如何改造为固定输出长度的Embedding模型。
六款大模型应用开发常用工具库
LLaMA 3的Rust实现
借助Candle中LLaMA 3的高质量Rust代码,可以帮助我们更直观地理解大羊驼架构、注意力与推演缓存机制。
大语言模型输出的罚重操作
Repeat penalty的作用与实现。
Azure OpenAI的定价与使用前提
GPT有几种?
使用LLAMA.CPP推演百川13B大语言模型
脱离PyTorch,使用C++实现百川大语言模型的高效推理。
Guanaco的秘密QLoRA
Guannaco说低精度也能获得好效果