尹国冰的博客
  • 起始页
  • 新手广场
  • 精选文章
  • 关于作者
登录 注册

大语言模型

通往终极人工智能的一道隐秘裂缝

通用文本语义特征提取模型GTE-QWEN
大语言模型

通用文本语义特征提取模型GTE-QWEN

执着于输出下一个Token的大语言模型,如何改造为固定输出长度的Embedding模型。
六款大模型应用开发常用工具库
大语言模型

六款大模型应用开发常用工具库

LLaMA 3的Rust实现
大语言模型

LLaMA 3的Rust实现

借助Candle中LLaMA 3的高质量Rust代码,可以帮助我们更直观地理解大羊驼架构、注意力与推演缓存机制。
大语言模型输出的罚重操作
大语言模型

大语言模型输出的罚重操作

Repeat penalty的作用与实现。
Azure OpenAI的定价与使用前提
大语言模型

Azure OpenAI的定价与使用前提

GPT有几种?
使用LLAMA.CPP推演百川13B大语言模型
大语言模型

使用LLAMA.CPP推演百川13B大语言模型

脱离PyTorch,使用C++实现百川大语言模型的高效推理。
Guanaco的秘密QLoRA
大语言模型

Guanaco的秘密QLoRA

Guannaco说低精度也能获得好效果
LoRA撬动大语言模型的杠杆
大语言模型

LoRA撬动大语言模型的杠杆

大语言模型与下游任务的高效桥接方法。
GPT的一生
大语言模型

GPT的一生

State of GPT是由OpenAI的Andrej Karpathy在Microsoft Build 2023上发表的演讲。其中详细介绍了GPT模型的生成过程,含金量极高,推荐阅读。
Alpaca指令遵循大语言模型
大语言模型

Alpaca指令遵循大语言模型

Alpaca,羊驼家族中最正统的名字,曾经的中文互联网网红。
Vicuna小羊驼也是大语言模型
大语言模型

Vicuna小羊驼也是大语言模型

Vicuna是什么,以及如何获取与转换权重。
LLaMA大语言模型
大语言模型

LLaMA大语言模型

什么是LLaMA,如何获取权重文件以及HuggingFace格式转换。
尹国冰的博客 © 2025
  • Find me on Github
  • 微信订阅号
  • B站
Powered by Ghost