尹国冰的博客 尹国冰的博客
  • 起始页
  • 新手广场
  • 精选文章
  • 关于作者
Sign in Subscribe

yinguobing

裁剪ONNX模型

裁剪ONNX模型

按需裁剪ONNX模型,仅保留所需要的部分。
yinguobing Sep 16, 2023
使用LLAMA.CPP推演百川13B大语言模型

使用LLAMA.CPP推演百川13B大语言模型

脱离PyTorch,使用C++实现百川大语言模型的高效推理。
yinguobing Sep 5, 2023
在Kubernetes集群部署RTSP流媒体转发服务

在Kubernetes集群部署RTSP流媒体转发服务

使用MediaMTX实现RTSP流媒体转发
yinguobing Aug 31, 2023
编译并使用基于华为CANN的ONNXRUNTIME C++库

编译并使用基于华为CANN的ONNXRUNTIME C++库

为ONNXRUNTIME启用CANN支持,以无缝支持华为昇腾计算设备的C++开发。
yinguobing Aug 29, 2023
CMake使用MinIO的C++开发SDK

CMake使用MinIO的C++开发SDK

如何编译MINIO开发SDK,并集成在自己的CMake工程中。
yinguobing Aug 22, 2023
Guanaco的秘密QLoRA

Guanaco的秘密QLoRA

Guannaco说低精度也能获得好效果
yinguobing Jun 28, 2023
LoRA撬动大语言模型的杠杆

LoRA撬动大语言模型的杠杆

大语言模型与下游任务的高效桥接方法。
yinguobing Jun 26, 2023

Subscribe to 尹国冰的博客

订阅后即可阅读会员专属内容
  • Find me on Github
  • 微信订阅号
  • B站
尹国冰的博客 © 2025. Powered by Ghost