起始页
新手广场
精选文章
关于作者
Sign in
Subscribe
Latest
使用Prometheus监控瑞芯微NPU负载
简单高效的瑞芯微NPU负载Prometheus监控指标导出工具。
裁剪ONNX模型
按需裁剪ONNX模型,仅保留所需要的部分。
使用LLAMA.CPP推演百川13B大语言模型
脱离PyTorch,使用C++实现百川大语言模型的高效推理。
在Kubernetes集群部署RTSP流媒体转发服务
使用MediaMTX实现RTSP流媒体转发
编译并使用基于华为CANN的ONNXRUNTIME C++库
为ONNXRUNTIME启用CANN支持,以无缝支持华为昇腾计算设备的C++开发。
CMake使用MinIO的C++开发SDK
如何编译MINIO开发SDK,并集成在自己的CMake工程中。
Guanaco的秘密QLoRA
Guannaco说低精度也能获得好效果