起始页
新手广场
精选文章
关于作者
Sign in
Subscribe
新手入门
在C++库中嵌入Git Commit ID
方便版本管理与代码追溯。
Rust
使用Rust解析Json文件
高效、安全的Json解析
新手入门
高效精简GitLab CI/CD配置文件
使用两组关键字,避免冗余的、易出错的GitLab持续集成配置文件。
Rust
使用Prometheus监控瑞芯微NPU负载
简单高效的瑞芯微NPU负载Prometheus监控指标导出工具。
新手入门
裁剪ONNX模型
按需裁剪ONNX模型,仅保留所需要的部分。
大语言模型
使用LLAMA.CPP推演百川13B大语言模型
脱离PyTorch,使用C++实现百川大语言模型的高效推理。
Kubernetes
在Kubernetes集群部署RTSP流媒体转发服务
使用MediaMTX实现RTSP流媒体转发
Ascend
编译并使用基于华为CANN的ONNXRUNTIME C++库
为ONNXRUNTIME启用CANN支持,以无缝支持华为昇腾计算设备的C++开发。
新手入门
CMake使用MinIO的C++开发SDK
如何编译MINIO开发SDK,并集成在自己的CMake工程中。
大语言模型
Guanaco的秘密QLoRA
Guannaco说低精度也能获得好效果
大语言模型
LoRA撬动大语言模型的杠杆
大语言模型与下游任务的高效桥接方法。
深度学习
Grounding DINO开集物体检测