起始页
新手广场
深度学习
大语言模型
观点
旅行
关于作者
Sign in
Subscribe
yinguobing
高效精简GitLab CI/CD配置文件
使用两组关键字,避免冗余的、易出错的GitLab持续集成配置文件。
使用Prometheus监控瑞芯微NPU负载
简单高效的瑞芯微NPU负载Prometheus监控指标导出工具。
裁剪ONNX模型
按需裁剪ONNX模型,仅保留所需要的部分。
使用LLAMA.CPP推演百川13B大语言模型
脱离PyTorch,使用C++实现百川大语言模型的高效推理。
在Kubernetes集群部署RTSP流媒体转发服务
使用MediaMTX实现RTSP流媒体转发
编译并使用基于华为CANN的ONNXRUNTIME C++库
为ONNXRUNTIME启用CANN支持,以无缝支持华为昇腾计算设备的C++开发。
CMake使用MinIO的C++开发SDK
如何编译MINIO开发SDK,并集成在自己的CMake工程中。