
深度学习
Deep learning, learning deep.


DINO

DETR基于Transformer的目标检测

InstructBLIP:可指令调教的通用图像语言模型
图像模型正在追随大语言模型的设计路径

BLIP-2:连接图像与大语言模型的桥梁
为大语言模型LLM开启图像模态输入

BLIP:打破视觉与语言的次元壁
不仅能看,还能说

Segment Anything分割一切的启发式模型
空间域的理解也可以通过基础模型+提示解决吗?

YOLO v5 TensorRT C++推演快速教程
经过数天乃至数周的调试,你的神经网络模型终于在速度与精度上获得了令人满意的结果,并正式进入模型部署方案开发阶段。如何与现有的产品耦合,并在目标设备上最大化模型推演性能,成为一项重要课题。

ByteTrack多目标跟踪
你猜为啥要叫ByteTrack?

车牌识别LPRNet
从图像到序列

DeepSORT实时在线跟踪算法
基于深度学习的实时在线跟踪算法。

超越经验风险最小化的mixup
一种极其简单的数据增强方式