起始页
新手广场
精选文章
关于作者
Sign in
Subscribe
深度学习
Deep learning, learning deep.
Grounding DINO开集物体检测
DINO
DETR基于Transformer的目标检测
InstructBLIP:可指令调教的通用图像语言模型
图像模型正在追随大语言模型的设计路径
BLIP-2:连接图像与大语言模型的桥梁
为大语言模型LLM开启图像模态输入
BLIP:打破视觉与语言的次元壁
不仅能看,还能说
Segment Anything分割一切的启发式模型
空间域的理解也可以通过基础模型+提示解决吗?