InstructBLIP:可指令调教的通用图像语言模型

图像模型正在追随大语言模型的设计路径

InstructBLIP:可指令调教的通用图像语言模型
封面图片 Alexander Shatov

继BLIP 2之后,Salesforce又推出了可指令调教的InstructBLIP。

LAVIS/projects/instructblip at main · salesforce/LAVIS
A One-stop Library for Language-Vision Intelligence - LAVIS/projects/instructblip at main · salesforce/LAVIS

InstructBLIP是在BLIP 2的基础上经过指令调优得到的。作者将其主要贡献概括为以下三点: