最近,笔者系统的看了下一些比较经典的多模态大模型实现思路,本着动手实践的态度,从零到一实现了一个多模态大模型,并命名为 Reyes(睿视) ,R:睿,eyes:眼。Reyes的参数量为8B,视觉编码器使用的是 InternViT-300M-448px-V2_5 ,语言模型侧 ...