Keras之父官宣创业了!全新成立的实验室Ndea,押注了一条通往AGI的新路线——深度学习+程序合成。值得一提的是,这条新路,曾是Keras之父在谷歌搞的业余项目。 刚刚, Keras之父François Chollet宣布,与Mike ...
所以可以看到,现如今已有不少玩家选择投身应用端,不再执着于基座大模型。而继续坚持的玩家们,则在思考如何基于有限的资源,将每个参数的作用发挥到极致,这才是多数人一致看好的大模型训练最终方向。不过,现阶段,模型参数的能力上限还远未完全探索到。
1月15日,MiniMax发布并开源新一代01系列模型,包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破Transformer传统架构记忆瓶 ...
继公布全模态模型家族后,时隔5个月,MiniMax再亮相两大模型,且模型权重完全开源。而且与GPT-4o和Claude-3.5-Sonnet性能平起平坐,尤其在上下文窗口方面表现出色,处理能力甚至达到其他顶尖模型的 20 - 32倍。
日月开新元,万象启新篇。1月15日,驻扎在徐汇的AI独角兽企业MiniMax发布并开源新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意 ...
进一步分析AI的现状,黄仁勋认为推理成本正在持续下降,英伟达的最新GPU如Blackwell系列在推理性能上提升了30到40倍,大幅降低了数据中心运营成本。这种趋势将使AI应用更加普及,尤其是在自动驾驶、智能眼镜等方面变革将加速到来。
在科技飞速发展的当下,AI 已强势进军古代文本研究领域,成为解锁古文字奥秘的神奇钥匙! 从希腊、拉丁典籍到中国甲骨文,人工神经网络大显身手。据悉,研究表明,卷积神经网络(CNN)精准捕捉图像数据结构,助力甲骨文复原与文物碎片拼凑;循环神经网络(RNN ...
文章转载于新智元从章鱼通过改变皮肤颜色来融入周围环境,到人类大脑在受伤后重新连接神经网络,无不体现着那句经典的名言——「物竞天择,适者生存」。然而,对于LLM来说,想要加入哪怕只是一句话的新知识,都必须要再训练一次。针对这一挑战,来自Sakana ...
蓝鲸新闻1月15日讯(记者 朱俊熹)国产开源大模型再添一员强将。1月15日,大模型独角兽MiniMax发布并开源了MiniMax-01全新系列模型,包含基础语言大模型和视觉多模态大模型两个模型。
从金融到医学,人工智能(AI)正深刻改变着现代生活。如今,它开始进军古代文本研究:从希腊与拉丁典籍到中国甲骨文,人工神经网络正成为解读古文字的钥匙。它不仅能驾驭浩瀚档案,填补字符空缺,还能解码几乎无迹可寻的罕见或灭绝语言,令古代智慧在现代科技之光下重 ...