日前,知名独立程序员、社交会议目录 Lanyrd 联合创始人、Django Web 框架联合创建者 Simon Willison在题为 Things we learned about LLMs in 2024 的文章中详细回顾了2024 年大模型行业的变化、惊喜与不足 。
引言:2024年,人工智能(AI)领域迎来了令人瞩目的技术突破和市场变化。一年之内,GPT-4这个曾经高高在上的大语言模型(LLM)壁垒被彻底打破,市面上涌现出 dozens of models performance exceedingly surpassing GPT-4. 本文将详细探讨这一现象背后的原因,包括大模型训练成本的显著降低,多模态模型的崛起,以及新的交互方式如何推动整个行业的发展 ...
随着2023年悄然过去,2024年已然到来,这不仅是一年技术突破的里程碑,更是大语言模型(LLM)行业发展的重要转折点。从多个维度来看,2024年标志着LLM的普及与技术进步。我们一起来回顾这一年的主要事件和趋势。
在科技快讯的舞台上,谷歌再次掀起波澜,宣布推出其首个通用推理模型——Gemini 2.0 Flash Thinking。这款最新的AI杰作,号称可以清晰展示其思考过程,全新定义了人工智能的“思考”方式。不同于以往的AI模型,Gemini 2.0能模拟人类逐步推理的过程,让每一步都透明可见;这就像为枯燥的数学解题加上了生动的讲解。
【导读】 李飞飞、谢赛宁团队又有重磅发现了:多模态LLM能够记住和回忆空间,甚至内部已经形成了局部世界模型,表现了空间意识!李飞飞兴奋表示,在2025年,空间智能的界限很可能会再次突破。
擅长训练密集型和专家混合(MoE)模型! 像 Gemini 这样的大语言模型(LLM)本身就具有数十亿个参数,先天强大且复杂。要高效训练这些密集型的大 ...
近日,北卡罗来纳大学教堂山分校、谷歌 Cloud AI Research、谷歌 DeepMind 的一个联合团队。他们发布的论文表明,逆向思维可以显著 LLM 的推理能力,并且不限于数学任务。他们还提出了一个名叫 RevThink ...
【太平洋科技快讯】 近日,谷歌AI Studio平台推出了其首个通用推理模型——Gemini 2.0 Flash Thinking。该模型的核心亮点在于其能清晰地展示思考过程。不同于传统AI模型直接给出答案,该模型可以模拟人类逐步推理的过程,使AI的 ...
穿越重重迷雾,OpenAI模型参数终被揭开!一份来自微软华盛顿大学医疗论文,意外曝光了GPT-4、GPT-4o、o1系列模型参数。让所有人震惊不已的是,GPT-4o mini仅8B。
谷歌AI Studio平台近期震撼发布了其革命性的通用推理模型——Gemini 2.0 Flash Thinking。这款模型的最大创新之处在于,它能够以人类可以理解的方式,清晰地展示其推理过程。与传统的AI模型直接输出结果不同,Gemini 2.0 ...