编辑:桃子 好困 【新智元导读】600万美金训出击败GPT-4o大模型,竟被中国团队实现了!今天,DeepSeek-V3在全网掀起巨大风暴,仅凭671B参数在数学代码性能上,堪比国外大模型Claude 3.5 Sonnet。 一夜之间,来自中国的大模型刷屏全网。 DeepSeek-V3,一个拥有671B参数的MoE模型,吞吐量每秒高达60 ...
IT之家 1 月 9 日消息,在 2024 年 12 月 12 日发布后,微软昨日(1 月 8 日)在 Hugging Face 平台上,开源小语言模型 Phi-4,感兴趣的开发者和尝鲜者可以下载、微调和部署该 AI 模型。