OpenAI表示,新模型的大小仅为1.6GB,便于用户下载和使用。同时,公司将继续遵循MIT许可证,提供包括代码和模型权重在内的Whisper资源,以支持开发 ...
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! OpenAI开源的Whisper一直是很多开发者首选的语音识别模型。但它使用固定长度的编码器来处理 30 秒的音频块,对于较短的音频序列需要进行零填充。但这种填充即使输入音频非常短时也会产生恒定的算力负担,从而增加总处理时间并降低效 ...