随着人工智能技术的飞速发展,AI产品在文本生成、图片处理、智能体等多个领域展现出越来越强大的功能。 在今年8月份,我曾撰写了如题的系列文章,分别就“文本生成”、“图片生成 & ...
近日,上海微问家信息技术有限公司申请了一项名为“文本信息拼接方法、装置及电子设备”的专利(公开号CN119168854A),引发了业界的广泛关注。这项技术充分体现了目前图像处理技术的创新趋势,旨在通过减少计算量来提高文本信息提取的效率,并且有效解决了 ...
金融界2024年12月26日消息,国家知识产权局信息显示,广州小鹏汽车科技有限公司申请一项名为“语音交互方法、车辆及计算机可读存储介质”的专利,公开号CN 119181363 A,申请日期为2024年11月。
小米近日推出了Home Assistant集成,让用户在智能家居管理中享受更高的便利性。然而,随之而来的问题是,如何在这一新平台下继续使用小爱音箱的文本指令功能?本文将为您详细解答,帮助您重新掌握这一实用功能。
研究团队进行了定性的比较试验,实验结果表明所提出的方法能够精确捕捉并反映文本条件中指定的关键风格属性(如颜色),优先确保文本对齐;此外还保证了生成图像的布局稳定,保持结构完整性,没有出现内容泄漏的问题;同时没有损失风格特征,实现了与目标风格的高度相似 ...
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
当前的文生图主流模型以英文输入为主,中文原生的文生图模型研发则相对比较缓慢,这导致了模型对中文语义的理解能力不足,中文特色图片生成能力有限。中国联通作为数字信息运营服务国家队、数字技术融合创新排头兵,长期关注中文原生大模型的发展,并走出了一条夯实基础 ...
黑盒模式无压力突破:不需要模型的梯度、不需要对模型架构有任何了解,纯靠外部采样。 随机性是关键:每次对输入内容做各种小改动(例如对文本输入随机大写等),直到诱导大模型生成有害内容,或达到最大攻击次数限制 N。 跨模态攻击——这才是 BoN ...
近日,金融界报道,阿里巴巴集团控股有限公司又一创新成果获得专利授权,成为科技界的一大亮点。根据国家知识产权局的信息,阿里巴巴的这项专利名为“基于知识图谱的描述文本生成方法、装置及电子设备”,授权公告号为CN113536742B,申请时间追溯至2020年4月。此消息不仅关乎阿里的技术积累,更暗示着未来文本生成领域的颠覆性变化。
为了弥补这一不足,腾讯研究团队推出了名为 DRT-o1的新型翻译系统。该系统包含两个版本:DRT-o1-7B 和 DRT-o1-14B。这两款模型基于 Qwen2.5进行构建,并引入了一种全新的多代理框架,专门针对隐喻和比喻的翻译进行优化。研究团队从古登堡项目中收集了约400本公共领域的英语书籍,提取了577,600个句子,并筛选出63,000个包含比喻和隐喻的句子,以作为训练数据。
用一段简单的哼唱、一段节奏的敲击,就能让AI生成一段高品质的音乐或音效,这不再是幻想。一项名为Sketch2Sound的创新研究成果,展示了一种全新的AI模型,它可以通过声音模仿和文本提示来生成高质量的音频,为声音创作领域带来了革命性的突破。
IT之家 12 月 19 日消息,科技媒体 testingcatalog 昨日(12 月 18 日)发布博文,报道称 OpenAI 正积极提升 ChatGPT Canvas 功能, 新增 React 渲染功能和“Transform”高级文本格式化选项 ...