不久前,一群来自小红书的 95 后工程师联合北大团队发布了开源项目「InstantID」,只需上传一张照片,这款 AI 写真神器就能轻松定制多种...
为明晰发展脉络,把握未来趋势,墨天轮于5月29日正式发布 《2023年中国数据库年度行业分析报告》。该报告由墨天轮联合业界专家学者共同...
通过利用大型语言模型(LLM)的能力,最近的大规模多模态模型(LMMs)在开放世界多模态理解方面展现了卓越的多功能性。然而,它们通常参...
在处理长序列时,Transformers面临着注意力分散和噪音增加等挑战。随着序列长度的增长,每个词元必须与更多词元竞争注意力得分,这会导...
刚刚过去的五月,运营商大模型集体完成了一次PMF(Product-Market Fit,产品市场契合度)的“进化”。
上周,中国气象局首次发布了「人工智能气象大模型训练专题数据目录」,汇集了海量气象数据。该目录现已在气象局官网提供下载,可以根据...
人们仰望星空,那些遥远的星光其实已经穿越了数十亿年的时空,诉说着古老的故事。而中性碳吸收线,作为早期星系内冷气体云块的关键探针...
Arm® 终端计算子系统 (CSS) 作为新的计算解决方案,结合了 Armv9 架构的优势,以及基于三纳米工艺节点,经过验证和证实为生产就绪的新 A...
特征选择是构建机器学习模型过程中的决定性步骤。为模型和我们想要完成的任务选择好的特征,可以提高性能。
从全球视野看,OpenAI、谷歌等AI巨头,以及百度、昆仑万维等中国科技公司,作为推动技术创新的关键力量,成为各自地区AI发展的风向标。
5 月 17 日,马斯克公开表示,继今年年初首次成功将大脑芯片植入患者大脑后,Neuralink 正在寻找第二位受试者接受这项手术。
大型语言模型(llm)是在巨大的文本语料库上训练的,在那里他们获得了大量的事实知识。这些知识嵌入到它们的参数中,然后可以在需要时使用...
SWIFT支持了开源模型,尤其是中小型模型(7B、14B等)对Agent场景的训练,并将loss-scale技术应用到agent训练中,使中小模型API Call能...
本文介绍我们针对大语言模型量化的工作 IntactKV,可以作为插件有效提升GPTQ、AWQ、QuaRot等现有主流量化方法效果。论文作者来自清华大...
5月20日,国家发改委、国家数据局、财政部、自然资源部四部门联合制定了《关于深化智慧城市发展 推进城市全域数字化转型的指导意见》。...
「顶会」板块上线 hyper.ai 官网啦!该板块为大家提供最新最全的 CCF A 类计算机顶会信息,包含会议简介、截稿倒计时、投稿链接等。
自OpenAI推出 Sora 以来,「文生视频」概念及相关应用备受瞩目。而伴随 Sora 的大热,其背后的关键技术,DiT(Diffusion Transformers) ...
5月15日,中国科技产业智库「甲子光年」在北京中关村东升科技园万丽酒店举办「AI创生时代——2024甲子引力X科技产业新风向」大会。甲子光...
但也有很多认知没有收敛:AI基础模型技术是否放缓?信仰技术还是信仰市场?Killer App(杀手级应用)如何出现?先发优势还是后发优势?...
前一篇文章总结了关于计算机视觉方面的论文,这篇文章将要总结了2024年5月发表的一些最重要的大语言模型的论文。这些论文涵盖了塑造下一...