深度学习下最新的文章 - 极术社区 - 连接开发者与智能计算生态

深度学习

深度学习（英语：deep learning）是机器学习的分支，是一种以人工神经网络为架构，对数据进行表征学习的算法。

关注标签

关注数

11

内容数

2368

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

超神经HyperAI · 2024年06月27日

AI从业者怎么做Science？清华大学AIR周浩：从文本生成到蛋白质设计的跨界探索

近日，北京智源大会「AI for Science」分论坛上，清华大学智能产业研究院副研究员周浩以「面向科学发现的生成式人工智能」为主题展开演...

1 阅读 4.3k
汀丶人工智能 · 2024年06月27日

LLM 大模型学习必知必会系列(十三)：基于SWIFT的VLLM推理加速与部署实战

LLM 大模型学习必知必会系列(十三)：基于SWIFT的VLLM推理加速与部署实战1.环境准备GPU设备: A10, 3090, V100, A100均可. {代码...} 2.推...

1 阅读 4.3k
超神经HyperAI · 2024年06月26日

登Nature子刊，清华大学团队发布scFoundation：对2万基因同时建模

近年来，大规模预训练模型正在引领新一轮人工智能浪潮。「大模型」通过从大规模、多来源的数据中提取深层次规律，进而能够作为「基础模...

0 阅读 4.1k
超神经HyperAI · 2024年06月25日

北大医院副院长李建平：用AI解决临床心肌缺血预测的难点、卡点和痛点

2024年6月14日，第六届北京智源大会在中关村展示中心开幕，海内外的专家学者围绕人工智能关键技术路径和应用场景，展开了精彩演讲与尖峰...

0 阅读 4k
V · 2024年06月25日

2024年6月上半月30篇大语言模型的论文推荐

大语言模型（LLMs）在近年来取得了快速发展。本文总结了2024年6月上半月发布的一些最重要的LLM论文，可以让你及时了解最新进展。

0 阅读 4.3k
超神经HyperAI · 2024年06月24日

PhotoMaker 腾讯推出个性化图像生成新高度

PhotoMaker 是由腾讯与南开大学联合开发的 AI 图像生成工具，不仅能够捕捉人物的面部特征，还能根据喜好生成逼真的人物图像，将个性化定...

0 阅读 3.7k
超神经HyperAI · 2024年06月24日

一键体验 GLM-4-9B-Chat

近日，智谱 AI 发布了基座大模型 GLM-4 的最新开源成果——GLM-4-9B，首次拥有了多模态能力。官方给出的数据显示，对比训练量更多的 Llam...

0 阅读 1k
超神经HyperAI · 2024年06月24日

最强铁基超导磁体诞生！科学家基于机器学习设计新研究体系，磁场强度超过先前记录2.7倍

超导现象，自 1911 年被发现以来，始终保持着前沿性与高价值，吸引了大批学者投身其研究中。超导现象是指某些材料在低于特定温度时电阻...

1 阅读 3.1k
汀丶人工智能 · 2024年06月23日

LLM技术全景图：技术人必备的技术指南，一张图带你掌握从基础设施到AI应用的全面梳理

LLM 技术图谱（LLM Tech Map）是将 LLM 相关技术进行系统化和图形化的呈现，此图谱主要特点是“专注于技术人视角”，不求从 LLM 产业角度...

2 阅读 4.2k
汀丶人工智能 · 2024年06月21日

人工智能大模型之开源大语言模型汇总（国内外开源项目模型汇总）

Large Language Model (LLM) 即大规模语言模型，是一种基于深度学习的自然语言处理模型，它能够学习到自然语言的语法和语义，从而可以生...

1 阅读 5.2k
超神经HyperAI · 2024年06月20日

数据孤岛/计算消耗/误差累积，上海人工智能实验室AI气象预测突破

「AI 方法出现之前，每 10 年才可以提高 1 天的气象预报技巧，而引入 AI 后，几个月就能提高预报技巧。」

1 阅读 4k
V · 2024年06月19日

goldfish loss：减少训练数据泄漏，提高大语言模型输出的多样性

LLMs（大型语言模型）能够记忆并重复它们的训练数据，这可能会带来隐私和版权风险。为了减轻记忆现象，论文作者引入了一种名为"goldfish...

0 阅读 3.5k
汀丶人工智能 · 2024年06月19日

LLM 大模型学习必知必会系列(四)：LLM训练理论篇以及Transformer结构模型详解

深度学习领域所谓的“模型”，是一个复杂的数学公式构成的计算步骤。为了便于理解，我们以一元一次方程为例子解释：

2 阅读 3.5k
V · 2024年06月18日

Multi-Head RAG:多头注意力的激活层作为嵌入进行文档检索

现有的RAG解决方案可能因为最相关的文档的嵌入可能在嵌入空间中相距很远，这样会导致检索过程变得复杂并且无效。为了解决这个问题，论文...

2 阅读 3.5k
超神经HyperAI · 2024年06月18日

对话华师大上海人工智能金融学院院长邵怡蕾：AI时代，人文见长的学校会非常有优势

金融，是关乎老百姓钱袋子的国民经济血脉，更是国家核心竞争力的重要组成部分。AI，是当之无愧最具「活力」的行业，也是千行百业革故鼎...

1 阅读 3.5k
超神经HyperAI · 2024年06月17日

精准预测武汉房价！浙大GIS实验室提出osp-GNNWR模型：准确描述复杂空间过程和地理现象

住房是人类福祉和社会发展的重要组成部分，住房价格波动受到社会的广泛关注。中国是一个地域跨度极广的国家，即使是在同一个城市的同一...

0 阅读 3.1k
汀丶人工智能 · 2024年06月17日

揭秘In-Context Learning(ICL)：大模型如何通过上下文学习实现少样本高效推理

自GPT-3首次提出了In-Context Learning(ICL)的概念而来，ICL目前已经变成了一种经典的LLMs使用方法。ICL，即In-Context Learning，是一...

0 阅读 4.2k
数业智能心大陆 · 2024年06月14日

心灵解码：数业智能心大陆AI大模型开启数字心理新篇章

在探索人类复杂心理世界的旅途中，科学与技术正携手开启一扇通往深层次理解的大门。数业智能心大陆AI大模型，作为这一领域的先锋，正以...

0 阅读 2.3k
V · 2024年06月14日

使用‘消除’技术绕过LLM的安全机制，不用训练就可以创建自己的nsfw模型

开源的大模型在理解和遵循指令方面都表现十分出色。但是这些模型都有审查的机制，在获得被认为是有害的输入的时候会拒绝执行指令，例如...

0 阅读 5.1k
汀丶人工智能 · 2024年06月14日

解锁LLMs的“思考”能力：Chain-of-Thought(CoT) 技术推动复杂推理的新发展

Chain-of-Thought(CoT)是一种改进的Prompt技术，目的在于提升大模型LLMs在复杂推理任务上的表现，如算术推理（arithmetic reasoning）、...

3 阅读 4.3k

上一页
1
…
29
30
31
32
33
…
下一页

本月贡献榜

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息