深度学习下最新的文章 - 极术社区 - 连接开发者与智能计算生态

标签主页标签问答标签文章

标签文章

最新的 · 最热的

超神经HyperAI · 2024年05月29日

脑机接口：是现代医学的外挂，更是瘫痪病人的豪赌

5 月 17 日，马斯克公开表示，继今年年初首次成功将大脑芯片植入患者大脑后，Neuralink 正在寻找第二位受试者接受这项手术。

0 阅读 1.1k
V · 2024年05月29日

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉

大型语言模型(llm)是在巨大的文本语料库上训练的，在那里他们获得了大量的事实知识。这些知识嵌入到它们的参数中，然后可以在需要时使用...

0 阅读 3k
超神经HyperAI · 2024年05月28日

在线教程丨与 Sora 技术路线相似！全球首个开源文生视频 DiT 模型 Latte 一键部署

自OpenAI推出 Sora 以来，「文生视频」概念及相关应用备受瞩目。而伴随 Sora 的大热，其背后的关键技术，DiT(Diffusion Transformers) ...

2 阅读 3.2k
V · 2024年05月28日

2024年5月大语言模型论文推荐：模型优化、缩放到推理、基准测试和增强性能

前一篇文章总结了关于计算机视觉方面的论文，这篇文章将要总结了2024年5月发表的一些最重要的大语言模型的论文。这些论文涵盖了塑造下一...

0 阅读 3.1k
汀丶人工智能 · 2024年05月28日

LLM 大模型学习必知必会系列(三)：LLM和多模态模型高效推理实践

LLM 大模型学习必知必会系列(三)：LLM和多模态模型高效推理实践1.多模态大模型推理LLM 的推理流程：多模态的 LLM 的原理：代码演示：使...

2 阅读 3.4k
V · 2024年05月27日

SUPRA：无须额外训练，将Transformer变为高效RNN，推理速度倍增

Transformers 已经确立了自己作为首要模型架构的地位，特别是因为它们在各种任务中的出色表现。但是Transformers 的内存密集型性质和随...

1 阅读 3.2k
修志龙_ZenonXiu · 2024年05月24日

Arm Scalable Matrix Extension介绍

最近本人写了一篇介绍Arm Scalable Matrix Extension (可伸缩矩阵扩展，SME)的文章，[链接]。此为中文版，也加入了部分Introducing Armv...

15 阅读 7.5k
V · 2024年05月24日

使用FP8加速PyTorch训练的两种方法总结

在PyTorch中，FP8（8-bit 浮点数）是一个较新的数据类型，用于实现高效的神经网络训练和推理。它主要被设计来降低模型运行时的内存占用...

2 阅读 3.8k
V · 2024年05月23日

MambaOut：状态空间模型并不适合图像的分类任务

该论文探讨了Mamba架构（包含状态空间模型SSM）是否有必要用于视觉任务，如图像分类、目标检测和语义分割。通过实验证实了了Mamba在视觉...

2 阅读 3k
V · 2024年05月22日

DeepSparse: 通过剪枝和稀疏预训练，在不损失精度的情况下减少70%的模型大小，提升三倍速度

这篇论文提出了一种高稀疏性基础大型语言模型（LLMs）的新方法，通过有效的预训练和部署，实现了模型在保持高准确度的同时，显著提升了...

0 阅读 3.1k
V · 2024年05月21日

扩散模型的多元化应用：药物发现、文本生成、时间序列预测等

AlphaFold3 是 DeepMind 开发的一款蛋白质结构预测软件，它在AlphaFold2的基础上进行了改进。其中最主要的一个改进就是引入了扩散模型，...

4 阅读 3.2k
汀丶人工智能 · 2024年05月21日

新一代AI搜索引擎神器推荐及效果测试：秘塔AI、天工AI、Perplexity等

回到搜索引擎本身，搜索引擎的早期出现是为了解决互联网上信息过载的问题。随着互联网的快速发展，越来越多的网页被创建并发布，用户需...

1 阅读 4.2k
超神经HyperAI · 2024年05月20日

首个高光谱显着目标检测基准数据集上线；参与创作者激励计划，百分百得现金大奖！

本周， OpenAI 和 Google 接连在发布会中投出核弹级产品💣。OpenAI 还是一贯地爱抢新闻焦点，在 Google I/O 大会前发布了 GPT-4o。而 Goo...

0 阅读 541
V · 2024年05月20日

深入解析xLSTM：LSTM架构的演进及PyTorch代码实现详解

xLSTM的新闻大家可能前几天都已经看过了，原作者提出更强的xLSTM，可以将LSTM扩展到数十亿参数规模，我们今天就来将其与原始的lstm进行...

1 阅读 3.9k
超神经HyperAI · 2024年05月17日

收集30GB、近20万对训练样本，复旦大学团队发布UniFMIR：用AI突破显微成像极限

荧光显微镜是生命科学领域不可或缺的重要研究工具，其原理是以紫外线为光源，照射被检物体使之发出荧光，然后在显微镜下观察物体的形...

3 阅读 4.5k
V · 2024年05月17日

图神经网络入门示例：使用PyTorch Geometric 进行节点分类

基于图的神经网络是强大的模型，可以学习网络中的复杂模式。在本文中，我们将介绍如何为同构图数据构造PyTorch Data对象，然后训练不同...

2 阅读 4.2k
K_b0KBsM · 2024年05月16日

创客项目秀 | 基于浊度和TDS传感器的人工舌头

今天小编给大家介绍Thomas Vikstrom的人工舌头项目，该项目使用水质传感器来测量液体的浊度，并通过一个机器学习模型在Seeed Studio WIO...

1 阅读 3.6k
超神经HyperAI · 2024年05月16日

不怕太空物质「撞地球」！中科院团队提出日冕物质抛射识别新方法，接近人类识别结果

日冕物质抛射（简称 CME）是从太阳抛入行星际空间的大尺度等离子体团，是太阳释放能量的一种形式，也是影响空间天气的主要因素之一。大...

1 阅读 3.1k
V · 2024年05月16日

ATFNet：长时间序列预测的自适应时频集成网络

ATFNet是一个深度学习模型，它结合了时间域和频域模块来捕获时间序列数据中的依赖关系。引入了一种新的加权机制来调整周期性的权重，增...

1 阅读 3.5k
V · 2024年05月13日

Transformers 加速的一些常用技巧

Transformers 是一个强大的架构，但模型因其采用的自注意力机制，虽然能够有效地处理序列数据并捕获长距离依赖关系，但同时也容易导致在...

3 阅读 3.4k

本月贡献榜

关注极术微信号
实时接收点赞提醒和评论通知

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

关注安谋科技招聘
实时获取安谋科技中国职位信息

深度学习

标签文章

脑机接口：是现代医学的外挂，更是瘫痪病人的豪赌

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉

在线教程丨与 Sora 技术路线相似！全球首个开源文生视频 DiT 模型 Latte 一键部署

2024年5月大语言模型论文推荐：模型优化、缩放到推理、基准测试和增强性能

LLM 大模型学习必知必会系列(三)：LLM和多模态模型高效推理实践

SUPRA：无须额外训练，将Transformer变为高效RNN，推理速度倍增

Arm Scalable Matrix Extension介绍

使用FP8加速PyTorch训练的两种方法总结

MambaOut：状态空间模型并不适合图像的分类任务

DeepSparse: 通过剪枝和稀疏预训练，在不损失精度的情况下减少70%的模型大小，提升三倍速度

扩散模型的多元化应用：药物发现、文本生成、时间序列预测等

新一代AI搜索引擎神器推荐及效果测试：秘塔AI、天工AI、Perplexity等

首个高光谱显着目标检测基准数据集上线；参与创作者激励计划，百分百得现金大奖！

深入解析xLSTM：LSTM架构的演进及PyTorch代码实现详解

收集30GB、近20万对训练样本，复旦大学团队发布UniFMIR：用AI突破显微成像极限

图神经网络入门示例：使用PyTorch Geometric 进行节点分类

创客项目秀 | 基于浊度和TDS传感器的人工舌头

不怕太空物质「撞地球」！中科院团队提出日冕物质抛射识别新方法，接近人类识别结果

ATFNet：长时间序列预测的自适应时频集成网络

Transformers 加速的一些常用技巧

本月贡献榜