深度学习下最新的文章 - 极术社区 - 连接开发者与智能计算生态

深度学习

深度学习（英语：deep learning）是机器学习的分支，是一种以人工神经网络为架构，对数据进行表征学习的算法。

关注标签

关注数

11

内容数

2368

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

V · 2023年11月17日

大语言模型量化方法对比：GPTQ、GGUF、AWQ

在过去的一年里，大型语言模型(llm)有了飞速的发展，在本文中，我们将探讨几种(量化)的方式，除此以外，还会介绍分片及不同的保存和压缩...

2 阅读 2.5k
汀丶人工智能 · 2023年11月15日

ChatGLM3-6B：新一代开源双语对话语言模型，流畅对话与低部署门槛再升级

ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型，在保留了前两代...

2 阅读 3.1k
V · 2023年11月15日

sMLP:稀疏全mlp进行高效语言建模

具有专家混合(MoEs)的稀疏激活mlp在保持计算常数的同时显着提高了模型容量和表达能力。此外gMLP表明，所有mlp都可以在语言建模方面与tra...

0 阅读 1.5k
超神经HyperAI · 2023年11月13日

千年密码新解读，DeepMind 开发 Ithaca 破译希腊铭文

铭文、碑刻是过去文明的思想、文化和语言的体现。金石学家破译千年前的密码，需要完成文本修复、时间归因和地域归因三大任务。

3 阅读 1.6k
V · 2023年11月08日

使用Streamlit创建AutoGen用户界面

AutoGen作为一个最大化LLM(如GPT-4)能力的框架而脱颖而出。由微软研究院开发的AutoGen通过提供一种自动化、优化和编排工作流的方法，简...

0 阅读 1.4k
V · 2023年11月06日

Spectron: 谷歌的新模型将语音识别与语言模型结合进行端到端的训练

Spectron是谷歌Research和Verily AI开发的新的模型。与传统的语言模型不同，Spectron直接处理频谱图作为输入和输出。该模型消除归纳偏差...

2 阅读 1.5k
汀丶人工智能 · 2023年11月03日

突破性的多语言代码大模型基CodeShell：引领AI编程新时代

CodeShell是北京大学知识计算实验室联合四川天府银行AI团队研发的多语言代码大模型基座。它拥有70亿参数，经过对五千亿Tokens的训练，并...

1 阅读 2.7k
V · 2023年11月03日

10月发布的5篇人工智能论文推荐

由于现有基准和指标的限制，在开放式环境中评估大型语言模型(llm)是一项具有挑战性的任务。为了克服这一挑战，本文引入了微调llm作为可...

1 阅读 1.4k
汀丶人工智能 · 2023年11月02日

ElasticSearch实战指南必知必会：安装分词器、高级查询、打分机制

elasticsearch 提供了几个内置的分词器：standard analyzer(标准分词器)、simple analyzer(简单分词器)、whitespace analyzer（空格分词...

0 阅读 2.7k
超神经HyperAI · 2023年11月01日

生物信息学 | 借助 AI 更高效地开启研究

生物信息学 (Bioinformatics) 是指利用应用数学、信息学、统计学和计算机科学的方法，研究生物学问题。随着计算机科学技术的发展，AI 在...

0 阅读 2.3k
V · 2023年11月01日

AutoGen完整教程和加载本地LLM示例

Autogen是一个卓越的人工智能系统，它可以创建多个人工智能代理，这些代理能够协作完成任务，包括自动生成代码，并有效地执行任务。

0 阅读 2.2k
汀丶人工智能 · 2023年10月31日

多模态对比语言图像预训练CLIP：打破语言与视觉的界限

一种基于多模态（图像、文本）对比训练的神经网络。它可以在给定图像的情况下，使用自然语言来预测最相关的文本片段，而无需为特定任务...

0 阅读 3.1k
V · 2023年10月31日

使用Llama index构建多代理 RAG

检索增强生成(RAG)已成为增强大型语言模型(LLM)能力的一种强大技术。通过从知识来源中检索相关信息并将其纳入提示，RAG为LLM提供了有用...

0 阅读 1.3k
V · 2023年10月30日

使用Panda-Gym的机器臂模拟进行Deep Q-learning强化学习

强化学习(RL)是一种机器学习方法，它允许代理通过试错来学习如何在环境中表现。行为主体因采取行动导致预期结果而获得奖励，因采取行动...

0 阅读 1.3k
汀丶人工智能 · 2023年10月27日

释放搜索潜力：基于ES(ElasticSearch)打造高效的语义搜索系统，让信息尽在掌握

PaddleNLP Pipelines 是一个端到端智能文本产线框架，面向 NLP 全场景为用户提供低门槛构建强大产品级系统的能力。本项目将通过一种简单...

0 阅读 2.6k
E企研究院 · 2023年10月26日

坤前 AI 平台智慧仓储物流解决方案助力仓储物流走上“快车道”

随着物流订单达到新的量级，传统物流运输过程无法实时监控与管理，同时人力作业也难以保证其效率，容易出现各种意外风险，因此仓储物流...

1 阅读 1.8k
V · 2023年10月25日

VeRA: 性能相当，但参数却比LoRA少10倍

2022年的LoRA提高了微调效率，它在模型的顶部添加低秩(即小)张量进行微调。模型的参数被冻结。只有添加的张量的参数是可训练的。

1 阅读 1.5k
V · 2023年10月24日

使用TensorRT-LLM进行高性能推理

LLM的火爆之后，英伟达(NVIDIA)也发布了其相关的推理加速引擎TensorRT-LLM。TensorRT是nvidia家的一款高性能深度学习推理SDK。此SDK包含...

1 阅读 1.8k
汀丶人工智能 · 2023年10月20日

Elasticsearch向量检索的演进与变革：从基础到应用

通过将复杂的对象（例如文本、图像或声音）转换为数值向量，并在多维空间中进行相似性搜索，它能够实现高效的查询匹配和推荐。

0 阅读 3.1k
V · 2023年10月20日

使用Pytorch Geometric 进行链接预测代码示例

PyTorch Geometric (PyG)是构建图神经网络模型和实验各种图卷积的主要工具。在本文中我们将通过链接预测来对其进行介绍。

1 阅读 1.4k

上一页
1
…
41
42
43
44
45
…
下一页

本月贡献榜

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息