大模型下最新的文章 - 极术社区 - 连接开发者与智能计算生态

大模型

ChatGPT，文心一言等大模型技术及应用

关注标签

关注数

0

内容数

769

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

申耀的科技观察 · 2024年06月11日

Hitachi Vantara：按下AI时代的快进键，最大化释放数据要素价值

在今年的政府工作报告中，“人工智能+”首次被写入报告，同时“大力推进现代化产业体系建设，加快发展新质生产力”也被列为2024年的首项政府...

1 阅读 3.6k
AI学习者 · 2024年06月06日

I-LLM：首次实现了LLM全整形量化，精度超过Smooth/Omini/AffineQuant

宣传一下我们的工作I-LLM，（据我们所知）这是第一个在LLM上实现了integer-only量化的方法，精度逼近浮点，超过Smooth/Omini/Affine Qua...

1 阅读 6.1k
汀丶人工智能 · 2024年06月05日

中文金融大语言模型：专业、智能、全面，一站式金融解决方案，你的专属LLM金融顾问

DISC-FinLLM 是一个专门针对金融场景下为用户提供专业、智能、全面的金融咨询服务的金融领域大模型，

1 阅读 4.5k
爱笑的小姐姐 · 2024年06月04日

原理&图解vLLM Automatic Prefix Cache首Token时延优化

看了一些关于Prefix Caching的文章，感觉没有讲得很清晰。最近正好自己也想整理一下相关的技术，因此有了本篇文章。希望结合vLLM Automa...

2 阅读 8.4k
汀丶人工智能 · 2024年06月04日

LLM 大模型学习必知必会系列(二)：提示词工程-Prompt Engineering 以及实战闯关

prompt（提示词）是我们和 LLM 互动最常用的方式，我们提供给 LLM 的 Prompt 作为模型的输入，并希望 LLM 反馈我们期待的结果。虽然 LL...

0 阅读 4.2k
汀丶人工智能 · 2024年06月03日

LLM 大模型学习必知必会系列(五)：数据预处理(Tokenizer分词器)、以及LLM技术选型

在模型训练过程中，数据及数据处理是最为重要的工作之一。在当前模型训练流程趋于成熟的情况下，数据集的好坏，是决定了该次训练能否成...

0 阅读 3.7k
企业存储技术 · 2024年06月03日

GLake：大模型时代显存+传输管理与优化

本文内容，来自蚂蚁集团异构计算与推理引擎负责人-赵军平老师，在AICon全球人工智能开发与应用大会上的演讲ppt。

1 阅读 4.9k
汀丶人工智能 · 2024年06月01日

LLM 大模型学习必知必会系列(六)：量化技术解析、QLoRA技术、量化库介绍使用AutoAWQ

模型的推理过程是一个复杂函数的计算过程，这个计算一般以矩阵乘法为主，也就是涉及到了并行计算。一般来说，单核CPU可以进行的计算种类...

1 阅读 3.1k
汀丶人工智能 · 2024年05月31日

LLM 大模型学习必知必会系列(十二)：VLLM性能飞跃部署实践：从推理加速到高效部署的全方位优化

训练后的模型会用于推理或者部署。推理即使用模型用输入获得输出的过程，部署是将模型发布到恒定运行的环境中推理的过程。一般来说，LLM...

0 阅读 3.1k
风过 · 2024年05月31日

实操使用聆思CSK6大模型开发板接入ChatGPT

前言多模态交互离不开硬件载体，目前国内接了大模型体验最好的开发板应该是聆思CSK6大模型开发板了，不仅官方提供了已经集成讯飞星火认...

0 阅读 2.9k
啥都吃的豆芽 · 2024年05月31日

新的 Armv9 CPU 加速 AI 在移动设备等领域的发展

当今移动设备上的大多数人工智能 (AI) 工作负载均可在 Arm CPU 上运行。在智能手机领域，基于 Armv9 CPU 技术构建的 AI 旗舰智能手机立...

7 阅读 3.8k
AI学习者 · 2024年05月30日

上交大、上海 AI 实验室、ViVO 推出 TerDiT ，极低比特量化感知训练和和高效部署方案！

近期大规模预训练的文本到图像扩散模型的发展显著提高了高保真图像的生成，特别是基于 Transformer 架构的扩散模型（DiTs）的出现。在这...

2 阅读 4.5k
汀丶人工智能 · 2024年05月29日

LLM 大模型学习必知必会系列(九)：Agent微调最佳实践，用消费级显卡训练属于自己的Agent！

SWIFT支持了开源模型，尤其是中小型模型（7B、14B等）对Agent场景的训练，并将loss-scale技术应用到agent训练中，使中小模型API Call能...

2 阅读 3k
AI学习者 · 2024年05月29日

让量化大模型无损，IntactKV：保持关键词元无损，轻松提升量化精度！

本文介绍我们针对大语言模型量化的工作 IntactKV，可以作为插件有效提升GPTQ、AWQ、QuaRot等现有主流量化方法效果。论文作者来自清华大...

3 阅读 3.9k
腾讯技术工程 · 2024年05月29日

一文带你了解大模型——智能体（Agent）

大语言模型很强大，就像人类的大脑一样拥有思考的能力。如果人类只有大脑，没有四肢，没有工具，是没办法与世界互动的。如果我们能给大...

3 阅读 4.4k
甲子光年 · 2024年05月28日

张一甲：AI创生时代，2024中国AI新风向30条判断

5月15日，中国科技产业智库「甲子光年」在北京中关村东升科技园万丽酒店举办「AI创生时代——2024甲子引力X科技产业新风向」大会。甲子光...

1 阅读 3.1k
甲子光年 · 2024年05月28日

万字实录：投钱、烧钱与赚钱，五位AI大咖的不同AI观

但也有很多认知没有收敛：AI基础模型技术是否放缓？信仰技术还是信仰市场？Killer App（杀手级应用）如何出现？先发优势还是后发优势？...

3 阅读 3.4k
汀丶人工智能 · 2024年05月28日

LLM 大模型学习必知必会系列(三)：LLM和多模态模型高效推理实践

LLM 大模型学习必知必会系列(三)：LLM和多模态模型高效推理实践1.多模态大模型推理LLM 的推理流程：多模态的 LLM 的原理：代码演示：使...

2 阅读 3.4k
脑极体 · 2024年05月22日

大模型卷价格，向量数据库“卷”什么？

“不是我不明白，这世界变化快”，崔健在20世纪写下的这句歌词，放在公有云市场也同样适用。技术风向的变化之快，让不少人感到惊讶。

4 阅读 3.5k
AI学习者 · 2024年05月22日

生成式AI产业经济学：价值分配与利润结构

处在生成式人工智能（GenAI）技术变革的浪潮上，人们对这一将降低成本和产生利润的强大工具充满了期待。然而，ChatGPT爆火一年后，GenAI...

3 阅读 3.8k

上一页
1
…
23
24
25
26
27
…
下一页

本月贡献榜

CSK开发小助手

贡献 5 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息