2025年12月31日,来自 DeepSeek-AI 的研究团队在 arXiv 上发布了一篇题为《mHC: Manifold-Constrained Hyper-Connections》的技术论文,...
🎯 本文目标:在星睿O6上运行智谱AI视觉大模型,测试GLM-Edge视觉系列和GLM-4V系列的多模态能力,验证ARM设备上的图像理解和分析功能。
🎯 本文目标:为llama.cpp和chatglm.cpp部署Web服务与OpenAI兼容API,构建完整的AI服务生态系统,实现真正的产品化部署,让星睿O6成为可...
🎯 本文目标:在星睿O6上部署CodeGeeX2实现智能代码生成,完成整个智谱AI全栈大模型生态系统的构建,让星睿O6成为真正的AI开发工作站。
🎯 本文目标:在星睿O6上基于chatglm.cpp框架运行智谱AI文本大模型,对比llama.cpp的性能差异,重点测试GLM系列模型在专用框架上的优化效...
🎯 本文目标:在星睿O6上基于llama.cpp框架运行智谱AI文本大模型,包括GLM-Edge系列、GLM-4系列和最新的GLM-4.6V-Flash模型,进行全面的...
🎯 本文目标:将chatglm.cpp环境部署到星睿O6开发板,专门针对GLM系列模型进行优化,在ARM设备上实现更高的运行效率和更低的内存占用。
🎯 本文目标:将llama.cpp环境迁移到星睿O6开发板,并针对ARMv9架构进行专门优化配置,充分发挥硬件性能。
🎯 本文目标:在PC上搭建chatglm.cpp推理环境,这是专为GLM系列模型优化的推理框架,在星睿O6上运行时内存使用更高效,对话体验更流畅。
🎯 本文目标:在PC上搭建llama.cpp推理环境,为后续模型格式转换和量化处理做准备。这是整个部署流程的第一步,为星睿O6上的大模型运行奠...
🎯 本系列文章的核心价值:经过深入研究和实践,在星睿O6 ARM开发板上成功部署了完整的智谱AI大模型生态系统,包括文本生成、视觉理解、...
O6 的 npu 具有约 30 TOPS 算力- 支持 INT4 / INT8 / INT16 / FP16 / BF16 / TF32 等计算精度
11月20日,2025中国数据中心标准大会在北京国际会议中心成功举办,本次大会汇聚行业领袖、技术专家、生态伙伴与企业代表等精英。华为展...
AI-Compass 致力于构建最全面、最实用、最前沿的AI技术学习和实践生态,通过六大核心模块的系统化组织,为不同层次的学习者和开发者提供...
在人工智能技术狂飙突进的时代,大模型正以前所未有的速度重塑各行业生态,从智能客服到多模态交互,从边缘推理到端侧部署,其应用场景...
AI-Compass 致力于构建最全面、最实用、最前沿的AI技术学习和实践生态,通过六大核心模块的系统化组织,为不同层次的学习者和开发者提供...
传统的高质量 TTS(文本转语音)模型一直以来都面临着几个核心困境:它们往往对计算资源和云端服务有较高要求,由此产生的高昂成本使得...
2025 年 10 月,《时代周刊》发布 「TIME100:影响世界的 100 人」 年度榜单,Google DeepMind 首席执行官 Demis Hassabis 登上封面。 ...
orion o6配瑞莎AI PC Case Kit,通过oculink线接到显卡坞+4060ti显卡
随着大语言模型(LLM)的迅速发展,AI 不再只是“会聊天”的工具,而是能够理解、推理并生成多模态内容的智能体。本文将基于Orion O6平台...