从华西医院到Token工厂，联想重构AI规模化生产范式

当前，人工智能正深度渗透医疗健康管理全链路，驱动诊疗模式从“经验主导”迈向“数据驱动”的智能化范式跃迁。

这一变化已在四川大学华西医院的诊前、诊中环节实现“具象化”落地。患者就诊前，通过移动终端“预问诊智能体”即可完成病史与症状的结构化录入；步入诊室后，医生直接基于已同步的信息展开针对性核实与沟通，彻底告别耗时冗长的开放式初筛。

在此模式下，医生手工录入病历的时间占比从过去的约70%大幅压缩，如今绝大部分接诊时间可用于与患者直接交流。这不仅显著提升了诊疗效率，更让医患互动中的人文关怀得到强化。

而支撑这套流程再造的，正是一套稳定高效的“数字底座”。作为华西医院长期的智能化同路人，联想集团针对医疗行业数字化升级与AI落地的核心诉求，以混合式AI基础设施与“AI工厂”解决方案，为四川大学华西医院打造了覆盖算力资源、数据存储、容灾备份的一体化智慧医疗数字底座，为医学影像AI、临床辅助决策等应用提供了高可靠、可弹性扩展的底层支撑。

底座的持续进化，同样离不开产学研各方的协同探索。6月13日，“医学人工智能工程化落地技术培训暨2026联想领跑100-智算生态之旅”走进四川大学华西医院。联想集团携手英特尔等生态合作伙伴、异构智算产业生态联盟企业代表、行业专家及医疗机构代表，围绕医学AI落地实践、全域算力生态构建、医疗数据底座建设等核心议题展开深度交流与实地观摩。

华西医院与联想的实践表明，当顶尖医疗资源与领先的智算基础设施深度融合，AI普惠便不再是一句口号，而是体现在每一个环节——患者少走弯路、少等少问；医护减少重复劳动、增加有效沟通时间；医院从“被动响应”迈向“主动服务”。

这份可参考、可复制的落地方案，不仅为智慧医疗行业树立了“新标杆”，更为AI在更多垂直场景的工程化落地提供了可借鉴的经验。

01.

筑牢AI落地底座，

华西医院的工程化实践

作为国内综合实力领先的三级甲等医院，四川大学华西医院日均诊疗量、手术量及科研规模均位居全国前列，其信息化建设更是医疗行业的技术“风向标”。

然而，随着海量临床数据的激增与AI应用的集中爆发，算力、存储及业务连续性方面的挑战也随之而来。为此，华西医院与联想展开深度合作，共同构建了一套覆盖算力、存储、容灾与数据管理的全栈智慧医疗基础设施体系，具体来看：

一是，算力层面，基于联想基础设施底座构建的核心虚拟化平台，承载全院众多业务系统稳定运行；通过ThinkSystem四路服务器扩容升级，资源池整体算力压力得到有效缓解，关键业务性能大幅跃升，为医学影像、智能诊疗等应用提供充足的弹性算力支撑。

二是，业务连续性层面，依托联想高端全闪存存储与MetroCluster双活技术，物理故障场景下可实现零人工干预的自动切换，RTO 趋近于零；针对误操作、软件异常等逻辑风险，通过高频应用一致性快照技术，实现关键业务快速恢复，全方位保障核心诊疗业务与 AI 应用连续不中断。

三是，数据管理层面，联想为华西医院构建了高效可靠的数据存储基础设施。通过热冷数据自动分层机制，高频访问的热数据由高性能闪存池支撑极速访问，保障业务体验；历史冷数据自动归档至低成本长期存储，在提升管理效率的同时有效控制存储成本，让海量医疗数据持续沉淀为医院的重要数字资产。

这一底座不仅解决了基础设施层面的需求，更为数据治理与应用打开了全新空间。在此基础上，华西医院建设了新一代大数据中心，从底层重新设计数据组织逻辑，让数据秒级可查、专病模型快速可建、跨域数据轻松可用，以更好地迎接智能体经济时代的到来。

数据通了，应用才能活起来。依托这一底座，华西医院率先在AI应用上展开了系统性布局。围绕患者全周期健康管理，一套覆盖“诊前、诊中、诊后”的智能体矩阵逐步成型：诊前，预问诊与陪诊智能体帮助患者完成出行规划、挂号引导、订餐住宿等便医服务；诊中，生成式病历智能体配合病历质控与医保合规智能体，确保文书准确性与合规性；诊后，个性化康复计划智能体基于患者画像与手术类型定制专属方案，并通过陪诊智能体持续跟踪居家康复情况，最终实现“离院不离管”的全程健康管理。

这一环环相扣的实践路径清晰地表明，医学人工智能要真正走进临床，算法只是起点，算力底座、数据管理与临床级业务连续性才是决胜关键。

与此同时，要让这套底座真正跑得稳、跑得省，芯片层的协同创新同样不可或缺。以英特尔®至强®6处理器为代表的芯片突破，正通过CPU承接中小模型推理、AI Max加速单元优化Token吞吐等路径，为推理成本的持续下探提供硬件基础。

可以说，联想与英特尔等生态伙伴的深度协同，正加速打通医学人工智能从实验室到临床的“最后一公里”，这正是“工程化落地”得以兑现的关键所在。

02.

Token工厂的诞生，

智能经济的跃迁之路

华西医院的实践揭示了AI落地的底层逻辑：算法只是起点，底座才是关键。而当底座建成，应用铺开之后，一个更深层的问题浮出水面——当AI应用开始规模化落地，支撑其运转的算力体系该如何被标准化、商品化和工业化？

华西医院的实践已给出答案：AI在垂直行业的落地，本质是算力经济与场景需求的精准匹配，而匹配效率的关键变量，正是Token的标准化与成本控制。

这也正是中科院计算所研究员、全国政协委员张云泉提出的算力经济“三跃迁”理论所要回答的问题。算力经济要真正演化为智能经济，须经历算力标准化、Token商品化、生产工厂化三次跃迁，最终构建“Token工厂”，实现AI算力的工业化、规模化生产。

联想中国基础设施业务群战略管理总监黄山

如果说这套框架勾勒的是智能经济的宏观蓝图，那么联想中国基础设施业务群战略管理总监黄山，则从技术落地的层面，揭开了“Token工厂”的真实面貌。

他用一组数据直观展现了Token成本的显著下降：“去年，百万Token的推理成本还在5块钱以上；今年，我们已经能做到1块出头；经过团队深度优化，甚至可以降到0.27元。”黄山强调，这一降幅并非依赖硬件降价，而是在硬件价格上涨的背景下，通过软件层面的全栈优化实现的。

全栈优化的价值，在算力计费方式的演进中尤为明显。当Token成本降至可商业化水平，它便顺理成章地取代了传统的计费单位。2024年，行业仍在使用“GPU卡时”计费；到2025年上半年，逐步过渡到“P算力”计价；如今，很多大模型厂商也开始以“百万Token”作为计价单位，这也宣告了算力交易正式进入标准化时代。

计费方式演变的实质，是业界对算力效率的重新认知：“同样的GPU，用开源软件搭建和用优化方法搭建，效率可能相差2倍甚至10倍。”联想是如何将这一认知转化为实际降本的？黄山详细介绍了背后的三项核心技术。

首先，是缓存命中优化。在多轮对话和多智能体协同场景中，大量输入是重复的。通过缓存机制避免重复计算，可大幅节省算力消耗。他指出，今年智能体的调用方式已发生根本性变化：输入输出比从去年的1:1飙升至32:1，Token消耗量随之增长了约30倍。面对如此激增的需求，如果Token价格不变，根本用不起，因此必须通过缓存优化来有效控制成本。

其次，是稀疏注意力机制。并非所有输入都需要同等复杂的计算。通过区分复杂语义与简单语义，差异化分配计算资源，让算力用在刀刃上。

最后，是PD分离。将计算密集型的预填充阶段与访存密集型的解码阶段分开，分别交由不同类型算力资源处理。高性能算力负责预填充，高带宽算力负责解码，实现资源的最优配置。

黄山以MiniMax2.7模型为例，展示了优化效果：“从官网调用，综合Token费用是1.12元；用行业标准优化后可降至0.71元；而我们团队经过深度调优，可以做到0.27元。”这一成本优势，为Token工厂的商业化运营奠定了坚实基础。

0.27元的背后，是一整套全栈优化能力的支撑。现在，联想正将这种能力注入Token工厂架构，让AI从实验室走向生产线。以医疗行业为例，依托Token工厂架构打造的脑核磁大模型一体机，实现了训练与推理性能数倍提升，真正让AI从成本工具转变为可计量、可落地的价值载体。

不难看出，从算力标准化到Token商品化，再到生产工厂化，这三步跃迁正在产业一线逐步兑现。当Token成为算力的通用计量单位，当Token工厂开始工业化生产，智能经济的跃迁之路便不再停留于理论框架，而是真实地铺展在产业前沿。

03.

CPU归来与存储重构，

生态协同释放乘数效应

算力只是硬币的一面。当AI应用形态从单轮问答走向多智能体协同，算力需求的结构正在发生根本性变化——推理任务的复杂性骤增，通用计算的比例显著上升，算力格局本身也在悄然重塑。

英特尔中国全球大客户经理张奕君

最直观的信号来自英特尔中国全球大客户经理张奕君。她在本次会议中直言：“CPU回来了。”

她用了一个生动的办公场景来做诠释：智能体帮用户生成并迭代一份Excel报表，后台需要反复调模型、多次确认、不断纠错。整个过程消耗的Token量级已是典型一问一答的数十倍，但这些工作本质上属于通用算力的范畴。“这个算力，很可能就跑在CPU上。”

这一判断的底气，来自最新发布的英特尔®至强® 6处理器，这款CPU最高可达288核，内置AMX AI加速指令集，在AI推理场景下吞吐性能可提升数十倍。更重要的是，它让“通算+智算”混合部署成为可能：超大参数模型跑在GPU上，中小参数模型和日常办公类AI任务则交给CPU，从而实现算力资源的极致利用。

“我们不是在跟GPU竞争，而是在帮用户找到性价比更高的解决方案。”张奕君强调。她同时指出，在全球算力硬件涨价的背景下，科技巨头的资本开支水涨船高，单座晶圆厂的投资动辄高达数百亿美元。“软件团队可以通过优化，把Token的产出能力提上来。”

这一理念与联想的Token工厂战略不谋而合，黄山前述提到的0.27元/百万Token，正是软硬件协同降本的典型“注脚”，无论是联想的全栈软件优化，还是英特尔在CPU侧的硬件突破，目标都是同一个：在AI应用爆发的时代，帮用户把每一分钱都花在刀刃上。

如果说算力是AI的“发动机”，那么数据就是AI的“燃料”，而医疗行业的数据管理，恰恰面临着最为苛刻的挑战。

联想凌拓西区解决方案经理戴芒芒

联想凌拓西区解决方案经理戴芒芒在演讲中，一针见血地指出了医疗数据管理的三大痛点：业务连续性要求极高、海量数据快速增长、预算增长有限。“我们称之为‘不可能三角’。”他说，“既要保证核心诊疗永不中断，又要应对影像数据爆炸式增长，还要控制存储成本。这三件事放在一起，传统架构几乎无解。”针对这一困局，联想凌拓给出了三重解法。

解法一：双活加快照，筑牢业务连续性底线。第一层是物理故障防御，通过MetroCluster双活架构实现零人工干预的自动切换；第二层是逻辑故障防御，通过异地高频一致性快照，在分钟级将业务恢复到故障前状态。“严重故障下，关键业务分钟级拉起。”

解法二：智能分层，让每一份数据待在“该待的地方”。高频访问的热数据自动存放在高性能全闪存层，低频温数据迁移至混合介质层，历史冷数据流转至大容量对象存储层。“医生打开任何一个历史病历，体验都是一样的，但医院的后台存储成本，可能下降了50%以上。”

解法三：存储虚拟化，告别“吵闹的邻居”。通过将底层硬件资源整合为统一存储资源池，按应用需求“切分”出独立的虚拟存储单元，每个应用都拥有独立的性能保障和管理策略。“即使规模扩展到数百个应用、数千个虚拟机，管理复杂度也不会失控。”

戴芒芒还分享了一个有趣的探索：让大模型来管理存储。通过MCP协议，联想凌拓的存储已被AI智能体直接调用。用户只需一句话，智能体即可自动登录、采集数据、生成图表，甚至给出扩容建议。未来，更多存储管理能力将以“Skill”形式开放，实现存储运维的半自动化乃至全自动化。

从CPU的回归到存储的重构，算力与数据的双向突围正在同步推进。这两条线索的背后，折射出一个更深层的逻辑：AI在任何行业的工程化落地，都不是某一家企业的独角戏，而是一场生态协同的系统工程。医疗行业如此，金融、制造、教育等行业亦然。

回看具体实践，这种协同效应已经有了鲜活的样本。英特尔在CPU侧的算力供给创新，联想在Token工厂层面的全栈优化，联想凌拓在存储架构上的三重解法——三家企业在各自擅长的领域深耕，又在同一个场景下形成合力。这种协同的价值，远不止于单一技术的性能提升，而是让整个系统的效能实现了乘数级的释放。

04.

问天品牌升级，

构建AI规模化生产新范式

当算力、数据、成本都已齐备，接下来的问题是：如何将它们系统性地组织起来，变成可规模化复制的生产力？这正是联想问天近期发布品牌焕新战略所要回应的核心议题。

在联想集团副总裁、中国基础设施业务群总经理陈振宽看来，当前AI正从工具应用走向生产要素，算力也随之从资源供给升级为面向Token生产的系统能力，整个产业正在进入由“能力竞争”迈向“生产范式竞争”的新阶段。因此，联想问天的品牌焕新，正是基于这一趋势，面向词元经济，对技术、产品与生态体系的一次系统性重构。

那么，这场重构究竟意味着什么？答案是：一次从定位到能力的全面升维。今天，联想问天完成了从“本地化服务器品牌”向“中国AI算力基础设施领导者”的战略跃迁，它以企业AI方案为导向、以“AI+研发创新”为驱动、以AI算力保障为根基，系统重构面向AI时代的技术、产品与生态能力，释放算力的每一分价值。

具体而言，这一跃迁体现在三个层面：一是打通链路，通过AI工厂、超智融合算力与全栈产品体系，将分散、复杂的AI能力转化为标准化、规模化的生产能力；二是夯实底座，依托全栈自研体系与生态协同，构建高性能、低成本、可持续的基础设施底座，为客户提供面向未来的企业AI解决方案；三是引领生态，携手合作伙伴推动算力从资源供给走向价值生产，助力中国AI产业加速迈入产业化发展的新阶段。

战略方向已明，落地靠什么？那就是产品能力的实质性突破。为此，联想重磅发布了万全异构智算平台V5.0和超节点解决方案，正是将战略蓝图转化为可交付的算力能力的关键一步。

作为AI算力基础设施的核心技术底座，联想万全异构智算平台V5.0迎来两大核心突破：一方面，集群训推加速技术通过分层解耦PD分离架构、KV Cache共享缓存优化等核心技术，实现大模型训推性能的全面领先，大幅提升集群资源利用率；另一方面，芯模编译优化技术则实现面向不同模型的计算图自适应匹配和算子自动生成，深度适配多元算力芯片生态，提升训练与推理的全流程计算效率。在此基础上，依托持续迭代的九大差异化技术，该平台已实现从百卡到万卡规模的全场景覆盖，能够为AI训练、推理、超智融合等多元场景提供高效、稳定的算力支撑。

如果说V5.0解决的是“算力调度”的效率问题，那么面向万亿参数大模型训练与推理的极致需求，联想首度发布的问天超节点算力解决方案，则是在“算力密度”上实现了一次全新的跨越。

该方案具备四大优势：超强算力，单节点可搭载40张GPU，FP8算力超28 PFLOPS，HBM显存突破5.76 TB，满足万亿参数大模型训练与推理的极致需求；全互联低时延，访存总带宽超80TB/s、百纳秒级芯片P2P单向时延，破解万卡级集群协同的通信瓶颈；灵活扩展，支持独立40卡节点运行、Scale-out横向扩建集群，还可向下兼容32卡配置，满足各种规模的训练、推理和开发测试；简易部署，采用无线缆正交直插架构，兼容标准19英寸机箱，将集群部署周期压缩至数小时，大幅降低大规模算力集群的落地门槛。

值得一提的是，联想集团官方出品的产业专著《词元工厂：词元经济的财富生产范式》正式首发。该书围绕“词元工厂”“智能产能”“有效算力”“安全可控”四大核心概念，完整解构了AI时代基础设施从算力支撑走向智能生产系统的底层逻辑，从战略认知到工程落地，从架构设计到运营优化，为企业AI规模化落地提供了全链路的工程化解决方案。

在此过程中，生态协同亦是至关重要的一环。作为联想最紧密的战略合作伙伴之一，英特尔®至强®处理器为算力底座提供核心动力，到与联想联合推动Token成本优化，始终扮演着不可或缺的角色。

正如英特尔中国全球大客户经理张奕君所言：“英特尔致力于推动算力在产业端的普惠化，与联想等伙伴共同赋能如智慧医疗这样关乎民生福祉的关键领域，构建面向未来的创新生态。”

至此，一条从算力底座到Token工厂、从技术优化到商业模式创新的完整路径已然清晰——华西医院与联想的合作，验证了这条路径在医疗领域的可落地性；联想问天品牌战略的焕新发布，则标志着这条路径从个案实践走向系统化、可复制的生产新范式；而联想与英特尔等合作伙伴的生态协同，揭示了它得以运转的真正引擎。

回望历史，每一次基础设施的跃迁都催生了一个新的时代：蒸汽机驱动了工业时代，电力点亮了电气时代，互联网连接了信息时代。而今天，Token工厂正在开启的，正是一个算力即生产力的新时代。当算力像电力一样即插即用、按需取用，AI便不再是少数企业的奢侈品，而是千行百业都能触手可及的生产力。

这，才是构筑Token工厂最深层的价值与意义。

推荐阅读

目录