GPU专用服务器

GPU驱动的基础设施。
利用可扩展的 GPU 服务器，释放您的 AI 和 ML 潜力，这些服务器针对性能和成本效益进行了优化。

配置我的服务器

惠普企业服务器

您的 GPU 配置已安装在惠普企业服务器上，并经过压力测试，确保 100% 兼容性和稳定性。

选择您的数据中心

获取一台专用于 GPU 的服务器，部署在我们位于纽约、迈阿密、旧金山、阿姆斯特丹或布加勒斯特的数据中心之一。

低延迟网络

您的服务器已连接到定制的低延迟全球网络。

支持

通过电话或在线聊天，您可以随时获得真人客服的即时支持，全天候为您服务。

立即获取价格实惠的GPU专用服务器

无与伦比的价格

在其他地方找到更便宜的？在最低广告价格的基础上再享九折优惠。详情请联系我们。

5分钟部署

付款验证通过后，您即可在 5 分钟内访问您的裸机 GPU 服务器。

全天候支持

由GPU服务器专家团队提供即时、全天候支持。

请参阅配置。

A100 GPU 的每小时价格

图表-GPU成本比较

*价格基于配备 40GB 显存的单个 A100 GPU。

每台服务器最多可配备 4 个匹配的 GPU

NVIDIA A100芯片

英伟达 A40 / A100

NVIDIA Ampere 架构是实现 AI 加速的根本解决方案，其应用范围涵盖从边缘到云端。NVIDIA A40 具备强大的多工作负载能力，并拥有用于光线追踪渲染、VR 等的超现代功能。NVIDIA A100 Tensor Core GPU 则凭借多实例 GPU (MIG) 技术，在各种规模下都能提供无与伦比的加速性能。

NVIDIA A100 规格

48 GB GDDR6 内存，带 ECC 纠错功能
10752 个 CUDA 核心
336 个张量核心
最大带宽 696 GB/s
NVIDIA GPU Boost

NVIDIA A40 规格

40 GB GDDR6
6912 个 CUDA 核心
432 个张量核心
最大带宽 1555 GB/s
NVIDIA GPU Boost

NVIDIA H100

NVIDIA H100 Tensor Core GPU 助您释放新一代 AI 性能。H100 基于突破性的 Hopper 架构，专为大型语言模型、生成式 AI 和复杂的深度学习工作负载而打造。借助创新的 Transformer Engine 和第四代 Tensor Core，H100 的 AI 训练速度比上一代产品提升高达 9 倍。H100 配备 80GB HBM3 显存和 3TB/s 带宽，能够轻松应对数据密集型 AI 应用，是研究人员、数据科学家和 AI 开发人员拓展机器学习边界的理想之选。

NVIDIA H100 技术规格

80 GB HBM3 内存，带 ECC 纠错功能
8448 个 CUDA 核心
528 个 Tensor Core（第四代）
3 TB/s 内存带宽
变形引擎
NVIDIA GPU Boost

NVIDIA RTX 6000 PRO

NVIDIA RTX 6000 Pro

NVIDIA RTX 6000 Pro 专为追求极致性能的专业人士打造，助您革新创意工作流程。这款强大的工作站 GPU 可提供惊艳的实时光线追踪、AI 加速的内容创作以及流畅的 8K 视频编辑功能。RTX 6000 Pro 配备 48GB 大容量纠错显存，并支持多台高分辨率显示器，在 3D 动画、视觉特效、建筑可视化和产品设计领域表现卓越。无论您是渲染电影级场景、开发 AI 增强内容，还是直播专业节目，这款 GPU 都能提供工作室、创作者和制作团队在雄心勃勃的项目中赖以生存的卓越性能和坚如磐石的可靠性。

NVIDIA RTX 6000 Pro 规格

96 GB GDDR6 内存，带 ECC 纠错功能
24064 个 CUDA 核心
568 个 Tensor Core（第四代）
142 个 RT 核心（第三代）
1792 GB/s 内存带宽
NVIDIA GPU Boost

NVIDIA L4 L40S

英伟达 L4 / L40S

借助功能强大的 NVIDIA L4 和 L40S GPU，加速您的视频流媒体、AI 应用和创意工作负载。L4 专为高密度流媒体和 AI 推理而设计，可为直播、视频点播平台和实时内容交付提供卓越的视频转码性能，并将延迟降至最低。L40S 则进一步提升了内容创作者和开发者的能力，为 3D 渲染、虚拟制作、AI 增强型视频处理和生成式 AI 工作流程提供强大的支持。这两款 GPU 都擅长处理多个并发流，因此非常适合广播工作室、流媒体平台、游戏服务器和 AI 开发环境等对效率和性能要求极高的场景。

NVIDIA L4 规格

24 GB GDDR6 内存，带 ECC 纠错功能
7424 个 CUDA 核心
232 个 Tensor Core（第四代）
58 个 RT 核心（第三代）
300 GB/s 内存带宽

NVIDIA L40S 规格

48 GB GDDR6 内存，带 ECC 纠错功能
18176 个 CUDA 核心
568 个 Tensor Core（第四代）
142 个 RT 核心（第三代）
864 GB/s 内存带宽

NVIDIA GeForce RTX 5090

NVIDIA GeForce RTX 5080 / RTX 5090

NVIDIA 最新一代 GPU 凭借图形渲染和 AI 加速方面的尖端技术，突破了游戏和创意性能的界限。这些 GPU 基于新一代架构，拥有更高的能效、更快的光线追踪速度和卓越的计算能力。

GeForce RTX 5080 规格

16 GB GDDR6X
10752个CUDA核心
超快内存带宽

GeForce RTX 5090 规格

24 GB GDDR6X
21760个CUDA核心
极快的内存带宽

NVIDIA RTX 4090D

NVIDIA RTX 4090D

NVIDIA GeForce RTX 4090D 助您解锁游戏和创作性能的巅峰。这款 GPU 采用突破性的 Ada Lovelace 架构，可提供卓越的性能和效率，带来超逼真的图形和沉浸式体验。

RTX 4090D 规格

24 GB GDDR6X
14592 个 CUDA 核心
最大带宽 1008 GB/s

兼容Linux、CUDA/OpenCL、DirectX、Windows。

NVIDIA Quadro RTX A6000

NVIDIA Quadro RTX A4000 / A5000 / A6000

英伟达新一代基于安培架构的GPU相比图灵架构的Quadro RTX系列有了显著提升。RTX A系列单精度浮点运算（FP32）处理速度提升了一倍，能效也更高，能够提供更精准的渲染效果和两倍速的光线追踪性能。

Quadro RTX A4000 规格

16 GB GDDR6
6144 个 CUDA 核心
最大带宽 448 GB/s

Quadro RTX A5000 规格

24 GB GDDR6
8192 个 CUDA 核心
768 GB/s 最大带宽

Quadro RTX A6000 规格

48GB GDDR6X
10752 个 CUDA 核心
768 GB/s 最大带宽

NVIDIA RTX 3090

英伟达 RTX 3070 / 3080 / 3090

NVIDIA GeForce RTX 30 系列显卡采用 Ampere 架构，是第二代 RTX 技术，融合了多项全新技术，包括更快的光线追踪和 Tensor Core，以及先进的流式多处理器。全球速度最快的显存 GDDR6X 可提供卓越的性能，完美适用于人工智能、可视化和游戏。

RTX 3070 规格

8 GB GDDR6
5888 个 CUDA 核心
512 GB/s 最大带宽
NVIDIA GPU Boost

RTX 3080 规格

10 GB GDDR6X
8704 个 CUDA 核心
最大带宽 760 GB/s
NVIDIA GPU Boost

RTX 3090 规格

24GB GDDR6X
10496 个 CUDA 核心
最大带宽 936 GB/s
NVIDIA GPU Boost

兼容Linux、CUDA/OpenCL、KVM、Windows。

NVIDIA Quadro RTX 8000

英伟达 Quadro 5000 / 6000 / 8000

NVIDIA Quadro RTX 系列显卡采用久负盛名的 Turing™ 芯片架构，彻底改变了数百万设计师和创作者的工作方式。硬件加速光线追踪、先进的着色技术和全新的 AI 功能，助力艺术家提升渲染能力。

Quadro RTX 5000 规格

16 GB GDDR6
3072 个 CUDA 核心
最大带宽 448 GB/s
NVIDIA GPU Boost

Quadro RTX 6000 规格

24 GB GDDR6
4608 个 CUDA 核心
最大带宽 672 GB/s
NVIDIA GPU Boost

Quadro RTX 8000 规格

48 GB GDDR6
4608 个 CUDA 核心
最大带宽 672 GB/s
NVIDIA GPU Boost

兼容Linux、CUDA/OpenCL、KVM、Windows。

NVIDIA Quadro RTX 4000

Quadro RTX 4000

NVIDIA Quadro RTX 4000 显卡仅需一个 PCI-e 插槽即可提供最佳性能和功能。先进的显示和内存技术与 Turing™ 芯片架构相结合，可在极短时间内实现逼真的单光线追踪渲染。

Quadro RTX 4000 规格

8 GB GDDR6
2304 个 CUDA 核心
最大带宽 416 GB/s
NVIDIA GPU Boost

兼容Linux、CUDA/OpenCL、KVM、Windows。

视频

通过全新的图灵芯片架构，可同时转码多达两路视频流。

3D渲染

利用 RTX 2080 的强大性能，以前所未有的速度渲染 3D 图形。

矿业

利用 RTX 2080 和 RTX 2080 Ti 中采用的全新 Turing 芯片架构来挖掘加密货币。

NVIDIA TESLA T4

英伟达特斯拉T4

T4 引入了 Tensor Core 技术，支持多精度计算，速度比 CPU 快 40 倍，比其 Pascal 前代产品 Tesla P4 快 3.5 倍。单个 T4 GPU 即可提供 8.1 TFLOPS 的单精度性能。

规格

TURO TU104
320个图灵张量核
2560 个 CUDA 核心
16 GB GDDR6
8.1 TFLOPS 单精度
65 FP16 TFLOPS
130 INT8 顶部
260 INT4 顶级
最大带宽 320 GB/s

兼容系统：VMware ESXi、Citrix Xenserver、KVM、Linux、Windows。

Coral USB加速器

现在，您可以使用谷歌设计的 Coral USB 加速器，将 Edge TPU 协处理器添加到任何基于 Linux 的系统中。这款小型 ASIC 芯片能够以低功耗提供高性能的机器学习推理。例如，它可以在 MobileNet v2 模型上以 100fps 的速度运行，同时功耗极低。

规格

ARM 32 位 Cortex 32 MHz
边缘 TPU ASIC（用于 Lite TensorFlow 模型）
USB 3.1 5Gb/s 传输速度

兼容 Linux 机器、Debian 6.0 或更高版本，或任何衍生版本（如 Ubuntu 10.0+），也兼容 Raspberry Pi（213 模式 B/B+）。

NVIDIA GeForce RTX 2080 Ti

NVIDIA GeForce RTX 2080 / RTX 2080 Ti

NVIDIA 的 Turing 芯片架构采用突破性技术和新一代超高速 GDDR6 内存，性能比上一代 GPU 最高可达六倍。

RTX 2080 规格

8 GB GDDR6
2944 个 CUDA 核心
最大带宽 448 GB/s
NVIDIA GPU Boost 4.0

RTX 2080 Ti 规格

11 GB GDDR6
2944 个 CUDA 核心
最大带宽 616 GB/s
NVIDIA GPU Boost 4.0

兼容Linux、CUDA/OpenCL、KVM。

NVIDIA GeForce GTX 1080

NVIDIA GeForce GTX 1080 / 1070 TI

NVIDIA 上一代芯片架构非常适合挖矿、图形渲染和计算。NVIDIA Pascal 架构以亲民的价格提供卓越的性能。

规格

8 GB DDR5
2560 个 CUDA 核心
最大带宽 320 GB/s
NVIDIA GPU Boost 3.0

兼容Linux、CUDA/OpenCL、KVM。

NVIDIA TESLA P4

NVIDIA TESLA P4 / P40 / P100

适用于机器学习和视频转码的理想芯片。NVIDIA 的 Pascal 芯片架构已被证明比其前代 Maxwell 架构速度更快、能效更高。单颗 Tesla P4 芯片即可同时转码多达 20 路视频流。

规格

Pascal GP100 或 GP104 芯片
最多可达 3584 个 CUDA 核心
最高支持 16 GB CoWoS
企业级硬件

兼容系统：VMware ESXi、Citrix Xenserver、KVM、Linux、Windows。

NVIDIA TITAN V

首款突破深度学习性能 100 万亿次浮点运算大关的 GPU。NVIDIA 的 Volta 芯片速度比其前代 Pascal 芯片快 3 倍。现在，只需少量投资，即可将您的深度学习项目设计变为现实。

规格

NVIDIA Volta芯片
5120个CUDA核心
640 个张量核心
12 GB CoWoS 堆叠式 HBM2
最大带宽 653Gbps

兼容系统：VMware ESXi、Citrix Xenserver、KVM、Linux、Windows。

为什么选择Primcast？

为惠普企业级硬件添加GPU，该硬件专为GPU扩展而设计，可消除兼容性问题或硬件性能不佳/不足的情况。您的服务部署在我们全球低延迟网络上，享有99.9%的正常运行时间SLA保障，并由GPU服务器专家提供全天候支持。