NVLink

NVLink
	Tập tin:NVidia NVLink two lines of text.png
Nhà phát triển	Nvidia
Nhà sản xuất	Nvidia; ARM; Amazon Web Services; SiFive;
Loại	Công nghệ đa GPU và CPU
Tiền nhiệm	Scalable Link Interface (SLI)

NVLink là một liên kết truyền thông nối tiếp, đa làn, phạm vi gần dựa trên dây dẫn được phát triển bởi Nvidia. Không giống như PCI Express, một thiết bị có thể bao gồm nhiều NVLink và các thiết bị có thể sử dụng mạng lưới để giao tiếp thay vì một hub/bộ chuyển mạch trung tâm. Giao thức này được công bố lần đầu vào tháng 3 năm 2014 và sử dụng một kết nối tín hiệu tốc độ cao độc quyền (NVHS).^[1]

Đối với số lượng GPU nhỏ, các làn NVLink trên một thiết bị duy nhất là đủ cho một kết nối lưới tất cả-với-tất cả. Để đáp ứng số lượng GPU cao hơn, NVLink kể từ năm 2018 sử dụng kiến trúc chuyển mạch gói, trong đó một bộ chuyển mạch trung tâm có thể phục vụ tối đa 32 cổng hai làn. NVSwitch cho NVLink 4.0 có thể tự thực hiện một số tính toán đơn giản (ví dụ: tổng, phát sóng) để giảm nhu cầu truyền thông nhờ bộ tăng tốc "SHARP".^[2]

Nguyên lý

NVLink được Nvidia phát triển để truyền dữ liệu và mã điều khiển trong các hệ thống xử lý giữa CPU và GPU và giữa các GPU với nhau. NVLink quy định một kết nối điểm-đến-điểm với tốc độ dữ liệu 20, 25, và 50 Gbit/s (tương ứng v1.0/v2.0/v3.0+) trên mỗi cặp vi sai. Đối với NVLink 1.0 và 2.0, tám cặp vi sai tạo thành một "sub-link", và hai "sub-link", mỗi cái cho một hướng, tạo thành một "link". Bắt đầu từ NVLink 3.0, chỉ có bốn cặp vi sai tạo thành một "sub-link". Đối với NVLink 2.0 trở lên, tổng tốc độ dữ liệu cho một sub-link là 25 GB/s, và tổng tốc độ dữ liệu cho một link là 50 GB/s. Mỗi GPU V100 hỗ trợ tối đa sáu link. Do đó, mỗi GPU có khả năng hỗ trợ tổng băng thông hai chiều lên tới 300 GB/s.^[3]^[4] Các sản phẩm NVLink được giới thiệu cho đến nay tập trung vào không gian ứng dụng hiệu năng cao. Được công bố vào ngày 14 tháng 5 năm 2020, NVLink 3.0 tăng tốc độ dữ liệu trên mỗi cặp vi sai từ 25 Gbit/s lên 50 Gbit/s trong khi giảm số lượng cặp trên mỗi NVLink từ 8 xuống 4. Với 12 link cho một GPU A100 dựa trên Ampere, điều này mang lại tổng băng thông là 600 GB/s.^[5] Vi kiến trúc GPU Hopper, được công bố vào tháng 3 năm 2022, có 18 link NVLink 4.0, cho phép tổng băng thông là 900 GB/s.^[6] Như vậy, NVLink 2.0, 3.0, và 4.0 đều có tốc độ dữ liệu 50 GB/s trên mỗi link hai chiều, và có số lượng link tương ứng là 6, 12, và 18.

Hiệu năng

Bảng dưới đây hiển thị so sánh các chỉ số cơ bản dựa trên các thông số kỹ thuật tiêu chuẩn:

Kết nối	Tốc độ truyền	Mã đường truyền	Điều biến	Tốc độ tải hữu ích hiệu quả trên mỗi làn hoặc NVLink (đơn hướng)	Chiều dài làn tổng cộng tối đa ^[a]	Tổng số liên kết (NVLink)	Tổng băng thông (PCIe x16 hoặc NVLink)	Triển khai trong thiết kế
PCIe 3.x	8 GT/s	128b/130b	NRZ	0.99 GB/s	50 cm (20 in)^[7]		31.51 GB/s	Pascal, Volta, Turing
PCIe 4.0	16 GT/s	128b/130b	NRZ	1.97 GB/s	20–30 cm (8–12 in)^[7]		63.02 GB/s	Volta trên Xavier, Ampere, POWER9
PCIe 5.0	32 GT/s^[8]	128b/130b	NRZ	3.94 GB/s			126.03 GB/s	Hopper
PCIe 6.0	64 GT/s	236B/256B FLIT^[9]	PAM4 FEC	7.56 GB/s			242 GB/s	Blackwell
NVLink 1.0	20 GT/s		NRZ	20 GB/s		4	160 GB/s	Pascal, POWER8+
NVLink 2.0	25 GT/s		NRZ	25 GB/s		6	300 GB/s	Volta, POWER9
NVLink 3.0	50 GT/s		NRZ	25 GB/s		12	600 GB/s	Ampere
NVLink 4.0	50 GT/s ^[10]		Cặp vi sai PAM4	25 GB/s		18	900 GB/s	Hopper, Nvidia Grace
NVLink 5.0^[11]	100 GT/s		Cặp vi sai PAM4	50 GB/s		18	1800 GB/s	Blackwell, Nvidia Grace

Bảng dưới đây so sánh các tham số bus liên quan cho các chất bán dẫn thực tế có cung cấp NVLink như một tùy chọn:

Bán dẫn	Biến thể phân phối bo mạch/bus	Kết nối	Tốc độ công nghệ truyền tải (trên mỗi làn)	Làn trên mỗi sub-link (ra + vào)	Tốc độ dữ liệu sub-link (mỗi hướng dữ liệu)^[b]	Số lượng sub-link hoặc đơn vị	Tổng tốc độ dữ liệu (ra + vào)^[b]	Tổng số làn (ra + vào)	Tổng tốc độ dữ liệu (ra + vào)^[b]
Nvidia GP100	P100 SXM,^[12] P100 PCI-E^[13]	PCIe 3.0	08 GT/s	16 + 16 ^[c]	128 Gbit/s = 16 GB/s	1	16 + 16 GB/s^[14]	32 ^[d]	032 GB/s
Nvidia GV100	V100 SXM2,^[15] V100 PCI-E^[16]	PCIe 3.0	08 GT/s	16 + 16 ^[c]	128 Gbit/s = 16 GB/s	1	016 + 016 GB/s	32 ^[d]	032 GB/s
Nvidia TU104	GeForce RTX 2080, Quadro RTX 5000	PCIe 3.0	08 GT/s	16 + 16 ^[c]	128 Gbit/s = 16 GB/s	1	016 + 016 GB/s	32 ^[d]	032 GB/s
Nvidia TU102	GeForce RTX 2080 Ti, Quadro RTX 6000/8000	PCIe 3.0	08 GT/s	16 + 16 ^[c]	128 Gbit/s = 16 GB/s	1	016 + 016 GB/s	32 ^[d]	032 GB/s
Nvidia GA100^[17]^[18] Nvidia GA102^[19]	Ampere A100 (SXM4 & PCIe)^[20]	PCIe 4.0	016 GT/s	16 + 16 ^[c]	256 Gbit/s = 32 GB/s	1	032 + 032 GB/s	32 ^[d]	064 GB/s
Nvidia GP100	P100 SXM, (không có sẵn cho P100 PCI-E)^[21]	NVLink 1.0	20 GT/s	08 + 08 ^[e]	160 Gbit/s = 20 GB/s	4	080 + 080 GB/s	64	160 GB/s
Nvidia GV100	V100 SXM2^[22] (không có sẵn cho V100 PCI-E)	NVLink 2.0	25 GT/s	08 + 08 ^[e]	200 Gbit/s = 25 GB/s	6^[23]	150 + 150 GB/s	96	300 GB/s
Nvidia TU104	GeForce RTX 2080, Quadro RTX 5000^[24]	NVLink 2.0	25 GT/s	08 + 08 ^[e]	200 Gbit/s = 25 GB/s	1	025 + 025 GB/s	16	050 GB/s
Nvidia TU102	GeForce RTX 2080 Ti, Quadro RTX 6000/8000^[24]	NVLink 2.0	25 GT/s	08 + 08 ^[e]	200 Gbit/s = 25 GB/s	2	050 + 050 GB/s	32	100 GB/s
Nvidia GA100^[17]^[18]	Ampere A100 (SXM4 & PCIe)^[20]	NVLink 3.0	50 GT/s	04 + 04 ^[e]	200 Gbit/s = 25 GB/s	12^[25]	300 + 300 GB/s	96	600 GB/s
Nvidia GA102^[19]	GeForce RTX 3090, Quadro RTX A6000	NVLink 3.0	28.125 GT/s	04 + 04 ^[e]	112.5 Gbit/s = 14.0625 GB/s	4	56.25 + 56.25 GB/s	16	112.5 GB/s
NVSwitch cho Hopper^[26]	(bộ chuyển mạch 64 cổng kết nối đầy đủ)	NVLink 4.0	106.25 GT/s	09 + 09 ^[e]	450 Gbit/s	18	3600 + 3600 GB/s	128	7200 GB/s
CPU Nvidia Grace^[27]	Siêu chip Nvidia GH200	PCIe-5 (4x, 16x) @ 512 GB/s
CPU Nvidia Grace^[27]	Siêu chip Nvidia GH200	NVLink-C2C @ 900 GB/s
GPU Nvidia Hopper^[27]	Siêu chip Nvidia GH200	NVLink-C2C @ 900 GB/s
GPU Nvidia Hopper^[27]	Siêu chip Nvidia GH200	NVLink 4 (18x) @ 900 GB/s

^ PCIe: bao gồm 5" cho PCB
^ ^a ^b ^c Các cột tốc độ dữ liệu là các giá trị lý thuyết tối đa.
^ ^a ^b ^c ^d ^e giá trị mẫu; các phân đoạn khác cho việc sử dụng làn PCIe có thể thực hiện được.
^ ^a ^b ^c ^d ^e một làn PCIe đơn truyền dữ liệu qua một cặp vi sai.
^ ^a ^b ^c ^d ^e ^f ^g giá trị mẫu; việc gộp các sub-link NVLink có thể thực hiện được.

Hiệu năng trong thế giới thực có thể được xác định bằng cách áp dụng các chi phí bổ sung truyền dữ liệu khác nhau, cũng như tỷ lệ sử dụng. Chúng đến từ nhiều nguồn khác nhau:^{[cần dẫn nguồn]}

128b/130b mã đường truyền (xem ví dụ, truyền dữ liệu PCI Express cho phiên bản 3.0 trở lên)
Các ký tự điều khiển liên kết
Tiêu đề giao dịch (Transaction header)
Khả năng đệm
Sử dụng DMA ở phía máy tính

Những hạn chế vật lý này thường làm giảm tốc độ dữ liệu xuống còn khoảng 90-95 phần trăm tốc độ truyền tải.^{[cần dẫn nguồn]} Các thử nghiệm NVLink cho thấy tốc độ truyền đạt được khoảng 35.3 Gbit/sBản mẫu:Contradictory inline (máy chủ đến thiết bị) cho kết nối NVLink 40 Gbit/s (2 làn phụ hướng lên) tới một GPU P100 trong hệ thống được vận hành bởi một bộ CPU IBM POWER8.^[28]

Sử dụng với các bo mạch cắm

Đối với các phiên bản khác nhau của bo mạch cắm (hiện đã có một số lượng nhỏ các bo mạch GPU chơi game cao cấp và đồ họa chuyên nghiệp có tính năng này) để lộ các đầu nối bổ sung để gia nhập chúng vào một nhóm NVLink, một số lượng tương tự các phích cắm kết nối dựa trên PCB hơi khác nhau, tương đối nhỏ gọn cũng tồn tại. Thông thường chỉ có các bo mạch cùng loại mới có thể ghép đôi với nhau do thiết kế vật lý và logic của chúng. Đối với một số cấu hình, cần áp dụng hai phích cắm giống hệt nhau để đạt được tốc độ dữ liệu đầy đủ. Cho đến nay, phích cắm điển hình có hình chữ U với một đầu nối cạnh lưới mịn trên mỗi đầu của hình hướng ra xa người xem. Chiều rộng của phích cắm xác định khoảng cách các card cắm cần được đặt trên bo mạch chủ của hệ thống máy tính lưu trữ - khoảng cách đặt card thường được xác định bởi phích cắm phù hợp (các chiều rộng phích cắm hiện có là 3 đến 5 khe cắm và cũng phụ thuộc vào loại bo mạch).^[29]^[30] Kết nối này thường được gọi là Scalable Link Interface (SLI) từ năm 2004 do thiết kế cấu trúc và hình dáng của nó, mặc dù thiết kế dựa trên NVLink hiện đại có bản chất kỹ thuật khá khác biệt với các tính năng khác nhau ở các cấp độ cơ bản so với thiết kế trước đây. Các thiết bị thực tế được báo cáo là:^[31]

Quadro GP100 (một cặp card sẽ sử dụng tối đa 2 cầu nối;^[32] thiết lập thực hiện 2 hoặc 4 kết nối NVLink với tốc độ lên đến 160 GB/s^[33] - điều này có thể tương ứng với NVLink 1.0 với 20 GT/s)
Quadro GV100 (một cặp card sẽ cần tối đa 2 cầu nối và thực hiện lên đến 200 GB/s^[29] - điều này có thể tương ứng với NVLink 2.0 với 25 GT/s và 4 link)
GeForce RTX 2080 dựa trên TU104 (với cầu nối đơn "GeForce RTX NVLink-Bridge"^[34])
GeForce RTX 2080 Ti dựa trên TU102 (với cầu nối đơn "GeForce RTX NVLink-Bridge"^[30])
GeForce RTX 3090 dựa trên GA102 (với cầu nối độc nhất "GeForce RTX NVLink-Bridge (cho các sản phẩm dòng 30)")^[35]
Quadro RTX 5000^[36] dựa trên TU104^[37] (với cầu nối đơn "NVLink" lên đến 50 GB/s^[38] - điều này có thể tương ứng với NVLink 2.0 với 25 GT/s và 1 link)
Quadro RTX 6000^[36] dựa trên TU102^[37] (với cầu nối đơn "NVLink HB" lên đến 100 GB/s^[38] - điều này có thể tương ứng với NVLink 2.0 với 25 GT/s và 2 link)
Quadro RTX 8000^[36] dựa trên TU102^[39] (với cầu nối đơn "NVLink HB" lên đến 100 GB/s^[38] - điều này có thể tương ứng với NVLink 2.0 với 25 GT/s và 2 link)

Phần mềm dịch vụ và lập trình

Đối với các dòng sản phẩm Tesla, Quadro và Grid, NVML-API (Nvidia Management Library API) cung cấp một tập hợp các hàm để điều khiển theo lập trình một số khía cạnh của kết nối NVLink trên các hệ thống Windows và Linux, chẳng hạn như đánh giá thành phần và phiên bản cùng với truy vấn trạng thái/lỗi và giám sát hiệu năng.^[40] Hơn nữa, với việc cung cấp thư viện NCCL (Nvidia Collective Communications Library), các nhà phát triển trong không gian công cộng sẽ được hỗ trợ để thực hiện, ví dụ, các triển khai mạnh mẽ cho trí tuệ nhân tạo và các chủ đề tiêu tốn nhiều tài nguyên tính toán tương tự trên nền tảng NVLink.^[41] Trang "3D Settings" » "Configure SLI, Surround, PhysX" trong bảng điều khiển Nvidia Control panel và ứng dụng mẫu CUDA "simpleP2P" sử dụng các API như vậy để thực hiện các dịch vụ của họ đối với các tính năng NVLink. Trên nền tảng Linux, ứng dụng dòng lệnh với lệnh phụ "nvidia-smi nvlink" cung cấp một tập hợp thông tin và điều khiển nâng cao tương tự.^[31]

Lịch sử

Vào ngày 5 tháng 4 năm 2016, Nvidia thông báo rằng NVLink sẽ được triển khai trong GPU GP100 dựa trên vi kiến trúc Pascal, được sử dụng trong các sản phẩm như Nvidia Tesla P100.^[42] Với sự ra đời của máy tính hiệu năng cao DGX-1, có thể có tối đa tám mô-đun P100 trong một hệ thống rack duy nhất được kết nối với tối đa hai CPU chủ. Bo mạch mang (...) cho phép một bo mạch chuyên dụng để định tuyến các kết nối NVLink – mỗi P100 yêu cầu 800 chân, 400 cho PCIe + nguồn, và 400 chân khác cho NVLink, tổng cộng lên tới gần 1600 đường dẫn bo mạch chỉ riêng cho NVLink (...).^[43] Mỗi CPU có kết nối trực tiếp đến 4 đơn vị P100 thông qua PCIe và mỗi P100 có một NVLink đến 3 chiếc P100 khác trong cùng nhóm CPU cộng với một NVLink nữa đến một P100 trong nhóm CPU kia. Mỗi NVLink (giao diện liên kết) cung cấp tốc độ hai chiều 20 GB/s lên và 20 GB/s xuống, với 4 link mỗi GPU GP100, tạo ra tổng băng thông gộp là 80 GB/s lên và 80 GB/s xuống khác.^[44] NVLink hỗ trợ định tuyến để trong thiết kế DGX-1, đối với mỗi P100, tổng cộng 4 trong số 7 chiếc P100 còn lại có thể tiếp cận trực tiếp và 3 chiếc còn lại có thể tiếp cận chỉ với một bước nhảy (hop). Theo các mô tả trong các ấn phẩm trên blog của Nvidia, từ năm 2014 NVLink cho phép gộp các liên kết riêng lẻ để tăng hiệu năng điểm-đến-điểm, chẳng hạn như thiết kế với hai chiếc P100 và tất cả các liên kết được thiết lập giữa hai đơn vị sẽ cho phép băng thông NVLink đầy đủ là 80 GB/s giữa chúng.^[45]

Tại GTC2017, Nvidia đã giới thiệu thế hệ GPU Volta của mình và chỉ ra việc tích hợp phiên bản 2.0 sửa đổi của NVLink cho phép tổng tốc độ dữ liệu I/O là 300 GB/s cho một chip duy nhất đối với thiết kế này, và thông báo thêm tùy chọn đặt hàng trước với lời hứa giao hàng vào Quý 3/2017 cho các máy tính hiệu năng cao DGX-1 và DGX-Station sẽ được trang bị các mô-đun GPU loại V100 và triển khai NVLink 2.0 theo kiểu nối mạng (hai nhóm gồm bốn mô-đun V100 với kết nối liên nhóm) hoặc kiểu kết nối đầy đủ của một nhóm gồm bốn mô-đun V100.

Trong năm 2017–2018, IBM và Nvidia đã bàn giao các siêu máy tính Summit và Sierra cho Bộ Năng lượng Hoa Kỳ^[46], kết hợp dòng CPU POWER9 của IBM và kiến trúc Volta của Nvidia, sử dụng NVLink 2.0 cho các kết nối CPU-GPU và GPU-GPU và InfiniBand EDR cho các kết nối hệ thống.^[47]

Vào năm 2020, Nvidia thông báo rằng họ sẽ không còn thêm các cấu hình driver SLI mới trên dòng RTX 2000 và cũ hơn kể từ ngày 1 tháng 1 năm 2021.^[48]

Vào năm 2022, đầu nối NVLink đã bị loại bỏ trên kiến trúc Ada Lovelace với CEO Nvidia Jensen Huang nêu rõ rằng phần I/O được giải phóng từ việc loại bỏ này sẽ được sử dụng cho các khả năng xử lý AI và ý định chuyển sang tiêu chuẩn PCIe Gen 5.0.^[49]^[50]^[51] Một số người dùng báo cáo rằng một số bo mạch nhất định có dấu vết của các đầu nối NVLink đã bị loại bỏ.^[52]^[53]^[54] Công nghệ NVLink vẫn khả dụng cho các trung tâm dữ liệu và người dùng doanh nghiệp.^[55]

Hỗ trợ bởi các nhà sản xuất khác

Vào năm 2025, NVLink Fusion đã được công bố để cho phép các nhà thiết kế chip cấp phép và tích hợp NVLink vào các sản phẩm của họ.^[56] Sau đó, NVLink Fusion đã được cấp phép bởi ARM và SiFive cho các sản phẩm trung tâm dữ liệu,^[57]^[58] và Amazon Web Services cho máy tăng tốc Trainium4 sắp tới của họ.^[59]

Xem thêm

Tham khảo

^ Nvidia NVLINK 2.0 arrives in IBM servers next year by Jon Worrel on fudzilla.com on August 24, 2016
^ Kennedy, Patrick (ngày 23 tháng 8 năm 2022). "NVIDIA NVLink4 NVSwitch at Hot Chips 34". ServeTheHome.
^ "NVIDIA DGX-1 With Tesla V100 System Architecture" (PDF).
^ "What Is NVLink?". Nvidia. ngày 14 tháng 11 năm 2014.
^ Ryan Smith (ngày 14 tháng 5 năm 2020). "NVIDIA Ampere Unleashed: NVIDIA Announces New GPU Architecture, A100 GPU, and Accelerator". AnandTech. Bản gốc lưu trữ ngày 14 tháng 5 năm 2020.
^ Jacobs, Blair (ngày 23 tháng 3 năm 2022). "Nvidia reveals next-gen Hopper GPU architecture". Club386 (bằng tiếng Anh). Truy cập ngày 4 tháng 5 năm 2022.
^ ^a ^b "PCIe - PCI Express (1.1 / 2.0 / 3.0 / 4.0 / 5.0)". www.elektronik-kompendium.de.
^ Alcorn, Paul (ngày 17 tháng 1 năm 2019). "PCIe 5.0 Is Ready For Prime Time". Tom's Hardware.
^ "The PCIe 6.0 Specification Webinar Q&A: A Deeper Dive into FLIT Mode, PAM4, and Forward Error Correction (FEC) PCI-SIG". pcisig.com. PCI-SIG. Truy cập ngày 28 tháng 11 năm 2024. Chúng tôi đã xem xét nhiều kích thước FLIT khác nhau và quyết định chọn 256 Byte với 236 byte tải trọng TLP và hiệu suất TLP là 92%.
^ "NVLink-Network Switch - NVIDIA's Switch Chip for High Communication-Bandwidth SuperPODs" (PDF). HotChips 34. ngày 23 tháng 8 năm 2022.
^ "NVIDIA Blackwell Architecture Technical Overview". NVIDIA (bằng tiếng Anh). tr. 8. Truy cập ngày 28 tháng 11 năm 2024. NVLink thế hệ thứ năm tăng gấp đôi hiệu suất của NVLink thế hệ thứ tư trong NVIDIA Hopper. Trong khi NVLink mới trong GPU Blackwell cũng sử dụng hai cặp vi sai tốc độ cao ở mỗi hướng để tạo thành một liên kết duy nhất như trong GPU Hopper, NVIDIA Blackwell tăng gấp đôi băng thông hiệu dụng trên mỗi liên kết lên 50 GB/giây ở mỗi hướng.
^ online, heise. "NVIDIA Tesla P100 [SXM2], 16GB HBM2 (NVTP100-SXM) | heise online Preisvergleich / Deutschland". geizhals.de.
^ online, heise (ngày 14 tháng 8 năm 2023). "PNY Tesla P100 [PCIe], 16GB HBM2 (TCSP100M-16GB-PB/NVTP100-16) ab € 4990,00 (2020) | heise online Preisvergleich / Deutschland". geizhals.de.
^ NVLink Takes GPU Acceleration To The Next Level by Timothy Prickett Morgan at nextplatform.com on May 4, 2016
^ "NVIDIA Tesla V100 SXM2 16 GB Specs". TechPowerUp. ngày 14 tháng 8 năm 2023.
^ online, heise (ngày 14 tháng 8 năm 2023). "PNY Quadro GV100, 32GB HBM2, 4x DP (VCQGV100-PB) ab € 10199,00 (2020) | heise online Preisvergleich / Deutschland". geizhals.de.
^ ^a ^b Morgan, Timothy Prickett (ngày 14 tháng 5 năm 2020). "Nvidia Unifies AI Compute With "Ampere" GPU". The Next Platform.
^ ^a ^b "Data sheet" (PDF). www.nvidia.com. Truy cập ngày 15 tháng 9 năm 2020.
^ ^a ^b "NVIDIA ampere GA102 GPU Architecture Whitepaper" (PDF). nvidia.com. Truy cập ngày 2 tháng 5 năm 2023.
^ ^a ^b "Tensor Core GPU" (PDF). nvidia.com. Truy cập ngày 2 tháng 5 năm 2023.
^ Chris Williams (ngày 20 tháng 6 năm 2016). "All aboard the PCIe bus for Nvidia's Tesla P100 supercomputer grunt". theregister.co.uk.
^ online, heise (ngày 22 tháng 6 năm 2017). "Nvidia Tesla V100: PCIe-Steckkarte mit Volta-Grafikchip und 16 GByte Speicher angekündigt". heise online.
^ GV100 Blockdiagramm in "GTC17: NVIDIA präsentiert die nächste GPU-Architektur Volta - Tesla V100 mit 5.120 Shadereinheiten und 16 GB HBM2" by Andreas Schilling on hardwareluxx.de on May 10, 2017
^ ^a ^b Angelini, Chris (ngày 14 tháng 9 năm 2018). "Nvidia's Turing Architecture Explored: Inside the GeForce RTX 2080". Tom's Hardware. tr. 7. Truy cập ngày 28 tháng 2 năm 2019. TU102 và TU104 là các GPU máy tính để bàn đầu tiên của Nvidia sử dụng kết nối NVLink thay vì giao diện Multiple Input/Output (MIO) để hỗ trợ SLI. Cái trước cho phép hai liên kết x8, trong khi cái sau bị giới hạn ở một. Mỗi liên kết hỗ trợ băng thông hai chiều lên tới 50 GB/s. Vì vậy, GeForce RTX 2080 Ti có khả năng đạt tới 100 GB/s giữa các card và RTX 2080 có thể đạt một nửa mức đó.
^ Schilling, Andreas (ngày 22 tháng 6 năm 2020). "A100 PCIe: NVIDIA GA100-GPU kommt auch als PCI-Express-Variante". Hardwareluxx. Truy cập ngày 2 tháng 5 năm 2023.
^ "NVLINK AND NVSWITCH". www.nvidia.com. Truy cập ngày 7 tháng 2 năm 2021.
^ ^a ^b ^c ^d "A Big Memory Nvidia GH200 Next to Your Desk: Closer Than You Think". ngày 23 tháng 2 năm 2024.
^ Eliot Eshelman (ngày 26 tháng 1 năm 2017). "Comparing NVLink vs PCI-E with NVIDIA Tesla P100 GPUs on OpenPOWER Servers". microway.com.
^ ^a ^b "NVIDIA Quadro NVLink Grafikprozessor-Zusammenschaltung in Hochgeschwindigkeit". NVIDIA.
^ ^a ^b "Grafik neu erfunden: NVIDIA GeForce RTX 2080 Ti-Grafikkarte". NVIDIA.
^ ^a ^b "NVLink on NVIDIA GeForce RTX 2080 & 2080 Ti in Windows 10". Puget Systems. ngày 5 tháng 10 năm 2018.
^ [1]^{[liên kết hỏng]}
^ Schilling, Andreas (ngày 5 tháng 2 năm 2017). "NVIDIA präsentiert Quadro GP100 mit GP100-GPU und 16 GB HBM2". Hardwareluxx.
^ "NVIDIA GeForce RTX 2080 Founders Edition Graphics Card". NVIDIA.
^ "NVIDIA Reserves NVLink Support For The RTX 3090". TechPowerUp.
^ ^a ^b ^c "NVIDIA Quadro Graphics Cards for Professional Design Workstations". NVIDIA.
^ ^a ^b "NVIDIA Quadro RTX 6000 und RTX 5000 Ready für Pre-Order". ngày 1 tháng 10 năm 2018.
^ ^a ^b ^c "NVLink | pny.com". www.pny.com.
^ "NVIDIA Quadro RTX 8000 Specs". TechPowerUp. ngày 14 tháng 8 năm 2023.
^ "NvLink Methods". docs.nvidia.com.
^ "NVIDIA Collective Communications Library (NCCL)". NVIDIA Developer. ngày 10 tháng 5 năm 2017.
^ "Inside Pascal: NVIDIA's Newest Computing Platform". ngày 5 tháng 4 năm 2016.
^ Anandtech.com
^ NVIDIA Unveils the DGX-1 HPC Server: 8 Teslas, 3U, Q2 2016 by anandtech.com on April, 2016
^ How NVLink Will Enable Faster, Easier Multi-GPU Computing by Mark Harris on November 14, 2014
^ "Whitepaper: Summit and Sierra Supercomputers" (PDF). ngày 1 tháng 11 năm 2014.
^ "Nvidia Volta, IBM POWER9 Land Contracts For New US Government Supercomputers". AnandTech. ngày 17 tháng 11 năm 2014. Bản gốc lưu trữ ngày 18 tháng 11 năm 2014.
^ "RIP: Nvidia slams the final nail in SLI's coffin, no new profiles after 2020". PC World. ngày 18 tháng 9 năm 2020.
^ "NVIDIA kills NVLink support for Ada Lovelace, a silent death for SLI". TweakTown (bằng tiếng Anh). ngày 25 tháng 9 năm 2022. Truy cập ngày 4 tháng 3 năm 2026.
^ published, Chuong Nguyen (ngày 21 tháng 9 năm 2022). "Nvidia kills off NVLink on RTX 4090". Windows Central (bằng tiếng Anh). Truy cập ngày 4 tháng 3 năm 2026.
^ "Jensen Confirms: NVLink Support in Ada Lovelace is Gone". ngày 21 tháng 9 năm 2022.
^ "RTX 5090 Nvlink". Level1Techs Forums (bằng tiếng Anh). ngày 18 tháng 2 năm 2025. Truy cập ngày 4 tháng 3 năm 2026.
^ published, Anton Shilov (ngày 13 tháng 10 năm 2022). "Gigabyte's RTX 4090 has Traces of NVLink". Tom's Hardware (bằng tiếng Anh). Truy cập ngày 4 tháng 3 năm 2026.
^ Wilson, Jason R. (ngày 14 tháng 10 năm 2022). "Gigabyte GeForce RTX 4090 PCB Shows Left Out NVIDIA NVLINK Traces". Wccftech (bằng tiếng Anh). Truy cập ngày 4 tháng 3 năm 2026.
^ "NVLink & NVSwitch for Advanced Multi-GPU Communication". NVIDIA (bằng tiếng Anh). Truy cập ngày 4 tháng 3 năm 2026.
^ Smith, Ryan (ngày 18 tháng 5 năm 2025). "NVIDIA Computex 2025 Keynote Live Coverage". Serve the Home. Truy cập ngày 16 tháng 1 năm 2026.
^ Smith, Ryan (ngày 15 tháng 1 năm 2026). "SiFive To Adopt NVLInk Fusion For Future Data Center RISC-V CPU Designs". Serve the Home. Truy cập ngày 16 tháng 1 năm 2026.
^ Robinson, Cliff (ngày 17 tháng 11 năm 2025). "Arm Joins the NVIDIA NVLink Fusion Ecosystem". Serve the Home. Truy cập ngày 16 tháng 1 năm 2026.
^ Robinson, Cliff (ngày 2 tháng 12 năm 2025). "NVIDIA NVLink Fusion Tapped for Future AWS Trainium4 Deployments". Serve the Home. Truy cập ngày 16 tháng 1 năm 2026.

Bản mẫu:Nvidia Bản mẫu:Computer-bus

[7] PCIe: bao gồm 5" cho PCB

[datarate-13] Các cột tốc độ dữ liệu là các giá trị lý thuyết tối đa.

[fractions-16] á trị mẫu; các phân đoạn khác cho việc sử dụng làn PCIe có thể thực hiện được.

[diff_pair-18] ột làn PCIe đơn truyền dữ liệu qua một cặp vi sai.

[sub_bundling-26] ^ ^a ^b ^c ^d ^e ^f ^g giá trị mẫu; việc gộp các sub-link NVLink có thể thực hiện được.

[1] Nvidia NVLINK 2.0 arrives in IBM servers next year by Jon Worrel on fudzilla.com on August 24, 2016

[2] Kennedy, Patrick (ngày 23 tháng 8 năm 2022). "NVIDIA NVLink4 NVSwitch at Hot Chips 34". ServeTheHome.

[3] "NVIDIA DGX-1 With Tesla V100 System Architecture" (PDF).

[4] "What Is NVLink?". Nvidia. ngày 14 tháng 11 năm 2014.

[anand-A100-5] Ryan Smith (ngày 14 tháng 5 năm 2020). "NVIDIA Ampere Unleashed: NVIDIA Announces New GPU Architecture, A100 GPU, and Accelerator". AnandTech. Bản gốc lưu trữ ngày 14 tháng 5 năm 2020.

[6] Jacobs, Blair (ngày 23 tháng 3 năm 2022). "Nvidia reveals next-gen Hopper GPU architecture". Club386 (bằng tiếng Anh). Truy cập ngày 4 tháng 5 năm 2022.

[auto3-8] "PCIe - PCI Express (1.1 / 2.0 / 3.0 / 4.0 / 5.0)". www.elektronik-kompendium.de.

[9] Alcorn, Paul (ngày 17 tháng 1 năm 2019). "PCIe 5.0 Is Ready For Prime Time". Tom's Hardware.

[pcisig_gen6_pam4-10] "The PCIe 6.0 Specification Webinar Q&A: A Deeper Dive into FLIT Mode, PAM4, and Forward Error Correction (FEC) PCI-SIG". pcisig.com. PCI-SIG. Truy cập ngày 28 tháng 11 năm 2024. Chúng tôi đã xem xét nhiều kích thước FLIT khác nhau và quyết định chọn 256 Byte với 236 byte tải trọng TLP và hiệu suất TLP là 92%.

[hotchips_nvlink-11] "NVLink-Network Switch - NVIDIA's Switch Chip for High Communication-Bandwidth SuperPODs" (PDF). HotChips 34. ngày 23 tháng 8 năm 2022.

[nvidia_blackwell-12] "NVIDIA Blackwell Architecture Technical Overview". NVIDIA (bằng tiếng Anh). tr. 8. Truy cập ngày 28 tháng 11 năm 2024. NVLink thế hệ thứ năm tăng gấp đôi hiệu suất của NVLink thế hệ thứ tư trong NVIDIA Hopper. Trong khi NVLink mới trong GPU Blackwell cũng sử dụng hai cặp vi sai tốc độ cao ở mỗi hướng để tạo thành một liên kết duy nhất như trong GPU Hopper, NVIDIA Blackwell tăng gấp đôi băng thông hiệu dụng trên mỗi liên kết lên 50 GB/giây ở mỗi hướng.

[14] , heise. "NVIDIA Tesla P100 [SXM2], 16GB HBM2 (NVTP100-SXM) | heise online Preisvergleich / Deutschland". geizhals.de.

[15] , heise (ngày 14 tháng 8 năm 2023). "PNY Tesla P100 [PCIe], 16GB HBM2 (TCSP100M-16GB-PB/NVTP100-16) ab € 4990,00 (2020) | heise online Preisvergleich / Deutschland". geizhals.de.

[17] NVLink Takes GPU Acceleration To The Next Level by Timothy Prickett Morgan at nextplatform.com on May 4, 2016

[19] "NVIDIA Tesla V100 SXM2 16 GB Specs". TechPowerUp. ngày 14 tháng 8 năm 2023.

[20] , heise (ngày 14 tháng 8 năm 2023). "PNY Quadro GV100, 32GB HBM2, 4x DP (VCQGV100-PB) ab € 10199,00 (2020) | heise online Preisvergleich / Deutschland". geizhals.de.

[auto-21] Morgan, Timothy Prickett (ngày 14 tháng 5 năm 2020). "Nvidia Unifies AI Compute With "Ampere" GPU". The Next Platform.

[auto1-22] "Data sheet" (PDF). www.nvidia.com. Truy cập ngày 15 tháng 9 năm 2020.

[nvidia.com-23] "NVIDIA ampere GA102 GPU Architecture Whitepaper" (PDF). nvidia.com. Truy cập ngày 2 tháng 5 năm 2023.

[ReferenceA-24] "Tensor Core GPU" (PDF). nvidia.com. Truy cập ngày 2 tháng 5 năm 2023.

[25] Chris Williams (ngày 20 tháng 6 năm 2016). "All aboard the PCIe bus for Nvidia's Tesla P100 supercomputer grunt". theregister.co.uk.

[27] , heise (ngày 22 tháng 6 năm 2017). "Nvidia Tesla V100: PCIe-Steckkarte mit Volta-Grafikchip und 16 GByte Speicher angekündigt". heise online.

[28] GV100 Blockdiagramm in "GTC17: NVIDIA präsentiert die nächste GPU-Architektur Volta - Tesla V100 mit 5.120 Shadereinheiten und 16 GB HBM2" by Andreas Schilling on hardwareluxx.de on May 10, 2017

[tomshardware-geforcertx-29] Angelini, Chris (ngày 14 tháng 9 năm 2018). "Nvidia's Turing Architecture Explored: Inside the GeForce RTX 2080". Tom's Hardware. tr. 7. Truy cập ngày 28 tháng 2 năm 2019. TU102 và TU104 là các GPU máy tính để bàn đầu tiên của Nvidia sử dụng kết nối NVLink thay vì giao diện Multiple Input/Output (MIO) để hỗ trợ SLI. Cái trước cho phép hai liên kết x8, trong khi cái sau bị giới hạn ở một. Mỗi liên kết hỗ trợ băng thông hai chiều lên tới 50 GB/s. Vì vậy, GeForce RTX 2080 Ti có khả năng đạt tới 100 GB/s giữa các card và RTX 2080 có thể đạt một nửa mức đó.

[30] Schilling, Andreas (ngày 22 tháng 6 năm 2020). "A100 PCIe: NVIDIA GA100-GPU kommt auch als PCI-Express-Variante". Hardwareluxx. Truy cập ngày 2 tháng 5 năm 2023.

[:0-31] "NVLINK AND NVSWITCH". www.nvidia.com. Truy cập ngày 7 tháng 2 năm 2021.

[hpcwire.com-32] "A Big Memory Nvidia GH200 Next to Your Desk: Closer Than You Think". ngày 23 tháng 2 năm 2024.

[33] Eliot Eshelman (ngày 26 tháng 1 năm 2017). "Comparing NVLink vs PCI-E with NVIDIA Tesla P100 GPUs on OpenPOWER Servers". microway.com.

[auto2-34] "NVIDIA Quadro NVLink Grafikprozessor-Zusammenschaltung in Hochgeschwindigkeit". NVIDIA.

[auto7-35] "Grafik neu erfunden: NVIDIA GeForce RTX 2080 Ti-Grafikkarte". NVIDIA.

[auto5-36] "NVLink on NVIDIA GeForce RTX 2080 & 2080 Ti in Windows 10". Puget Systems. ngày 5 tháng 10 năm 2018.

[37] [1]^{[liên kết hỏng]}

[38] Schilling, Andreas (ngày 5 tháng 2 năm 2017). "NVIDIA präsentiert Quadro GP100 mit GP100-GPU und 16 GB HBM2". Hardwareluxx.

[39] "NVIDIA GeForce RTX 2080 Founders Edition Graphics Card". NVIDIA.

[40] "NVIDIA Reserves NVLink Support For The RTX 3090". TechPowerUp.

[auto6-41] "NVIDIA Quadro Graphics Cards for Professional Design Workstations". NVIDIA.

[auto8-42] "NVIDIA Quadro RTX 6000 und RTX 5000 Ready für Pre-Order". ngày 1 tháng 10 năm 2018.

[auto4-43] "NVLink | pny.com". www.pny.com.

[44] "NVIDIA Quadro RTX 8000 Specs". TechPowerUp. ngày 14 tháng 8 năm 2023.

[45] "NvLink Methods". docs.nvidia.com.

[46] "NVIDIA Collective Communications Library (NCCL)". NVIDIA Developer. ngày 10 tháng 5 năm 2017.

[47] "Inside Pascal: NVIDIA's Newest Computing Platform". ngày 5 tháng 4 năm 2016.

[48] Anandtech.com

[49] NVIDIA Unveils the DGX-1 HPC Server: 8 Teslas, 3U, Q2 2016 by anandtech.com on April, 2016

[50] How NVLink Will Enable Faster, Easier Multi-GPU Computing by Mark Harris on November 14, 2014

[51] "Whitepaper: Summit and Sierra Supercomputers" (PDF). ngày 1 tháng 11 năm 2014.

[52] "Nvidia Volta, IBM POWER9 Land Contracts For New US Government Supercomputers". AnandTech. ngày 17 tháng 11 năm 2014. Bản gốc lưu trữ ngày 18 tháng 11 năm 2014.

[53] "RIP: Nvidia slams the final nail in SLI's coffin, no new profiles after 2020". PC World. ngày 18 tháng 9 năm 2020.

[54] "NVIDIA kills NVLink support for Ada Lovelace, a silent death for SLI". TweakTown (bằng tiếng Anh). ngày 25 tháng 9 năm 2022. Truy cập ngày 4 tháng 3 năm 2026.

[55] ublished, Chuong Nguyen (ngày 21 tháng 9 năm 2022). "Nvidia kills off NVLink on RTX 4090". Windows Central (bằng tiếng Anh). Truy cập ngày 4 tháng 3 năm 2026.

[56] "Jensen Confirms: NVLink Support in Ada Lovelace is Gone". ngày 21 tháng 9 năm 2022.

[57] "RTX 5090 Nvlink". Level1Techs Forums (bằng tiếng Anh). ngày 18 tháng 2 năm 2025. Truy cập ngày 4 tháng 3 năm 2026.

[58] ublished, Anton Shilov (ngày 13 tháng 10 năm 2022). "Gigabyte's RTX 4090 has Traces of NVLink". Tom's Hardware (bằng tiếng Anh). Truy cập ngày 4 tháng 3 năm 2026.

[59] Wilson, Jason R. (ngày 14 tháng 10 năm 2022). "Gigabyte GeForce RTX 4090 PCB Shows Left Out NVIDIA NVLINK Traces". Wccftech (bằng tiếng Anh). Truy cập ngày 4 tháng 3 năm 2026.

[60] "NVLink & NVSwitch for Advanced Multi-GPU Communication". NVIDIA (bằng tiếng Anh). Truy cập ngày 4 tháng 3 năm 2026.

[61] Smith, Ryan (ngày 18 tháng 5 năm 2025). "NVIDIA Computex 2025 Keynote Live Coverage". Serve the Home. Truy cập ngày 16 tháng 1 năm 2026.

[62] Smith, Ryan (ngày 15 tháng 1 năm 2026). "SiFive To Adopt NVLInk Fusion For Future Data Center RISC-V CPU Designs". Serve the Home. Truy cập ngày 16 tháng 1 năm 2026.

[63] Robinson, Cliff (ngày 17 tháng 11 năm 2025). "Arm Joins the NVIDIA NVLink Fusion Ecosystem". Serve the Home. Truy cập ngày 16 tháng 1 năm 2026.

[64] Robinson, Cliff (ngày 2 tháng 12 năm 2025). "NVIDIA NVLink Fusion Tapped for Future AWS Trainium4 Deployments". Serve the Home. Truy cập ngày 16 tháng 1 năm 2026.

[1]

[2]

[3]

[4]

[5]

[6]

[a]

[7]

[8]

[9]

[10]

[11]

[b]

[12]

[13]

[c]

[14]

[d]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[e]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]