You are on page 1of 17

Tìm hiểu kiến trúc mới Intel Xeon Scalable

Nhóm 4:
Nguyễn Hải Quang
Mã số học viên 20202479M
Nguyễn Hoàng Dương
Mã số học viên 20202483M

1
trung tâm dữ liệu và các mạng hiện
Tóm tắt : - Trên khắp thế giới kỹ đại, sẵn sàng trong tương lai để có
thuật số đang ngày càng phát triển, thể nhanh chóng điều chỉnh và mở
các xu hướng công nghệ đột phá và rộng quy mô.
mới nổi ngày càng tác động đến các
nền kinh tế thế giới. Khi chúng ta Nền tảng có khả năng thay đổi Intel
bước vào một thập kỷ mới, các Xeon tạo cơ sở cho một bước phát
công ty sẽ phụ thuộc vào khả năng triển hướng đến sự linh hoạt và khả
tạo ra các sản phẩm, dịch vụ và trải năng mở rộng của trung tâm dữ
nghiệm được cải tiến kỹ thuật số và liệu. Với thiết kế đột phá, bộ xử lý
các tổ chức lớn sẽ nắm lấy sức tiên tiến này tạo nên một đẳng cấp
mạnh của những tiến bộ về công mới về sự hội tụ nền tảng, cũng
nghệ và mô hình sử dụng mà chúng như các chức năng điện toán, lưu
mang lại .Sự chuyển đổi toàn cầu trữ, bộ nhớ, nối mạng và bảo mật.
này làm gia tăng nhanh chóng Các doanh nghiệp, nhà cung cấp
những nhu cầu về điện toán, mạng dịch vụ đám mây và dịch vụ truyền
và lưu trữ linh hoạt. Các khối lượng thông giờ đây có thể tăng tốc các
công việc trong tương lai sẽ đòi hỏi sáng kiến kỹ thuật số đầy tham
cơ sở hạ tầng phải có khả năng mở vọng của mình với một nền tảng
rộng liên tục để hỗ trợ khả năng giàu tính năng và cực kỳ linh hoạt.
phản hồi ngay lập tức và đáp ứng
các yêu cầu cực kỳ da dạng về hiệu
suất. Sự tăng trưởng theo cấp số
nhân của quá trình tạo và sử dụng
dữ liệu, sự mở rộng nhanh chóng
của điện toán đám mây và mạng
5G và sự hội tụ của điện toán hiệu
năng cao (HPC) và trí tuệ nhân tạo
(AI) trong các ứng dụng mới đòi
hỏi các trung tâm dữ liệu và các
mạng ngày nay cần phải phát triển
ngay lập tức - nếu không sẽ bị bỏ
lại phía sau trong một môi trường
cạnh tranh cao. Những yêu cầu này
đang thúc đẩy cấu trúc của các
2
I . Giới thiệu chung : II./ Kiến trúc Intel Xeon
Xeon được Intel ra mắt vào tháng
6/1998, nhắm đến thị trường
Workstation, server và các hệ thống 1. Tổng quan về bộ xử lý Intel®
nhúng. Chúng được dựa trên cùng 1 kiến Xeon® Scalable Processor :
trúc với các CPU mainstream. Tuy
nhiên, chúng được cài cắm thêm một số Intel đã loại bỏ sự khác biệt giữa
tính năng chuyên dụng như sau: Xeon E5 và Xeon E7 và hiện hỗ trợ mở
rộng cấu hình 4P trở lên một cách tương
• Khả năng hỗ trợ bộ nhớ RAM tự đối dễ dàng : socket mới, chipset mới, hỗ
sửa lỗi (ECC) trợ lưu trữ NVMe mới, kết cấu tích hợp
• Số lượng nhân lớn hơn tùy chọn, nhiều lõi hơn, nhiều kênh bộ
• Hỗ trợ dung lượng RAM lớn hơn nhớ hơn và các tính năng bảo mật mới.
• Cache nhiều hơn Có thể nói, nền tảng này chỉ đơn giản là
• Nhiều tính năng khác làm tăng lớn hơn toàn diện so với dòng Intel Xeon
tính ổn định E5 từng có.
• Khả năng kết nối nhiều socket với • BMC(Baseboard Management
nhau thông qua liên kết Quick Controller): Bộ điều khiển quản lý bo
Path Interconnect (QPI) mạch chủ
• PCH(Platform Controller Hub): Trung
Tuy nhiên, Xeon cũng có những bất tâm điều khiển nền tảng Intel®
lợi nhất định khi so sánh với các CPU • IE(Innovation Engine): Công cụ đổi mới
mainstream. Thứ nhất là mức xung • Intel® OPA(Intel® Omni-Path
thường thấp hơn nhiều lần trong cùng 1 Architecture): Kiến trúc đa đường dẫn
Intel®
phân khúc giá. Thứ 2 là không có iGPU.
• Intel QAT(Intel® QuickAssist
Và hơn nữa là sự hỗ trợ cho việc ép Technology): Công nghệ Intel®
xung. Tuy vậy, theo mình, 2 sự hy sinh QuickAssist
đó là hợp lý. Bởi vì một dòng CPU • ME(Manageability Engine): Công cụ
chuyên cho Server/Workstation thì luôn quản lý
được đề cao về tính ổn định và khả năng • NIC(Network Interface Controller): Bộ
tính toán cùng lượng nhân khổng lồ mà. điều khiển giao diện mạng
• VMD(Volume Management Device):
Hiện tại, thế hệ mới nhất của Intel Thiết bị quản lý âm lượng
Xeon là dòng Xeon Scalable dựa trên
kiến trúc Scalable Processor , Skylake-
SP , Lewisburg PCH

3
BMC(Baseboard PCH(Platform IE(Innovation
Đặc tính Chi tiết Management Controller Hub): Engine): Công
Controller): Bộ Trung tâm điều cụ đổi mới
Socket Socket P điều khiển quản lý khiển nền tảng
bo mạch chủ Intel®
Khả năng 2S, 4S, 8S, and >8S (với sự hỗ trợ của
mở rộng bộ điều khiển nút)
CPU TDP 70W -205W

Chipset Intel® C620 Series (tên mã Lewisburg) Intel® OPA(Intel® Intel QAT(Intel®
Omni-Path QuickAssist ME(Manageabili
Kết nối Intel® Omni-Path Fabric (tích hợp Architecture): Kiến Technology): Công ty Engine): Công
mạng hoặc rời rạc) 4x10GbE (tích hợp trúc đa đường dẫn nghệ Intel® cụ quản lý
w/chipset) Tùy chọn rời 100G / 40G / Intel® QuickAssist
NIC(Network VMD(Volume NTB(Non-
25G Interface Management Transparent
Compression Công nghệ Intel® QuickAssist để hỗ Controller): Bộ Device): Thiết bị Bridge): Cầu
and Crypto trợ 100Gb / giây điều khiển giao quản lý âm lượng không trong suốt
Acceleration diện mạng
comp / dec / crypto 100K khóa công
khai RSA2K
Storage Tích hợp Công nghệ QuickData, VMD
và NTB Intel® Optane ™ SSD, Intel®
3D-NAND NVMe &SATA SSD

Cải tiến CPU (MBE, PPK, MPX)

Công cụ quản lý
Bảo mật
Công nghệ tin cậy nền tảng Intel®

Công nghệ bảo vệ khóa Intel®

Công cụ đổi mới (IE)


Khả năng
quản lý Trình quản lý nút Intel®

Trình quản lý trung tâm dữ liệu Intel®

4
2.Chi tiết các đặc tính mới của chip 3.So sánh Intel Scalable với thế hệ
Intel® Xeon® Scalable Processor : trước Intel Broadwell:
Các CPU Intel Xeon Scalable mới Intel® Xeon® Scalable Processor Được
hỗ trợ 2 liên kết UPI hoặc 3 UPI trên mỗi
CPU. Intel có thể hỗ trợ thiết kế 4S hiệu tái cấu trúc từ Ground Up :
suất thấp hơn, chi phí thấp hơn (dòng - Vi kiến trúc lõi Skylake, với các cải
Intel Xeon Gold 5100) với 2 liên kết UPI tiến dành, riêng cho trung tâm dữ liệu .
hoặc 4S hiệu suất cao hơn và thiết kế lên
đến 8S với các CPU có 3 liên kết UPI. - Intel® AVX-512 với 32 DP flops trên
mỗi lõi
- Kiến trúc kết nối lưới mới
- Hệ thống bộ nhớ con nâng cao
- IO mô-đun với các thiết bị tích hợp Kết
nối siêu đường dẫn Intel® mới (Intel®
UPI)
- Công nghệ chuyển đổi tốc độ Intel®
- Cải tiến bảo mật & ảo hóa (MBE, PPK,
MPX)
- Tùy chọn tích hợp Intel® Omni-Path
Fabric (Intel® OPA)

Hình ảnh 1.Cấu trúc nền tảng Intel


Skylake SP .

5
Hình ảnh 2. Hình sơ đồ khối Intel
Scalable
Intel® Xeon® Intel® Xeon®
Đặc tính Processor E5- Scalable Processor
2600 v4

Cores trên mỗi Lên đến 22 Lên đến 28


Socket

Luồng trên mỗi Lên tới 44 Lên tới 56 luồng


Socket luồng

Last-level Cache Lên tới 38.5 MB


Lên tới 55 MB
(LLC) (non-inclusive)

Tốc độ QPI/UPI 2x QPI Lên tới 3x UPI


(GT/s) channels @ 9.6 @ 10.4 GT/s
GT/s

PCIe* Lanes/
Controllers/Speed(G 40 / 10 / PCIe*
T/s) 48 / 12 / PCIe 3.0 (2.5,
3.0 (2.5, 5, 8
5, 8 GT/s)
GT/s)

4 kênh lên 6 kênh lên đến 2


đến 3 RDIMM, LRDIMM
RDIMM, hoặc 3DS LRDIMM
Bộ nhớ Ram hỗ trợ LRDIMM
hoặc 3DS
LRDIMM

Lên đến 2400 Lên đến 2666


Tốc độ bộ nhớ tối đa

TDP (W) 55W-145W 70W-205W

6
• Bộ dự đoán nhánh lớn hơn và được cải
4.Kiến trúc Skylake-SP core :
tiến, bộ giải mã thông lượng cao hơn,
cửa sổ lớn hơn để trích xuất ILP .
-Cải thiện hiệu suất khoảng 10% cho mỗi • Băng thông tải / lưu trữ nhiều hơn, bộ
lõi trên các ứng dụng số nguyên ở cùng đệm tải / lưu trữ sâu hơn, trình tải trước
tần số được cải thiện .

Cải tiến kiến trúc bộ tập lệnh

TÍNH TOÁN
ẢO HÓA BẢO MẬT

Khóa bảo vệ trang


(PPK)
Intel® AVX-512 Cải thiện bộ đếm Mở rộng kiến trúc phân
Mật độ tính toán thời gian ảo hóa
gấp đôi trên mỗi Giảm chi phí cho trang để cung cấp bảo vệ
lõi cho các phép các máy ảo di bộ nhớ cấp độ người
toán vectơ chuyển trên các
dùng riêng tư, chi tiết
CPU có tần số cơ
bản khác nhau từng trang

Tệp lệnh quản lý bộ


nhớ Cache MPX (Mở rộng bảo vệ
CLFLUSHOPT - Thực thi dựa trên bộ nhớ)
Dòng xóa bộ nhớ chế độ (MBE) Cho phép kiểm tra giới
cache có độ trễ thấp hạn đối với quyền truy
Bảo vệ chống lại
hơn cập dữ liệu để ngăn
các bản cập nhật
Kernel độc hại chặn các cuộc tấn công
CLWB - Cache line
trong một hệ thống tràn bộ đệm
writeback to memory ảo hóa
without invalidation
Ghi lại dòng trong bộ
nhớ cache vào bộ nhớ
mà không bị vô hiệu

7
5.Intel® Advanced Vector - Các loại tập lệnh Intel AVX-512
Extensions 512 (Intel® AVX-512):
Các loại lệnh Intel AVX-512
-Intel® Advanced Vector Extensions
AVX-512-F Hướng dẫn nền tảng AVX-512
512 (Intel® AVX-512) là một tập hợp
gồm các lệnh mới có thể gia tăng hiệu Tính trực giao độ dài vectơ: khả
năng cho các khối lượng công việc và năng hoạt động trên kích thước
AVX-512-VL vectơ nhỏ hơn 512
mục đích sử dụng .VD :mô phỏng khoa
học, phân tích tài chính, trí tuệ nhân tạo AVX-512-BW Hỗ trợ 512-bit Byte / Word
(AI)/học sâu, dựng mô hình 3D và phân Hướng dẫn D / Q / SP / DP bổ
tích, xử lý hình ảnh và âm thanh/video, AVX-512-DQ sung (chuyển đổi, hỗ trợ siêu việt,
mã hóa và nén dữ liệu,.. v.v.)
AVX-512-CD Phát hiện xung đột: được sử dụng
Chức năng Xử lý Vector nâng cao : trong vectơ vòng lặp có xung đột
địa chỉ tiềm ẩn
➔ Với các chức năng của
phép tính vector 512 bit
siêu rộng, Intel® AVX-512
có thể xử lý các tác vụ tính
toán đòi hỏi khắt khe nhất.
Các ứng dụng có thể tập hợp các Vi kiến trúc Bộ tập lệnh SP FLOPs DP FLOPs
phép toán dấu chấm động độ chính xác / cycle / cycle
kép 32 và độ chính xác đơn 64 mỗi chu Intel® AVX-512
kỳ xung nhịp trong các vector 512 bit Skylake 64 32
& FMA
cũng như 8 số nguyên 64 bit và 16 số
nguyên 32 bit, với tối đa 2 đơn vị tính Haswell / Intel AVX2 & 32 16
Broadwell FMA
gộp nhân và cộng (FMA) 512 bit, do đó
làm tăng gấp đôi độ rộng của thanh ghi
dữ liệu, tăng gấp đôi số lượng thanh ghi, Intel AVX
Sandybridge 16 8
đồng thời làm tăng gấp đôi độ rộng của (256b)
các đơn vị FMA, so với tập lệnh Mở
Rộng 2 về Vector Nâng Cao của Intel®
Nehalem SSE (128b) 8 4
(Intel® AVX2).
-> Tập lệnh mạnh mẽ để tính toán
song song dữ liệu

8
Lõi Skylake-SP xây dựng dựa để thêm FMA thứ hai bên ngoài lõi
trên lõi Skylake với các tính năng Skylake
được cấu trúc để sử dụng cho Data
Center : • Băng thông lưu trữ và tải L1-D tăng
gấp đôi để cho phép tải lên đến 2x64B và
• Intel® AVX-512 được triển khai với lưu trữ 1x64B
Cổng 0/1 được kết hợp với một đơn vị
thực thi 512b duy nhất

• Cổng 5 được mở rộng đến 512b đầy đủ

Hình ảnh 3A.Cấu trúc lõi Skylake-SP

Hình ảnh 3B .Intel® AVX-512 mang lại hiệu suất và hiệu quả đáng kể

9
6) Kết nối siêu đường dẫn Intel® 7) Những Cải tiến ảo hóa Intel®
(Intel® UPI) : Xeon® Scalable Processor:

• Intel® Ultra Path Interconnect (Intel® • Hợp nhất nhiều hơn trên một
UPI), thay thế Intel® QPI .
nút Máy tính:
• Liên kết nhanh hơn với băng thông - Cải thiện hiệu suất lõi và số lượng
được cải thiện để thiết kế hệ thống cân
bằng lõi lớn hơn

• Cải thiện hiệu quả nhắn tin trên mỗi gói - TLB lớn hơn và bộ nhớ đệm L2
. trên mỗi lõi để cải thiện hiệu suất
và độ biến thiên thấp hơn trên
khối lượng công việc được ảo hóa
- Cải thiện băng thông bộ nhớ và
khả năng sắp xếp khối lượng công
việc đòi hỏi
• Tạo an toàn và di chuyển VM
• Tùy chọn 3 UPI cho 2 ổ cắm - bổ sung trên các hệ thống :
băng thông giữa các socket cho các - Kiểm soát thực thi dựa trên chế độ
trường hợp sử dụng được tối ưu hóa
không phải truy cập bộ nhớ không đồng để làm cứng lỗ hổng khởi chạy máy ảo .
nhất . - Cải thiện ảo hóa dấu thời gian để
giảm chi phí di chuyển máy ảo trên các
➔ Khả năng mở rộng hệ thống hỗ trợ giao diện CPU khác nhau .
Intel® UPI với băng thông liên ổ
cắm cao hơn .

10
8) Những Cải tiến bảo mật Intel® III) Kiến trúc Lewisburg:
Xeon® Scalable Processor:
1) Định nghĩa :
- Hiệu suất bảo mật: Công nghệ Lewisburg là một Cung cấp nền
Intel® AVX-512 Intel® tảng chung trong thế hệ Purley để đáp
ứng yêu cầu hội tụ.
QuickAssist
- Phần cứng chống lại các cuộc tấn Tính phổ biến của bảo mật mạng,
lưu trữ dữ liệu hiệu quả và thao tác gói
công bên ngoài . trong các thiết bị Đám mây, Lưu trữ,
- Thực thi dựa trên chế độ để bảo Doanh nghiệp và Mạng.
vệ khỏi các cuộc tấn công trong 2)Cấu trúc :
quá trình tạo máy ảo PCH(Trung tâm điều khiển nền tảng)
mới cho nền tảng hội tụ.
- Khóa bảo vệ trang để tạo các ứng
• Trung tâm dữ liệu PCH cung cấp
dụng mạnh mẽ với các quyền truy
các giải pháp khởi động, kế thừa
cập trang phân biệt được quản lý tiêu chuẩn và IO tốc độ cao, khả
ở cấp người dùng Mở rộng Bảo vệ năng quản lý và xung nhịp:
• Intel® Innovation Engine là một
Bộ nhớ Intel® (Intel® MPX) để
hộp cát có khả năng quản lý dành
ngăn chặn các cuộc tấn công tràn cho người xây dựng hệ thống .
bộ đệm. Bộ điều khiển Ethernet Intel®
- Nền tảng phần cứng : tích hợp giúp giảm diện tích, điện
năng, chi phí và khả năng cung cấp
✓ Quản lý khóa an toàn trong
nền tảng LOM .
chipset mà không cần TPM(Trust
• Kết nối Ethernet Intel® X722 lên
Platform Module) rời . tới 4x10Gbps
✓ Các tùy chọn khởi chạy và khôi • Hỗ trợ tải ảo hóa mạng và giao
thức RDMA
phục đã được xác thực và đo • Bộ tăng tốc công nghệ Intel®
lường . QuickAssist cung cấp khả năng
bảo mật và nén cho Truyền thông,
Lưu trữ và Kho lưu trữ đám mây
• Tiền mã hóa/ nén lên tới 100Gbps

11
3)So sánh thế hệ PCH :

Bulk
Crypto
PKE

KPT

High Speed IO

Hình ảnh 4 .Sơ đồ kiến trúc


Lewisburg

PKE Mã hóa khóa công khai


KPT Chìa khóa bảo vệ công
nghệ
RDM Truy cập bô nhó trực
A tiếp từ xa

12
4 ) Cấu hình triển khai Lewisburg:

Thông thường Dây đai CPU Đa-PCH


Trên mạch PCH. tải lên Dual PCIe Trên mạch PCH PCIe tải lên Nhiều PCH trên bo mạch để
tới CPU đơn, được cung cấp cho nhiều CPU, được cung cấp cho chuyển đổi dự phòng,phân vùng
Intel QAT and 4x10GbE (Giao thức QAT và 4x10GbE linh hoạt hoặc bành trướng IO
PCIe) Lựa chọn PCIe tải lên tới QAT
và 4x10GbE

PCIe*Chế độ điểm cuối Quấn quanh


Trên mạch hoặc card PCIe-tăng tốc Trên mạch PCH cấu hình thấp-
dựa trên khả năng mở rộng, được BW QAT/Ethernet giống PCH-
cung cấp cho QATvà 4x10GbE thiết bị dưới cấp đính kèm

13
5) Cài đặt mạng Intel 4x10Gb/1Gb:

Hỗ trợ tính năng Giá trị khách hàng

Các cổng 10GbE Được tối ưu hóa cho khả năng


MAC/PHY kết nối mạng trong cloud ,
giao tiếp,lưu trữ
Dựa trên giải pháp Intel’s
10GbE Single network driver on
Intel® platform
Giao diện : 10G (KR, SFI,
XFI), 1G (KX)

Truy cập bộ nhớ trực tiếp RDMA có thể định tuyến và


từ xa mở rộng lý tưởng cho các VF00
VF
VF VF00
VF
VF
VF00
VF
VF
mạng phân đoạn lớn trong các
iWARP PF0 PF1 PFn
đám mây riêng và công cộng.
PCIe* with SR-IOV
Tải xuống mạng ảo Tóm tắt mạng cho tính linh
hoạt của đám mây.
Bộ lọc linh hoạt (ATR,
Flow Director) Khả năng lập trình nâng cao Q0 Q1
và mối quan hệ ứng dụng.
NVGRE, IPinGRE,
VXLAN, MACinUDP

Mạng ảo dựa trên tiêu Kich hoạt hệ điều hành rộng 4x10G MACs
chuẩn
SR-IOV: 4 Physical/128
chức năng ảo
4x10GbE/1GbE
VEB (Virtual Ethernet with
Bridge) RDMA(iWARP)

Quản lý dung lượng Tiết kiệm dung lượng mạng

Khả năng quản lý Vận chuyển chung mạng LAN


tới BMC
BMC Pass-Through(kiểm
soát và mạng)
Giao diện: NC-SI,
SMBus, and MCTP

14
6)Truy cập bộ nhớ trực tiếp từ xa
(RDMA) : IV) Kết luận :
RDMA là một tối ưu hóa hiệu suất mạng
: ➢ Với những công việc đòi hỏi
nhiều phần mềm, ứng dụng, thiết
✓ -Cho phép giao tiếp ứng dụng với kế đồ họa chuyên nghiệp thì nên
ứng dụng trực tiếp trên các nút . sử dụng Chip Intel Xeon vì nó có
✓ -Bỏ qua ngăn xếp và nhân hệ điều tích hợp tính năng tự kiểm tra lỗi.
hành. ➢ Giá thành CPU Xeon cao nhưng
✓ -Cung cấp kênh trực tiếp để truy có nhiều định mức khác nhau cho
cập ứng dụng bộ nhớ từ xa cá nhân, doanh nghiệp lựa chọn.
Được đề xuất dể dễ dàng triển ➢ Việc bổ sung một số tính năng
khai và cấu hình , khả năng mở rộng bảo mật được tăng cường phần
và kiểm soát tắc nghẽn. cứng giúp xây dựng một nền tảng
đáng tin cậy hơn cho điện toán,
Hệ điều hành Windows*/Linux* bao gồm các biện pháp bảo vệ
được hỗ trợ cho các danh mục ứng kênh bên được tích hợp trực tiếp
dụng : Lưu trữ , phần mềm trung gian vào phần cứng.
nhắn tin và giải pháp HPC(Thông ➢ Tích hợp công nghệ Intel Deep
lượng cao). Learning Boost (Intel DL Boost)
được tối ưu hóa để tăng tốc khối
lượng công việc suy luận AI như
nhận dạng hình ảnh, phát hiện đối
tượng và phân đoạn hình ảnh
trong trung tâm dữ liệu, doanh
nghiệp và môi trường máy tính
cạnh thông minh. Intel đã làm
việc rộng rãi với các đối tác hệ
sinh thái để tối ưu hóa các khung
(TensorFlow, PyTorch, Caffe,
MXNet và Paddle Paddle) và các
ứng dụng tận dụng tối đa công
nghệ Intel DL Boost. Khách hàng
có thể chọn các công cụ nâng cao
như OpenVINO để dễ dàng triển
khai.

15
Tài liệu tham khảo :
[1].https://www.intel.vn/content/www/vn/
vi/support/articles/000007291/processor
s/intel-xeon-processors.html
[2].https://hoanghapc.vn/cpu-xeon-la-
gi#:~:text=CPU%20Xeon%20l%C3%A0
%20d%C3%B2ng%20CPU,cho%20m%
C3%A1y%20tr%E1%BA%A1m%20ho%
E1%BA%B7c%20Server.
[3].http://octapus.vn/news/cpu-xeon-la-
gi.html
[4].https://ark.intel.com/content/www/vn/
vi/ark/products/series/59138/intel-xeon-
processor-e5-family.html
[5].Intel® Xeon® Scalable Processors
Datasheet, Vol. 1
[6].Intel® Xeon® Scalable Processors
Datasheet, Vol. 2

16
17

You might also like