Professional Documents
Culture Documents
Ibm Power8 Server 소개자료
Ibm Power8 Server 소개자료
1 KOLON Techline
POWER Systems Product Portfolio
TM TM
•PowerLinux •PowerLinux •Power 710/720 •Power 730/740 •Power 750 •Power 760 •Power 770 •Power 780
•7R1/7R2 7R4
•Power
TM •Powe S822 •Power S814 •Power S824
S812L/S822L
2 KOLON Techline
POWER8 New Naming
Scale-out
POWER8
1socket
2U
Power Systems S812L
Linux
3 KOLON Techline
Power Systems April Announcement
1 Socket 2 Socket
POWER S812L POWER S822/S822L
4 KOLON Techline
Power Systems April Announcement Summary
3Q14 Power S812L 8247-21L 1x 10c 3.42 GHz 512 GB 12SFF or Max1 2x PCIe G3 x16 RED HAT
(one socket) 1x 12c 3.02 GHz 8SFF + 4x PCIe G3 x8 SUSE
6SSD UBUNTU
2Q14 Power S822L 8247-22L 2x 10c 3.42 GHz 1 TB 12SFF or Max2 4x PCIe G3 x16 RED HAT
(two socket) 2x 12c 3.02 GHz 8SFF + 5x PCIe G3 x8 SUSE
6SSD UBUNTU
2Q14 Power S822 8284-22A 1x 6c 3.89 GHz 1 TB 12SFF or Max2 4x PCIe G3 x16 AIX
(one socket upgradeable or two 1x 10c 3.42 GHz 8SFF + 5x PCIe G3 x8 RED HAT
socket) 2x 6c 3.89 GHz 6SSD SUSE
2x 10c 3.42 GHz
2Q14 Power S814 8286-41A 1x 6c 3.02 GHz 512 GB 12SFF or Max1 2x PCIe G3 x16 AIX
(one socket) 1x 8c 3.72 GHz 18SFF 5x PCIe G3 x8 System i
1x 4c 3.02 GHz RED HAT
SUSE
2Q14 Power S824 8286-42A 1x 6c 3.89 GHz 1 TB 12 SFF or Max2 4x PCIe G3 x16 AIX
(one socket upgradeable or two 1x 8c 4.15 GHz 18 SFF + 7x PCIe G3 x8 System i
socket) 2x 6c 3.89 GHz 8 SSD RED HAT
2x 8c 4.15 GHz SUSE
2x 12c 3.52 GHz
5 KOLON Techline
1 & 2 Socket Servers
4U 4U 2U 2U
6 KOLON Techline
POWER8 Extended Operating System
7 KOLON Techline
POWER8 - 한 눈에 보는 변화
8 KOLON Techline
POWER8 New / Enhanced Feature
KOLON Techline
9
9
POWER8 : Leadership & Innovation (Details)
Designed for Big CPU 8core to 12core Socket당 12core의 CPU는 보다 많은 데이터를 동일한 Socket에서 처리하게 됩니다. 또한 이전 모
SMT4 to SMT8 델에서는 4개의 SMT (Simultaneous Multi-Threading)가 지원되었으나, POWER8에서는 8개의 SMT
Data
가 지원이 되어서 동시에 더 많은 연산을 할 수 있습니다
Cache L2 : 256kB / core 512kB / core L2 Cache의 경우 단위 Core당 512kB로 이전 모델의 2배가 되었습니다. 보다 더 많은 데이터를 보다
L3 : 80MB / Chip 96MB / Chip 더 빠른 속도로 처리할 수 있습니다. 시스템의 전 영역에 걸쳐 존재하는 이러한 캐쉬는 이전 세대의
L4 : Max 128MB / Chip
모델에 이어서 역시 현재 시스템 중에서도 역시 최대의 사이즈를 제공하게 됩니다.
메모리 Transactional Memory 메모리 Buffer Chip을 통한 L4 Cache (Off Chip)를 추가하였으며, 단위 CPU Socket 당 최대 512MB
Nova 1060MHz to Centaur 가 장착됩니다. (추후 1GB로 확장 예정) 이를 통해 대용량 In-Memory DB 등의 처리가 강화되었습
1600MHz
니다.
대역폭 Memory : 100GB/s 230GB/s 메모리와 CPU, Cache와 Cache, CPU와 I/O 등 전 영역에 걸쳐서 이전 모델에 비해 2~3배 개선이 되
Bandwidth Max I/O : 40GB/s 96GB/s 어 대용량 데이터를 보다 빠른 속도로 처리할 수 있습니다.
(Gen2 to Gen3, PCIe Direct)
Superior Cloud Power KVM Power KVM Linux 전용 제품에 탑재되는 오픈 소스 기반의 POWER KVM을 통하여 Linux 기반의 Cloud를 보다
용이하게 구축할 수 있습니다.
Economics
Performance x86 Ivy Bridge 대비 2.1배 이전 세대의 제품에 비해 단위 코어당 1.5배의 성능 개선을 바탕 으로 강력한 경제성을 제공하게 됩
니다. (성능 기준은 4월 29일 발표된 공인 SAPs 성능 수치 기준)
More Linux Red Hat, SUSE, Ubuntu POWER8의 Linux 전용 제품에는 UBUNTU O/S가 추가되어 고객의 다양한 운영 환경 및 클라우드
환경에 대응하게 되며, 향후 추가로 더 많은 Linux O/S가 추가될 예정입니다.
Open Innovation CAPI Coherent accelerator processor interface POWER8에 새롭게 도입되는 CAPI를 통해 고객 업무의 특성에 따라 요구되는 사항들을 추가로 강화
One CPAI Adapter per Socket 할 수 있습니다. CAPI를 통해 GPGPU(General Purpose GPU) 또는 FPGA(Field Programming Gate
Platform
Array)와 같은 외부 가속기 등을 CPU에 직접 연결할 수 있는데, 이러한 GPGPU나 FPGA에는 시스템
POWER 에 탑재된 개별 Solution이 특별히 요구하는 기능들을 별도의 H/W Logic이나 프로그래밍 등을 통
해 지원하게 됩니다. 이러한 외부 가속기가 CPU와 동일한 메모리 어드레스를 공유함으로써, 복잡성
을 줄이고 메모리의 속도로 가속 기능을 사용할 수 있게 됩니다.
OpenPOWER OpenPOWER Foundation의 지속적 IBM과 구글(Google), 엔비디아(NVIDIA), 멜라녹스(Mellanox), 타이안(Tyan)에 의해 설립된 오픈파워
Foundation 인 확대 및 POWER8 신기술 접목 파운데이션은 현재 25개의 세계적인 기술 기업들로 구성되어 있으며 지속적으로 규모가 증가하고
있습니다. 국내 기업 중에서는 지난 2월 삼성전자가 오픈파워 파운데이션에 합류한 데에 이어, SK하
이닉스도 합류하여 오픈 서버 생태계를 위한 보다 발전된 메모리 기술을 지원하고 있습니다.
10 KOLON Techline
POWER8
Processor
11 KOLON Techline
POWER Processor Technology
POWER9
Extreme Analytics
Optimization
POWER8 Extreme Big Data
POWER5/5+ POWER6/6+ POWER7/7+ Optimization
65/65 nm 45/32 nm 22 nm On-chip accelerators
130/90 nm
2 2 8 8 12 Cores
Compute
Threads
SMT2 SMT2 SMT4 SMT4 SMT8
On-chip
1.9MB 8MB 2 + 32/80MB 6 + 96MB Caching
Off-chip
36MB 32MB None 128MB
12 KOLON Techline
POWER8 Processor
Technology
22nm SOI, eDRAM, 15 ML 650mm2
Cores Caches
•12 cores (SMT8) •512 KB SRAM L2 / core
•8 dispatch, 10 issue •96 MB eDRAM shared L3
•16 execution pipe
Accelerators
Core Core Core Core Core Core •Up to 128 MB off-chip L4
SMP Links
•2X internal dataflow/queue
•Enhanced prefetching L2 L2 L2 L2 L2 L2
•64K data cache 8M L3
Region
•32K instruction cache Memory
Mem. Ctrl. L3 Cache & Chip Interconnect Mem. Ctrl. •Up to 230 GB/s bandwidth
•Up to 1 TB capacity / socket
Accelerators
SMP Links
L2 L2 L2 L2 L2 L2
•Crypto & Mem expansion
PCIe
•Transactional Memory
Core Core Core Core Core Core Bus Interfaces
•VMM assist
•Durable open memory attach
•Data Move / VM Mobility
•Robust SMP Interconnect
•Integrated PCIe Gen3
Energy Management •CAPI
•On-chip Power Management Micro-controller
•Integrated Per-core VRM
13 KOLON Techline
Scale Out Systems - DCMs and POWER8 Chips
Accelerators
362 mm2 Core Core Core
22nm SOI w/ eDRAM
Strengthen Cores
8 Threads per Core L2 L2 L2
Caches 8M L3
D Cache: 64KB Region
L2: 512KB
L3 Cache & Chip Intercon MemCtrl
L3: 8 MB per Region Total: 48MB
14 KOLON Techline
POWER8
SMT
15 KOLON Techline
POWER8 Multi-threading Options
Can dynamical shift between modes as required: SMT1 / SMT2 / SMT4 / SMT8
Mixed SMT modes supported within same LPAR
– Requires use of “Resource Groups”
4
2.5
3.5
3 2
2.5
1.5
2
1.5 1
0.5
0.5
0
0
P7 P8 P8 P8 P8 SMT1 SMT2 SMT4 SMT8
SMT1 SMT1 SMT2 SMT4 SMT8
16 KOLON Techline
rPerf – Multiple SMT Levels
17 KOLON Techline
18 KOLON Techline
POWER8 OS Support
19 KOLON Techline
Compatible Mode Architecture
20 KOLON Techline
AIX Levels
11 / 2012 2 / 2012 3 / 2013 5 / 2013 8 / 2013 9 / 2013 10 / 2013 12 / 2013 2Q / 2014 3Q / 2014
AIX 6
SP6 SP7 SP8 SP9 SP10
TL7
AIX 6
SP1 SP2 SP3 SP4 SP5
TL8
AIX 6
SP1 SP3
TL9
AIX 7
SP6 SP7 SP8 SP9 SP10
TL1
AIX 7
SP1 SP2 SP3 SP4 SP5
TL2
AIX 7
SP1 SP3
TL3
21 KOLON Techline
22 KOLON Techline
POWER8
CAPI
23 KOLON Techline
CAPI (Coherent Accelerator Processor Interface) 개요
Virtual Addressing
POWER8
•Adapter 기반의가속기가CPU와같은가상메모리주소를사용
POWER8
•OS와device driver 등의오버헤드를제거
Application
Read/Write
Syscall
FileSystem
Application
strategy() iodone()
20,000 Instructions Posix Async aio_read()
I/O Style API aio_write()
LVM
strategy() iodone() User Library
< 500
Disk & Adapter DD Shared
Instructions Memory Work
Queue
Pin buffers, Interrupt,
Translate, unmap,
Map DMA, unpin,Iodone
Start I/O scheduling
25 KOLON Techline
26 KOLON Techline
POWER8
Memory
27 KOLON Techline
POWER8 Memory Buffer Chip
DDR Interfaces
28 KOLON Techline
POWER8 Memory Organization (Max Config shown)
POWER8 DCM
128 GB 16MB 16MB 128 GB
Up to 1 TB / Socket
First P8 Systems:
512 GB /Socket
29 KOLON Techline
Active Memory Expansion
30 KOLON Techline
Memory Performance/Configuration Insights
Always plug in pairs, except for one DIMM possible on 1-socket servers
– 2-socket servers always have a minimum of two DIMMs (one pair min)
• Above true even if only 1 socket populated
• STRONGLY urge for performance, at least one DIMM pair per DCM
• Having two DIMM pairs per DCM is a very good thing (gives 50% of bandwidth)
– 1-socket server can have a single DIMM for entry price reasons
• When add any add’l memory, resulting configuration result in valid pairs
• STRONGLY urge for performance, at least one DIMM pair per DCM
• Having two DIMM pairs per DCM is a very good thing (gives 50% of bandwidth)
Performance testing not done yet with servers with less-than-max memory configurations to understand detailed trade off
considerations. Testing not planned prior to announce. ????to GA????
31 KOLON Techline
32 KOLON Techline
POWER8
IO (PCI)
33 KOLON Techline
POWER8 Integrated PCI Gen 3
Native PCI – PCIe Gen3 인터페이스를 프로세서에 직접탑재, 추가적인 경유로직을 제거하여I/O 성능향상시킴
POWER8
I/O
Bridge
PCIe G2
PCI
Devices
34 KOLON Techline
PCIe Gen3
Though these cards physically look the same … and fit in the same slots
Gen3 cards/slots have up to 2X more bandwidth than Gen2 cards/slots
Gen3 cards/slots have up to 4X more bandwidth than Gen1 cards/slots
– More virtualization
– More consolidation saving PCI slots and I/O drawers
– More ports per adapter
18
16
14
Peak A Gen1 x8 PCIe adapter has a theoretical max (peak) bandwidth of 4 GB/sec.
12 A Gen2 x8 adapter has a peak bandwidth of 8 GB/sec. A Gen3 x8 adapter has a
Sustained
10 peak bandwidth of 16 GB/sec.
8
6
4
2
0
x1 x4 x8 x16
x8 x16
36 KOLON Techline
PCIe x16 and x8 Slot 사용의고려사항
• PCIe x16이고려되어야하는어댑터의종류
–CAPI cards: PCIe x16
–2-port 40Gb Ethernet 과IB cards: PCIe x16에장착시더나은성능제공
–아래의adapter는PCIe x16 slot에서만지원됨
#5901/#5278(LP)/#EL10(LP) PCIe Dual-x4 SAS Adapter
#5287(LP)/#5288 PCIe2 2-port 10GbE SR Adapter
• 대부분의Card는어떤Slot을사용해도문제없음
–모든low profile slots = 2U box
–모든full-high slots = 4U box
–모든Slot은PCIe Gen3 지원
37 KOLON Techline
PCIe Slots - High Level
4U 2U
1S 4U 2S 4U 1S 2U 2S 2U
38 KOLON Techline
PCIe Slots - More Detail -- x8 and x16
4U 2U
S822L
S814 S824 S824
S822 S822
8247-22L
8286-41A 8286-42A 8286-42A
8284-22A 8284-22A
Only 1S in 2S Only 1S in 2S
1S box 2S box 2S
5 5 9 4 7
PCIe slots after required LAN and if
using high performance backplane 2 x16 2 x16 4 x16 2 x16 4 x16
3 x8 3 x8 5 x8 2 x8 3 x8
• PCIe slots are all Gen3 slots (Higher MHz used than Gen2 = 2x theoretical bandwidth)
• Some slots are x16 and some are x8. (x16 have 2x theoretical bandwidth)
39 KOLON Techline
40 KOLON Techline