Professional Documents
Culture Documents
CPU Pentium
CPU Pentium
1) Sơ đồ khối.
Đường ống
U của ALU
Đường ống
V của ALU
1
4)Có 2 cache nhớ riêng, 2 chiều , 8kb; Một cache cho lệnh và một cache cho
data; kết nối bus 64 bit → tốc độ nhanh hơn 486 nhiều lần.
5)Có nghi thức (Protocol) đặc biệt MESI → Làm việc tốt hệ đa vi xử lý
(Modified; exclusive; sharedd; Invalid).
6) Bộ xử lý d.c.d.d nhanh hơn là 486; cũng có phần chọn hai lệnh thi hành
đồng thời cho số thập phân .
7) Có vùng đệm đích dành cho các lệnh nhảy rẽ nhánh → các lệnh nhảy chỉ
mất một chu kỳ.
-Mỗi công đoạn này đòi hỏi một chu kỳ máy ( Một nhịp xung đồng hồ của
CPU ) Riêng công đoạn D2 và Ex còn có thể yêu cầu thêm một chu kỳ nữa
→ Tối thiểu phải mất 5 chu kỳ trong đó người ta vẫn nói một số lệnh chỉ
dùng hết một hoặc hai chu kỳ máy là do nguyên lý vận dụng như trong dây
chuyền lắp ráp sản phẩm. Có nhiều lệnh nhiều công đoạn khác nhau chạy
song song trong đường ống → Mỗi lệnh chỉ mất một chu kỳ mặc dù thực
chất phải chạy đủ 5 chu kỳ trên một lệnh.
-Trong 486 việc thi hành theo đường ống đã nhanh rồi, nhưng Pentium lại
còn nhân tốc độ lên bằng cách thiết lập đường ống thứ 2 song song → cơ
chế này gọi này gọi là cấu trúc đường ống “Super calar” – siêu vô hướng.
Gọi hai đường ống là đường ống U & V:
+ Nhờ hai đường ống này về mặt lý thuyết Pentium có thể thi hành đồng thời
hai lệnh → kết quả tăng gấp đôi tốc độ thi hành lệnh ( Trên thực tế không
đơn giản thế, vì hai lệnh kế tiếp nhau thường thi hành tuần tự vì chúng phụ
thuộc nhau ).
+Công đoạn thứ hai D1 sẽ xác định xem có thể thi hành song song cả hai
lệnh được không ? Trong công đoạn PF : lệnh hiện hành phải được thi hành,
còn lệnh kế tiếp sẽ được nạp vào đơn vị giải mã song song
Lệnh hiện hành → đưa vào đơn vị giải mã ống U
2
Lệnh kế tiếp → dưa vào đơn vị giải mã ống V
+ Nếu công đoạn D1 xác định là có thể thi hành đồng thời hai lệnh thì mỗi
lệnh sẽ trải qua các công đoạn khác nhau trong đường ống của mình theo
phương thức song song. Nếu như không thể thi hành hai lệnh cùng lúc thì
lệnh hiện hành trong ống U đi đến công đoạn kế tiếp như bình thường, lệnh
kế tiếp trong ống V sẽ được chuyển qua thi hành trong ống U ( Vì trước đó
các lệnh được nạp vào cả hai đường ống ) → Thực hiện như là một lệnh kế
tiếp lệnh hiện hành.
Các trình biên dịch đã được tối ưu hóa với Pentium → tổ chức mã máy theo
một cách thức sao cho các lệnh ngôn ngữ máy kế tiếp nhau cho phép càng
thi hành đồng thời càng nhiều càng tốt.
3
-Khái niệm Cache: + Cache CPU (hay Cache cấp 1)
+ Cache tr ên Main board (Cache cấp 2 )
- Trước hết cache được dùng tăng tốc việc truy xuất số liệu hay thông tin cụ
thể bằng cách giữ các dữ liệu trong một vùng nhớ riêng → vùng này là 1
cache. Ưu điểm là việc truy xuất nhanh hơn là truy xuất từ thiết bị trữ tin.
+ Cache đĩa cứng
Cache font Sử dụng RAM làm “Bộ nhớ cao tốc”.
Cache CD-Rom
Nhưng cache CPU không áp dụng nguyên tắc này vì RAM cung cấp dữ liệu
và lệnh chương trình không đủ nhanh cho CPU.
-Cache CPU là cấp 1 ( the f irst level cache ) được đặt ngay trong CPU và
đọc nhanh như đọc từ các thanh ghi (đặt cache càng to càng nhiều trong
CPU càng tốt, nhưng còn tùy thuộc công nghệ chế tạo vi xử lý).
Cache cấp 2 là cache nhớ 128 k hoặc 256 k nằm giữa CPU và RAM.
Thường là các SRAM (RAM tĩnh ) – dạng RAM cao tốc, nhanh gấp 3, 4 lần
các bộ nhớ chính cấu tạo từ DRAM, SRAM (20,25 ns); DRAM (70,80,100
ns).
-Cache cấp 3 là bộ nhớ chính [(RAM) thường] dùng làm cache cho đĩa cứng
và các thiết bị ngoại vi khác.
-Số cấp cache càng tăng → tốc độ càng giảm → giá thành/ 1kb cũng giảm
theo.
4
3. Điều rất quan trọng là tổ chức của Cache phụ thuộc vào hai yếu tố:
-Chiến lược trữ đệm ( Cache strategies )
-Cấu trúc Cache
c) Chi ến lược trữ đệm.
* WriteThrough: Cache chỉ định vị với các truy xuất đọc của CPU, WTC
(Writethough cache). Chuyển các truy xuất ghi đến bộ nhớ RAM chính.
Trước khi chuyển, WTC kiểm tra xem vị trí ô nhớ vừa mô tả:
-Đã được trữ trong Cache do kết quả đọc chưa ? → đã → Trị mới của
vị trí ô nhớ cũng được ghi ngay trong Cache.
-Không có → truy xuất RAM chính.
* Thủ tục hiệu chính tốt hơn WTC là “Buffered Writethough”. Cache cấp 1
được trang bị bổ sung thêm các vùng đệm ghi (Write buffer) để tăng tốc các
thao tác ghi đến bộ nhớ ( 486DX có đến 4 vùng đệm này ).
Khi số liệu cần phải ghi vào bộ nhớ → WTC đặt vào vùng đệm ghi này →
cho phép CPU tiếp tục làm việc khác ngay. Vì vùng đệm ghi này được định
vị nhanh, trong khi CPU làm việc thì Cache ghi nội dung các vùng đệm ra bộ
nhớ thông thường trên Bus riêng của nó, ngay khi Bus vừa rảnh rỗi.
*Thủ tục WriteBack(WBC):
Với tác vụ đọc thì WBC giống như WTC.
Với tác vụ ghi thì WBC khác với WTC.
Nếu thông tin (được ghi ra bộ nhớ) đã nằm sẵn trong Cache, nó chưa
phải ra khỏi cache cho đến khi nó cần vị trí đó để đọc thông tin mới vào. Khi
cần đến vị trí này → được chuyển vào vùng đệm cas toff → sau đó chuyển
đến bộ nhớ song song với công việc của CPU (Làm việc đồng thời với
CPU).
d) Cấu trúc Cache.
- Cache nhớ thường được tổ chức thành các hàng Cache(Cache Line).
Kích thước một hàng Cache tùy thuộc dung lượng số liệu nội bộ CPU
hoặc dung lượng Cache cấp 1 của CPU.
386: Một hàng Cache: 32 bit ( Dword =4 bytes)
486: Một hàng Cache : 128 bit (4Dword=16 bytes)
Pentium: Một hàng Cache: 256 bit( Qword=32 bytes)
* Chế độ Burst Mode: Với các CPU đời mới chạy theo chế độ “Burt Mode”
làm tăng tốc truy xuất các byte nằm liên tục trong ô nhớ nhanh kinh khủng.
Thông thường CPU phải cho địa chỉ lên Bus trước khi đọc ô nhớ mà nó
nhắm tới trong chế độ Burst Mode, truy xuất số liệu được đọc như một khối.
CPU chỉ cần cung cấp địa chỉ của byte đầu tiên trên bus, sau đó bộ nhớ tự
động cung cấp tất cả địa chỉ ô nhớ tiếp theo khi có yêu cầu → giảm chu kỳ
chuyển địa chỉ ổ nhớ cần truy xuất:
5
Ví dụ: 486 thường cần 2 chu kỳ đồng hồ để đọc một Dword từ bộ nhớ →
để nạp trọn vẹn một hàng Cache cần 4x2=8 chu kỳ đồng hồ trong chế độ
Burst Mode chỉ có Dword đầu tiên là cần 2 chu kỳ còn 3 Dword tiếp theo chỉ
còn một chu kỳ → Burst Mode chỉ cần 5 chu kỳ 2-1-1-1. Thay cho 8 chu kỳ
cho phép chuyển số liệu thông thường.
* Cache trữ đệm cả số liệu và cả các địa chỉ của số liệu → Mỗi hàng
có một cái tên ( Gọi là tag ). Các tag này không được kèm ngay với hàng
Cache mà được ghi vào phần nhớ riêng biệt (Khi tìm sẽ mất thời gian,
nhưng bù lại SRAM nhanh hơn).
* Cùng với các hàng cache và tag mỗi Cache còn có bộ phận điều
khiển Cache.
Với Cache cấp 2 → có một bộ vi điều khiển trên vỉ mạch chính.
Còn với Cache cấp 1 → Điều khiển Cache là một phần của CPU.
6
Cache khác nhau bị phân chia rời nhau ra mà chính là nội dung các hàng
cache bị chia ra.
Ví dụ: Cache dữ liệu cấp 1 của Pentium là Cache đan xen gấp 8, nghĩa là 8
Dword của một hàng 256 bit được đặt trong 8 trang khác nhau. Các Dword
đầu tiên từ tất cả hàng Cache được trữ trong trang đầu tiên, Các Dword thứ
hai → Trang thứ 2...→ Các đường ống U và V của CPU muốn đọc các
Dword khác nhau từ một trong hàng Cache → có thể truy xuất các trang
khác nhau, vì thế cả hai đường ống có thể làm việc cùng một lúc.
g) Nghi thức MESI ( Viết tắt 4 trạng thái khác nhau của một hàng Cache
CPU )
- Nảy sinh vấn đề là các truy xuất trực tiếp như điều khiển DMA, bỏ qua
CPU và bộ phận điều khiển Cache mà truy xuất trực tiếp ô nhớ → phá hủy
sự nhất quán trong Cache. Hay với hệ đa xử lý, nhiều CPU, mỗi CPU có
cache cấp 1 riêng của mình → sự nhất quán giữa các Cache phải được duy
trì → sử dụng nghi thức MESI – là nghi thức đặc biệt gọi là ngó trộm Bus
( Bus snooping ).
-MESI viết tắt đại diện cho 4 tình trạng của một hàng Cache. Mỗi hàng
Cache có một tag chứa các cờ hiệu tích hợp để nhận diện tình trạng này.
1) M (Modified – Điều chỉnh): Hàng Cache này là duy nhất trong Cache
( Các CPU khác không truy xuất nó ); Nhưng nó đã bị điều chỉnh và chưa
ghi trở lại RAM . Nội dung RAM khác với nội dung hiện có của địa chỉ ô nhớ.
2) E ( Exclusive – Độc nhất): Hàng Cache này là duy nhất trong Cache chưa
bị điều chỉnh ( Nội dung RAM và nội dung hàng Cache khớp nhau )
3) Shared ( chung ): Hàng Cache này có thể hiện diện trong các Cache
khác, (CPU khác có thể truy xuất được).
4) Invalid ( Không hiệu lực ): Nội dung của hàng Cache này bây giờ không
có ý nghĩa nữa, xem như là một hàng trống → nhận dữ kiện mới một cách
tự do.
Cache số liệu có khả năng đáp ứng đồng thời hai yêu cầu từ đường ống U &
V → để làm được điều này các hàng Cache của nó là hàng đan xen gấp 8.
Các tag trong Cache dữ liệu là Tripple – ported; nghĩa là có thể định vị cùng
7
một lúc bởi 3 nguồn khác nhau: hai cho ống U & V, còn một sử dụng cho
việc sử dụng ngó trộm bus ( bus snooping) khi cần xác định một địa chỉ cụ
thể có nằm trong cache hay không?
-Nói chung cấu trúc Cache trong Pentium phức tạp hơn nhiều với Cache
trong 486 ( Do sử dụng song song hai đường ống U, V và việc có thể sử
dụng Cache của Pentium trong các hệ thống đa xử lý tạo nên sự phức tạp
này ). Nhưng chính Cache Pentium là động lực, yếu tố làm nổi bật tốc độ
của Pentium.
*Giống như 486 đơn vị d.c.d.d của Pentium được sát nhập ngay trên Chip.
Nhưng hiệu suất đã được cải thiện rất lớn.
8
X2 – FP Excution stage 2 - thực thi dấu chấm di động công đoạn 2.
WF – Write file – Ghi tập tin
ER – Error Report – Báo lỗi
-3 công đoạn đầu tiên giống như thi hành một lệnh số nguyên.
-Công đoạn thứ 4( Ex ): Với số nguyên là thực thi lệnh, với dấu chấm di
động thì nó chuyển đổi lệnh thành một dạng dấu chấm đặc biệt. Việc thi
hành thực sự diễn ra trong công đoạn X1 và X2. Trong công đoạn WF, kết
quả được quy tròn và được chuyển đến thanh ghi đích trên ngăn chồng dấu
chấm di động.
-Việc thi hành lệnh kết thúc ở công đoạn ER nếu có lỗi sẽ được báo ra và
thanh ghi trạng thái dấu chấm di động làm việc với lệnh mới.
Pentium
Data 64 bit Mỗi chuyển tải 8 bytes
CPU
32 bit
Bus địa chỉ
9
-Chế độ Burst Mode tính cả thời gian định vị ( 2,1,1,1)
Tốc độ chuyển giao = 4 26 MB/giây
Tóm lại: Pentium là nhà vô địch hiện nay của họ 80x86. Nhìn từ phía phần
mềm Pentium rất giống với 486 chỉ bổ sung thêm 1 vài lệnh. Nhưng về phần
cứng thì đây là những tiến bộ rât lớn so với 486.
a.Pentium Pro:
Ra đời 1985; chíp có 5.5 triệu transistor,chíp có ổ cắm riêng,tốc độ cao hơn
pentium;cache C2:256-1MB;xử lý 3 lệnh song song.
c.Pentium2 (1997)
-Thêm bus giữa CPU Cache level 2 hoạt động đồng thời song
song với bus hệ thống (2 bus độc lập).
10
-Chip CPU,Cache,tỏa nhiệt : cắm vuông góc mainboard.Card SEC(single
edge contact)
-Kết hợp ưu điểm của Pentium pro và Pentium MMX
-Tối ưu hóa cho hệ điều hành 32 bit;
-Giảm năng lượng tiêu hao CPU
* Deschutes:
Là pentium II ra đời 1998; 333MHz ; công nghệ 0.25µm;
Cache level 1 : 512Kb – Loại slot 1
Đầu năm 1999: Ra đời 400MHz (Clock bus : 100M)
*Celeron:
4/1998: 0.25m; thẻ cắm SEPP; 266MHz rồi 300MHz
8/1998: 128kb Cache level 2 ;
1999: 400MHz.
*Pentium II Xeon:
6/48: Chủ yếu cho máy chủ
1999: 450MHz
d.Pentium III:
1999: Phát triển của MMX đặc biệt cho đồ họa không gian 3 chiều
F=450 - 500MHz.
e.Pentium IV:
Năm 2000: 0.18 – 0.13m. Thay dây dẫn nhôm bằng dây dẫn đồng
→Tần số tăng 700MHz
Năm 2001: 0.13m; f= 1000MHz rồi 1500MHz.
f.Vi xử lý 64 bit:
Cấu trúc hoàn toàn mới.
64 bit địa chỉ→Định vị 16 Ebyte (Exabyte=260 byte)
Làm việc chế độ 64 bit hoặc 32 bit.
Hiện nay , cuối năm 2006 đã ra đời CPU hai nhân ; đầu năm 2007 sẽ ra đời
các chíp CPU đa nhân ( ba , hoặc bốn nhân ) .
11
Thai’ computer :
HP NoteBook V3320TU
Bộ vi xử lý Intel Core 2 Duo 2x1.73GHz
Bộ nhớ cache L2 2048KB
Ram 512 DDRAM
Ổ cứng 80GB
Màn hình 14”.1 TFT
DVD-Rewriter
Reader 5.1
Wireless LAN IEEE802.11b/g
Tích hợp sẵn card màn hình 64MB share RAM
Adapter , pin 6 tháng
Khi bộ xử lý máy tính được nâng lên hàng GHz, năng lực xử lý
của máy tính trở nên khó kiểm soát khó đánh giá và càng phức
tạp hơn khi các chip đa lõi xuất hiện.
12
như số lõi chip, tốc độ bus hệ thống và số bộ nhớ đệm mức 2
(L2) cũng như xác định bạn có muốn khả năng xử lý 64 bit hoặc
cần ép xung cho CPU hay không.
Nếu bạn muốn nâng cấp CPU hoặc dựng những máy tính để bàn
với CPU đáp ứng được nhu cầu sử dụng, bài viết này sẽ cung
cấp những kiến thức cơ bản giúp bạn đưa ra lựa chọn đúng đắn
nhất.
Lợi thế trong thực thi ứng dụng của chip đa lõi phụ thuộc vào
phần mềm bạn dùng và cách sử dụng nó. Các phần mềm ứng
dụng và chơi game nếu không được lập trình phân công cho
từng bộ xử thành phần - hỗ trợ tối đa cấu trúc đa lõi - thì nó chỉ
khai thác được hết công suất của một trong số lõi đó. Tuy nhiên,
chip lõi kép vẫn cho năng suất xử lý cao hơn, đáp ứng hầu hết
nhu cầu của đa số người dùng, nhất là khi các ứng dụng trong
Windows được đưa sang cho lõi thứ hai đảm nhiệm. Vai trò của
lõi thứ hai càng rõ rệt khi bạn chạy đa nhiệm như vừa lướt web
vừa tải video cho máy duyệt media cầm tay.
Hiện tại, một số chương trình như in nhãn đĩa trực tiếp Nero
Recode hay biên tập video Pinnacle Studio 11 chỉ hỗ trợ với chip
lõi kép. Tuy nhiên, đã có một số chương trình như chỉnh sửa
video Sony Vegas 7.0 và Microsoft Flight Simulator X SP1 và
13
Supereme Commander được thiết kế để khai thác năng lực của
chip lõi tứ. Phần mềm Sony Vegas có thể biên tập video trên
chip lõi tứ Core 2 Quad nhanh hơn một phần ba thời gian sửa
video trên một chip lõi đơn.
Hiện nay chỉ còn các máy tính cấp thấp mới dùng chip lõi đơn,
còn lại hầu hết dòng máy tính đại trà đã sử dụng chip 2 nhân trở
lên. Các chip lõi tứ cao cấp thích hợp dành cho dân nghiện
game nặng hoặc luôn phải chỉnh sửa, biên tập video và những
người thích đón đầu công nghệ.
Với tốc độ xung đồng hồ, bộ xử lý Core 2 Duo E6700 2,66 GHz rõ
ràng nhanh hơn chip E6600 2,4 GHz. Tuy nhiên, lưu ý là việc so
sánh tốc độ xung không còn giá trị nữa với các chip khác dòng.
Chẳng hạn chip Core 2 Duo 1,86 GHz cấp thấp hơn vẫn chạy
nhanh hơn chip Pentium D 960 3,6 GHz đời cũ, và chip Core 2
Duo E6700 2,66 GHz của Intel lại tốt hơn chip Athlon X2 6000+ 3
GHz của AMD khi thử nghiệm với hầu hết benchmark (thước đo
khả năng thực thi PC).
Bộ nhớ đệm L2 của một bộ xử lý giúp cải thiện năng lực vận
hành tức là gần như đưa ngay lập tức các dữ liệu tới bộ xử lý.
Bộ nhớ đệm L2 càng lớn thì càng tốt với chip Intel hơn là chip
Athlon 64 X2 bởi cách thức mỗi chip truy cập vào bộ nhớ.
Còn chỉ số FSB (tính theo MHz) là thước đo tốc độ giao tiếp giữa
bộ xử lý và bộ điều khiển bộ nhớ, và chỉ số này càng lớn càng
tốt. Đây là một thông số chỉ liên quan tới các bộ xử lý của Intel,
và hiện có khá nhiều mức tốc độ FSB khác nhau. Tốc độ FSB
lớn hơn kéo theo nhu cầu dung lượng RAM lớn hơn để tăng tốc
vận hành. Chip mới nhất của Intel có tốc độ FSB là 1,333 MHz.
Chip Core 2 Duo serie E6000 gốc có tốc độ bus 1.066MHz, còn
serie E4000 có bus 800 MHz. Với bộ xử lý AMD, mạch điều khiển
14
bộ nhớ được tích hợp trên chip nên cho tốc độ truy cập nhanh
hơn. Giao tiếp với bộ nhớ thực thường qua đường dẫn
HyperTranport Bus, bởi thế tốc độ FSB không phải là vấn đề với
các bộ xử lý Athlon.
Ảnh hưởng của cache và FSB còn tùy thuộc vào chương trình
đang chạy. Bộ xử lý Core 2 Duo E6320 1,86 GHz có thể làm việc
tốt hơn bộ xử lý Core 2 Duo E4400 2 GHz trong một số bài thử,
nhờ bộ nhớ đệm và FSB lớn hơn mặc dù thời gian xử lý của hầu
hết các ứng dụng đều có chênh lệch rất nhỏ.
Hầu hết các phần mềm được viết cho các chip 32 bit. Tuy nhiên,
tất cả các bộ xử lý (BXL) trung và cao cấp của Intel và AMD ngày
nay có kiến trúc 64 bit nhưng vẫn đảm bảo tính tương thích với
các phần mềm này.
Các chip 64 bit sẽ khai thác các lợi thế vượt trội của các phần
mềm ứng dụng tương ứng nhưng nó cần hệ điều hành cùng hỗ
trợ công nghệ này, chẳng hạn Windows Vista 64 bit. Như vậy, tốt
nhất bạn phải cài các phần mềm viết riêng cho BXL 64 bit. Đã có
một số tiện ích viết theo nền tảng mới này, nhưng nếu chạy các
phần mềm 32 bit trên chip mới bạn cũng nhận được những lợi
ích đáng kể, bởi chip này thường đi kèm với RAM 4 GB trở lên.
Kỹ thuật ép xung
Muốn nâng tốc độ xung lên cao hơn định mức, nhiều người
dùng kỹ thuật ép xung để mong có tốc độ thực thi nhanh hơn. Ví
dụ, bạn có thể nâng tốc độ xử lý của chip Core 2 Extreme
QX6700 từ 2,66 GHz lên 3,3 GHz.
Ép xung giúp gia tăng tốc độ thực thi, nhưng cũng tiềm ẩn
những rủi ro như tổn thọ BXL, thậm chí là phá hỏng nó. Việc làm
mát cũng cần đặc biệt quan tâm. Tìm một mức tốc độ tới hạn mà
chip đó còn có thể chịu được cần nhiều kinh nghiệm và đôi khi
phải chấp nhận cả sự thất bại. Mặc dù cả Intel và AMD đồng
thuận khả năng cho ép xung cho các BXL và chipset nhưng
15
không hãng nào chính thức ra mặt khuyến khích hoặc ủng hộ
việc làm này.
Bạn cần tìm chủng loại chip dễ ép xung. Những BXL dễ thực
hiện nhất là có hệ số nhân không bị khóa. Hệ số nhân này cho
biết chip có thể chạy nhanh hơn bao nhiều lần tốc độ tiêu chuẩn
của nó. Chẳng hạn, để nâng xung đồng hồ của chip Core 2
Extreme QX6800 2,93 Ghz chỉ đơn giản là thay đổi hệ số nhân
trong BIOS từ 11 lên 12. Các chip lõi tứ cao cấp nhất dòng Core
2 Extreme của Intel và chip 64 bit Athlon 64 FX của AMD đều
không khóa hệ số nhân.
16