You are on page 1of 16

chương IV : CPU PENTIUM

1) Sơ đồ khối.

Các thanh ghi


Vùng đệm đích Bộ xử lý
Rẽ nhánh dấu chấm
(BTB) di động Cache số liệu
8K

Đường ống
U của ALU

Cache lệnh Hàng nhặt


8K sớm Các thanh ghi

Đường ống
V của ALU

Bus số liệu 64 bit

2) Đặc điểm của Pentium:


Đơn vịCó
*Intel giới thiệu năm 1993: Busđặc trưng 100MIPS ( 100 Million Instruction
per Bus
second);
địa chỉTốc độ đồng hồ là 66Mhz.
32 bit
Về số nguyên gấp nhanh gấp 4 lần 486DX.
Hiệu suất số thập phân nhanh hơn 5 đến 7 lần 486DX
* Thay đổi chính làm tăng tốc độ do 3 thành phần:
-Đơn vị tính số nguyên: Hai đường dây song song đồng thời.
-Cache cấp 1riêng cho số liệu và lệnh
-Đơn vị tính toán d.c.d.d nhanh hơn.
* Đặc điểm chính của Pentium:
1) Sản xuất theo công nghệ BICMOS:( 0,8µm; 4 lớp dây dẫn).
2)Chip có 3,1 triệu Transistor; Bus bên trong rộng 64 bit; Bus ngoài 32 bit.
3) Có cặp song sinh ALU; mỗi đường ống có 5 công đoạn → Có thể thi hành
đồng thời 2 lệnh ngôn ngữ máy trong một chu kỳ.

1
4)Có 2 cache nhớ riêng, 2 chiều , 8kb; Một cache cho lệnh và một cache cho
data; kết nối bus 64 bit → tốc độ nhanh hơn 486 nhiều lần.
5)Có nghi thức (Protocol) đặc biệt MESI → Làm việc tốt hệ đa vi xử lý
(Modified; exclusive; sharedd; Invalid).
6) Bộ xử lý d.c.d.d nhanh hơn là 486; cũng có phần chọn hai lệnh thi hành
đồng thời cho số thập phân .
7) Có vùng đệm đích dành cho các lệnh nhảy rẽ nhánh → các lệnh nhảy chỉ
mất một chu kỳ.

3) Đường ống (Pipe line):


-Thực ra mỗi lệnh khi thi hành ở cả hai loại 486 và Pentium đều phải trải qua
5 công đoạn theo một trình tự nhất định.
1. PF Prefetch - nhặt sớm: Lệnh ngôn ngữ máy nhặt từ bộ nhớ → vào
CPU.
2. D1 Decode 1-Giải mã 1: Mục tiêu phân tích lệnh xem CPU sẽ khởi
kích hành động nào.
3. D2 Decode 2-Giải mã 2: Tùy hành động → Xác định tác tố cần đến.
4. Ex Execute – Thực thi lệnh, và truy xuất ô nhớ liên quan.
5. WB – WriteBack- Ghi lại: Hoàn tất nội dung các thanh ghi CPU và
thanh ghi trạng thái nội bộ vừa được thực hiện.

-Mỗi công đoạn này đòi hỏi một chu kỳ máy ( Một nhịp xung đồng hồ của
CPU ) Riêng công đoạn D2 và Ex còn có thể yêu cầu thêm một chu kỳ nữa
→ Tối thiểu phải mất 5 chu kỳ trong đó người ta vẫn nói một số lệnh chỉ
dùng hết một hoặc hai chu kỳ máy là do nguyên lý vận dụng như trong dây
chuyền lắp ráp sản phẩm. Có nhiều lệnh nhiều công đoạn khác nhau chạy
song song trong đường ống → Mỗi lệnh chỉ mất một chu kỳ mặc dù thực
chất phải chạy đủ 5 chu kỳ trên một lệnh.
-Trong 486 việc thi hành theo đường ống đã nhanh rồi, nhưng Pentium lại
còn nhân tốc độ lên bằng cách thiết lập đường ống thứ 2 song song → cơ
chế này gọi này gọi là cấu trúc đường ống “Super calar” – siêu vô hướng.
Gọi hai đường ống là đường ống U & V:
+ Nhờ hai đường ống này về mặt lý thuyết Pentium có thể thi hành đồng thời
hai lệnh → kết quả tăng gấp đôi tốc độ thi hành lệnh ( Trên thực tế không
đơn giản thế, vì hai lệnh kế tiếp nhau thường thi hành tuần tự vì chúng phụ
thuộc nhau ).
+Công đoạn thứ hai D1 sẽ xác định xem có thể thi hành song song cả hai
lệnh được không ? Trong công đoạn PF : lệnh hiện hành phải được thi hành,
còn lệnh kế tiếp sẽ được nạp vào đơn vị giải mã song song
Lệnh hiện hành → đưa vào đơn vị giải mã ống U

2
Lệnh kế tiếp → dưa vào đơn vị giải mã ống V
+ Nếu công đoạn D1 xác định là có thể thi hành đồng thời hai lệnh thì mỗi
lệnh sẽ trải qua các công đoạn khác nhau trong đường ống của mình theo
phương thức song song. Nếu như không thể thi hành hai lệnh cùng lúc thì
lệnh hiện hành trong ống U đi đến công đoạn kế tiếp như bình thường, lệnh
kế tiếp trong ống V sẽ được chuyển qua thi hành trong ống U ( Vì trước đó
các lệnh được nạp vào cả hai đường ống ) → Thực hiện như là một lệnh kế
tiếp lệnh hiện hành.
Các trình biên dịch đã được tối ưu hóa với Pentium → tổ chức mã máy theo
một cách thức sao cho các lệnh ngôn ngữ máy kế tiếp nhau cho phép càng
thi hành đồng thời càng nhiều càng tốt.

4) Vùng đệm đích rẽ nhánh BTB: ( Dành cho lệnh nhảy )


-Hiệu quả của nguyên lý đường ống → Dựa vào phải cung cấp liên tục các
lệnh cho mỗi đường ống, phải “Cho ăn liên tục” → Phải sử dụng hai vùng
đệm prefetch được thiết lập cho công đoạn đầu tiên của cả hai đường ống.
-Khi thực hiện một lệnh nhảy thì các vùng đệm prefetch này trở nên vô ích .
Thay vì thi hành lệnh kế tiếp → thì chương trình phải thi hành một lệnh hoàn
toàn khác → các lệnh tiếp theo nằm trong đường ống phải tống ra ngoài và
nạp các lệnh mới → khi gặp lệnh nhảy phải mất một vài chu kỳ trước khi
lệnh đầu tiên rời khỏi đường ống sau khi thi hành lệnh nhảy.
Để giải quyết → Pentium sử dụng thêm vùng đệm BTB dành cho lệnh
nhảy . Vùng đệm BTB sẽ được sử dụng trong công đoạn D1 đối với tất cả
các lệnh nhảy gần ( Near Jump – Ví dụ như các lệnh nhảy có điều kiện và
vô điều kiện, các lệnh triệu gọi các thủ tục ). Nếu gặp một lệnh nhảy như thế
CPU nạp lệnh này vào BTB ( Nó cất cả địa chỉ lệnh nhảy và địa chỉ nơi đến
của lệnh nhảy vào trong BTB ). Giả thiết là lệnh nhảy phải thi hành lần nữa
thì thay vì nạp lệnh nhảy kế tiếp sau lệnh nhảy vào đường ống → CPU nạp
lệnh ở địa chỉ đích của lệnh nhảy vào đường ống.
Trong trường hợp này một lệnh nhảy có điều kiện thậm chí cũng chỉ
mất có một chu kỳ còn bình thường phải tốn 3 chu kỳ cho một lệnh nhảy.

5) Cache của Pentium:


a) Khái niệm Cache
-CPU Pentium có hai cache nhớ 8kb riêng biệt: Môt cache cho dữ liệu, một
cache cho lệnh chương trình: Cả hai cache đều thuộc loại hai chiều kết hợp
với nhau ( 2 way Set- Associative cache ), mỗi chiều gồm có 128 mục vào –
32 bytes ( bằng 4 kb ). Cache có thể làm việc theo chế độ Writethrough và
copyback, và có khả năng đáp ứng đồng thời hai truy xuất từ đường ống U
và V.

3
-Khái niệm Cache: + Cache CPU (hay Cache cấp 1)
+ Cache tr ên Main board (Cache cấp 2 )

- Trước hết cache được dùng tăng tốc việc truy xuất số liệu hay thông tin cụ
thể bằng cách giữ các dữ liệu trong một vùng nhớ riêng → vùng này là 1
cache. Ưu điểm là việc truy xuất nhanh hơn là truy xuất từ thiết bị trữ tin.
+ Cache đĩa cứng
Cache font Sử dụng RAM làm “Bộ nhớ cao tốc”.
Cache CD-Rom
Nhưng cache CPU không áp dụng nguyên tắc này vì RAM cung cấp dữ liệu
và lệnh chương trình không đủ nhanh cho CPU.
-Cache CPU là cấp 1 ( the f irst level cache ) được đặt ngay trong CPU và
đọc nhanh như đọc từ các thanh ghi (đặt cache càng to càng nhiều trong
CPU càng tốt, nhưng còn tùy thuộc công nghệ chế tạo vi xử lý).
Cache cấp 2 là cache nhớ 128 k hoặc 256 k nằm giữa CPU và RAM.
Thường là các SRAM (RAM tĩnh ) – dạng RAM cao tốc, nhanh gấp 3, 4 lần
các bộ nhớ chính cấu tạo từ DRAM, SRAM (20,25 ns); DRAM (70,80,100
ns).
-Cache cấp 3 là bộ nhớ chính [(RAM) thường] dùng làm cache cho đĩa cứng
và các thiết bị ngoại vi khác.
-Số cấp cache càng tăng → tốc độ càng giảm → giá thành/ 1kb cũng giảm
theo.

b)Hiệu quả Cache.


-Chất lượng và hiệu quả của một cache được đánh giá bằng tỉ số: Số lần
trúng tủ/Số lần trượt (Cache hits/Cache misses) Khi truy xuất dữ kiện
Cache hits: Dữ kiện CPU yêu cầu có sẵn trong Cache
Cache misses: Không có trong Cache.
-Tỉ số trên phụ thuộc 3 yếu tố:
Tổ chức cache, loại mã lệnh chương trình, kích thước cache.
1. Kích thước Cache : tăng lên → Trữ nhiều thông tin → Truy tìm của
CPU nằm sẵn trong Cache tăng.
2. Loại mã lệnh chương trình, Tính địa phương ( Locality ) rất quan
trọng vì cache CPU chứa cả dữ liệu và mã lệnh chương trình → nếu các
phần trình “bó gọn“(Self Contained), đặc biệt các vòng lặp nằm trọn trong
một cache thì tốc độ thi hành rất nhanh ( Khối lệnh chương trình nhỏ hơn
kích thước cache ). Nếu một chương trình chứa các lệnh nhảy lên nhảy
xuống liên tục giữa các chương trình con khác nhau, hay các phần chương
trình khác nhau → hiệu quả dùng cache rất thấp.

4
3. Điều rất quan trọng là tổ chức của Cache phụ thuộc vào hai yếu tố:
-Chiến lược trữ đệm ( Cache strategies )
-Cấu trúc Cache
c) Chi ến lược trữ đệm.
* WriteThrough: Cache chỉ định vị với các truy xuất đọc của CPU, WTC
(Writethough cache). Chuyển các truy xuất ghi đến bộ nhớ RAM chính.
Trước khi chuyển, WTC kiểm tra xem vị trí ô nhớ vừa mô tả:
-Đã được trữ trong Cache do kết quả đọc chưa ? → đã → Trị mới của
vị trí ô nhớ cũng được ghi ngay trong Cache.
-Không có → truy xuất RAM chính.
* Thủ tục hiệu chính tốt hơn WTC là “Buffered Writethough”. Cache cấp 1
được trang bị bổ sung thêm các vùng đệm ghi (Write buffer) để tăng tốc các
thao tác ghi đến bộ nhớ ( 486DX có đến 4 vùng đệm này ).
Khi số liệu cần phải ghi vào bộ nhớ → WTC đặt vào vùng đệm ghi này →
cho phép CPU tiếp tục làm việc khác ngay. Vì vùng đệm ghi này được định
vị nhanh, trong khi CPU làm việc thì Cache ghi nội dung các vùng đệm ra bộ
nhớ thông thường trên Bus riêng của nó, ngay khi Bus vừa rảnh rỗi.
*Thủ tục WriteBack(WBC):
Với tác vụ đọc thì WBC giống như WTC.
Với tác vụ ghi thì WBC khác với WTC.
Nếu thông tin (được ghi ra bộ nhớ) đã nằm sẵn trong Cache, nó chưa
phải ra khỏi cache cho đến khi nó cần vị trí đó để đọc thông tin mới vào. Khi
cần đến vị trí này → được chuyển vào vùng đệm cas toff → sau đó chuyển
đến bộ nhớ song song với công việc của CPU (Làm việc đồng thời với
CPU).
d) Cấu trúc Cache.
- Cache nhớ thường được tổ chức thành các hàng Cache(Cache Line).
Kích thước một hàng Cache tùy thuộc dung lượng số liệu nội bộ CPU
hoặc dung lượng Cache cấp 1 của CPU.
386: Một hàng Cache: 32 bit ( Dword =4 bytes)
486: Một hàng Cache : 128 bit (4Dword=16 bytes)
Pentium: Một hàng Cache: 256 bit( Qword=32 bytes)
* Chế độ Burst Mode: Với các CPU đời mới chạy theo chế độ “Burt Mode”
làm tăng tốc truy xuất các byte nằm liên tục trong ô nhớ nhanh kinh khủng.
Thông thường CPU phải cho địa chỉ lên Bus trước khi đọc ô nhớ mà nó
nhắm tới trong chế độ Burst Mode, truy xuất số liệu được đọc như một khối.
CPU chỉ cần cung cấp địa chỉ của byte đầu tiên trên bus, sau đó bộ nhớ tự
động cung cấp tất cả địa chỉ ô nhớ tiếp theo khi có yêu cầu → giảm chu kỳ
chuyển địa chỉ ổ nhớ cần truy xuất:

5
Ví dụ: 486 thường cần 2 chu kỳ đồng hồ để đọc một Dword từ bộ nhớ →
để nạp trọn vẹn một hàng Cache cần 4x2=8 chu kỳ đồng hồ trong chế độ
Burst Mode chỉ có Dword đầu tiên là cần 2 chu kỳ còn 3 Dword tiếp theo chỉ
còn một chu kỳ → Burst Mode chỉ cần 5 chu kỳ 2-1-1-1. Thay cho 8 chu kỳ
cho phép chuyển số liệu thông thường.
* Cache trữ đệm cả số liệu và cả các địa chỉ của số liệu → Mỗi hàng
có một cái tên ( Gọi là tag ). Các tag này không được kèm ngay với hàng
Cache mà được ghi vào phần nhớ riêng biệt (Khi tìm sẽ mất thời gian,
nhưng bù lại SRAM nhanh hơn).
* Cùng với các hàng cache và tag mỗi Cache còn có bộ phận điều
khiển Cache.
Với Cache cấp 2 → có một bộ vi điều khiển trên vỉ mạch chính.
Còn với Cache cấp 1 → Điều khiển Cache là một phần của CPU.

e) Tổ chức hàng Cache


* Thông tin không thể được cất giữ tùy tiện trong hàng cache bất kỳ; vì
như vậy bộ phận điều khiển Cache phải kiểm tra tất cả các tag để tìm đúng
địa chỉ so sánh với địa chỉ CPU → Quá trình này mất nhiều thời gian → tổ
chức Cache đơn giản nhất gọi là “Ánh xạ trực tiếp” ( Direct Mapping) Địa chỉ
 Một hàng Cache.
Ví dụ: Cache thứ cấp của 486 →Làm việc một hàng Cache 128 bit (16 byte).
Một Cache 256 k cung cấp 16384 hàng ( 2 14 ) Nhiệm vụ của điều khiển
Cache là ánh xạ địa chỉ CPU đến một trong 16384 hàng Cache.
Như vậy : -14 bit ( từ 4-17 ) của CPU xác định số thứ tự hàng Cache
-4 bit ( từ 0-3): Chỉ mục trong hàng Cache.
-Còn lại 18-31: trữ trong tag của một hàng Cache: (Gồm 14 bit )
Nhưng thường chỉ dùng 8 bit ( từ 18-25 ) . Cache chỉ quản lý 64 Mb thấp
(226) của bộ nhớ RAM. (Dung lượng này cũng đủ cho RAM trên vỉ mạch
chính.).
Nhược điểm: 64Mb RAM chỉ được ánh xạ đến 16384 hàng Cache →
Có đến 256 địa chỉ ô nhớ cùng chia sẻ một hàng cache → Cache liên hợp.
*Cache liên hợp(Associative Cache) tinh chỉnh lại quá trình ánh xạ trực
tiếp . Thay vì gán một hàng Cache đơn lẻ cho mỗi địa chỉ ô nhớ, ta có thể
gán 2, 4, 8 hàng cache. Gọi là Cache liên hợp gấp đôi ( two fold ), Gấp 4
( four fold ); gấp 8 (eight fold).

f) Phân trang và Đan xen: ( Paging and Interleaving)


Nội dung chính là phân phối nội dung các hàng Cache đến các trang khác
nhau trong bộ nhớ. Một trang là một khối nhớ liên tục. Không phải các hàng

6
Cache khác nhau bị phân chia rời nhau ra mà chính là nội dung các hàng
cache bị chia ra.
Ví dụ: Cache dữ liệu cấp 1 của Pentium là Cache đan xen gấp 8, nghĩa là 8
Dword của một hàng 256 bit được đặt trong 8 trang khác nhau. Các Dword
đầu tiên từ tất cả hàng Cache được trữ trong trang đầu tiên, Các Dword thứ
hai → Trang thứ 2...→ Các đường ống U và V của CPU muốn đọc các
Dword khác nhau từ một trong hàng Cache → có thể truy xuất các trang
khác nhau, vì thế cả hai đường ống có thể làm việc cùng một lúc.

g) Nghi thức MESI ( Viết tắt 4 trạng thái khác nhau của một hàng Cache
CPU )
- Nảy sinh vấn đề là các truy xuất trực tiếp như điều khiển DMA, bỏ qua
CPU và bộ phận điều khiển Cache mà truy xuất trực tiếp ô nhớ → phá hủy
sự nhất quán trong Cache. Hay với hệ đa xử lý, nhiều CPU, mỗi CPU có
cache cấp 1 riêng của mình → sự nhất quán giữa các Cache phải được duy
trì → sử dụng nghi thức MESI – là nghi thức đặc biệt gọi là ngó trộm Bus
( Bus snooping ).
-MESI viết tắt đại diện cho 4 tình trạng của một hàng Cache. Mỗi hàng
Cache có một tag chứa các cờ hiệu tích hợp để nhận diện tình trạng này.

1) M (Modified – Điều chỉnh): Hàng Cache này là duy nhất trong Cache
( Các CPU khác không truy xuất nó ); Nhưng nó đã bị điều chỉnh và chưa
ghi trở lại RAM . Nội dung RAM khác với nội dung hiện có của địa chỉ ô nhớ.
2) E ( Exclusive – Độc nhất): Hàng Cache này là duy nhất trong Cache chưa
bị điều chỉnh ( Nội dung RAM và nội dung hàng Cache khớp nhau )
3) Shared ( chung ): Hàng Cache này có thể hiện diện trong các Cache
khác, (CPU khác có thể truy xuất được).
4) Invalid ( Không hiệu lực ): Nội dung của hàng Cache này bây giờ không
có ý nghĩa nữa, xem như là một hàng trống → nhận dữ kiện mới một cách
tự do.

h) Cache cấp một của Pentium.


-2 Cache cấp 1 riêng biệt:-Một dành cho mã lệnh chương trình, một dành
cho số liệu, cả hai đều có kích thước 8 k, thuộc loại liên hợp hai tuyến. Mỗi
tuyến chứa 128 hàng Cache, mỗi hàng 32 byte (2 tuyến x 128 hàng Cache x
32 byte = 8k) . Cùng lúc có thể truy xuất cả hai cache được .

Cache số liệu có khả năng đáp ứng đồng thời hai yêu cầu từ đường ống U &
V → để làm được điều này các hàng Cache của nó là hàng đan xen gấp 8.
Các tag trong Cache dữ liệu là Tripple – ported; nghĩa là có thể định vị cùng

7
một lúc bởi 3 nguồn khác nhau: hai cho ống U & V, còn một sử dụng cho
việc sử dụng ngó trộm bus ( bus snooping) khi cần xác định một địa chỉ cụ
thể có nằm trong cache hay không?
-Nói chung cấu trúc Cache trong Pentium phức tạp hơn nhiều với Cache
trong 486 ( Do sử dụng song song hai đường ống U, V và việc có thể sử
dụng Cache của Pentium trong các hệ thống đa xử lý tạo nên sự phức tạp
này ). Nhưng chính Cache Pentium là động lực, yếu tố làm nổi bật tốc độ
của Pentium.

6. Đơn vị dấu chấm di động ( Floating point Unit )

*Giống như 486 đơn vị d.c.d.d của Pentium được sát nhập ngay trên Chip.
Nhưng hiệu suất đã được cải thiện rất lớn.

So sánh thời gian thi hành lệnh d.c.d.d.


Lệnh 486 Pentium ý nghĩa lệnh
FXCH 4chukì 1chukì Trao đổi số liệu
FLD 3 1 Nạp
FST 3 2 Cất dữ
FADD 10 3 Cộng
FSUB 10 3 Trừ
FMUL 16 3 Nhân
FDIV 73 39 Chia
Lệnh FXCH có vai trò đặc biệt vì nó được thường xuyên sử dụng trong lập
trình dấu chấm di động. Lệnh này phải thi hành với 8 thanh ghi dấu chấm di
động ( của bộ xử lý dấu chấm di động). Các thanh ghi này xử lý giống như
một ngăn chồng → Các lệnh này được thi hành nhiều hơn cả . Tăng tốc
được lệnh FXCH là tăng được nhiều về tốc độ d.c.d.đ .
*Đường ống dấu chấm di động gồm 8 công đoạn, super calar tạo nền tảng
cho việc thi hành song song một lệnh FXCH và bất kỳ một lệnh dấu chấm di
động nào khác(Như vậy có thể không cần một chu kỳ nào cho lệnh FXCH ).
Giống như đường ống cho số nguyên; đường ống cho dấu chấm di động
cũng gồm hai đường ống làm việc song song với nhau. nhưng gồm 8 công
đoạn:

PF prefetch - nhặt sớm


D1 là Decode 1 – Giải mã 1
D2 là Decode 2 – Giải mã 2
Ex là Excute – Thực thi
X1 – FP Excution stage 1 – thực thi dấu chấm di động công đoạn 1.

8
X2 – FP Excution stage 2 - thực thi dấu chấm di động công đoạn 2.
WF – Write file – Ghi tập tin
ER – Error Report – Báo lỗi

-3 công đoạn đầu tiên giống như thi hành một lệnh số nguyên.
-Công đoạn thứ 4( Ex ): Với số nguyên là thực thi lệnh, với dấu chấm di
động thì nó chuyển đổi lệnh thành một dạng dấu chấm đặc biệt. Việc thi
hành thực sự diễn ra trong công đoạn X1 và X2. Trong công đoạn WF, kết
quả được quy tròn và được chuyển đến thanh ghi đích trên ngăn chồng dấu
chấm di động.
-Việc thi hành lệnh kết thúc ở công đoạn ER nếu có lỗi sẽ được báo ra và
thanh ghi trạng thái dấu chấm di động làm việc với lệnh mới.

7. Các đặc tính của Pentium :

Pentium
Data 64 bit Mỗi chuyển tải 8 bytes

CPU
32 bit
Bus địa chỉ

1) Là vi xử lý 64 bit thực sự ( 386, 486 là 32 bit ) Xử lý gấp 2 lần lượng


thông tin so với 486 DX ( cùng tần số làm việc như nhau )
2) Các Bus nội bộ rộng hơn:
-một số là 64 bit, số khác là 128 bit.
-bus từ cache nhớ vào vùng đệm prefetch của các ALU rộng 256 bits
3) 2 ALU, 2 Cache nhớ riêng biệt.
4) Đơn vị xử lý dcdd được cải thiện ( 8 công đoạn đường ống )
5) Tốc độ chuyển giao ( Clock =64 Mhz )→ chu kỳ 15ns.
-Chế độ truyền thống:
Tốc độ giao dịch = 1giaodịch/ 15ns x 2 chu kỳ =33.333.333 giao dịch/giây
Tốc độ chuyển giao=33.333.333 x 8 bytes/1 chuyển giao= 267 MB/giây
-Chế độ Burst:
Tốc độ giao dịch = 1 giaodịch/15ns = 66.666.667 giaodịch/giây.
Tốc độ chuyển giao = 66.666.667 x 8 byte/ 1 lần chuyển giao = 533 MB/giây

9
-Chế độ Burst Mode tính cả thời gian định vị ( 2,1,1,1)
Tốc độ chuyển giao = 4 26 MB/giây

Tóm lại: Pentium là nhà vô địch hiện nay của họ 80x86. Nhìn từ phía phần
mềm Pentium rất giống với 486 chỉ bổ sung thêm 1 vài lệnh. Nhưng về phần
cứng thì đây là những tiến bộ rât lớn so với 486.

8. CÁC PHIÊN BẢN CỦA PENTIUM

Tốc độ bus Clock CPU


Thế hệ Vi xử lý năm Data/add Cache level
(MHz) (MHz)
Pentium 1993 64/32 8+8 60 (60-200)M
5
Pentium MMX 1997 64/32 16+16 66 (166-233)
Pentium Pro 1995 64/36 8+8 66 (150-200)
Pentium II 1997 64/36 16+16 66 (233-300)
6
Pentium II 1998 64/36 16+16 100 (200-450)
Pentium III 1999 64/36 16+16 100 (450-600)
AMD Athion 1999 64/36 64+64 >200 >600
Pentium III 2001 64/36 32+32 800-1000 1.2G
7 2001 64/36 64/64 1300-1500 1.8G
Pentium 4 2002 64/36 64/64 1500 2.8G
2004 (64+64)/(32,36) 64/64 1500 3.2G

a.Pentium Pro:
Ra đời 1985; chíp có 5.5 triệu transistor,chíp có ổ cắm riêng,tốc độ cao hơn
pentium;cache C2:256-1MB;xử lý 3 lệnh song song.

b.Pentium MMX(1997)(MultiMedia Extesions)


cache sơ cấp:16+16kb , tăng gấp 2 lần
-thêm 57 lệnh cho xử lý Video,Audio và đồ họa.
-xử lý 8 byte số liệu song song→rất tốt cho xử lý tin hiệu video,audio.

c.Pentium2 (1997)

-Thêm bus giữa CPU Cache level 2 hoạt động đồng thời song
song với bus hệ thống (2 bus độc lập).

10
-Chip CPU,Cache,tỏa nhiệt : cắm vuông góc mainboard.Card SEC(single
edge contact)
-Kết hợp ưu điểm của Pentium pro và Pentium MMX
-Tối ưu hóa cho hệ điều hành 32 bit;
-Giảm năng lượng tiêu hao CPU

* Deschutes:
Là pentium II ra đời 1998; 333MHz ; công nghệ 0.25µm;
Cache level 1 : 512Kb – Loại slot 1
Đầu năm 1999: Ra đời 400MHz (Clock bus : 100M)

*Celeron:
4/1998: 0.25m; thẻ cắm SEPP; 266MHz rồi 300MHz
8/1998: 128kb Cache level 2 ;
1999: 400MHz.

*Pentium II Xeon:
6/48: Chủ yếu cho máy chủ
1999: 450MHz

d.Pentium III:
1999: Phát triển của MMX đặc biệt cho đồ họa không gian 3 chiều
F=450 - 500MHz.

e.Pentium IV:
Năm 2000: 0.18 – 0.13m. Thay dây dẫn nhôm bằng dây dẫn đồng
→Tần số tăng 700MHz
Năm 2001: 0.13m; f= 1000MHz rồi 1500MHz.

f.Vi xử lý 64 bit:
Cấu trúc hoàn toàn mới.
64 bit địa chỉ→Định vị 16 Ebyte (Exabyte=260 byte)
Làm việc chế độ 64 bit hoặc 32 bit.

( 260= 1Exabyte= 106 Tb= 1012Mb= 109 Gb )

Hiện nay , cuối năm 2006 đã ra đời CPU hai nhân ; đầu năm 2007 sẽ ra đời
các chíp CPU đa nhân ( ba , hoặc bốn nhân ) .

Hệ điều hành Vistra viết cho vi xử lý 64 bit !

11
Thai’ computer :

HP NoteBook V3320TU
Bộ vi xử lý Intel Core 2 Duo 2x1.73GHz
Bộ nhớ cache L2 2048KB
Ram 512 DDRAM
Ổ cứng 80GB
Màn hình 14”.1 TFT
DVD-Rewriter
Reader 5.1
Wireless LAN IEEE802.11b/g
Tích hợp sẵn card màn hình 64MB share RAM
Adapter , pin 6 tháng

Trang chủ > Hỗ trợ > Thông tin hữu ích

Bí quyết chọn mua CPU


Trước đây, giống như chỉ số mã lực ở xe hơi, tốc độ xử lý của
bộ xử lý (CPU), đơn vị tính là Hz, nếu càng cao thì máy tính xử lý
càng nhanh. Tuy nhiên bước sang “kỷ nguyên” đa lõi, việc so
sánh hiệu năng PC cần xét thêm những thông số khác.

Khi bộ xử lý máy tính được nâng lên hàng GHz, năng lực xử lý
của máy tính trở nên khó kiểm soát khó đánh giá và càng phức
tạp hơn khi các chip đa lõi xuất hiện.

Hiện nay việc so sánh các bộ vi xử lý không đơn giản là chọn


tốc độ xử lý cao nhất. Bạn cần phải xét cả các thông số khác

12
như số lõi chip, tốc độ bus hệ thống và số bộ nhớ đệm mức 2
(L2) cũng như xác định bạn có muốn khả năng xử lý 64 bit hoặc
cần ép xung cho CPU hay không.

Nếu bạn muốn nâng cấp CPU hoặc dựng những máy tính để bàn
với CPU đáp ứng được nhu cầu sử dụng, bài viết này sẽ cung
cấp những kiến thức cơ bản giúp bạn đưa ra lựa chọn đúng đắn
nhất.

Vì sao chọn chip lõi kép?

Thay đổi cơ bản nhất ở bộ xử lý này là chuyển sang đa lõi - tức


là ghép hơn một bộ xử lý vào một chip đơn. Thay vì tăng tốc độ
xung đồng hồ, phương pháp vốn làm nhanh nóng máy và tốn
điện, cả AMD và Intel cùng quyết định tăng cường tốc độ thực
thi bằng thiết kế đa lõi.

Các bộ xử lý Athlon 64 X2 của AMD và Intel Core 2 Duo đều sử


dụng cấu trúc lõi kép để tăng tốc xử lý đa nhiệm. Intel còn đi
trước một bước với chip Core 2 Quad và Core 2 Extreme serie
QX với 4 lõi trong một chip. AMD cũng có kế hoạch tung ra dòng
chip lõi tứ Phenom vào cuối năm nay. Đối thủ của Intel hiện còn
tung ra giải pháp Quad FX giúp tạo chip lõi tứ bằng cách ghép
hai chip lõi kép Athlon 64 FX với một bo mạch chủ.

Lợi thế trong thực thi ứng dụng của chip đa lõi phụ thuộc vào
phần mềm bạn dùng và cách sử dụng nó. Các phần mềm ứng
dụng và chơi game nếu không được lập trình phân công cho
từng bộ xử thành phần - hỗ trợ tối đa cấu trúc đa lõi - thì nó chỉ
khai thác được hết công suất của một trong số lõi đó. Tuy nhiên,
chip lõi kép vẫn cho năng suất xử lý cao hơn, đáp ứng hầu hết
nhu cầu của đa số người dùng, nhất là khi các ứng dụng trong
Windows được đưa sang cho lõi thứ hai đảm nhiệm. Vai trò của
lõi thứ hai càng rõ rệt khi bạn chạy đa nhiệm như vừa lướt web
vừa tải video cho máy duyệt media cầm tay.

Hiện tại, một số chương trình như in nhãn đĩa trực tiếp Nero
Recode hay biên tập video Pinnacle Studio 11 chỉ hỗ trợ với chip
lõi kép. Tuy nhiên, đã có một số chương trình như chỉnh sửa
video Sony Vegas 7.0 và Microsoft Flight Simulator X SP1 và

13
Supereme Commander được thiết kế để khai thác năng lực của
chip lõi tứ. Phần mềm Sony Vegas có thể biên tập video trên
chip lõi tứ Core 2 Quad nhanh hơn một phần ba thời gian sửa
video trên một chip lõi đơn.

Hiện nay chỉ còn các máy tính cấp thấp mới dùng chip lõi đơn,
còn lại hầu hết dòng máy tính đại trà đã sử dụng chip 2 nhân trở
lên. Các chip lõi tứ cao cấp thích hợp dành cho dân nghiện
game nặng hoặc luôn phải chỉnh sửa, biên tập video và những
người thích đón đầu công nghệ.

Đánh giá tốc độ xung, cache và bus

Tốc độ xử lý là một chỉ số quan trọng nhưng chỉ so sánh được


với các CPU trong cùng serie. Hai thông số khác tốc độ FSB
(front side bus) và L2 Cache cũng đóng vai trò quan trọng quyết
định tốc độ xử lý của chip nói chung.

Với tốc độ xung đồng hồ, bộ xử lý Core 2 Duo E6700 2,66 GHz rõ
ràng nhanh hơn chip E6600 2,4 GHz. Tuy nhiên, lưu ý là việc so
sánh tốc độ xung không còn giá trị nữa với các chip khác dòng.
Chẳng hạn chip Core 2 Duo 1,86 GHz cấp thấp hơn vẫn chạy
nhanh hơn chip Pentium D 960 3,6 GHz đời cũ, và chip Core 2
Duo E6700 2,66 GHz của Intel lại tốt hơn chip Athlon X2 6000+ 3
GHz của AMD khi thử nghiệm với hầu hết benchmark (thước đo
khả năng thực thi PC).

Bộ nhớ đệm L2 của một bộ xử lý giúp cải thiện năng lực vận
hành tức là gần như đưa ngay lập tức các dữ liệu tới bộ xử lý.
Bộ nhớ đệm L2 càng lớn thì càng tốt với chip Intel hơn là chip
Athlon 64 X2 bởi cách thức mỗi chip truy cập vào bộ nhớ.

Còn chỉ số FSB (tính theo MHz) là thước đo tốc độ giao tiếp giữa
bộ xử lý và bộ điều khiển bộ nhớ, và chỉ số này càng lớn càng
tốt. Đây là một thông số chỉ liên quan tới các bộ xử lý của Intel,
và hiện có khá nhiều mức tốc độ FSB khác nhau. Tốc độ FSB
lớn hơn kéo theo nhu cầu dung lượng RAM lớn hơn để tăng tốc
vận hành. Chip mới nhất của Intel có tốc độ FSB là 1,333 MHz.
Chip Core 2 Duo serie E6000 gốc có tốc độ bus 1.066MHz, còn
serie E4000 có bus 800 MHz. Với bộ xử lý AMD, mạch điều khiển

14
bộ nhớ được tích hợp trên chip nên cho tốc độ truy cập nhanh
hơn. Giao tiếp với bộ nhớ thực thường qua đường dẫn
HyperTranport Bus, bởi thế tốc độ FSB không phải là vấn đề với
các bộ xử lý Athlon.

Ảnh hưởng của cache và FSB còn tùy thuộc vào chương trình
đang chạy. Bộ xử lý Core 2 Duo E6320 1,86 GHz có thể làm việc
tốt hơn bộ xử lý Core 2 Duo E4400 2 GHz trong một số bài thử,
nhờ bộ nhớ đệm và FSB lớn hơn mặc dù thời gian xử lý của hầu
hết các ứng dụng đều có chênh lệch rất nhỏ.

Tại sao cần chip 64 bit?

Hầu hết các phần mềm được viết cho các chip 32 bit. Tuy nhiên,
tất cả các bộ xử lý (BXL) trung và cao cấp của Intel và AMD ngày
nay có kiến trúc 64 bit nhưng vẫn đảm bảo tính tương thích với
các phần mềm này.

Các chip 64 bit sẽ khai thác các lợi thế vượt trội của các phần
mềm ứng dụng tương ứng nhưng nó cần hệ điều hành cùng hỗ
trợ công nghệ này, chẳng hạn Windows Vista 64 bit. Như vậy, tốt
nhất bạn phải cài các phần mềm viết riêng cho BXL 64 bit. Đã có
một số tiện ích viết theo nền tảng mới này, nhưng nếu chạy các
phần mềm 32 bit trên chip mới bạn cũng nhận được những lợi
ích đáng kể, bởi chip này thường đi kèm với RAM 4 GB trở lên.

Kỹ thuật ép xung

Muốn nâng tốc độ xung lên cao hơn định mức, nhiều người
dùng kỹ thuật ép xung để mong có tốc độ thực thi nhanh hơn. Ví
dụ, bạn có thể nâng tốc độ xử lý của chip Core 2 Extreme
QX6700 từ 2,66 GHz lên 3,3 GHz.

Ép xung giúp gia tăng tốc độ thực thi, nhưng cũng tiềm ẩn
những rủi ro như tổn thọ BXL, thậm chí là phá hỏng nó. Việc làm
mát cũng cần đặc biệt quan tâm. Tìm một mức tốc độ tới hạn mà
chip đó còn có thể chịu được cần nhiều kinh nghiệm và đôi khi
phải chấp nhận cả sự thất bại. Mặc dù cả Intel và AMD đồng
thuận khả năng cho ép xung cho các BXL và chipset nhưng

15
không hãng nào chính thức ra mặt khuyến khích hoặc ủng hộ
việc làm này.

Bạn cần tìm chủng loại chip dễ ép xung. Những BXL dễ thực
hiện nhất là có hệ số nhân không bị khóa. Hệ số nhân này cho
biết chip có thể chạy nhanh hơn bao nhiều lần tốc độ tiêu chuẩn
của nó. Chẳng hạn, để nâng xung đồng hồ của chip Core 2
Extreme QX6800 2,93 Ghz chỉ đơn giản là thay đổi hệ số nhân
trong BIOS từ 11 lên 12. Các chip lõi tứ cao cấp nhất dòng Core
2 Extreme của Intel và chip 64 bit Athlon 64 FX của AMD đều
không khóa hệ số nhân.

Bạn cũng có thể ép xung với các CPU đã khóa hệ số nhân,


nhưng cần phải tăng tốc độ bus của hệ thống, kết quả là các linh
kiện khác đều phải chạy “quá sức”. Lưu ý là mặc dù hầu hết các
mainboard đều được hỗ trợ lựa chọn ép xung mở rộng, nhưng
rất ít nhà sản xuất PC cho tùy chọn này hoạt động.

16

You might also like