Lớp: MMT & TT K-49

Nhóm 1:
1. Mai Xuân Quỳnh
2. Vũ Văn Bá
3. Phạm Thị Ngọc
4. Bùi Thị Thanh Hòa
5. Lưu Thị Tuyết
6. Nguyễn Văn Tuấn

: trang 330 – 334
: trang 335 – 336 (nhóm trưởng)
: trang 337 – 338
: trang 339 – 340
: trang 341 – 342
: trang 343 - 345

Bài dịch: Data_Compression_The_Complete_Reference,_3ed_(Springer,_2004) (từ trang
330 đến 345)
4.8 JPEG
JPEG là một phương pháp nén không giảm chất lượng cho màu sắc hoặc màu xám vẫn
còn của hình ảnh (không phải phim). Nó không xử lý hai cấp (màu đen và trắng) hình ảnh
rất tốt. Nó cũng hoạt động tốt nhất trên tông màu liên tiếp hình ảnh, nơi mà điểm ảnh liền
kề có màu sắc tương tự.
Một ưu điểm của JPEG là việc sử dụng nhiều thông số, cho phép người dùng điều chỉnh
Số lượng dữ liệu bị mất (và do đó cũng là tỉ lệ nén) trong một phạm vi rất rộng.
Thông thường, mắt không nhìn thấy bất kỳ sự suy thoái hình ảnh ngay cả ở tỷ lệ nén là
10:01 hoặc 20:01. Có hai phương thức chính: mất dữ liệu (còn gọi là đường cơ sở) và
lossless (mà tỷ lệ nén thông thường sản xuất khoảng 0,5). Hầu hết việc triển khai hỗ trợ
chỉ cần các chế độ mất dữ liệu. Hình thức này bao gồm tiến bộ và phân cấp mã hóa. Một
vài của nhiều tài liệu tham khảo JPEG là [Pennebaker và Mitchell 92], [Wallace 91], và
[Zhang 90].
JPEG là một phương pháp nén, không phải là một tiêu chuẩn hoàn chỉnh cho đại diện
hình ảnh.Đây là lý do tại sao nó không xác định các tính năng hình ảnh như là tỉ lệ điểm
ảnh, không gian màu sắc, hoặc đan xen của các hàng bitmap.
JPEG được thiết kế như là một phương pháp nén hình ảnh liên tục âm. Các
mục tiêu chính của JPEG nén như sau:
1. Tỷ lệ nén cao, đặc biệt là trong trường hợp chất lượng hình ảnh được đánh giá là rất
tốt để xuất sắc.
2. Việc sử dụng nhiều thông số, cho phép người dùng tinh vi để thử nghiệm và đạt được
nén mong muốn / chất lượng cân bằng.
3. Lấy kết quả tốt với bất kỳ loại hình âm liên tục, bất kể hình ảnh
kích thước, màu sắc không gian, tỉ lệ điểm ảnh, hoặc các tính năng hình ảnh khác.
4. A, tinh vi nhưng không quá phức tạp phương pháp nén, cho phép phần mềm và
phần cứng triển khai trên nhiều nền tảng.
5. Một số phương thức hoạt động: (a) Hình thức tuần tự: mỗi thành phần hình ảnh (màu)
được nén trong một trái sang phải duy nhất, từ trên xuống dưới quét, phương thức tiến bộ
(b): các hình ảnh được nén trong nhiều khối (được gọi là "quét") để được xem từ thô đến
phạt tiền cụ thể, (c) Lossless thức: quan trọng đối với trường hợp người sử dụng quyết
định rằng không có điểm ảnh nên bị mất (cân bằng được tỷ số nén thấp so với các chế độ
mất dữ liệu); và (d) chế độ phân cấp: hình ảnh được nén ở nhiều nghị quyết cho phép
độ phân giải thấp hơn các khối để được xem mà không cần phải giải nén sau
độ phân giải cao hơn các khối.

JPEG là chữ viết tắt cho Joint Photographic Experts Group.Đây là một nỗ lực chung của
CCITT và ISO (hiệp hội các tiêu chuẩn quốc tế) mà bắt đầu vào tháng Sáu năm 1987 và
sản xuất đề nghị dự thảo đầu tiên trong JPEG.Năm 1991,các tiêu chuẩn JPEG đã chứng
tỏ thành công và đã trở thành sử dụng rộng rãi cho hình ảnhnén, đặc biệt là trong các
trang web.
Các bước JPEG nén chính được trình bày dưới đây, và mỗi bước sau đó described cụ thể sau.
1. Hình ảnh màu được chuyển đổi từ RGB vào độ sáng một / không gian màu sắc độ
(mục 4.8.1; bước này được bỏ qua cho hình ảnh màu xám). Mắt là nhạy cảm với nhỏ
thay đổi về độ sáng nhưng không phải trong sắc độ, do đó phần sắc độ sau này có thể mất
nhiều dữ liệu, và do đó có độ nén cao, mà không làm suy yếu thị giác hình ảnh tổng thể
chất lượng nhiều. Bước này là tùy chọn, nhưng quan trọng kể từ khi phần còn lại của
thuật toán hoạt động trên mỗi thành phần màu riêng biệt.Nếu không có biến đổi không
gian màu, không có các thành phần màu ba sẽ chịu mất mát nhiều, dẫn đến nén tồi tệ hơn.
2. Hình ảnh màu được downsampled bằng cách tạo ra độ phân giải thấp điểm ảnh từ
những người ban đầu (bước này chỉ được sử dụng khi nén phân cấp là cần thiết, nó luôn
luôn bỏ qua cho hình ảnh màu xám). Downsampling không phải là làm cho thành phần
độ sáng.Downsampling được thực hiện hoặc tại một tỷ lệ 2:1 cả hai chiều ngang và theo
chiều dọc (những cáigọi là 2h2v hoặc "04:01:01" lấy mẫu) hoặc tại các tỷ lệ 2:1 theo
chiều ngang và chiều dọc 01:01 (2h1v hoặc "04:02:02" lấy mẫu). Từ này được thực hiện
trên hai thành phần màu ba, 2h2v làm giảm hình ảnh đến 1 / 3 + (03/02) × (04/01) = 1 / 2
kích thước ban đầu của nó, trong khi 2h1v làm giảm nó đến 1 / 3 + (03/02) × (1 / 2) = 2 /
3 kích thước ban đầu của nó. Kể từ khi thành phần độ sáng không phải là xúc động,
không có thiệt hại đáng kể chất lượng hình ảnh. Grayscale hình ảnh không đi qua
bước này.
3. Các điểm ảnh của mỗi thành phần màu sắc được tổ chức trong các nhóm của 8 × 8
điểm ảnh được gọi là các đơn vị dữ liệu và mỗi đơn vị dữ liệu được nén riêng biệt. Nếu
số hàng hình ảnh hoặc cột không phải là một bội số của 8, hàng phía dưới và cột cuối
cùng bên phải được nhân đôi nhiều lần khi cần thiết. Trong chế độ noninterleaved, mã
hóa các xử lý tất cả các dữ liệu các đơn vị của thành phần hình ảnh đầu tiên, sau đó các
đơn vị dữ liệu của thành phần thứ hai, và cuối cùng những người của thành phần thứ ba.
Trong chế độ chèn mã hóa các quá trình ba trên bên trái (# 1) dữ liệu các đơn vị thuộc các
thành phần hình ảnh ba, sau đó ba dữ liệu đơn vị số 2, và như vậy. Thực tế là mỗi đơn vị
dữ liệu được nén riêng là một trong các nhược điểm của JPEG. Nếu người dùng yêu cầu
nén tối đa, giải nén triển lãm hình ảnh có thể ngăn chặn hiện vật do sự khác biệt giữa các
khối. Hình 4,59 là một ví dụ cực của hiệu ứng này.
4. Các biến đổi cosin rời rạc (DCT, mục 4.6) sau đó được áp dụng cho mỗi đơn vị dữ liệu
để tạo ra một bản đồ 8 × 8 của thành phần tần số (mục 4.8.2). Họ đại diện cho giá trị
trung bình pixel và cao hơn tần số thay đổi kế tiếp trong nhóm. Điều này chuẩn bị các dữ
liệu hình ảnh cho các bước quan trọng của việc mất thông tin. Từ DCT liên quan đến
các cô sin chức năng siêu việt, nó phải liên quan đến một số mất thông tin do giới hạn độ
chính xác của số học máy tính. Điều này có nghĩa là ngay cả khi không mất dữ liệu chính
bước (bước 5 dưới đây), sẽ có một số làm giảm chất lượng hình ảnh, nhưng nó thường
nhỏ.
5. Mỗi thành phần tần số 64 trong một đơn vị dữ liệu được chia cho một số riêng biệt
gọi là lượng tử hóa của nó hệ số (QC), và sau đó được làm tròn đến một số nguyên (mục

làm chậm lại chế độ tiến bộ. và hình ảnh không nén. cao hơn tần số DCTcoefficients được viết trên các dòng nén trong khối được gọi là Mỗi quét đọc và xử lý kết quả giải mã trong một hình ảnh sắc nét hơn "quét.4.63c. và từng được chuyển đổi bằng cách DCT. bằng cách sử dụng cùng một bảng. QCs lớn gây thiệt hại nhiều hơn. về nguyên tắc. d). mỗi tiếp quét bao gồm AC liên tiếp (một ban nhạc của) một số hệ số. Các file nén có thể là một trong ba định dạng (1) các định dạng trao đổi.63b là một khối có độ sâu tương ứng với 8. lựa chọn phổ hoặc xấp xỉ liên tục (Hình 4. Các chế độ tiến bộ là một lựa chọn JPEG.64). Tuy nhiên. và họ đã cùng xây dựng các bảng in Định dạng thứ ba được sử dụng trong trường hợp nhiều hình ảnh đã được nén bởi một bộ mã hóa tương tự. Bước cuối cùng thêm vào tiêu đề và tất cả các thông số JPEG được sử dụng.8. và có chiều rộng tương ứng với tám bit của từng hệ số.63a cho thấy một ví dụ của một hình ảnh với độ phân giải 1024 × 512. Trong chế độ thứ bậc. (Vì vậy. đánh số 0). tổng số lượng thông tin ít hơn cần thiết để lưu trữ các nghị quyết khác nhau một cách riêng biệt. mỗi phần độ phân giải cao sử dụng thông tin từ các bộ phận độ phân giải thấp của các dòng đầu ra.8. trở thành một tập hợp của 64 con số 8-bit. Một số học biến thể mã hóa được gọi là coder quản lý chất lượng (mục 2. Nếu quang phổ lựa chọn được sử dụng. (2) các định dạng viết tắt cho các dữ liệu hình ảnh nén. Mỗi trong số 64 QCs là một tham số JPEG-eter và có thể. Các tần số 64 hệ số lượng (mà hiện nay số nguyên) của mỗi đơn vị dữ liệu mã hóa bằng cách sử dụng một sự kết hợp của RLE và mã hóa Huffman (mục 4. hầu hết implemen-JPEG tations sử dụng các bảng QC khuyến cáo của tiêu chuẩn JPEG cho độ sáng và sắc độ hình ảnh các thành phần (Bảng 4. Sự cân bằng là bộ mã hóa đã lưu tất cả các hệ số của tất cả các đơn vị dữ liệu trong một bộ nhớ đệm trước khi chúng được gửi đi trong quét. 7. cho biết thêm một chút nhiều hơn đáng kể (bit 3 đến 0. quét thứ hai bao gồm bốn bit quan trọng nhất của tất cả các hệ số AC. mà chỉ tập tin có chứa các bảng. Hình 4. Sau khi chuẩn bị tất cả các đơn vị dữ liệu trong một bộ nhớ đệm. Định dạng thứ hai có ý nghĩa trong trường hợp cùng một bộ mã hóa / giải mã được sử dụng cặp. Mỗi phần có thứ bậc có thể sử dụng chế độ tiến bộ.192 đơn vị dữ liệu.16) tùy chọn có thể được sử dụng thay vì Huffman mã hóa. Ý tưởng này là sử dụng quét đầu tiên để nhanh chóng tạo ra một chất lượng thấp. Các bộ giải mã định dạng JPEG thực hiện các bước ngược lại. Các lần quét đầu tiên trong phương thức hoặc là tập hợp các hệ số DC.". 6. Trong chế độ này. có chiều cao tương ứng với 64 hệ số DCT (hệ số DC là một trong những đầu trang. bộ mã hóa các ghi chúng vào nén luồng theo một trong hai phương pháp.3). và cũng có thể đi qua tất cả các bước cho mỗi quét. số 3 đến 6. Hình 4. tại một số nghị quyết. các cửa hàng mã hóa hình ảnh nhiều lần ở đầu ra dòng. mờ xem trước của hình ảnh. do đó. nơi mà tập tin có chứa các hình ảnh nén và có thể chứa không có bảng (hoặc chỉ là một vài bàn). và kết quả đầu ra của kết quả. chúng được gửi đến một bộ giải mã trước bởi một tập tin với dữ liệu đặc tả bàn. và mỗi trong số bốn quét sau đây. hoặc đầu vào quét còn lại hoặc ngăn chặn quá trình và loại bỏ các hình ảnh. Nếu xấp xỉ liên tục được sử dụng. sau đó. JPEG là một năm đối xứng pression phương pháp). nên caothành phần tần số thường có QCs lớn hơn. trong đó tập tin có chứa các hình ảnh nén và tất cả các bảng cần thiết cho bộ giải mã (chủ yếu là bảng lượng tử và các bảng mã Huffman). và (3) các định dạng viết tắt cho bàn đặc tả dữ liệu. Hình ảnh là chia thành 128 × 64 đơn vị dữ liệu = 8192.Đây là nơi thông tin được vĩnh viễn các file bị mất.4). Trong thực tế. . Khi những hình ảnh cần phải được giải nén. được chỉ định bởi người sử dụng. tương ứng).

nm. do đó hạn không gian màu. có bước sóng trong vùng từ 400 nm đến 700 nm. JPEG 2000 và MPEG. nơi ba tham số là cường độ của màu đỏ. Vật lý năng lượng (hoặc ánh sáng) được thể hiện trong một phân phối điện quang phổ (SPD). Khi một quang phổ điện phân phối được tích hợp bằng cách sử dụng chức năng này như là một hàm trọng số. thường trong 31 thành phần từng đại diện cho một 10 nm ban nhạc. Điều này cho thấy không ít hơn ba tham số được yêu cầu để xác định màu sắc. Của não nhận thức về độ sáng là không thể xác định. xanh lá cây. Huffman hoặc số học viết mã) được sử dụng bởi bước 5 ở trên. Một cách đơn giản để làm này là để trừ Y từ các thành phần màu xanh và đỏ của RGB.Các chế độ phân cấp là hữu ích trong trường hợp một hình ảnh độ phân giải cao cần được sản xuất trong độ phân giải thấp. bằng 10-9 m). CIE các định nghĩa một số lượng thực tế hơn gọi là luminance. Những dãy YCbCr đượcthích hợp cho video kỹ thuật số thành phần như video studio. .8.Mắt rất nhạy cảm với những thay đổi nhỏ về độ sáng. và sử dụng ba thành phần Y.5) tính toán một "dự đoán" giá trị cho mỗi pixel. Những phần sau thảo luận các bước cụ thể hơn: Các tổ chức quốc tế dành cho ánh sáng và màu sắc là Com-Quốc tế mittee về chiếu sáng (Ủy ban Internationale de l''Eclairage). z) tương tự như biểu thị một điểm trong không gian ba chiều không gian. CIE định nghĩa độ sáng như các thuộc tính của một cảm giác trực quan.Y cho các ứng dụng khác nhau. và R-Y như là một không gian màu sắc mới. đó là lý do tại sao nó rất hữu ích để có không gian màu sử dụng Y là một trong ba thông số của họ. tạo ra sự khác biệt giữa các điểm ảnh và giá trị dự đoán của nó (xem Phần 1. B-Y. các Kết quả là CIE độ sáng.1 để mã hóa tương đối). trong đó có một tối đa khoảng 555 nm. Các không gian màu phổ biến nhất là RGB. các thông số này thường nằm trong khoảng 0-255 (8 bit). Hai thành phần cuối cùng được gọi là sắc độ. nhưng những thành phần quang phổ của độ sáng có liên quan đến độ nhạy sáng của tầm nhìn của con người.Nó được định nghĩa là năng lượng bức xạ được đo theo một chức năng nhạy cảm đó là đặc trưng quang phổ của tầm nhìn. được phát triển vào năm 1931. Khi sử dụng máy vi tính. viết tắt CIE. Hiệu quả phát sáng của Observer chuẩn được định nghĩa bằng CIE như là một tích cực chức năng của các bước sóng. Một trong những đầu những thành tựu của CIE là biểu đồ của nó Sắc [Salomon 99]. được ký hiệu là Y. Giá trị dự đoán được tính bằng cách sử dụng giá trị của điểm ảnh ở trên và bên trái của điểm ảnh hiện tại (điểm ảnh đó đã được đầu vào và mã hóa). Nó tương tự như cường độ. do đó. Thể hiện một một số màu sắc của bộ ba người (x. Những dãy YPbPr được tối ưu hóa cho video tương tự thành phần. Họ đại diện cho màu sắc về sự có mặt hay vắng mặt của màu xanh (CB) và màu đỏ (Cr) đối với một cường độ sáng nhất định. theo đó một khu vực xuất hiện để phát ra nhiều hơn hoặc ít ánh sáng. và mã hóa sự khác biệt bằng cách sử dụng phương pháp tương tự (ví dụ. JPEG.Số phạm vi khác nhau được sử dụng trong B – Y và R . y.3. Các chế độ nén thông minh của JPEG (mục 4. sự cố khi võng mạc (một nanomet. Nó chịu trách nhiệm phát triển tiêu chuẩn và định nghĩa trong lĩnh vực này. và màu xanh trong màu. chói là một số lượng quan trọng trong các lĩnh vực xử lý hình ảnh kỹ thuật số và nén Độ sáng tỷ lệ thuận với sức mạnh của nguồn sáng. Cu hơn máy in kim có thể là một ví dụ tốt về một độ phân giải thấp thiết bị đầu ra vẫn còn sử dụng. CIE định nghĩa màu sắc như là kết quả nhận thức của ánh sáng trong khu vực nhìn thấy được của quang phổ.

601 (trước đây là CCIR 601) trong quá trình phát triển của một thành phần của video trên toàn thế giới kỹ thuật số tiêu chuẩn. Nếu các điểm ảnh của hình ảnh là tương quan.8. và bởi vì có cách để tăng tốc độ nó lên (mục 4. với giá trị có thể thường xuyên trong 0-15 và 236-255. Áp dụng DCT cho các đơn vị dữ liệu làm giảm nén tổng thể tỷ lệ nhưng nhanh hơn. Khi thực hiện YCbCr để RGB chuyển đổi.15). thực hiện bởi phương trình (4. Có một số định dạng YCbCr lấy mẫu. Cả hai có những ứng dụng trong nhiều lĩnh vực và cũng có phiên bản rời rạc (DFT và DWT).Chuyển đổi giữa RGB với một phạm vi 16-235 và YCbCr là tuyến tính và do đó đơn giản. Các ví dụ khác của biến đổi quan trọng là các biến đổi Fourier (mục 5.Không gian màu YCbCr được phát triển như là một phần của Khuyến nghị ITU-R BT. bởi vì nó không giả định bất cứ điều gì về cấu trúc của dữ liệu (các DFT. cho Ví dụ. (2) Kinh nghiệm cho thấy rằng. nhân đôi ở đây cho n = 8 . Các thông tin hình ảnh không quan trọng được giảm hoặc loại bỏ bởi lượng tử của 64 hệ số DCT.16). Các tiêu chuẩn JPEG kêu gọi áp dụng các DCT không toàn bộ hình ảnh nhưng với dữ liệu đơn vị (khối) của 8 × 8 điểm ảnh. Những lý do cho điều này là (1) Áp dụng cho tất cả các điểm ảnh DCT n n ×của một hình ảnh sản xuất nén tốt hơn mà còn liên quan đến nhiều phép tính số học và do đó làm chậm. giả định rằng các dữ liệu được chuyển đổi được định kỳ).6. Các cosin rời rạc xuyên là hình thức thảo luận chi tiết hơn trong phần 4. Đối với kết quả tốt nhất. B=Y+1.3). Các bộ giải mã hoạt động bằng cách tính toán JPEG DCT ngược (IDCT).732(Cb − 128). 4:2:2. Một điểm ảnh trong hình ảnh như vậy có giá trị (phần màu hoặc màu xám) đó là gần với những người hàng xóm gần của nó. như 04:04:04. Chuyển đổi RGB đến YCbCr được thực hiện bằng (lưu ý trọng lượng nhỏ được giao màu xanh): Y = (77/256)R + (150/256)G + (29/256)B. Các DCT JPEG là như vậy. về nguyên tắc.1) và biến đổi wavelet (Chương 5). và 04:02:00. lượng tử hóa không làm suy giảm chất lượng hình ảnh nhiều. với 128 bằng số không. Các khái niệm chung của một biến được thảo luận trong Phần 4. nhưng không có gì để làm với các giá trị của hàng xóm đến nay. phương trình (4. nhân đôi ở đây n=8 DCT của JPEG là chìa khóa để nén mất dữ liệu. 4:1:1. bởi người sử dụng (mục 4. Y được định nghĩa để có một loạt các 16-235. các kết quả có giá trị RGB nhiều danh nghĩa 16-235. mỗi trong số 64 hệ số là lượng tử bằng cách chia nó bằng một hệ số lượng tử khác nhau (QC).371(Cr − 128). Các ủy ban bầu JPEG sử dụng DCT vì hiệu suất tốt của nó. G=Y − 0. trong khi việc chuyển đổi ngược lại là R=Y+1.336(Cb − 128). tương quan giữa các điểm ảnh được tầm ngắn.5). cũng còn được mô tả trong khuyến nghị. trong một hình ảnh có tông màu liên tục. Tất cả 64 QCs được các thông số có thể được kiểm soát.698(Cr − 128) − 0. CB và Cr được xác định để có một phạm vi từ 16 đến 240.6.4. Cr = (131/256)R − (110/256)G − (21/256)B + 128. Cb = −(44/256)R − (87/256)G + (131/256)B + 128. đặc biệt là những người nằm về phía bên phải thấp hơn.

và kết quả là làm tròn đến số nguyên gần nhất. IDCT là ánh xạ ngược lại. Một lượng tử đơn giản bảng Q được tính toán. Bản 64 số mỗi bảng tạo thành lượng tử là tất cả JPEG thông số.64. Về mặt toán học. vài người dùng có sự kiên nhẫn và chuyên môn để thử nghiệm với rất nhiều thông số.65 cho thấy một ví dụ của bảng như một với R = 2. 4. dựa trên một tham số R được xác định bởi người sử dụng. vì vậy JPEG thông thường sử dụng phần mềm sau đây hai phương pháp: 1. Nếu DCT và IDCT có thể được tính toán với độ chính xác vô hạn và nếu các hệ số DCT không được lượng tử. Nếu lượng hóa được thực hiện một cách chính xác. Mỗi số trong các hệ số DCT ma trận được chia cho số tương ứng từ những "bàn lượng tử hóa" đặc biệt sử dụng. Về nguyên tắc. Mặc định lượng hóa các bảng. DCT là một ánh xạ một-một trong những vectơ 64-điểm từ các miền hình ảnh đến miền tần số. Các tiêu chuẩn JPEG cho phép tối đa bốn bảng. Một biểu hiện đơn giản như Qij = 1 + (i + j) × R đảm bảo rằng QCs bắt đầu nhỏ ở góc trên bên trái và nhận được lớn hơn về phía góc dưới bên phải.3 Quantization Sau mỗi ma trận 8 × 8 / DCT Gij hệ số được tính toán. là kết quả của nhiều thí nghiệm được thực hiện bởi JPEG ủy ban.8. Những con số này là đầu ra của JPEG. Bảng 4. Đây là bước hợp mất thông tin (trừ một số thiệt hại không thể tránh khỏi vì hữu hạn tính toán chính xác trong các bước khác) xảy ra. và họ thường sẽ được tập trung ở vùng trên bên trái. cho các thành phần màu ba. trên 64 điểm mới sẽ rất giống với những bản gốc. Hai như bảng biểu. 2.Nó có 64 hệ số DCT lượng và tính toán 64 điểm pxy. 64 điểm ảnh ban đầu sẽ được tái tạo chính xác. ba bàn như vậy là cần thiết. số khác không rất ít sẽ còn lại trong DCT hệ số ma trận. đó là lượng tử. và người dùng có thể chọn bất kỳ của bốn đối với lượng tử mỗi thành phần màu sắc. Đây là cách làm giảm JPEG DCT hệ số với tần số cao không gian. nhưng họ lại được nén trước khi được bằng văn bản về các dòng đầu ra. tất cả đều có thể được quy định và điều chỉnh tốt bởi người sử dụng để nén tối đa. cho độ sáng (màu xám) và các thành phần sắc độ. Nếu QCs là những người bên phải. Trong thực tế. Trong văn học JPEG nén này được gọi là "entropy . Như đã được đề cập. Họ được bao gồm trong tiêu chuẩn JPEG và được sao chép ở đây như Bảng 4. Nó rất dễ dàng để xem cách các QCs trong bảng thường tăng lên khi chúng tôi di chuyển từ góc trên bên trái với một góc dưới bên phải.

sau đó ghi vào một mảng zz cơ cấu.coding "và mục 4. Điều này tạo ra một chuỗi số 64 số bắt đầu với một số nonzeros và thường kết thúc bằng nhiều số không liên tiếp. nơi mà mỗi cơ cấu có một cặp tọa độ cho các con đường như được hiển thị.66. ví dụ. Bằng cách này không cần để ra các số không theo sau (chúng tôi có thể nói rằng EOB là mã hóa chiều dài chạy của tất cả các dấu số không).65: Bảng lượng tử hóa 1 + (i + j) × 2.8. Đầu tiên tìm ra con đường ngoằn ngoèo bằng tay. Người đọc quan tâm cũng nên tham khảo mục 8. Ba kỹ thuật được sử dụng bởi mã hóa dữ liệu ngẫu nhiên để nén 8 × 8 ma trận các số nguyên: 336 4. Có một cách thực tế đơn giản để viết một vòng lặp đi qua một 8 × 8 ma trận trong ngoằn ngoèo.8b).5 cho khác phương pháp để nén các chuỗi nhị phân với nhiều số không liên tiếp. Chỉ có những con số khác không có đầu ra (sau khi thêm nén chúng) và được theo sau bởi một kết thúc đặc biệt-code (EOB) của khối.4 cho thấy chi tiết làm thế nào nó được thực hiện. 1. . trong hình 4. Hình ảnh nén (A) Bảng 4. 64 số được thu thập bằng cách quét ma trận trong zigzags (hình 1.

dữ liệu bên cạnh các đơn vị các điểm ảnh được bình thường tương quan với ý nghĩa là giá trị trung bình của các điểm ảnh trong dữ liệu bên cạnh các đơn vị được đóng. 1114. phía trên góc trái] và 63 hệ số AC. 0). trong đó cô tìm thấy được gì. i <64) { hàng: = zz [i] r. sau đó sản lượng JPEG cho các đơn vị dữ liệu đầu tiên là 1118 (Huffman . Ví dụ: Nếu trong ba đầu tiên 8 × 8 dữ liệu các đơn vị của một hình ảnh có hệ số lượng DC của 1118. tiếp theo là sự khác biệt (cũng được mã hóa) của các hệ số DC liên tiếp dữ liệu các đơn vị. và đã được đi lặn ở giữa các lá..4 Coding Chúng tôi đầu tiên thảo luận về điểm 3 trên đây. Điều này có nghĩa rằng DC hệ số của dữ liệu bên cạnh các đơn vị không khác nhau nhiều.4). -Lewis Carroll.3.8.JPEG 4. Kinh nghiệm cho thấy rằng trong một hình ảnh có tông màu liên tục.8. trang 279) là đối xử khác biệt từ những người khác (các hệ số AC).r và zz..c. 3. . Các con số khác không được nén bằng cách sử dụng mã hóa Huffman (mục 4. Data_unit [hàng] [col ]. Alice in Wonderland 4. khi một tiếng rít sắc nét vẽ làm cho cô trở lại trong một khẩn trương. nhưng ngọn của cây theo đó cô đã lang thang. tạo thành các đơn vị dữ liệu. i + +. Mỗi ma trận 8 × 8 / hệ số DCT lượng chứa một hệ số DC [ở vị trí (0. col:. = zz [i] c. và 1119..Chúng tôi đã biết rằng các hệ số DC của một đơn vị dữ liệu là bội số của mức bình quân của 64 điểm tạo thành các đơn vị. Việc đầu tiên của những con số (các DC hệ số.1.8 337 Nếu hai thành phần của một cấu trúc được zz..} 2. Các DC hệ số là một thước đo giá trị trung bình của 64 điểm ban đầu. Cô đã chỉ thành công trong việc uốn cong nó xuống thành một chữ chi duyên dáng. sau đó các zig-zag traversal có thể được thực hiện bởi một vòng lặp dạng: for (i = 0. JPEG kết quả đầu tiên (Mã hóa). Khái niệm về Differencing được thảo luận tại mục 1.

15 11110 5: -31 -30 -29.67. . một lần nữa theo sau 63 (mã hóa) AC hệ số của đơn vị dữ liệu. do đó. . Nó nằm trong một hàng 11 cột 930 của bảng (cột đánh số bắt đầu từ số không). kể từ khi chương trình có thể tìm ra nơi trong bảng cho bất kỳ số nguyên x là vụ phải cư trú bằng cách phân tích các bit của x. C)] được sử dụng làm hàng và số cột cho bảng 4. do đó. và đầu ra cho thứ ba đơn vị dữ liệu sẽ được 1119 . và với một số không chạy dài theo sau. Cách xử lý các hệ số DC là giá trị các rắc rối thêm. Z). . (3) cặp (R.67. không (R. vì vậy nó được mã hoá như 338 4. . có nghĩa là một đơn giản mảng hai chiều không phải là một cấu trúc dữ liệu tốt cho các bảng này. (2) tìm thấy x trong bảng 4. .(2i-1-1). -17 -16 16 17.1118 = -4 (cũng Huffman mã hóa). nó được mã hoá như 1110 | 101. Mỗi hàng có một số hàng (bên trái). . và (4) các mã Huffman được tìm thấy ở đó vị trí trong bảng được nối với C (nơi C được viết như là một số R-bit) và kết quả là (cuối cùng) mã phát ra từ JPEG Bộ mã hóa cho AC các hệ số x và tất cả các số không liên tiếp trước đó.Mỗi hàng có chứa số lượng lớn (Và cũng có nhiều số) hơn so với người tiền nhiệm của nó nhưng không phải là con số có trong trước hàng. Đối với mỗi số khác không x. DC đầu tiên hệ số được mã hóa trong ví dụ của chúng tôi là 1118. . . -9 -8 8 9 10. Trong thực tế.I có hàng dãy các số nguyên [. Hình ảnh nén 111111111110 | 01110100010 (mã đơn nguyên cho hàng 11. . . Nó sử dụng một sự kết hợp của RLE và số học hoặc Huffman hoặc mã hóa. Nó nằm ở cột 3 dòng 3 của Bảng 4. đầu tiên ở đây là một vài từ về bảng này. do đó. Các đầu ra cho các đơn vị dữ liệu thứ hai sẽ được 1114 .67 và chuẩn bị hàng và số cột (R và C). mã đơn nguyên cho hàng (bên phải). 5. . 63 1111110 . + (2i-1)] nhưng còn thiếu giữa nhiều [.(2i-1). nó được mã hoá như 1110 | 011 (mã đơn nguyên cho hàng 3. không có cần lưu trữ các số nguyên trong một cấu trúc dữ liệu. -33 -32 32 33. tiếp theo là 63 hệ số AC (mã hóa) của đơn vị dữ liệu.mã hóa. Ý tưởng là chuỗi các hệ số AC thông thường chỉ chứa một vài giá trị khác không số. Mã hóa sự khác biệt DC được thực hiện bằng cách sử dụng Bảng 4. vì những khác biệt nhỏ. và một số cột ở giữa. tiếp theo là giá trị nhị phân 3-bit của 3). Các DC thứ ba khác biệt. 0: 0 0 1: -1 1 10 2: -3 -2 2 3 110 3: -7 -6 -5 -4 4 5 6 7 1110 4: -15 -14.1114 = 5 (cũng Huffman mã hóa). Z) [đó là (R. bộ mã hóa (1) tìm số Z số không liên tiếp trước đó x. Các DC thứ hai khác biệt là -4.70. . nằm ở cột 3 dòng 5. với chạy của số không giữa chúng. + (2i-1-1)]. 31 111110 6: -63 -62 -61.Các hàng do đó nhận được rất dài. tiếp theo là 11-bit nhị phân giá trị 930). xem dưới đây) tiếp theo là 63 hệ số AC (mã hóa) của đơn vị dữ liệu. Điểm 2 trên đây đã làm với các cách chính xác các hệ số AC 63 của một đơn vị dữ liệu được nén.

. -16385 -16384 16384 16385. do đó._.. Tiêu chuẩn này đề nghị sử dụng bảng 4.70 thực tế là như vậy.. Z) = (2.768 1111111111111111 Bảng 4.68 và 4. Các mã Huffman trong Bảng 4. Các AC đầu tiên hệ số 2 không có số không trước nó. -8193 -8192 8192 8193. Nó được tìm thấy trong bảng 4. 0. và mã ZRL tại vị trí (0. 0.. do đó. . ngoại trừ các cơ sở chế độ có thể sử dụng chỉ có hai bàn như vậy. ._. . 16383 111111111111110 15: -32767 -32766 -32765. Các mã số này những người được đề nghị cho các hệ số AC độ sáng của bảng 4.. 0_ 13 .. . 2. _0.68. Mã Huffman ở vị trí (R. -1. tùy ý. . tương ứng. cột 2. Các EOB và ZRL mã số khuyến cáo cho các hệ số AC sắc độ của bảng là 00 và 4. và sau này là mã được phát ra trong 15 số không liên tiếp khi số lượng số không vượt quá 15 liên tiếp. .69 và nói rằng lên đến bốn bảng mã Huffman có thể được sử dụng bởi một codec JPEG. Người đọc cần phải thông báo mã EOB tại vị trí (0. -65 -64 64 65.69 1111111010.7: -127 -126 -125. .67 ở hàng 2. 32767 1111111111111110 16: 32. .. Các mã trong bảng 4. trước đây chỉ ra cuối cùng của khối. .. 15). 0) JPEG 4. R = 2 và C = 2. . 0). 14: -16383 -16382 -16381. .70 không phải là những khuyến cáo của JPEG tiêu chuẩn.67: Mã hóa sự khác nhau của hệ sốhư một ví dụ xem xét trình tự 1118. . -2. . 127 11111110 . .

68: Mã Huffman khuyến nghị cho hệ số chóiộtảng 4. 340 4. Hình ảnh nén R Z12345 6789A 0 01 100 1010 11000 11001 111000 1111000 111110100 1111110110 111111110100 1 1011 111001 11110110 111110101 11111110110 .

ột

. do đó. Tiếp theo dữ liệu mã số đơn vị khác biệt của DC hệ số của họ. 1111111111110110 3: 100 1111001. Các hệ số tự được tìm thấy trong Bảng 4. 15 0: 1010 11111111001 (ZRL) 1: 00 1100. 13) của Bảng 4. . Những 46 bit mã hóa một thành phần màu sắc của 64 điểm ảnh của một đơn vị dữ liệu. . mã cuối cùng được phát ra cho 1 là 1.) Cùng bảng (Bảng 4. Họ có thể tính năng nén cao hơn rất nhiều yếu tố như vậy. do đó. được sử dụng bởi bộ giải mã. . 1111111111110101 2: 01 11011.Các tiêu chuẩn JPEG không chỉ định bất kỳ các bảng mã.67 và 4. Nó được tìm thấy trong bảng 4.67 ở hàng 2. cột 0. nên R = 1 và C = 0. Z = 13.110.Nếu mỗi người pixel ban đầu bao gồm 24 bit. trình tự các số không dấu được mã hoá như năm 1010 (EOB). Có một số không trước nó.70 là 01. . Các hệ số khác không tiếp theo. Các AC khác không qua hệ số là -1. Các bảng có thể được xác định trước và được sử dụng bởi một codec JPEG như mặc định.70) được sử dụng bởi bộ mã hóa nên. 1111111111110111 4: 1011 111110110.70 là 11.69: Mã Huffman khuyến nghị cho hệ số sắc độ AC.70 là 1.101.67 trong hàng 1. rất ấn tượng! (Chú ý rằng hệ số DC 1118 đã đóng góp 23 trong số 46 bit. kết quả cuối cùng cho toàn bộ đơn vị dữ liệu 64-pixel là số 46-bit 1111111111100111010001001101101110111010101010. tất nhiên. Mã Huffman ở vị trí (R. vì vậy mã cuối cùng được phát ra cho 2 là 01 | 10. mà có thể mất ít hơn 10 bit thay vì 23. R Z: 0 1. Z = 1. . . do đó. . vì vậy mã cuối cùng được phát ra cho 2 là 11011 | 01. 1) của Bảng 4. Giả sử rằng mã Huffman ở vị trí (R. JPEG 4.1111111111110001 1111111111110010 1111111111110011 1111111111110100 1111111111110101 F 111111111000011 111111111010110 1111111111110111 1111111111111000 1111111111111001 1111111111111010 1111111111111011 1111111111111100 1111111111111101 1111111111111110 Bảng 4. -2. Cuối cùng.8 341 của Bảng 4. cột 1. Chúng tôi đã nhìn thấy trước đó hệ số DC được mã hoá như 111111111110 | 1110100010. .13. sau đó điều này tương ứng với một hệ số nén 64 × 24 / (46 × 3) ≈ 11. Z) = (1. do đó. .101 | 0. do đó. hoặc họ có thể được tính toán cụ thể cho một hình ảnh được đưa ra trong một truyền đặc biệt trước nén thực tế. Z) = (2. 1111111111111000 . R = 2 và C = 1.011. Mười ba liên tiếp số không trước này hệ số. do đó bất kỳ codec JPEG phải sử dụng riêng của mình. đầu ra cho trình tự nêu trên của hệ số AC là 01101101110111010101010.110. Giả sử là hai thành phần màu sắc khác cũng được mã hóa thành số 46-bit.

70. và C. 7 là "hai chiều.16). .8.8.5 Chế độ Lossless Các chế độ nén thông minh của JPEG sử dụng Differencing (mục 1. 2. Nó điều chỉnh hành vi của mình cho thống kê hình ảnh như nó đi cùng. Hình 4. nó là nhiều hơn phức tạp để thực hiện hơn Huffman mã hóa..1 dự đoán.Tuy nhiên. Hình ảnh nén 4. mà sau đó được nén hơn nữa bằng cách sử dụng mã hóa Huffman hoặc số học.71a cho thấy một X pixel và ba điểm ảnh hàng xóm A.3. vì vậy trong thực tế nó là rất hiếm để tìm thấy một JPEG codec mà sử dụng nó. 5. Dự đoán 0 là chỉ được sử dụng ở chế độ phân cấp của JPEG. 6. nó không cần bảng 4. được gọi là quản lý chất lượng coder (mục 2. Đây là phiên bản của số học mã hóa là thích ứng. người sử dụng có thể chọn một trong các dự đoán. Kết quả là bình thường một số lượng nhỏ.4. 342 4. Sử dụng số học mã hóa có thể sản xuất tốt hơn 5-10% nén hơn Huffman cho một hình ảnh điển hình liên tục âm..1) để làm giảm giá trị của điểm ảnh trước khi chúng được nén." . B. đó là quy định trong tiêu chuẩn JPEG. 1111111111111001 . sau đó mã hóa dữ liệu ngẫu nhiên trong một cách rất tương tự như mô tả cho các DC hệ số tại mục 4. và sau đó sử dụng bộ mã hóa nó kết hợp các điểm ảnh hàng xóm ba và trừ sự kết hợp từ giá trị của X. Các giá trị của một số nước láng giềng gần các điểm ảnh một bị trừ từ điểm ảnh để có được một số lượng nhỏ. . .. Một số biến thể JPEG sử dụng một phiên bản đặc biệt của mã số học. và 3 được gọi là "một chiều.67 và 4. Bảng 4.70: Hệ số mã AC. do đó.71b cho thấy tám có thể cách (dự đoán) để kết hợp các giá trị của ba nước láng giềng. Hình 4.5: 11010 11111110110. Hình thức này đặc biệt được gọi là dự đoán Differencing. Trong chế độ nén thông minh.."4 dự báo.

C) / 2) 7 (A + B) / 2 (A) (b) Hình 4. Mỗi là hai byte dài.Tiêu chuẩn này bây giờ thường được gọi là JPEG-LS và được mô tả trong Phần 4.Kết quả là. một số JPEG hiện thực không cho phép cài đặt thông số dẫn đến việc mất tối thiểu.Sức mạnh của JPEG là trong khả năng của mình để tạo ra hình ảnh độ nén cao khi giải nén được không thể phân biệt từ bản gốc.C) / 2) 6 B + ((A . ISO đã quyết định đi lên với một tiêu chuẩn cho nén không giảm chất lượng của hình ảnh liên tục âm. nơi mà các byte đầu tiên là X'FF 'và là một trong những thứ hai không . phổ biến JPEG thậm chí không triển khai thực hiện chế độ này.Ngay cả các (cơ sở) mất dữ liệu phương thức JPEG không hoạt động tốt khi yêu cầu giới hạn số lượng tổn thất đến mức tối thiểu. Cần lưu ý rằng các chế độ không giảm chất lượng của JPEG chưa bao giờ được rất thành công. hoặc hai byte. và nén dữ liệu các đơn vị. dấu.CB Một X Lựa chọn giá trị dự báo 0 không có dự đoán 1A 2B 3C 4A+B-C 5 A + ((B . Các tham số hoặc là 4 bit (những luôn luôn đi theo cặp).9.Nhận ra điều này. 4.8. Các dấu hiệu dùng để xác định các bộ phận khác nhau của tập tin. và vì thế kém hơn so với hình ảnh không giảm chất lượng khác phương pháp nén.Bởi vì điều này.71: Pixel Dự đoán trong các chế độ Lossless.6 Các tập tin nén Một bộ mã hóa JPEG đầu ra một file nén bao gồm các thông số. một byte. Nó tạo ra các yếu tố nén điển hình của 2.

4. Đây là nơi JFIF đến in . hợp MCU là. file bắt đầu với điểm đánh dấu SOI và kết thúc với EOI đánh dấu.Việc đầu tiên quét có thể được theo sau bởi một phân đoạn DNL tùy chọn (xác định số các dòng).8 343 các đơn vị dữ liệu được kết hợp thành MCUs (tối thiểu mã đơn vị). hình ảnh nén được tổ chức trong khung hình. nhưng khung cũng chứa một tiêu đề và bảng tùy chọn (trong đó. bắt đầu với điểm đánh dấu DNL và chứa số lượng các dòng trong hình ảnh của đại diện bởi khung. ECS chứa một hoặc nhiều MCUs. tiếp theo tiêu đề quét. màu sắc không gian. và trong tất cả các chế độ khác chỉ có một khung hình. Hình 4. hoặc là một đơn vị dữ liệu duy nhất hoặc ba đơn vị. 4. nơi một MCU hoặc là một một đơn vị dữ liệu (ở chế độ noninterleaved) hoặc ba đơn vị dữ liệu với hình ảnh ba thành phần (trong chế độ xen kẽ). lần lượt.phải là 0 hoặc X'FF. đó là lý do tại sao nó không xác định các tính năng hình ảnh như là tỉ lệ điểm ảnh. Một quét bắt đầu với bảng tùy chọn. Nén [Bàn] [Bàn] [DNL đoạn] Khung SOI Khung hình EOI MCU MCU MCU MCU MCU MCU hình ảnh Khung tiêu đề Segment0 Segmentlast Khung tiêu đề Scan1 Quét ECS0 [RST0] ECSlast-1 [RSTlast-1] ECSlast [Scan2] [Scanlast] Hình 4. không phải là một tập tin đồ họa định dạng. hoặc đan xen của các hàng bitmap.Trong chế độ phân cấp có một số khung hình. như giải thích trước đó.đánh dấu có thể bị trước bởi một số byte với X'FF '. tiếp theo là một số entropy-đoạn mã (ECS).72: Định dạng file JPEG. có thể bao gồm đánh dấu).73 bảng liệt kê tất cả các dấu JPEG (bốn nhóm đầu tiên được bắt đầu-của-frame dấu).7 JFIF Nó đã được đề cập trước đó JPEG là một phương pháp nén.Trong mỗi khung thông tin hình ảnh được chứa trong một hoặc nhiều quét. Những nén JPEG 4.8. cách bởi (tùy chọn) khởi động lại đánh dấu (RST). Trong giữa những dấu hiệu.72 cho thấy các phần chính của các tập tin nén JPEG (các bộ phận trong hình vuông ngoặc là tùy chọn).

344 4. mã số học JPG FFC8 Dành cho các phần mở rộng SOF9 FFC9 tuần tự mở rộng DCT FFCA SOF10 tiến DCT FFCB SOF11 Lossless (tuần tự) Phân. chẳng hạn như độ phân giải hình ảnh. tỉ lệ. mã Huffman FFC5 SOF5 sai thứ tự DCT FFC6 SOF6 tiến bộ vi sai DCT FFC7 SOF7 sai lossless (tuần tự) Nondifferential. số học mã hóa FFCD SOF13 sai thứ tự DCT FFCE SOF14 tiến bộ vi sai DCT FFCF SOF15 sai lossless (tuần tự) Huffman bảng đặc điểm kỹ thuật FFC4 DHT Xác định bảng Huffman Mã số học đặc điểm kỹ thuật điều DAC FFCC Xác định arith điều mã hóa (s) Khởi động lại chấm dứt khoảng thời gian FFD0-FFD7 RSTm Khởi động lại với modulo 8 m tính Các dấu FFD8 SOI bắt đầu của hình ảnh FFD9 EOI End của hình ảnh FFDA SOS Bắt đầu quét FFDB DQT Xác định bảng lượng tử hóa (s) FFDC DNL Xác định số dòng FFDD DRI Xác định khởi động lại khoảng FFDE DHP Xác định sự tiến triển theo cấp bậc FFDF EXP Mở rộng thành phần tham chiếu (s) FFE0-FFEF APPn Dành cho các phân khúc ứng dụng FFF0-FFFD JPGn Dành cho các phần mở rộng JPEG COM FFFE luận . mã Huffman FFC0 SOF0 cơ bản DCT FFC1 SOF1 mở rộng liên tiếp DCT FFC2 SOF2 tiến DCT FFC3 SOF3 Lossless (tuần tự) Phân.JFIF (JPEG Interchange File Format) là một tập tin định dạng đồ họa mà làm cho nó có thể để trao đổi hình ảnh JPEG nén giữa các máy tính. Hình ảnh nén Tên mô tả giá trị Nondifferential. Các tính năng chính của JFIF được sử dụng không gian màu YCbCr ba thành phần cho hình ảnh màu sắc (chỉ có một thành phần cho hình ảnh màu xám) và sử dụng các điểm đánh dấu một để xác định các tính năng còn thiếu từ JPEG. và tính năng được ứng dụng cụ thể.

Sau này. JFIF là tên kỹ thuật cho các định dạng hình ảnh tốt hơn (nhưng không chính xác) được biết đến như JPEG. trong trường hợp này nó bắt đầu với một chuỗi khác nhau. . 1 có nghĩa là Xdensity và Ydensity được điểm trên mỗi inch. (RGB) n (3n byte): Đóng gói (24-bit) RGB giá trị cho các điểm ảnh thumbnail. 3.Thuật ngữ này chỉ được sử dụng khi sự khác biệt giữa Định dạng hình ảnh và nén hình ảnh là rất quan trọng.Nói đúng ra. Mỗi phần mở rộng bắt đầu với chuỗi JFXX bằng không chấm dứt. không JFIF hoặc JFXX nhưng cái gì đó xác định các ứng dụng cụ thể hoặc nhà sản xuất của mình. 5. 4. bao gồm 2 byte của trường "chiều dài" nhưng không bao gồm điểm đánh dấu APP0 chính (lĩnh vực 1). Cú pháp của đoạn mở rộng đánh dấu JFIF APP0 như sau: 1. 3. n = Xthumbnail × Ythumbnail.02. các Xdensity và Ydensity lĩnh vực xác định tỉ lệ pixel. Nhận dạng (5 byte): 4A4658580016 Đây là chuỗi JFXX xác định một phần mở rộng. 1116 = Hình thu nhỏ mã hóa bằng cách sử dụng 1 byte / pixel (đơn sắc). Ydensity (2 byte): ngang và dọc mật độ điểm ảnh (cả hai nên được giá trị khác không). có thể có thêm các phân đoạn định JFIF mở rộng. Ythumbnail (1 byte): Hình thu nhỏ theo chiều ngang và dọc pixel đếm. 2. 2. Phiên bản (2 byte): Ví dụ: 010216 xác định bản 1. rằng họ là chấm trên mỗi cm. JPEG 4. có thông tin điểm ảnh và thông số khác (xem bên dưới). APP0 đánh dấu (4 byte): FFD8FFE0. Các định dạng của các phân đoạn đầu tiên của một điểm đánh dấu APP0 là như sau: 1. Chiều dài (2 byte): Tổng chiều dài của cọc tiêu. 1316 = Hình thu nhỏ của mã hóa bằng cách sử dụng 3 byte / pixel (Tám màu sắc). tiếp theo là 1-byte mã xác định phần mở rộng. Một phần mở rộng có thể chứa thông tin ứng dụng cụ thể. 2. Khuyến mã (1 byte): 1016 = Hình thu nhỏ của mã hóa bằng cách sử dụng định dạng JPEG. 6. 5. Xthumbnail (1 byte). 4. Chiều dài (2 byte): Tổng chiều dài của cọc tiêu.Một JFIF mở rộng chứa nhiều nền tảng thông tin cụ thể về hình ảnh. 0 có nghĩa là không có đơn vị.8 345 Các điểm đánh dấu JFIF (gọi là điểm đánh dấu APP0) bắt đầu với các số không-chấm dứt chuỗi JFIF. APP0 đánh dấu.Dành dấu FF01 TEM cho sử dụng cá nhân tạm thời FF02-FFBF RES Reserved Bảng 4.Xdensity (2 byte). Sau này. bao gồm 2 byte của trường "chiều dài" nhưng không bao gồm điểm đánh dấu APP0 chính (lĩnh vực 1). Đây là chuỗi nhận dạng JFIF APP0 đánh dấu.73: Markers JPEG. 7. Nhận dạng (5 byte): 4A4649460016. Các đơn vị (1 byte): Đơn vị cho mật độ X và Y. 8. Mở rộng dữ liệu (biến): trường này phụ thuộc vào phần mở rộng cụ thể.

Một Định dạng ảnh JPEG cho là SPIFF được xác định bởi các tiêu chuẩn JPEG. đó là lý do tại sao nó không xác định các tính năng hình ảnh như là tỉ lệ điểm ảnh. nơi một MCU hoặc là một đơn vị dữ liệu duy nhất (ở chế độ noninterleaved) hoặc ba đơn vị dữ liệu từ các thành phần hình ảnh ba (ở chế độ xen kẽ). tiếp theo tiêu đề quét.Tuy nhiên. tiếp theo là một số entropy-đoạn mã (ECS).8. hoặc là một đơn vị dữ liệu duy nhất hoặc ba đơn vị này 4.72 cho thấy các phần chính của các tập tin nén JPEG (các bộ phận trong hình vuông ngoặc là tùy chọn). Trong mỗi khung thông tin hình ảnh được chứa trong một hoặc nhiều quét. hoặc đan xen của các hàng bitmap. không gian màu sắc.7 JFIF Nó đã được đề cập trước đó JPEG là một phương pháp nén. cá nhân trực tuyến Bảng thuật ngữ Các đơn vị dữ liệu nén được kết hợp thành MCUs (tối thiểu mã đơn vị). nhưng khung cũng chứa một tiêu đề và bảng tùy chọn (trong đó. Trong chế độ phân cấp có một số khung hình. Việc đầu tiên quét có thể được theo sau bởi một phân đoạn DNL tùy chọn (xác định số các dòng). ECS chứa một hoặc nhiều MCUs. Trong giữa những dấu hiệu. nó sẽ được chính xác hơn để nói về JFIF hơn là JPEG. mà JFIF là nhiều hơn nữa rộng rãi hơn SPIFF. có thể bao gồm đánh dấu). hợp MCU là. lần lượt. Đây là nơi JFIF đến in JFIF (JPEG trao đổi Tập Định dạng) là một tập tin định dạng đồ họa mà làm cho nó có thể trao đổi JPEG nén hình ảnh giữa các máy tính. và trong tất cả các chế độ khác chỉ có một khung hình. không phải là một tập tin đồ họa định dạng. hình ảnh nén được tổ chức trong khung hình. như giải thích trước đó. bắt đầu với điểm đánh dấu DNL và chứa số lượng các dòng trong hình ảnh của đại diện bởi khung. -Erik Wilde. Tính năng chính của JFIF được sử dụng không gian màu YCbCr ba thành phần cho hình ảnh màu sắc (chỉ có một thành . và do đó trong hầu hết các trường hợp. cách bởi (tùy chọn) khởi động lại đánh dấu (RST). Hình 4. Một quét bắt đầu với bảng tùy chọn. File bắt đầu với điểm đánh dấu SOI và kết thúc với EOI đánh dấu. JPEG không định nghĩa một định dạng hình ảnh.

Các định dạng của các phân đoạn đầu tiên của một điểm đánh dấu APP0 là như sau: 1. APP0 đánh dấu (4 byte): FFD8FFE0. tỉ lệ. và các tính năng được ứng dụng cụ thể ( Khung ảnh trang 344 ) Các điểm đánh dấu JFIF (gọi là điểm đánh dấu APP0) bắt đầu với các số không-chấm dứt chuỗi JFIF. Chiều dài (2 byte): Tổng chiều dài của cọc tiêu. chẳng hạn như độ phân giải hình ảnh. Một phần mở rộng có thể chứa thông tin trong báo ứng dụng cụ thể-. Mỗi phần mở rộng bắt đầu với chuỗi JFXX bằng không chấm dứt. Một JFIF mở rộng chứa nhiều nền tảng thông tin cụ thể về hình ảnh. trong trường hợp nó bắt đầu với một chuỗi khác nhau. Sau này. Sau này. có thể có thêm các phân đoạn định JFIF mở rộng. tiếp theo là 1-byte mã xác định phần mở rộng. 2. . bao gồm 2 byte của trường "chiều dài" nhưng không bao gồm điểm đánh dấu APP0 chính (lĩnh vực 1). không JFIF hoặc JFXX nhưng cái gì đó xác định các ứng dụng cụ thể hoặc nhà sản xuất của mình.phần cho hình ảnh màu xám) và sử dụng các điểm đánh dấu một để xác định các tính năng còn thiếu từ JPEG. có thông tin điểm ảnh và thông số khác (xem bên dưới).

Thuật ngữ này chỉ được sử dụng khi sự khác biệt giữa Định dạng hình ảnh và nén hình ảnh là rất quan trọng. WWW Online Glossary . nó sẽ được chính xác hơn để nói về JFIF hơn là JPEG. Mở rộng dữ liệu (biến): trường này phụ thuộc vào phần mở rộng cụ thể.02. 4. Y mật độ (2 byte): ngang và dọc mật độ điểm ảnh (cả hai nên được giá trị khác không). 3. Một Định dạng ảnh JPEG cho là SPIFF được xác định bởi các tiêu chuẩn JPEG. Nói đúng ra. APP0 đánh dấu. 7. Phiên bản (2 byte): Ví dụ: 010216 xác định bản 1. Đây là chuỗi nhận dạng JFIF APP0 đánh dấu. 1116 = Hình thu nhỏ mã hóa bằng cách sử dụng 1 byte / pixel (đơn sắc). Chiều dài (2 byte): Tổng chiều dài của cọc tiêu. Tuy nhiên. 2. Nhận dạng (5 byte): 4A4649460016. 5. Nhận dạng (5 byte): 4A4658580016 Đây là chuỗi JFXX xác định một phần mở rộng. JPEG không định nghĩa một Định dạng hình ảnh. 0 có nghĩa là không có đơn vị. n = X thu nhỏ × Y thumbnail. Cú pháp của đoạn mở rộng đánh dấu JFIF APP0 như sau: 1. mà JFIF là nhiều hơn nữa rộng rãi hơn SPIFF. 5. X mật độ (2 byte). (RGB) n (3n byte): Đóng gói (24-bit) RGB giá trị cho các điểm ảnh thumbnail. Khuyến mã (1 byte): 1016 = Hình thu nhỏ của mã hóa bằng cách sử dụng định dạng JPEG. X thu nhỏ (1 byte). Các đơn vị (1 byte): Đơn vị cho mật độ X và Y. rằng họ là chấm trên mỗi cm. JFIF là tên kỹ thuật cho các định dạng hình ảnh tốt hơn (nhưng không chính xác) được biết đến như JPEG. 6. bao gồm 2 byte của trường "chiều dài" nhưng không bao gồm điểm đánh dấu APP0 chính (lĩnh vực 1). —Erik Wilde. 1316 = Hình thu nhỏ của mã hóa bằng cách sử dụng 3 byte / pixel (tám màu sắc).3. và do đó trong hầu hết các trường hợp. các X – mật độ và Ythu nhỏ lĩnh vực xác định tỉ lệ pixel. 1 có nghĩa là Xdensity và Ydensity được điểm trên mỗi inch. Y thu nhỏ (1 byte): Hình thu nhỏ theo chiều ngang và dọc của điểm ảnh 8. 4. 2.