Professional Documents
Culture Documents
Trong nền báo chí Việt Nam, báo mạng điện tử tuy ra đời sau những loại hình
báo chí khác nhưng đã nhanh chóng phát triển về số lượng, chất lượng và ngày càng
khẳng định được vị trí của mình trong đời sống báo chí, đời sống xã hội của đất nước.
Đi tiên phong trong phong trào đó là sự ra đời của trang báo điện tử Vnexpress.net với
dịch vụ Internet tạo nên một mạng thông tin báo chí điện tử sôi động có sức thu hút hàng
triệu lượt người truy cập hàng ngày. Là trang báo điện tử số 1 của Việt Nam đòi hỏi
Vnexpress.net phải bảo vệ chất lượng và uy tín cho độc giả ngay từ cách giao tiếp với
người dùng, vì vậy giao thức HTTPS là không thể thiếu để đảm bảo những điều trên.
Mục đích của báo cáo này là để cung cấp một cái nhìn khách quan về trang báo
điện tử Vnexpress hoạt động trên giao thức HTTPS (Hypertext Transfer Protocol
Secure) giao thức truyền tải siêu văn bản được bảo vệ. Nhóm em sẽ nghiên cứu về Cấu
trúc trang của trang web VnExpress.net, giao thức của VnExpress, hoạt động của
Vnexpress trên giao thức HTTPS và Xu hướng phát triển của VnExpress.
Nhóm em chân thành cám ơn cô giáo Nguyễn Thị Thu Hằng trong quá trình qua
đã tận tình giảng dạy cho chúng em những kiến thức quý báu về môn Internet và các
Giao thức. Để cho chúng em có những kiến thức hiểu biết khi còn ngồi trong ghế nhà
trường và sau khi tốt nghiệp.
Kí tên
ii
MỤC LỤC
iii
DANH MỤC HÌNH
Hình 1.1 Xếp hạng về lưu lượng truy cập của Vnexpress(Theo Alexa) ......................... 2
Hình 1.2 Giao diện người dùng của VnExpress.net ........................................................ 2
Hình 2.1 Cấu trúc trang HTML của VnExpress.net ........................................................ 2
Hình 2.2 Cấu trúc trang Web Vnexpress ......................................................................... 3
Hình 3.1 Biểu tượng dấu chấm than cảnh báo không an toàn của trình duyệt Firefox ... 9
Hình 3.2 Cảnh báo website kém an toàn từ trình duyệt Chrome .................................... 9
Hình 3.3 Sơ đồ hoạt động .............................................................................................. 12
iv
THUẬT NGỮ VIẾT TẮT
v
Bài tập nhóm Internet và các giao thức Chương 1: Tổng quan và lịch sử phát triển
1|Page
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 1: Tổng quan và lịch sử phát triển
Hình 1.1 Xếp hạng về lưu lượng truy cập của Vnexpress(Theo Alexa)
- Vnexpress với giao diện thân thiện, cập nhật thông tin nhanh, dễ dàng cho người đọc
tìm kiếm thông tin mình cần. Tờ báo đăng tải nhiều bài viết liên quan đến các lĩnh vực
của ngành tài chính như chính sách thuế, giá cả, phí, tài chính công, thị trường chứng
khoán. Chính sự thành công của VnExpress.net đã thúc đẩy sự phát triển của hệ thống
báo chí điện tử tại Việt Nam đồng thời góp phần hình thành thói quen đọc báo điện tử
cho độc giả. Bên cạnh đưa tin nhanh, VnExpress.net cũng bao quát được mọi sự kiện
quan trọng của tình hình thời sự trong và ngoài nước. VnExpress.net có một đội ngũ
phóng viên khá trẻ, năng động, sáng tạo,yêu nghề. Đây là nguồn động lực rất quý để tờ
báo tiếp tục phát triển trong tương lai.
2|Page
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 2: Cấu trúc trang web VnExpress.net
2|Page
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 2: Cấu trúc trang web Vnexpress.net
Logo HEADER
GLOBAL NAVIGATION
SIDEBAR
CONTENT
FOOTER
Phần đầu(Header): chứa logo, câu slogan, các liên kết, các banner liên kết, các
button, đoạn flash, các form ngắn như form tìm kiếm,…
Phần liên kết toàn cục (Global navigation): chứa các liên kết đến những trang
quan trọng trong toàn bộ trang, trong phần này chứa thêm các liên kết con (sub
navigation).
Phần thân của trang (page body): phần này chứa phần nội dung chính (content)
và phần nội dung phụ (sidebar):
Phần nội dung chính(content): phần này chứa nội dung chính cần thể hiện
cho người dùng xem.
Phần nội dung phụ(sidebar): phần này có thể chứa liên kết phụ của từng
trang (local navigation), các banner chứa liên kết liên quan, chứa các liên kết
quảng cáo,...
3|Page
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 2: Cấu trúc trang web Vnexpress.net
Phần cuối trang web(footer): phần này chứa phần liên hệ như: tên công ty, địa
chỉ, số điện thoại, mail liên hệ,...và đặc biệt là copyright, chứa các liên kết toàn
trang, các banner liên kết,...
Site ID
Là định danh cho website, dễ hiểu hơn là tên website. Site ID được đặt ở góc bên
tay trái. Bạn thấy ngay trên giao diện chính là hình logo VnExpress và một đoạn
slogan ngắn “Báo Tiếng Việt nhiều người xem nhất”.
Home link
Home link hay còn gọi là đường dẫn liên kết đến trang chủ, khi bạn click vào link
này sẽ chuyển đến trang chủ của website.
* Trang chủ là gì? trang chủ là trang đầu tiên bạn nhìn thấy khi truy cập vào
địa chỉ website là VnExpress.net …
* Link là gì? link hay còn gọi là liên kết, link có thể được đặt bên trong hình
ảnh hay đoạn text mà khi bạn click vào đó sẽ được chuyển sang một đường dẫn
trang web khác.
Home link được gắn vào logo của website.(VnExpress bên trái màn hình giao
diện người dùng).
4|Page
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 2: Cấu trúc trang web Vnexpress.net
Slider
Thành phần này thường được đặt bên dưới header. Slider phổ biến là hình ảnh,
gồm nhiều tấm hình khác nhau nhưng không phải là hiển thị tất cả lên trang web.
Slider sẽ có nút điều hướng, giúp bạn có thể di chuyển qua các slide khác. Ngoài
ra slide có thể là video.
Slider được thiết kế đẹp sẽ thu hút người đọc ngay lần đầu tiên vào trang web.
(quảng cáo v.v.)
Banner
Các banner được dùng trong việc quảng cáo như quảng cáo sản phẩm, quảng cáo
sự kiện … Banner thông thường sẽ là hình ảnh, được thiết kế bắt mắt nhằm thu
hút khách hàng. Các vị trí đặt banner phổ biến như trên cùng của trang (trên phần
header) hay ở scan column.
5|Page
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 2: Cấu trúc trang web Vnexpress.net
– Thanh chia sẻ mạng xã hội: bao gồm các nút chia sẻ trang qua các mạng xã
hội Facebook, Twitter.
Page footers
Còn gọi là chân trang, nằm ở vị trí cuối cùng của trang web và được hiển thị ở
tất cả các trang trong website của bạn.
Chân trang chứa các thành phần sau:
– Thông tin bản quyền website
– Link liên kết
– Menu
–…
6|Page
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 3: Giao thức của VnExpress.net
Giao thức HTTPS sử dụng port 443, giúp đảm bảo các tính chất sau của thông tin:
Confidentiality: sử dụng phương thức mã hóa (encryption) để đảm bảo rằng các
thông điệp được trao đổi giữa client và server không bị kẻ thứ ba đọc được.
Integrity: sử dụng phương thức hashing để cả người dùng (client) và máy chủ
(server) đều có thể tin tưởng rằng thông điệp mà chúng nhận được có không bị mất
mát hay chỉnh sửa.
Authenticity: sử dụng chứng chỉ số (digital certificate) để giúp client có thể tin
tưởng rằng server/website mà họ đang truy cập thực sự là server/website mà họ mong
muốn vào, chứ không phải bị giả mạo.
Việc nhờ đến bên thứ 3 (thường là CA) để xác thực danh tính của website cộng thêm
sự chú ý của người dùng rằng website đó có sử dụng HTTPS và SSL certificate của
nó còn hiệu lực sẽ giúp loại bỏ hoàn toàn nguy cơ bị lừa đảo.
Sử dụng HTTPS như thế nào
Trước hết, muốn áp dụng HTTPS thì trong quá trình cấu hình Webserver, bạn có thể
dễ dàng tự tạo ra một SSL certificate dành riêng cho website của mình và nó được
gọi là self-signed SSL certificate.
SSL certificate tự cấp này vẫn mang lại tính Confidentiality và Integrity cho quá
trình truyền thông giữa server và client. Nhưng rõ ràng là không đạt được tính
Authenticity bởi vì không có bên thứ 3 đáng tin cậy nào đứng ra kiểm chứng sự tính
xác thực của certificate tự gán này. Điều này cũng giống như việc một người tự làm
chứng minh nhân dân (CMND) cho mình rồi tự họ ký tên, đóng dấu luôn vậy!
Vì vậy, đối với các website quan trọng như E-Commerce, Online Payment, Web
Mail,… thì họ sẽ mua một SSL certificate từ một Trusted Root CA nào đó như
VeriSign, Comodo, GoDaddy,… Ở đây, các CA có nhiệm vụ chính là cấp phát và
quản lý các certificate.
Thực chất thì SSL certificate cũng là một loại digitial certificate (một loại file trên
máy tính). Vì HTTPS có dính tới giao thức SSL nên người ta mới đặt tên cho nó là
SSL certificate để phân biệt với các loại digital certificate khác như Personal
Certificate, Server Certificate, Software Publisher Certificate, Certificate Authority
Certificate.
Dưới đây là một số thông tin quan trọng được chứa trong SSL certificate:
7|Page
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 3: Giao thức của VnExpress.net
Thông tin về chủ sở hữu của certificate (có thể là tổ chức, tên cá nhân hoặc tên
miền của website).
Thông tin và digital signature của CA mà cấp certificate này.
Khoảng thời gian mà certificate còn hiệu lực.
Public key của website. Còn private key không có trong certificate mà được lưu trữ
trên chính server và tuyệt đối không được để lộ cho bất cứ client nào.
Một số thông tin phụ khác như: loại SSL certificate, các thuật toán dùng để
encryption và hashing, chiều dài (tính bằng bit) của key, cơ chế trao đổi key (như
RSA, DSA).
v.v…
Cách nhận biết webside có sử dụng giao thức HTTPS:
Để bạn có thể hình dung rõ hơn về giao thức HTTPS, chúng tôi sẽ đưa ra các ví dụ sau
đây.
Đối với các website có sử dụng giao thức HTTPS, khi truy cập bạn sẽ thấy ở đầu khung
địa chỉ web xuất hiện chiếc ổ khóa màu xanh lá cùng dòng HTTPS. Đây chính là dấu
hiệu cho thấy website được bảo mật và chứng thực.
Ngược lại, nếu bạn truy cập một website và nhìn thấy biểu tượng dấu chấm than, bên
cạnh đó lại không có tiền tố HTTPS phía trước tên miền, nhiều khả năng trang web này
chưa được đăng kí giao thức HTTPS. Và trong nhiều trường hợp khác, các trình duyệt
cũng sẽ đưa ra cảnh báo nguy hiểm cho bạn khi nghĩ rằng việc truyền tải thông tin trong
một trang web nào đó là không an toàn.
8|Page
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 3: Giao thức của VnExpress.net
Hình 3.1 5 Biểu tượng dấu chấm than cảnh báo không an toàn của trình duyệt Firefox
Hình 3.2 6 Cảnh báo website kém an toàn từ trình duyệt Chrome
3.1.3 Phân biệt giao thức HTTP và HTTPS
-Hai giao thức HTTP và HTTPS có khá nhiều điểm khác nhau, từ tên gọi đến cách thức
hoạt động, tốc độ truy cập, …
9|Page
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 3: Giao thức của VnExpress.net
Về tên gọi
Như đã tìm hiểu ở phần trước, HTTPS là viết tắt của cụm từ Hypertext Transfer
Protocol Secure và tương tự như vậy, từ viết tắt của HTTP là Hypertext Transfer
Protocol. Sự khác nhau ngay cả trong tên gọi này không phải chỉ để phân biệt, nó
thực sự nói với chúng ta rằng, giao thức HTTPS an toàn hơn khá nhiều so với
HTTP, loại giao thức không có "Secure".
Với cuộc sống hiện nay, khi việc bảo mật thông tin riêng tư được đẩy lên hàng
đầu, xu hướng sử dụng HTTPS đã và đang được đẩy lên cao trào hơn bao giờ hết
Về nguyên lý hoạt động
HTTP hoạt động trên mô hình Client - Server, với giao thức này, các máy
khách sẽ gửi yêu cầu đến máy chủ và chờ sự hồi đáp từ nó. Để có thể trao đổi
thông tin với nhau, máy chủ và máy khách phải thực hiện một giao thức thống
nhất đó là HTTP. Giao thức HTTP chỉ có tác dụng trong quá trình truyền thông
tin giữa hai phía và không có bất kỳ tác dụng nào trong việc bảo mật thông tin
trong quá trình truyền đi.
10 | P a g e
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 3: Giao thức của VnExpress.net
HTTPS cũng hoạt động tương tự HTTP nhưng có bổ dung thêm các giao thức
bảo mật như SSL hoặc TLS, giúp thông tin trong quá trình truyền đi được mã hóa
và bảo mật an toàn, đảm bảo rằng không có ai khác ngoài máy khách và máy chủ
có thể để lộ thông tin, dữ liệu ra ngoài. HTTPS hoạt động kể cả khi bạn sử dụng
thiết bị truy cập công cộng.
Về cổng kết nối
Cổng kết nối hay Port là nơi mà máy khách nhận được thông tin từ máy chủ gửi đến.
Mỗi một Port có số hiệu và chức năng riêng biệt. Cụ thể:
Giao thức truyền tải thông tin tại HTTP sử dụng Port 80
Trong khi đó, giao thức truyền tải thông tin tại HTTPS lại sử dụng Port 443
Trước đây, HTTPS thường ít được sử dụng do thời gian truy cập chậm hơn khá
nhiều so với HTTP. Tuy nhiên, đến thời điểm hiện tại, khi cấu hình máy cũng
như tốc độ truy cập mạng tăng lên đáng kể thì con số này được rút ngắn xuống
gần như bằng không.
Trên đây là một số thông tin cơ bản về cách phân biệt giao thức HTTP và HTTPS.
Và hiển nhiên, HTTPS an toàn hơn so với HTTP rất nhiều trong việc mã hóa dữ
liệu và bảo mật thông tin cá nhân, đó cũng là lý do vì sao giao thức này đang
ngày càng được tin dùng.
Ví dụ về một HTTP Response:
HTTP/1.1 200 OK
Date: Mon, 23 May 2005 22:38:34 GMT
Content-Type: text/html; charset=UTF-8
Content-Encoding: UTF-8
Content-Length: 138
Last-Modified: Wed, 08 Jan 2003 23:11:55 GMT
Server: Apache/1.3.3.7 (Unix) (Red-Hat/Linux)
ETag: "3f80f-1b6-3e1cb03b"
Accept-Ranges: bytes
Connection: close
<html>
<head>
<title>An Example Page</title>
</head>
<body>
Hello World, this is a very simple HTML document.
</body>
</html>
11 | P a g e
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 3: Giao thức của VnExpress.net
3.2.1 Tầm quan trọng của giao thức https lên web vnexpress
- Như chúng ta đã biết trang Web Vnexpress.net là một trang báo điện tử được
quan tâm nhất tại Việt Nam. Vì vậy cần phải bảo vệ website an toàn bằng cách
sử dụng giao thức https, bạn sẽ được đảm bảo rằng không ai thay đổi dữ liệu cũng
như cách chúng được gửi tới người sử dụng.
- Nhiều người đọc hiểu được tầm quan trọng của https, họ sẽ từ chối việc theo dõi
và hợp tác với một website mà không có https. Việc hiển thị bảo mật trên trang
web sẽ cho khách hàng biết rằng họ có thể yên tâm sử dụng website với sự tin
cậy và họ biết rằng thông tin của họ được bảo vệ hoàn toàn.
- Cũng như tăng tiêu chí xếp hạng trong SEO, SSl cũng là một tiêu chí mà Google
sử dụng đẻ đánh giá 1 Website
12 | P a g e
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 3: Giao thức của VnExpress.net
1. Browser sẽ truy cập 1 trang web https. Ở đây là https://vnexpress.net Server hay
Load Balancer (LB) của https://vnexpress.net sẽ trả về certificate để chứng thực
rằng website user đang truy cập là website chính thức. Trong certificate là một
public key PK, dùng để mã hóa K ở bước 4.
2. Browser sẽ kiểm chứng certificate (bằng cách chạy thuật toán kiểm tra chữ ký số
CA). Quá trình này giúp browser xem https://vnexpress.net là thật hay giả.
3. Sau khi kiểm chứng được certificate, browser sẽ tự sinh ra 1 khóa K. Khóa K sẽ
được dùng để mã hóa tất cả các liên lạc giữa browser và https://vnexpress.net sau
này. Do quá trình mã hóa các gói tin dùng mã đối xứng, khóa K cần được gửi trở
lại https://vnexpress.net vì nếu không có K, server (LB) không thể nào giải mã
được gói tin.
4. Khóa K được gửi trả lại cho https://vnexpress.net. Phía https://vnexpress.net sẽ
dùng private key (được bảo vệ) để giải mã gói tin này và qua đó có được thông
tin về K.
5. https://vnexpress.netvà browser dùng khóa K để mã hóa toàn bộ dữ liệu liên lạc
sau này.
Certificate là một khối dữ liệu bao gồm rất nhiều thông tin về https://vnexpress.net
Tên domain
Tên công ty sở hữu
Thời gian certificate được cấp
Thời hạn certificate
Public key PK
13 | P a g e
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 3: Giao thức của VnExpress.net
14 | P a g e
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức Chương 4: Xu hướng phát triển của VnExpress
“Tất cả ưu việt của các loại hình báo chí đang hội tụ ở báo điện tử.Một số báo không chỉ
có tác động xã hội lớn ở trong nước mà còn có tầm ảnh hưởng quốc tế”
VnExpress.net là tờ báo ra đời có hướng đi đúng theo quá trình phát triển của khoa
học công nghệ, nhất là công nghệ thông tin và thực hiện tốt tôn chỉ mục đích. Chính vì
định hướng tốt như vậy nên ở VnExpress.net có 5 điểm mạnh sau:
- Thứ nhất, Báo luôn có kế hoạch, chiến lược phát triển và luôn chú trọng tới việc
đảm bảo chất lượng, do vậy đã duy trì được vị trí là một trong ít tờ báo điện tử
bằng tiếng Việt có lượng độc giả truy cập cao nhất.
- Thứ hai, phóng viên đã tận dụng triệt để những điểm mạnh của kỹ thuật, vì vậy,
tin tức các bạn cập nhật rất nhanh, nóng hổi và tốt.
- Thứ ba, trong những năm gần đây VnExpress.net có rất nhiều đổi mới từ giao
diện, cách tổ chức đến bài trí trang bài nghệ thuật, giúp độc giả tra cứu thông tin
dễ dàng hơn.
- Thứ tư, chất lượng nội dung của VnExpress.net không ngừng tăng trưởng và rất
đáng khích lệ. Trước đây, báo chủ yếu tập trung vào phần thông tin, tức chỉ đơn
thuần là tin tức, giờ tôi đã thấy xuất hiện những bài chuyên sâu, có tính chất phân
tích, bình luận đi sâu vào chuyên đề. Ví dụ năm 2009, kinh tế Việt Nam có sự
suy giảm, do ảnh hưởng của kinh tế thế giới, Đảng, Chính phủ đã phát động một
chương trình rất lớn để làm sao VN duy trì được tăng trưởng, đẩy lùi lạm phát,
đảm bảo an sinh xã hội.
- Thứ năm, nhận thấy là ở VnExpress.net có một đội ngũ phóng viên khá trẻ, năng
động, sáng tạo. Đây là nguồn động lực rất quý để tờ báo tiếp tục phát triển trong
tương lai.
15 | P a g e
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức
Tuy nhiên, VnExpress.net cần nâng cao hơn nữa trình độ phóng viên, biên tập viên
để họ không chỉ là những nhà báo săn tin chuyên nghiệp mà còn am hiểu sâu hơn nữa
tất cả các vấn đề chính trị, kinh tế, xã hội. Khi ấy, những bài viết của các bạn sẽ có chiều
sâu và có tác động lớn đến đời sống xã hội. Về sau này VnExpress.net nhanh nhưng tin
tức phải trung thực và chính xác. Cố gắng tránh những cái quá giật gân, nhiều khi giật
gân thì thu hút được độc giả tuy nhiên đôi khi nó lại phản cảm và tác dụng ngược lại với
bài viết của mình.
KẾT LUẬN
Bài tiểu luận đã trình bày tổng quan và lịch sử của trang báo điện tử
VnExpress. Trình về cấu trúc trang web này trên nền tảng ngôn ngữ lập trình
PHP. Cũng đã đưa ra lý thuyết về giao thức HTTPS là giao thức hoạt động của
VnExpress trên Internet, thông qua đó cho thấy cách VnExpress hoạt động trên
giao thức này. Cuối cùng là đưa ra những đánh giá và xu hướng phát triển trong
tương lai của báo điện tử nói chung và VnExpress nói riêng.
16 | P a g e
Nhóm 5- Lớp D16N6
Bài tập nhóm Internet và các giao thức
17 | P a g e
Nhóm 5- Lớp D16N6