You are on page 1of 27

PHÂN TÍCH DỮ LIỆU

KINH DOANH
GV: Võ Hoàng Kim An
CÁC DẠNG DỮ LIỆU
CỦA PYTHON
Dữ liệu số (Numbers)

•Có 2 dạng số:


•Số nguyên
•Số thập phân
•Chúng ta sẽ học cách tạo biến và gán giá trị cho
biến
Gán giá trị cho biến

•Để tiện hơn cho việc tính toán, chúng ta sẽ gán


các giá trị số này cho các biến để dễ dàng gọi lại
chúng trong các dòng code phía sau
•Ví dụ:
•my_dogs = 2
Gán giá trị cho biến

•Luật đặt tên biến


•Tên biến không được bắt đầu bằng số
•Không được có khoảng trống trong tên biến, thay
vào đó, chúng ta sử dụng ”_”
•Không sử dụng các ký hiệu sau:
:’”,<>/?|()!@#$%^&*~-+
Gán giá trị cho biến

•Luật đặt tên biến


•Nên sử dụng chữ thường
•Không nên sử dụng các tên trùng với các từ có ý
nghĩa đặc biệt trong Python như “list” hoặc ”str”
Gán giá trị cho biến

•Python sử dụng Dynamic Typing


•Đây là loại ngôn ngữ lập trình cho phép thay đổi
kiểu biến tùy biến. Kiểu của biến được tự do gán
như số, chuỗi, số nguyên, mảng, đối tượng …
Gán giá trị cho biến

•my_dogs = 2
•My_dogs = [‘Sammy’, ‘Frankie’]
Gán giá trị cho biến

•my_dogs = 2
•My_dogs = [‘Sammy’, ‘Frankie’]
Gán giá trị cho biến

int my_dog = 1;

my_dog = “Sammy”; //RESULTS IN ERROR


Gán giá trị cho biến

•Ưu điểm và hạn chế của Dynamic Typing


•Ưu điểm:
•Thuận tiện
•Tối ưu về mặt thời gian
•Hạn chế:
•Có nhiều khả năng xảy ra lỗi với các dạng dữ liệu đặc
biệt dạng của dữ liệu

•Thận trọng về type() của dữ liệu


Chuỗi (string)

•String là chuỗi các ký tự, được thể hiện qua


nháy đơn hoặc nháy kép
•‘hello’
•“Hello”
•“ I don’t do that “
Chuỗi (string)

•Vì chuỗi bao gồm các ký tự được sắp xếp có


trình tự, chúng ta index và slice (cắt) để lấy
các phần nhỏ trong chuỗi
•Indexing sử dụng ký hiệu [] phía sau chuỗi
(hoặc tên biến)
•Indexing cho phép chung ta lấy được một ký tự
trong chuỗi
Chuỗi (string)

•Hành động này dùng [] ngoặc vuông và chỉ số


để chỉ vị trí của ký tự bạn muốn lấy
Character: h e l l o
Index: 0 1 2 3 4
. Reversed index: 0 -4 -3 -2 -1
Chuỗi (string)

•Cắt (slicing) cho phép chúng ta lấy được một phần


của các ký tự, một “lát cắt” của chuỗi ký tự
•Công thức: [start, stop, step]
•Start là vị trí bắt đầu của chuỗi mà ta muốn lấy
•Stop là vị trí ta muốn dừng lại(nhưng không bao
gồm vị trí này)
•Step là khoảng cách
Chuỗi (string)

•Cắt (slicing) cho phép chúng ta lấy được một phần


của các ký tự, một “lát cắt” của chuỗi ký tự
•Công thức: [start, stop, step]
•Start là vị trí bắt đầu của chuỗi mà ta muốn lấy
•Stop là vị trí ta muốn dừng lại(nhưng không bao
gồm vị trí này)
•Step là khoảng cách
Tính chất của Chuỗi (string)

•Tính bất biến: Trong lập trình hướng đối tượng


và hàm, đối tượng bất biến là một đối tượng mà
trạng thái của nó không thể bị thay đổi sau khi
được tạo ra.
Định dạng chuỗi để in (print)

•Đôi khi bạn muốn đưa một biến vào một chuỗi
để in. Ví dụ:
•my_name=‘Jose’
•Print(‘Hello’ + my_name)
•Có nhiều cách để định dãng chuỗi và in cùng
với biến
Định dạng chuỗi để in (print)

•Có hai phương pháp định dạng chuỗi:


•.format()
•f-strings
Danh sách (lists)

•Định nghĩa: Trong khoa học máy tính, danh


sách (lists) là một kiểu dữ liệu trừu tượng đại
diện cho một số hữu hạn các giá trị có thứ tự,
trong đó cùng một giá trị có thể xuất hiện nhiều
hơn một lần.
Danh sách (lists)

•Chúng ta dùng ngoặc vuông [] và dấu phẩy để


phân biệt các thành phần trong một list
•Chúng ta có thể index và cắt (slice) danh sách
(list).
•List có thể được lồng vào nhau và có rất nhiều
phương pháp hữu ích hỗ trợ trong phân tích dữ
liệu
Từ điển (Dictionaries)
•Dictionary trong Python là một tập hợp các cặp key và
value không có thứ tự.
•Nó là một container mà chứa dữ liệu, được bao quanh
bởi các dấu ngoặc móc đơn {}.
•Mỗi cặp key-value được xem như là một item.
•Key mà đã truyền cho item đó phải là duy nhất, trong khi
đó value có thể là bất kỳ kiểu giá trị nào.
•Các cặp key-value giúp cho chúng ta có thể gọi được bất
kể thành phần nào, cho dù chúng ta không biết chính xác
vị trí của nó
Từ điển (Dictionaries)
•Dictionary sử dụng ngoặc móc đơn để báo hiệu key
và giá trị tương ứng của nó:
•{‘key 1’:’giá trị 1’, ‘key 2’: ‘giá trị 2’}
•Vậy khi nào thì sử dụng list và khi nào sử dụng
dictionary?
Từ điển (Dictionaries)
•Dictionary: truy vấn phần tử bằng key
• Không có thứ tự và không thể sắp xếp
•List: truy vấn phần tử bằng vị trí
•Có thứ tự và có thể index hoặc slice
Tuples
•Tuples rất giống với list, nhưng có một điểm
khác biệt: Tính bất biến
•Khi các giá trị đã có sẵn trong tuples, chúng
không thể thay đổi
•Tuples sử dụng dấu ngoặc đơn: (1,2,3)
Sets
•Sets là một tập hợp các giá trị không lặp lại
•Có nghĩa là mỗi giá trị trong sets chỉ xuất hiện
một lần
•Tuples sử dụng dấu ngoặc đơn: (1,2,3)
Booleans
•Booleans là các phép toán cho ta biết kết quả
Đúng và Sai (True & False)
•Dạng dữ liệu này rất quan trọng trong các bài
sau

You might also like