Data Visualization với Seaborn

Tính Phạm
2 min readMar 10, 2020

Cho data set như sau

Link data set: https://github.com/mwaskom/seaborn-data

Tiến hành

Cài đặt seaborn bằng command line nếu chưa cài anaconda

pip install seaborn

Import thư viện seaborn và load data

import seaborn as sns  #import thư viện seaborn
dataSet = sns.load_dataset('tips') # tips là dataset mẫu có sẵn
  1. Ngày nào có total bill cao nhất ? Ngày nào có total bill thấp nhất

data: dataset

jitter: True (Tách 2 đối tượng ra riêng)

hue: màu sắc sẽ được nhóm theo sex

palette: Set1 (bộ màu sắc có sẵn, có thể thay đổi Set2, Set 3…

Fri day có total bill thấp nhất

2. Ngày nào phụ nữ trả tiền nhiều nhất ? Ngày nào đàn ông trả tiền nhiều nhất

Lưu ý split = True
Sun day đàn ông trả tiền nhiều nhất

3. Có phải total bill có giá trị lớn thì được tip nhiều ?

Trên biểu đồ thấy rằng total bill có giá trong khoảng 10 đến 25 thì số lượng tips nhiều hơn.

4. Số lượng khách trong các ngày như thế nào ?

Dựa vào kết quả thì ta thấy thứ 6 có số lượng khách đến quán ít nhất, đông nhất không phải chủ nhật mà là thứ 7

5. Nhóm khách nào đến quán với số lượng đông nhất ?

Nhóm khách đến quán với số lượng đông nhất là 2 người (có thể tình nhân), 1,6 người là ít nhất, 3,4 người có thể là gia đình.

--

--