Data Visualization với Seaborn

Tính Phạm
2 min readMar 10, 2020

--

Cho data set như sau

Link data set: https://github.com/mwaskom/seaborn-data

Tiến hành

Cài đặt seaborn bằng command line nếu chưa cài anaconda

pip install seaborn

Import thư viện seaborn và load data

import seaborn as sns  #import thư viện seaborn
dataSet = sns.load_dataset('tips') # tips là dataset mẫu có sẵn
  1. Ngày nào có total bill cao nhất ? Ngày nào có total bill thấp nhất

data: dataset

jitter: True (Tách 2 đối tượng ra riêng)

hue: màu sắc sẽ được nhóm theo sex

palette: Set1 (bộ màu sắc có sẵn, có thể thay đổi Set2, Set 3…

Fri day có total bill thấp nhất

2. Ngày nào phụ nữ trả tiền nhiều nhất ? Ngày nào đàn ông trả tiền nhiều nhất

Lưu ý split = True
Sun day đàn ông trả tiền nhiều nhất

3. Có phải total bill có giá trị lớn thì được tip nhiều ?

Trên biểu đồ thấy rằng total bill có giá trong khoảng 10 đến 25 thì số lượng tips nhiều hơn.

4. Số lượng khách trong các ngày như thế nào ?

Dựa vào kết quả thì ta thấy thứ 6 có số lượng khách đến quán ít nhất, đông nhất không phải chủ nhật mà là thứ 7

5. Nhóm khách nào đến quán với số lượng đông nhất ?

Nhóm khách đến quán với số lượng đông nhất là 2 người (có thể tình nhân), 1,6 người là ít nhất, 3,4 người có thể là gia đình.

Sign up to discover human stories that deepen your understanding of the world.

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

--

--

Tính Phạm
Tính Phạm

Written by Tính Phạm

càng đơn giản càng tốt

No responses yet

Write a response