Scatter Plot

Scatter plot sangat penting dalam menggambarkan distribusi data antara dua variabel seperti korelasi antara dua fitur atau variabel. Halaman ini akan mengupas bagaimana cara menggambar scatter plot.

Definisi

Scatter plot adalah jenis plot atau diagram matematika menggunakan koordinat Cartesian untuk menampilkan nilai-nilai biasanya dua variabel untuk satu set data. Chart ini berguna banyak dalam menampilkan distribusi suatu fitur dataset ketika seorang data scientist melakukan Exploratory Data Analysis (EDA) atau untuk mengetahui korelasi dari dua/tiga fitur yang berbeda.

Video

Matplotlib

Scatter Plot Menggunakan Matplotlib

Seaborn

Visualisasi Scatter Plot

Matplotlib

Untuk menampilkan scatter plot pada Matplotlib dapat dilakukan cukup menggunakan plt.scatter() dengan beberapa input argument. Salah satunya yang dibutuhkan adalah minimal berupa data x dan y. Berikut adalah contoh implementasi code visualisasi scatter plot dalam Matplotlib namun disertai dengan variasi bubble size dan warna dengan random value.

import numpy as np
import matplotlib.pyplot as plt

# menetukan nilai random seed untuk reproducibility
np.random.seed(19680801)


# membuat dataset
N = 50
x = np.random.rand(N)
y = np.random.rand(N)
colors = np.random.rand(N)
area = (30 * np.random.rand(N))**2 

# membuat scatter plot
plt.scatter(x, y, s=area, c=colors, alpha=0.5)
plt.show()

Sumber contoh: https://matplotlib.org/stable/gallery/shapes_and_collections/scatter.html

Dokumentasi scatter plot: https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.scatter.html

Seaborn

Seperti cara membuat chart-chart sebelumnya, dalam Seaborn pembuatan scatter plot juga sangan sederhana dan hanya dibutuhkan minimal line code dan dapat dilakukan dengan sns.scatterplot() saja. Berikut merupakan code pembuatan scatter plot menggunakan Seaborn.

import seaborn as sns
sns.set_theme()

# load dataset
tips = sns.load_dataset("tips")
tips.head()

# menggambar scatter plot
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="time")

Sumber contoh dan dokumentasi: https://seaborn.pydata.org/generated/seaborn.scatterplot.html

Last updated