220331 데이터 시각화(Seaborn) TIL

데이터 시각화

이번 포스팅에서는 Seaborn에 대해서 학습한 내용에 대해서 작성해보려고 한다.

Seaborn

Seaborn은 강력한 데이터 시각화 라이브러리로, matplotlib의 최상에 속하는 라이브러리이다. 그래서 Seaborn이 matplotlib에 비해 기능을 높이는 것을 볼 수 있다고 한다.

우선 판다스와 Seaborn을 활용해서 데이터를 시각화해보는 연습을 해보겠다.
앞으로 많은 것을 학습하고, 까먹을 수 있기 때문에 기본적인 시각화하는 방법에 대해서 기록을 해두겠다.

시각화를 하는 방법에는 여러 방법이 있지만, 그것들은 방법이지 정말 중요한 것은 가장 기본이 되는 시각화를 통해서 얻고자하는 결과와 어떤 사회적 현상을 해결할 수 있는지에 대한 인식의 전환이 필요한 것 같다.

단순히 parameter값을 뭐를 넣고 빼고 함으로써 그래프를 뽑아내는 것이 중요한 것이 아닌, 실제 시각화를 통해서 머신러닝 모델링하기 전에 해당 데이터셋에 적합한 최적의 알고리즘을 선택하기 위한 직관을 얻기 위한 용도로써 데이터 시각화를 바라봐야 되는 것 같다.

아직은 잘 모르는 단계이지만, 일단 이정도의 이론상 개념을 알고 있는 상태에서 앞으로의 AI, ML에 대한 공부도 확장해가야겠다.

Read more

220330 데이터 시각화(Matplotlib) TIL

데이터 시각화

이번 포스팅에서는 Matplotlib에 대해서 학습한 내용에 대해서 작성해보려고 한다.

Matplotlib

우선 matplotlib를 어떻게 가져와서 사용하는지에 대해서 알아보자.
우선 가장 기본적인 형태의 그래프를 Matplotlib 라이브러리를 사용해서 그려보려고 한다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import matplotlib.pyplot as plt
import pandas as pd

investment_df = pd.read_csv('crypto_daily_prices.csv')
investment_df

# matplotlib을 사용해서 Pandas DataFrame의 data를 시각화하기
investment_df.plot(x = 'Date', y = 'BTC-USD Price', label = 'Bitcoin Price', linewidth = 3, figsize = (14, 6))
plt.ylabel('Price [$]')
plt.xlabel('Date')
plt.title('가상화폐 시각화 실습 (matplotlib)')

# 기본 범례 위치 변경해보기
plt.legend(loc = 'upper right')
# 그리드 그려주기
plt.grid()
가상화폐 데이터프레임 리스트
가상화폐 matplotlib 그래프
Read more