· 시각화 라이브러리
데이터 분석에서 시각화는 매우 중요한 요소이다. 복잡한 데이터를 이해하기 쉬운 그래프로 표현하면, 데이터의 패턴이나 트렌드를 빠르게 파악할 수 있다. 파이썬에서는 주로 'Matplotlib'와 'Seaborn' 라이브러리를 이용하여 데이터를 시각화한다.
# 시각화 라이브러리
import matplotlib
import matplotlib.pyplot as plt
import seaborn as sns
'Matplotlib'는 파이썬에서 가장 기본적인 그래프를 그릴 수 있는 라이브러리이다.
또한, 'matplotlib.pyploy'은 'Matplotlib'의 하위 모듈로, 'pit'이라는 별칭으로 주로 사용된다. 이 'Pyplot' 모듈은 기본적인 데이터 시각화 기능을 제공하며, 선 그래프, 히스토그램, 산점도 등 다양한 그래프를 그릴 수 있다.
'Seaborn'은 'Matplotlib' 라이브러리를 기반으로 만들어졌으며, 통계 기반의 그래프를 그리는데 특화되어 있다. 각 막대에 대한 평균과 표준편차를 함께 표시하는 등의 복잡한 작업을 간단하게 처리할 수 있는 함수를 제공한다
· 폰트 설정 라이브러리
그래프에 한글이 포함된 경우, 기본적으로 한글 폰트가 적용되지 않아 글자가 깨지는 현상이 발생할 수 있다. 이를 해결하기 위한 폰트 환경설정이 필요하다.
# 폰트 환결설정 라이브러리
from matplotlib import font_manager, rc
plt.rc("font", family = "Malgun Gothic")
# Mac의 경우
plt.rc("font", family = "AppleGothic")
위의 코드는 한글 폰트로 'Malgun Gothic'을 사용하도록 설정하는 코드이다. 만약 맥(Mac) 환경에서 작업을 진행한다면, 'AppleGothic'을 사용하면 된다.
· 마이너스 기호 적용
또한, 그래프 내에 마이너스(-) 기호가 표시되지 않는 문제도 해결해야 한다.
# 그래프 내에 마이너스(-) 기호 적용하기
plt.rcParams["axes.unicode_minus"] = False
위의 코드는 그래프 내에 마이너스(-) 기호가 정상적으로 표시되도록 하는 설정이다.
이렇게 설정한 후에는 다양한 그래프를 그릴 준비가 완료된 것이다.
이제 데이터에 따른 적절한 그래프를 선택하여 시각화를 진행하면 된다.
'[파이썬] > 데이터 분석' 카테고리의 다른 글
[데이터 분석] selenium 라이브러리를 활용한 동적 웹 크롤링 (3) | 2023.12.05 |
---|---|
[데이터 분석] 데이터 시각화를 통한 데이터 분석(matplotlib, matplotlib.pyplot, seaborn) (3) | 2023.12.04 |
[데이터 분석] 데이터 분석을 위한 데이터 가공(전처리) (4) | 2023.12.03 |
판다스를 활용한 데이터프레임 데이터 추출 및 컬럼명 변경 (0) | 2023.12.03 |
[데이터 분석] SQL 명령어를 이용한 데이터베이스 관리 : 입력, 수정, 삭제 (4) | 2023.12.02 |