본문 바로가기

데이터 전처리2

[데이터 분석] 데이터 분석을 위한 데이터 가공(전처리) HTML 삽입 미리보기할 수 없는 소스 본 글에서는 "분석을 위한 데이터 가공하기"에 관한 내용을 다룰 것이다. 차례와 사용 툴은 아래와 같다. [차례] 첫 번째, 데이터 가공(전처리)란 두 번째, 분석에 필요한 시나리오 작성하기 (분석 목적, 주제 등 포함) 세 번째, 사용할 데이터 검증하기 네 번째, 분석에 필요한 데이터 가공(전처리)하기 다섯 번째, 생성한 프로세스를 통해 하나의 통합 파일로 생성하기 [사용 툴] - Jupyter notebook(웹 기반 대화형 코딩 환경) · 데이터 가공, 또는 전처리 데이터 가공, 또는 데이터 전처리는 같은 의미로 사용되는데, 이 용어들은 원시 데이터(초기 상태의 데이터)를 분석이 가능한 형태로 변환하는 과정을 가리킨다. 이는 데이터 분석을 수행하기 전에 반드시.. 2023. 12. 3.
[데이터 분석] 판다스를 활용한 데이터프레임 재구성 HTML 삽입 미리보기할 수 없는 소스 (데이터프레임 생성에 관한 글은 아래의 링크를 참고하시라.) 2023.11.29 - [[파이썬]/데이터 분석] - [데이터 분석] 판다스를 활용한 데이터프레임 생성 및 개념 데이터프레임 재구성 한국전력거래소에서 수집한 "시간별 전력수요량" 공공데이터를 새로운 데이터프레임으로 재구성하려고 한다. 이러한 작업을 수행하는 이유는 데이터의 구조가 보기 불편하다고 느껴지기 때문이다. (왜 이렇게 생각하는지에 대해서는 아래에 명시하였다.) · 데이터 조회 import pandas AS pd # 데이터 불러오기 file_path = "./01_data/new_data.csv" # CSV 파일을 읽어 데이터프레임 객체로 변환 df = pd.read_csv(file_path) # .. 2023. 11. 30.