pandas(6) : 날짜 데이터 변환 및 변환 오류 / 주피터노트북
1. 날짜 데이터 변환날짜 데이터를 다룰 때는 데이터 타입을 정확하게 지정하는 것이 매우 중요합니다. 날짜 데이터는 다양한 연산과 비교가 가능하므로 적절한 형식으로 변환해야 합니다. 우선 간단한 예시를 통해 날짜 데이터를 어떻게 처리하는지 알아보겠습니다.1) 데이터프레임 생성하기먼저 예제 데이터를 담은 데이터프레임을 만들어보겠습니다. 여기에는 이름, 생년월일, 나이 정보가 포함되어 있습니다.Person = pd.DataFrame( data = {"name" : ["JUN", "ANGELA", "SAM"], "birthday" : ["2000-04-21", "1997-01-12", "1989-02-11"], "age" : [26, 30, 38]}, column..
2025. 2. 19.
pandas (5) : 데이터프레임 생성, 데이터프레임 필터링 / 주피터 노트북
1. 데이터프레임 생성하기조선 초기 5명의 왕들에 대한 정보를 바탕으로 데이터프레임(DataFrame)을 생성해보겠습니다. 데이터프레임은 여러 개의 시리즈(Series)를 열(Column) 단위로 모아 만든 2차원 형태의 표 구조입니다. pandas에서 pd.DataFrame() 함수를 사용하여 생성 가능합니다.아래 예시는 '묘호', '출생연도', '사망연도', '재위기간', '즉위나이'라는 다섯 개의 열로 구성되어 있으며, 각 행은 조선 왕의 정보를 담고 있습니다. 인덱스는 '제1대'부터 '제5대'까지의 왕 순번으로 설정했습니다.Joseon_King = pd.DataFrame( data = {"묘호" : ["태조", "정종", "태종", "세종", "문종"], "출생연도" : ..
2025. 2. 13.
pandas(4) : 데이터(시리즈, 데이터프레임) 생성, 시리즈 데이터 필터링, 시리즈 연산, 내림차순, 올림차순
1. 데이터 생성1) 시리즈 데이터 생성하기pandas에서 시리즈(series)는 1차원 배열 형태의 데이터 구조로, 하나의 데이터 타입만을 가질 수 있습니다. 시리즈는 pd.Series()를 이용해 생성할 수 있습니다.예를 들어, 아래와 같이 사람 이름과 숫자를 함께 넣을 수 있습니다.pd.Series(["태조", 6])위 코드는 인덱스가 자동으로 0, 1로 생성됩니다. 그러나 인덱스를 직접 지정하고 싶다면 index 매개변수를 사용해 문자열로 생성할 수 있습니다. 이와 같이 지정하면, 각각의 값에 대해 직접 이름을 붙일 수 있어 데이터 해석이 쉬워집니다.pd.Series(["태조", 6], index = ["묘호", "재위기간"])2) 데이터프레임 데이터 생성하기여러 개의 시리즈가 모이면 데이터프레임..
2025. 2. 12.
pandas (3) : 기초 통계 함수 총정리 - describe, groupby, nunique, value_counts, count
1. 기초 데이터 통계 계산데이터 분석의 첫걸음 바로 데이터의 성질을 파악하는 것입니다. 어떤 데이터가 담겨 있는지, 평균이나 합계가 어떻게 되는지, 고유값의 개수는 몇 개인지 등을 살펴보면서 분석 방향을 설정하는 것이 중요합니다. 파이썬의 pandas 라이브러리를 활용하면 이러한 기본 통계 정보를 간단한 코드로 쉽게 확인이 가능합니다.1) describe() 함수describe()는 데이터의 전체적인 통계 요약을 한눈에 확인할 수 있는 함수입니다. 데이터프레임에서 숫자형(int, float 등) 컬럼을 중심으로 주요 통계 지표들을 출력합니다.예를 들어, int64의 데이터 타입을 가진 항목들이 있다면, describe()를 통해 개수(count), 평균(mean), 표준편차(std), 최솟값(min),..
2025. 2. 10.