반응형

데이터 분석/Python 28

파이썬 문자형(string) 한 눈에 보기 (2편) - 문자열 포맷팅

📌 문자열 포맷팅문자열에 값을 삽입하고자 할 때, 문자열 포맷팅은 자주 사용됩니다. 파이썬에서는 대표적으로 세 가지 방식이 있는데, 각 방식과 문법의 특징에 대해 알아보고자 한다. 1) % 방식 (고전적 방식)① 특징C 언어 스타일에서 유래된 가장 오래된 방식이며, 현재는 많이 사용되진 않지만 오래된 코드에서는 볼 수도 있습니다.❌ 단점 : 가독성이 떨어집니다.② 예제name = "Angela"age = 30result = "내 이름은 %s이고, 나는 %d살이야." % (name, age)print(result) ③ 포맷 코드포맷 코드의미%s문자열 삽입%d정수 삽입%f실수 삽입2) str.format() 방식① 특징Python 2.6부터 도입된 방식으로, 가독성과 유연성이 크게 개선되었습니다.인덱스 지..

파이썬 문자열(string) 한 눈에 보기 (1편) - 기본 사용법부터 주요 문자형 함수까지

1. 문자열 기본 사용법파이썬에서 문자열은 작은따옴표(')나 큰 따옴표(")로 감싸서 생성합니다.1) 생성text1 = 'Hello'text2 = "Python"text1, text22) 결합 (문자열 더하기)greeting = "Hello"name = "World"message = greeting + " " + namemessage3) 반복laugh = 'ha 'big_laugh = laugh * 5big_laugh2. 문자열 인덱싱과 슬라이싱문자열은 순서가 있는 시퀀스 자료형입니다.따라서 인덱스를 통해 문자에 접근하거나, 슬라이싱으로 문자 일부를 추출할 수 있습니다. text = "Python"# 인덱싱print("첫 글자:", text[0])print("마지막 글자:", text[-1])# 슬라이싱..

파이썬 숫자형(Number) 한 눈에 보기: 정수, 실수, 변환, 연산

1. 정수형 (int)1) 개념정수형(int)은 소수점이 없는 숫자를 의미합니다. 예를 들어, 10, -3, 0, 2025 등이 있습니다.2) 특징양수/음수 모두 가능합니다.크기에 제한이 없어, 아주 큰 정수도 표현이 가능합니다.일반적인 수학 연산도 가능합니다.3) 예제a = 10b = -7print(type(a))print(type(b))2. 실수형 (float)1) 개념실수형(float)은 소수점이 있는 숫자를 말합니다. 예를 들어, 3.14, -0.5, 0.0 등을 의미합니다.2) 특징지수 표현이 가능합니다. (1.5e2 → 150.0)부동소수점 오차를 주의할 필요가 있습니다.정수와의 연산도 지원 가능합니다.3) 예제pi = 2.1415e = 1.2e3print(type(pi))print(type(..

단층신경망(Single-Layer Perceptron)이란? 개념부터 실습까지!

안녕하세요! 오늘은 딥러닝의 가장 기초적인 구조인 단층신경망에 대해 알아보고, 간단한 실습을 진행하도록 하겠습니다.1. 단층신경망이란?1) 단층신경망(SLP)의 개념단층신경망(Single-Layer Perceptron, SLP)은 가장 기본적인 인공 신경망 구조로, 입력층(Input Layer)과 출력층(Output Layer) 두 개의 층으로만 이루어져 있는 단순한 형태의 신경망입니다.일반적으로 우리가 신경망을 이야기할 때, 중간에 여러 은닉층(Hidden Layer)이 존재하는 다층신경망(Multi-Layer Perceptron, MLP)을 떠올리기 쉬운데, 단층신경망은 그보다 훨씬 구도가 간단하다는 것이 특징입니다.이러한 단층신경망은 선형 분류 문제를 해결하는데 적합합니다.2) 단층신경망 수식단층신..

의사결정나무 시각화, 어떻게 읽어야 할까? - 의사결정나무 시각화 해석하는 방법

머신러닝 모델 중 하나인 의사결정나무(Decision Tree)는 직관적이고 해석하기 쉬운 알고리즘으로 많이 사용됩니다. 특히, 시각화한 트리 구조는 모델이 어떻게 결정을 내리는지 한눈에 파악하기 쉽다는 장점을 가지고 있습니다. 하지만 의사결정나무 시각화를 처음 접하면, "이 복잡한 트리 구조를 어떻게 해석하지?" 라는 생각이 들 수도 있습니다. 그래서 오늘은 의사결정나무 시각화를 읽는 방법을 소개하려 합니다.1. 의사결정나무 기본 구조의사결정나무는 노드(Node)와 가지(Edge)로 구성되어 있습니다.✅ 루트 노드 (Root Node)- 트리의 가장 상단에 있는 노드로, 트리의 시작점입니다. 전체 데이터가 처음 분할되는 기준입니다.✅ 내부 노드 (Internal Node) 혹은 결정 노드 (Decisi..

쉽게 배우는 의사결정나무(Decision Tree) - 주피터 노트북으로 개념부터 실습까지!

1. 의사결정나무(Decision Tree)란?의사결정나무는 머신러닝에서 자주 사용되는 알고리즘으로, 데이터를 분류하거나 회귀 분석을 할 때 활용됩니다.마치 스무고개처럼 질문을 던지고 데이터를 분류하는 방식으로 작동하며, 이를 통해 예측 가능한 규칙들의 집합을 생성합니다.의사결정나무는 범주형 데이터와 연속형 데이터 모두 예측이 가능하며, 트리 구조를 기반으로 학습합니다.2. 의사결정나무 장점과 단점1) 장점해석이 쉬움 : 트리 구조가 직관적이므로, 다른 지도학습 기법에 비해 해석하기 용이합니다.범주형 & 연속형 데이터 모두 처리 가능 : 분류 모델과 회귀 모델 모두 사용이 가능합니다.비모수 모형 : 선형성, 정규성, 등분산성 등의 수학적 가정이 불필요합니다.전처리가 비교적 쉬움 : 스케일링이 의사결정나무..

파이썬: mutable과 immutable 구분하기 / PyCharm 활용

1. mutable1) 의미mutable을 영어로 번역하면 '변할 수 있는, 잘 변하는'이라는 의미를 가집니다.즉, mutable은 객체를 생성한 후에 내용을 변경할 수 있는 데이터 타입을 의미합니다.이러한 mutable 객체는 데이터를 변경하더라도 메모리 주소가 유지된다는 특징을 가지고 있습니다.2) 장단점(1) 장점mutable은 데이터를 직접 수정할 수 있어 성능이 좋고, 유연한 데이터 조작이 가능합니다.반복적인 변경이 필요한 경우, 즉 실시간으로 데이터를 업데이트해야 하거나 할 경우에 적합합니다.(2) 단점같은 객체를 여러 곳에서 활용할 때는 변경 시 다른 곳에도 영향을 주어 예측하기가 어렵습니다.즉, 하나의 객체를 여러 곳에서 동시 수정할 경우에 예상치 못한 결과가 발생할 수 있다는 것입니다.3..

pandas(6) : 날짜 데이터 변환 및 변환 오류 / 주피터노트북

1. 날짜 데이터 변환날짜 데이터를 다룰 때는 데이터 타입을 정확하게 지정하는 것이 매우 중요합니다. 날짜 데이터는 다양한 연산과 비교가 가능하므로 적절한 형식으로 변환해야 합니다. 우선 간단한 예시를 통해 날짜 데이터를 어떻게 처리하는지 알아보겠습니다.1) 데이터프레임 생성하기먼저 예제 데이터를 담은 데이터프레임을 만들어보겠습니다. 여기에는 이름, 생년월일, 나이 정보가 포함되어 있습니다.Person = pd.DataFrame( data = {"name" : ["JUN", "ANGELA", "SAM"], "birthday" : ["2000-04-21", "1997-01-12", "1989-02-11"], "age" : [26, 30, 38]}, column..

pandas (5) : 데이터프레임 생성, 데이터프레임 필터링 / 주피터 노트북

1. 데이터프레임 생성하기조선 초기 5명의 왕들에 대한 정보를 바탕으로 데이터프레임(DataFrame)을 생성해보겠습니다. 데이터프레임은 여러 개의 시리즈(Series)를 열(Column) 단위로 모아 만든 2차원 형태의 표 구조입니다. pandas에서 pd.DataFrame() 함수를 사용하여 생성 가능합니다.아래 예시는 '묘호', '출생연도', '사망연도', '재위기간', '즉위나이'라는 다섯 개의 열로 구성되어 있으며, 각 행은 조선 왕의 정보를 담고 있습니다. 인덱스는 '제1대'부터 '제5대'까지의 왕 순번으로 설정했습니다.Joseon_King = pd.DataFrame( data = {"묘호" : ["태조", "정종", "태종", "세종", "문종"], "출생연도" : ..

pandas(4) : 데이터(시리즈, 데이터프레임) 생성, 시리즈 데이터 필터링, 시리즈 연산, 내림차순, 올림차순

1. 데이터 생성1) 시리즈 데이터 생성하기pandas에서 시리즈(series)는 1차원 배열 형태의 데이터 구조로, 하나의 데이터 타입만을 가질 수 있습니다. 시리즈는 pd.Series()를 이용해 생성할 수 있습니다.예를 들어, 아래와 같이 사람 이름과 숫자를 함께 넣을 수 있습니다.pd.Series(["태조", 6])위 코드는 인덱스가 자동으로 0, 1로 생성됩니다. 그러나 인덱스를 직접 지정하고 싶다면 index 매개변수를 사용해 문자열로 생성할 수 있습니다. 이와 같이 지정하면, 각각의 값에 대해 직접 이름을 붙일 수 있어 데이터 해석이 쉬워집니다.pd.Series(["태조", 6], index = ["묘호", "재위기간"])2) 데이터프레임 데이터 생성하기여러 개의 시리즈가 모이면 데이터프레임..

반응형