본문 바로가기
728x90

데이터 분석 관련31

단층신경망(Single-Layer Perceptron)이란? 개념부터 실습까지! 안녕하세요! 오늘은 딥러닝의 가장 기초적인 구조인 단층신경망에 대해 알아보고, 간단한 실습을 진행하도록 하겠습니다.1. 단층신경망이란?1) 단층신경망(SLP)의 개념단층신경망(Single-Layer Perceptron, SLP)은 가장 기본적인 인공 신경망 구조로, 입력층(Input Layer)과 출력층(Output Layer) 두 개의 층으로만 이루어져 있는 단순한 형태의 신경망입니다.일반적으로 우리가 신경망을 이야기할 때, 중간에 여러 은닉층(Hidden Layer)이 존재하는 다층신경망(Multi-Layer Perceptron, MLP)을 떠올리기 쉬운데, 단층신경망은 그보다 훨씬 구도가 간단하다는 것이 특징입니다.이러한 단층신경망은 선형 분류 문제를 해결하는데 적합합니다.2) 단층신경망 수식단층신.. 2025. 3. 30.
의사결정나무 시각화, 어떻게 읽어야 할까? - 의사결정나무 시각화 해석하는 방법 머신러닝 모델 중 하나인 의사결정나무(Decision Tree)는 직관적이고 해석하기 쉬운 알고리즘으로 많이 사용됩니다. 특히, 시각화한 트리 구조는 모델이 어떻게 결정을 내리는지 한눈에 파악하기 쉽다는 장점을 가지고 있습니다. 하지만 의사결정나무 시각화를 처음 접하면, "이 복잡한 트리 구조를 어떻게 해석하지?" 라는 생각이 들 수도 있습니다. 그래서 오늘은 의사결정나무 시각화를 읽는 방법을 소개하려 합니다.1. 의사결정나무 기본 구조의사결정나무는 노드(Node)와 가지(Edge)로 구성되어 있습니다.✅ 루트 노드 (Root Node)- 트리의 가장 상단에 있는 노드로, 트리의 시작점입니다. 전체 데이터가 처음 분할되는 기준입니다.✅ 내부 노드 (Internal Node) 혹은 결정 노드 (Decisi.. 2025. 3. 12.
쉽게 배우는 의사결정나무(Decision Tree) - 주피터 노트북으로 개념부터 실습까지! 1. 의사결정나무(Decision Tree)란?의사결정나무는 머신러닝에서 자주 사용되는 알고리즘으로, 데이터를 분류하거나 회귀 분석을 할 때 활용됩니다.마치 스무고개처럼 질문을 던지고 데이터를 분류하는 방식으로 작동하며, 이를 통해 예측 가능한 규칙들의 집합을 생성합니다.의사결정나무는 범주형 데이터와 연속형 데이터 모두 예측이 가능하며, 트리 구조를 기반으로 학습합니다.2. 의사결정나무 장점과 단점1) 장점해석이 쉬움 : 트리 구조가 직관적이므로, 다른 지도학습 기법에 비해 해석하기 용이합니다.범주형 & 연속형 데이터 모두 처리 가능 : 분류 모델과 회귀 모델 모두 사용이 가능합니다.비모수 모형 : 선형성, 정규성, 등분산성 등의 수학적 가정이 불필요합니다.전처리가 비교적 쉬움 : 스케일링이 의사결정나무.. 2025. 3. 8.
파이썬: mutable과 immutable 구분하기 / PyCharm 활용 1. mutable1) 의미mutable을 영어로 번역하면 '변할 수 있는, 잘 변하는'이라는 의미를 가집니다.즉, mutable은 객체를 생성한 후에 내용을 변경할 수 있는 데이터 타입을 의미합니다.이러한 mutable 객체는 데이터를 변경하더라도 메모리 주소가 유지된다는 특징을 가지고 있습니다.2) 장단점(1) 장점mutable은 데이터를 직접 수정할 수 있어 성능이 좋고, 유연한 데이터 조작이 가능합니다.반복적인 변경이 필요한 경우, 즉 실시간으로 데이터를 업데이트해야 하거나 할 경우에 적합합니다.(2) 단점같은 객체를 여러 곳에서 활용할 때는 변경 시 다른 곳에도 영향을 주어 예측하기가 어렵습니다.즉, 하나의 객체를 여러 곳에서 동시 수정할 경우에 예상치 못한 결과가 발생할 수 있다는 것입니다.3.. 2025. 3. 5.
[통계 개념] 정규분포, 첨도와 왜도 알아보기 1. (표준) 정규분포1) (표준) 정규분포 개념(1) 정규분포정규분포는 연속형 확률분포 중 하나로, 평균이 μ이고, 표준편차가 σ인 분포를 의미합니다.(2) 표준정규분포표준정규분포는 평균이 0이고, 표준편차가 1인 분포를 의미합니다.2) (표준) 정규분포 공식 및 그래프(1) 정규분포정규분포를 구하는 공식은 다음과 같습니다.정규분포는 평균값에 가장 많이 몰려있는 종모양의 그래프를 갖습니다.(2) 표준정규분포표준정규분포를 구하는 공식은 다음과 같으며, 이 작업을 표준화라고 합니다.이를 통해 쉽게 확률 값을 구할 수 있습니다.표준정규분포의 그래프는 위의 정규분포 그래프와 형태는 동일하게 생겼으며, 가운데 평균이 0인 값을 의미합니다.2. 첨도(kurtosis)1) 첨도 개념첨도는 확률분포의 뾰족한 정도를 .. 2025. 2. 25.
pandas(6) : 날짜 데이터 변환 및 변환 오류 / 주피터노트북 1. 날짜 데이터 변환날짜 데이터를 다룰 때는 데이터 타입을 정확하게 지정하는 것이 매우 중요합니다. 날짜 데이터는 다양한 연산과 비교가 가능하므로 적절한 형식으로 변환해야 합니다. 우선 간단한 예시를 통해 날짜 데이터를 어떻게 처리하는지 알아보겠습니다.1) 데이터프레임 생성하기먼저 예제 데이터를 담은 데이터프레임을 만들어보겠습니다. 여기에는 이름, 생년월일, 나이 정보가 포함되어 있습니다.Person = pd.DataFrame( data = {"name" : ["JUN", "ANGELA", "SAM"], "birthday" : ["2000-04-21", "1997-01-12", "1989-02-11"], "age" : [26, 30, 38]}, column.. 2025. 2. 19.
pandas (5) : 데이터프레임 생성, 데이터프레임 필터링 / 주피터 노트북 1. 데이터프레임 생성하기조선 초기 5명의 왕들에 대한 정보를 바탕으로 데이터프레임(DataFrame)을 생성해보겠습니다. 데이터프레임은 여러 개의 시리즈(Series)를 열(Column) 단위로 모아 만든 2차원 형태의 표 구조입니다. pandas에서 pd.DataFrame() 함수를 사용하여 생성 가능합니다.아래 예시는 '묘호', '출생연도', '사망연도', '재위기간', '즉위나이'라는 다섯 개의 열로 구성되어 있으며, 각 행은 조선 왕의 정보를 담고 있습니다. 인덱스는 '제1대'부터 '제5대'까지의 왕 순번으로 설정했습니다.Joseon_King = pd.DataFrame( data = {"묘호" : ["태조", "정종", "태종", "세종", "문종"], "출생연도" : .. 2025. 2. 13.
pandas(4) : 데이터(시리즈, 데이터프레임) 생성, 시리즈 데이터 필터링, 시리즈 연산, 내림차순, 올림차순 1. 데이터 생성1) 시리즈 데이터 생성하기pandas에서 시리즈(series)는 1차원 배열 형태의 데이터 구조로, 하나의 데이터 타입만을 가질 수 있습니다. 시리즈는 pd.Series()를 이용해 생성할 수 있습니다.예를 들어, 아래와 같이 사람 이름과 숫자를 함께 넣을 수 있습니다.pd.Series(["태조", 6])위 코드는 인덱스가 자동으로 0, 1로 생성됩니다. 그러나 인덱스를 직접 지정하고 싶다면 index 매개변수를 사용해 문자열로 생성할 수 있습니다. 이와 같이 지정하면, 각각의 값에 대해 직접 이름을 붙일 수 있어 데이터 해석이 쉬워집니다.pd.Series(["태조", 6], index = ["묘호", "재위기간"])2) 데이터프레임 데이터 생성하기여러 개의 시리즈가 모이면 데이터프레임.. 2025. 2. 12.
프로그래머스 문제 풀이 - 두 수의 합 구하기 프로그래머스(Programmers)의 가장 기본적인 레벨의 문제 중 하나인, "두 수의 합" 문제입니다. 초보자도 어렵지 않게 접근할 수 있는 문제이며, 파이썬의 기본 문법을 연습하기에 아주 적합한 유형입니다.1. 문제 설명정수 num1과 num2가 주어졌을 때, 이 두 수를 더한 결과를 반환하는 함수를 작성하는 것이 문제의 핵심입니다. 문제에서 주어진 조건은 다음과 같습니다.제한 사항:-50,000 ≤ num1 ≤ 50,000  -50,000 ≤ num2 ≤ 50,000입출력 예시:예 1 : num1 = 2, num2 = 3 → return : 5예 2 : num1 = 100, num2 = 2 → return : 102num1num2result2351002102 2. 내가 작성한 답안def soluti.. 2025. 2. 11.
pandas (3) : 기초 통계 함수 총정리 - describe, groupby, nunique, value_counts, count 1. 기초 데이터 통계 계산데이터 분석의 첫걸음 바로 데이터의 성질을 파악하는 것입니다. 어떤 데이터가 담겨 있는지, 평균이나 합계가 어떻게 되는지, 고유값의 개수는 몇 개인지 등을 살펴보면서 분석 방향을 설정하는 것이 중요합니다. 파이썬의 pandas 라이브러리를 활용하면 이러한 기본 통계 정보를 간단한 코드로 쉽게 확인이 가능합니다.1) describe() 함수describe()는 데이터의 전체적인 통계 요약을 한눈에 확인할 수 있는 함수입니다. 데이터프레임에서 숫자형(int, float 등) 컬럼을 중심으로 주요 통계 지표들을 출력합니다.예를 들어, int64의 데이터 타입을 가진 항목들이 있다면, describe()를 통해 개수(count), 평균(mean), 표준편차(std), 최솟값(min),.. 2025. 2. 10.
728x90