python/실습(project)6 [Python/딥러닝/실습] Keras를 이용한 다중 분류 분석(인공신경망) 데이터 정의/EDA [R/머신러닝/실습] 랜덤포레스트를 이용한 다중 분류 분석 데이터 정의 및 탐색적 데이터 분석(EDA) 1) 데이터 정의 iris 데이터셋은 꽃잎의 각 부분의 너비와 길이들을 측정한 데이터이며 150개의 레코드로 구성되어 있다. 변수명 변수 설명 Sepal.Length 꽃받 robinlovesyeon.tistory.com 위 링크 참고 파이썬에서는 seaborn을 이용한 변수 비교를 추가했다. import seaborn as sns sns.pairplot(raw_data, hue="Species", size=3, diag_kind="kde") 4개의 특성에 해당하는 Sepal.Length, Sepal.Width, Petal.Length, Petal.Width와 모든 쌍(pair)의 조.. python/실습(project) 2023. 1. 12. [Python/딥러닝/실습] 로지스틱 회귀 분석 데이터 정의 [R/머신러닝/실습] 로지스틱 회귀 분석 데이터 정의 사용 데이터: weather.csv 기상 관측 자료를 날짜별, 항목별로 기록한 자료이다. 각 항목에 따라 다른 자료형과 단위를 포함한다. 독립변수는 RainTomorrow 이며, 종속변수는 Date부터 RainToda robinlovesyeon.tistory.com 위 링크 참고 로지스틱 회귀 분석 1) 데이터 호출 및 전처리 import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.preprocessing import LabelEncoder raw_data = pd.read_csv('weather.csv',encoding='cp949') raw_.. python/실습(project) 2023. 1. 12. [Python/딥러닝/실습] 단순 선형회귀 분석 데이터 정의 및 EDA [R/머신러닝/실습] 단순 선형회귀 분석 목표 제품적절성이 제품만족도에 미치는 영향 주제로 R을 이용한 단순 선형 회귀분석을 실시하고, 인공신경망을 이용한 선형 회귀분석을 python으로 실행하여 결과를 비교한다. 분석방법 SyncRNG패 robinlovesyeon.tistory.com 위 링크 참고 단순 선형회귀 분석 1) 데이터 호출 import pandas as pd import numpy as np import matplotlib.pyplot as plt from SyncRNG import SyncRNG raw_data = pd.read_csv('E:/product.csv',encoding='cp949') v=list(range(1,len(raw_data)+1)) s=Syn.. python/실습(project) 2023. 1. 5. [Python/실습] 의사결정나무를 이용한 BostonHousing 예측분석 데이터 정의 [R/실습] 의사결정나무를 이용한 BostonHousing 예측분석 데이터 정의 사용 데이터: R의 melbench 패키지 내 Bostonhousing dataset 변수명 의미 CRIM 자치시(town) 별 1인당 범죄율 ZN 25,000 평방피트를 초과하는 거주지역의 비율 INDUS 비소매상업지역이 점유하고 있 robinlovesyeon.tistory.com 의사결정나무 생성 1) Import packages import numpy as np import pandas as pd from sklearn.datasets import load_boston from sklearn.model_selection import train_test_split from sklearn.tree import .. python/실습(project) 2023. 1. 3. [Python/실습] 랜덤포레스트 모델을 이용한 위스콘신 유방암 데이터 분류분석 데이터 정의 [R/실습] xgboost 모델을 이용한 위스콘신 유방암 데이터 분류분석 데이터 정의 - 사용 데이터 : wisc_bc_data.csv 컬럼명 의미 id 환자 식별 번호 diagnosis 양성 여부 (M = 악성, B = 양성) 각 세포에 대한 정보 radius 반경 (중심에서 외벽까지 거리들의 평균값) texture 질감 (Gr robinlovesyeon.tistory.com 위 링크 참고 랜덤포레스트 모델링 1) Import packages import pandas as pd import numpy as np from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt from sklearn.met.. python/실습(project) 2023. 1. 2. [python/실습] xgboost를 이용한 위스콘신 유방암 데이터 분류분석 데이터 정의 [R/실습] xgboost 모델을 이용한 위스콘신 유방암 데이터 분류분석 데이터 정의 - 사용 데이터 : wisc_bc_data.csv 컬럼명 의미 id 환자 식별 번호 diagnosis 양성 여부 (M = 악성, B = 양성) 각 세포에 대한 정보 radius 반경 (중심에서 외벽까지 거리들의 평균값) texture 질감 (Gr robinlovesyeon.tistory.com 위 게시물 참고 xgboost 모델 생성 1) Import packages import pandas as pd import numpy as np from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt import xgboo.. python/실습(project) 2022. 12. 20. 이전 1 다음