전체 글74 올해 마셨던 특별한 술 모음 나는...술을 절대 많이 마시지 않는다..그래서 소주는 아예 안 마시고 맥주는 아주 가끔 마신다..(변명) 근데 새로운 거 시도해보는 걸 좋아하고 맛보는 것도 좋아해서 독특한 주류가 있으면 꼭 마셔보는 편 그리고 와인을 즐기는 편 취향이 있다는 건 언제나 좋은 거고 다양한 술을 마셔보는 것도 내 취향 중 하나니까 고민고민하다 올리는 올해의 특별했던 술 리스트 사진 찾는데 관련 추억이 새록새록 떠올라 즐거웠다 ㅎ.ㅎ 관련 추억은 생생한데 맛은 잘 기억이 안나서... 얼레벌레 주의.. 이 때만 해도 나는 가게 사장으로 케이크 만들고 간식 만들고 그랬는데... 정말.. 인생 어떻게 될지 모르는 것 참고로 멍와인은 강아지용이고 양배추즙맛이난다 왼쪽은 레드, 오른쪽은 화이트 거의 레드 와인만 마시다가 화이트 처음.. life/fav things 2022. 12. 20. [python/실습] xgboost를 이용한 위스콘신 유방암 데이터 분류분석 데이터 정의 [R/실습] xgboost 모델을 이용한 위스콘신 유방암 데이터 분류분석 데이터 정의 - 사용 데이터 : wisc_bc_data.csv 컬럼명 의미 id 환자 식별 번호 diagnosis 양성 여부 (M = 악성, B = 양성) 각 세포에 대한 정보 radius 반경 (중심에서 외벽까지 거리들의 평균값) texture 질감 (Gr robinlovesyeon.tistory.com 위 게시물 참고 xgboost 모델 생성 1) Import packages import pandas as pd import numpy as np from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt import xgboo.. python/실습(project) 2022. 12. 20. Pygments - 소스코드 워드로 예쁘게 옮기기 https://pygments.org/demo/ Demo — Pygments Try out Pygments! This website requires JavaScript (and WebAssembly) You can also try out pygments locally by running pip install pygments . Then you can use the command-line interface . Language guess the language ABAP ABNF ActionScript ActionScript 3 Ada pygments.org R은 언어를 S로, python 은 python으로 설정하면 된다 워드로 옮길 때 폰트가 깨져서 고민이었는데 해결 ~~ 워드 -> pdf 변환해도 안 깨.. python/참고자료 2022. 12. 20. [R/실습] Zelensky 대통령 연설문 모음 텍스트 분석 - 연관 분석 데이터 정의 [R/실습] Zelensky 대통령 연설문 모음 텍스트 분석 - 단어 구름 생성 분석 목적 Zelensky 의 연설문에 기반한 빈도 분석에 따른 단어구름 생성을 기술한다. 그에 따라 현재 우크라이나가 러시아에 대해 취하는 태도를 살펴보고, 나아가 어떠한 부분에서 훌륭한 지도 robinlovesyeon.tistory.com 위 게시글 참고. 연관 분석에서는 단어 구름 과정에서 전처리한 데이터가 아닌, 원본 데이터를 다시 사용했다. 텍스트 전처리 1) library 호출 및 데이터 불러오기 library(arules) library(backports) library(igraph) library(KoNLP) library(tm) library(multilinguer) library(stringr).. R/실습(project) 2022. 12. 20. [R/실습] Zelensky 대통령 연설문 모음 텍스트 분석 - 단어 구름 생성 분석 목적 Zelensky 의 연설문에 기반한 빈도 분석에 따른 단어구름 생성을 기술한다. 그에 따라 현재 우크라이나가 러시아에 대해 취하는 태도를 살펴보고, 나아가 어떠한 부분에서 훌륭한 지도자로서의 연설문으로 평가받는지 분석해 보고자 한다. 데이터 정의 사용데이터: zelensky.txt 데이터 분석에 앞서 원본 텍스트 파일을 살펴보았다. 원본 파일은 우크라이나 원어 연설문을 영어로 번역한 후 다시 한국어로 번역한 버전이며, 일부 문단은 원어와 영어가 함께 기술되어 있다. 원문의 의미 훼손을 최소화하는 방향에 따라 아래와 같이 분석 데이터를 선별했다. 원본 출처 링크와 우크라이나어, 영어를 제외한 텍스트 전문 우크라이나어와 영어를 기반으로 한국어 번역을 수행한 텍스트이므로 제거하더라도 의미 분석에는 .. R/실습(project) 2022. 12. 20. [R/실습] Diamonds 데이터 군집분석(hierarchical/k-means) 개요 diamonds 데이터의 경우 등간척도와 명목척도가 혼재되어 있으며 데이터 양이 많아 (53940 행) 샘플링을 포함한 데이터 전처리 과정이 필요하였다. 데이터는 1000개를 임의 추출하였으며, seed값으로 1234를 부여하였다. 군집 분석의 경우 범위가 넓은 변수에 영향을 많이 받는 경향이 있어 scale() 함수를 통해 데이터 표준화 과정을 거쳤다. 이상치에도 영향을 많이 받으나 해당 데이터는 실존하는 다이아몬드의 데이터이므로 결측치를 제외한 이상치는 없는 것으로 간주하였다. 결측치 또한 실제로 존재하지 않았다. dist()함수로 계산되는 manhattan, maximum, canberra 거리의 경우 명목척도를 제외한 데이터셋으로 계산하였다. 또한, distance() 함수로 계산된 결과값을.. 카테고리 없음 2022. 12. 20. [R/실습] 선형회귀분석을 이용한 BostonHousing 예측분석 데이터 정의 [R/실습] 의사결정나무를 이용한 BostonHousing 예측분석 데이터 정의 사용 데이터: R의 melbench 패키지 내 Bostonhousing dataset 변수명 의미 CRIM 자치시(town) 별 1인당 범죄율 ZN 25,000 평방피트를 초과하는 거주지역의 비율 INDUS 비소매상업지역이 점유하고 있 robinlovesyeon.tistory.com 위 게시물 참고. 선형회귀모델 생성 1) library 호출 library(mlbench) library(car) library(ggplot2) library(Metrics) 2) 선형회귀모델 생성 및 다중공선성 확인 model 10 lm() 함수를 활용하여 선형회귀모형을 만들고 vif() 함수를 활용하여 다중공선성 여부를 확인했다... R/실습(project) 2022. 12. 20. [R/실습] 의사결정나무를 이용한 BostonHousing 예측분석 데이터 정의 사용 데이터: R의 melbench 패키지 내 Bostonhousing dataset 변수명 의미 CRIM 자치시(town) 별 1인당 범죄율 ZN 25,000 평방피트를 초과하는 거주지역의 비율 INDUS 비소매상업지역이 점유하고 있는 토지의 비율 CHAS 찰스강에 대한 더미변수(강의 경계에 위치한 경우는 1, 아니면 0) NOX 10ppm 당 농축 일산화질소 RM 주택 1가구당 평균 방의 개수 AGE 1940년 이전에 건축된 소유주택의 비율 DIS 5개의 보스턴 직업센터까지의 접근성 지수 RAD 방사형 도로까지의 접근성 지수 TAX 10,000 달러 당 재산세율 PTRATIO 자치시(town)별 학생/교사 비율 B 1000(Bk-0.63)^2, 여기서 Bk는 자치시별 흑인의 비율을 말함... R/실습(project) 2022. 12. 20. [R/실습] 랜덤포레스트를 이용한 위스콘신 유방암 데이터 분류분석 데이터 정의 [R/실습] xgboost 모델을 이용한 위스콘신 유방암 데이터 분류분석 데이터 정의 - 사용 데이터 : wisc_bc_data.csv 컬럼명 의미 id 환자 식별 번호 diagnosis 양성 여부 (M = 악성, B = 양성) 각 세포에 대한 정보 radius 반경 (중심에서 외벽까지 거리들의 평균값) texture 질감 (Gr robinlovesyeon.tistory.com 데이터 정의 및 파일 다운로드는 위 링크 참고 랜덤포레스트를 이용한 분류분석 1) library 호출 library(randomForest) 2) 데이터 전처리 set.seed(1234) idx R/실습(project) 2022. 12. 20. [R/실습] xgboost 모델을 이용한 위스콘신 유방암 데이터 분류분석 데이터 정의 - 사용 데이터 : wisc_bc_data.csv 컬럼명 의미 id 환자 식별 번호 diagnosis 양성 여부 (M = 악성, B = 양성) 각 세포에 대한 정보 radius 반경 (중심에서 외벽까지 거리들의 평균값) texture 질감 (Gray-Scale 값들의 표준편차) perimeter 둘레 area 면적 smoothness 매끄러움 (반경길이의 국소적 변화) compactness 조그만 정도 (둘레^2/면적-1) concavity 오목함 (윤곽의 오목한 부분의 정도) points 오목한 점의 수 symmetry 대칭 dimension 프랙탈 차원("해안선 근사" - 1) _mean 3~12번까지는 평균값을 의미 _se 13~22번까지는 표준오차를 의미 _worst 23~32번까지는.. R/실습(project) 2022. 12. 20. [R/실습] 시계열 분석을 통한 2022년 12월 환율 예측 분석 목적 USD/KRW 환율 데이터에 있는 일별 환율 데이터(2021년 11월 15일 ~ 2022년 11월 14일 대상)를 기반으로 시계열분석을 이용하여 2022년 12월 우리나라 미국달러대비 원화 환율을 예측하고 시각화 하기 분석 개요 환율 관련 여러 데이터 중 예측에 필요한 데이터(날짜, 종가)를 추출 후 시계열 데이터로 변경한다. ARIMA 모형으로 모델을 생성한 후 2022년 원화 환율을 예측하고 시각화한다. 데이터 정의 사용 데이터: 아래 링크에서 저장한 2021년 11월 15일 ~ 2022년 11월 14일 환율 데이터 (링크와 파일 첨부) https://kr.investing.com/currencies/usd-krw-historical-data USD KRW 과거 자료 - Investing... R/실습(project) 2022. 12. 5. [ADsP] 비전공자 합격 후기 , 팁 시험 응시료가 무려 오만원이라 한 번에 합격하길 바랬던 ADsP 얼마 전 결과가 나왔고 합격이라 ! 후기를 공유하러 왔다 1, 2, 3과목 총 세 가지로 이루어져 있고 나는 제일 유명한 민트색 책을 썼고, 시험일 기준 두 달 전부터 준비했다. 그 전에는...예전에 통계 시험 후기 글을 보면 알겠지만.. 통계의 ㅌ 도 모르는 사람이었고 어문계열을 졸업했다. 암기에는 무척 약한 편이고 벼락치기랑도 성향상 안 맞기 때문에 애초에 여유롭게 기간을 잡고 첫 1달간은 개념 1회독 1주차 기출문제 돌리기 + 오답노트, 2주차 개념 2회독, 3주차 기출문제 2회독, 4주차 반복해서 틀리는 문제 위주 + 헷갈리는 개념 정리 및 암기 이렇게 준비를 했다 ! 준비 시간이 급하면 기출만 돌리는 걸 추천하지만 내 경우에는 개념.. 자격증 공부/ADsP 2022. 12. 5. 이전 1 2 3 4 5 6 7 다음