'r' 태그의 글 목록

Caret Package - Tuning(Grid Search, Random Search) in R

R에는 참 위대한 package들이 많습니다. dplyr이 대표적이죠. 그러나 그 중 압권은 단연컨대 caret이라 생각합니다. caret은 "short for Classification And REgression Training"의 약자로 분류와 회귀를 매우 간편하게 만들어주는 package로, R의 머신러닝 구현을 python보다 극도로 쉽게 만들었습니다. caret이 편리한 이유들은 다음과 같습니다. 1. train/test 효율적 분획: createDataPartition() 2. 간편한 전처리: preProcess() 3. 손쉬운 모델 훈련 컨트롤: trainControl() 4. 튜닝 기본 제공 + 추가적 튜닝의 편의성: tuneGrid, tunelength 등 5. 대부분의 모델 지원 이번 ..

Machine Learning

Phylogenetic Tree(계통수) 실습 in R (2) - Neighbor Joining, Maximum parsimony, Maximum Likelihood, Bootstrapping, ggtree

1편에 이어서 글을 작성하겠습니다. 1편 링크 첨부해드립니다. https://rython.tistory.com/8 Phylogenetic Tree(계통수) 실습 with R (1) - DNA Alignment, Hierarchical Clustering, Multidimensional Scaling 안녕하세요, Killer T Cell입니다. 이번에는 Phylogenetic Tree를 R로써 어떻게 구현하는지 포스팅하겠습니다. 전체적 개괄은 다음과 같습니다. 우선 Phylogenetic Tree란 생물의 진화로 인해 발생한 유사성, � rython.tistory.com 2편에서는, 1편에서 가공한 데이터와 각종 자료(Clustering) 등을 활용해 phylogenetic tree를 다양한 알고리즘으로 ..

Bioinformatics

선형회귀의 5가지 가정 실습 in R

Linear Regression은 몇 가지 가정과 함께 모델을 만든다. 이번 포스팅에서는 그 가정을 간략히 살펴보고, 데이터와 모델이 가정에 부합하는지 판단할 수 있는 R 코드를 설명한다. 그 가정들은 다음과 같다. 선형회귀모형이 $Y_i = \sum \alpha_i X_i + \beta + \epsilon_i, \epsilon_i \sim N(0, \sigma^2)$ 을 가정한다는 점을 상기하면 이해에 도움이 될 것이다. 1. 선형성: 종속 변인과 독립 변인 사이에 선형적 관계가 존재해야 한다. 당연한 이야기다. Linear Regression이 무엇인지 안다면 자명하게 받아들일 수 있다. 2. 다중공선성 X: 독립 변인들 간의 강한 상관관계가 없어야 한다. 다중선형회귀분석에서만 따져주면 되는 조건이다..

Statistics/Regression

다중회귀분석 실습 in R

다중회귀분석은 말 그대로 여러 개의 독립 변인을 회귀분석하는 것이다. 그러나 단일회귀분석과 달리 분석 과정에 여러 주의해야할 점이 존재한다. 글을 보기 전, 회귀계수와 오차항의 정의 정도는 알아두고 가자. 회귀계수는 위 사진에서 beta들, 오차항은 epsilon이다. 즉 회귀계수의 절댓값이 커질수록 독립 변인이 종속 변인에 미치는 영향은 지대해진다. R 코드를 보며 차차 정리하겠다. csv는 첨부파일에 올려두겠다. car

Statistics/Regression

이전 1 다음

이전 다음

공지사항

안녕하세요, Rython 팀블로그입니다.

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

글 보관함

통계학, 그리고 인공지능(R, python)

티스토리툴바