제목이 다중 분류이긴 한데 약간 모호할 수 있으므로 Multiclass Classification임을 밝힙니다. 이전 글 https://rython.tistory.com/7 머신러닝 모델의 평가 (1. 이진 분류) 어떠한 결과값을 예측하는 머신러닝 모델을 만들게 된다면 어떤 모델이 더 좋은지 평가를 할 수 있어야 한다. 이러한 평가는 모델을 다 만든 후에만 하는 것이 아니라 모델을 선택하고 만드는 rython.tistory.com 이전 글에서는 이진 분류의 평가 지표들에 대해 알아보았습니다. Titanic 생존자 예측과 같은 경우에는 target이 0과 1, 즉 이진 분류로 해결할 수 있는 문제인데요, 분류 문제를 보면 항상 2가지로 나누는 문제만 있는 것은 아닙니다. 예를 들면 Iris 품종 예측과 같..
R에는 참 위대한 package들이 많습니다. dplyr이 대표적이죠. 그러나 그 중 압권은 단연컨대 caret이라 생각합니다. caret은 "short for Classification And REgression Training"의 약자로 분류와 회귀를 매우 간편하게 만들어주는 package로, R의 머신러닝 구현을 python보다 극도로 쉽게 만들었습니다. caret이 편리한 이유들은 다음과 같습니다. 1. train/test 효율적 분획: createDataPartition() 2. 간편한 전처리: preProcess() 3. 손쉬운 모델 훈련 컨트롤: trainControl() 4. 튜닝 기본 제공 + 추가적 튜닝의 편의성: tuneGrid, tunelength 등 5. 대부분의 모델 지원 이번 ..
1편에 이어서 글을 작성하겠습니다. 1편 링크 첨부해드립니다. https://rython.tistory.com/8 Phylogenetic Tree(계통수) 실습 with R (1) - DNA Alignment, Hierarchical Clustering, Multidimensional Scaling 안녕하세요, Killer T Cell입니다. 이번에는 Phylogenetic Tree를 R로써 어떻게 구현하는지 포스팅하겠습니다. 전체적 개괄은 다음과 같습니다. 우선 Phylogenetic Tree란 생물의 진화로 인해 발생한 유사성, � rython.tistory.com 2편에서는, 1편에서 가공한 데이터와 각종 자료(Clustering) 등을 활용해 phylogenetic tree를 다양한 알고리즘으로 ..