파이썬

AI/MachineLearning

클러스터링(Clustering)

클러스터링(Clustering)이란? 각 개체의 그룹 정보(정답)없이 유사한 특성을 가진 개체끼리 군집화하는 것 Hard Clustering: 특정 개체가 집단에 포함되는지 여부, 클러스터에 속한다(1), 속하지 않는다(0)으로 표현 K-means Clustering 알고리즘이 이에 해당 Soft Clustering: 특정 개체가 집단에 얼마나 포함되는지 정도, 클러스에 속하는 정도로 표현 Gasussian Mixture Model 알고리즘이 이에 해당 클러스터링 목표 (1) 군집 간 유사성 최소화: 다른 군집 간 데이터 간에는 서로 비슷하지 않게 (2) 군집 내 유사성 최대화: 동일 군집 내 데이터 간에는 서로 비슷하게 최적의 군집 개수 K 구하기 다양한 K값을 시도해보고, 비용 함수 그래프가 꺾이는 ..

AI/MachineLearning

SVM(Support Vector Machine)

서포트 벡터 머신은 높은 성능을 보여주는 대표적인 분류 알고리즘입니다. 특히 이진 분류를 위해 주로 사용되는 알고리즘으로, 각 클래스의 가장 외곽의 데이터들 즉, 서포트 벡터들이 가장 멀리 떨어지도록 합니다. SVM을 위한 사이킷런 함수/라이브러리 from sklearn.svm import SVC: SVM 모델을 불러옵니다. SVC(): SVM 모델을 정의합니다. [Model].fit(x, y): (x,y) 데이터 셋에 대해서 모델을 학습시킵니다. [Model].predict(x): x 데이터를 바탕으로 예측되는 값을 출력합니다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import warnings warnings.fi..

AI/MachineLearning

로지스틱 회귀

로지스틱 회귀를 위한 사이킷런 함수/라이브러리 from sklearn.linear_model import LogisticRegression: 사이킷런 안에 구현되어 있는 로지스틱 회귀를 불러옵니다. LogisticRegression(): 로지스틱 회귀 모델을 정의합니다. [Model].fit(X, y): (X,y) 데이터 셋에 대해서 모델을 학습시킵니다. [Model].predict(X): X 데이터 바탕으로 예측되는 값을 반환 from data_plot import * # 경고메세지(버전이 낮다던가 다음 버전에서는 지워지는 경우 나타남)를 안 뜨게 해줌 import warnings warnings.filterwarnings(action='ignore') import numpy as np from skl..

AI/MachineLearning

과적합 방지 기법 - 정규화

릿지(Ridge), 라쏘(Lasso) 회귀를 위한 사이킷런 라이브러리/함수 from sklearn.linear_model import Ridge : 사이킷런에 저장된 릿지회귀를 불러옵니다. Ridge(alpha) : 릿지 회귀를 정의합니다. alpha : 기본값은 1입니다. alpha값이 클수록 더 강한 정규화를 적용합니다. from sklearn.linear_model import Lasso : 사이킷런에 저장된 라쏘회귀를 불러옵니다. Lasso(alpha) : 라쏘 회귀를 정의합니다. alpha: 기본값은 1입니다. alpha값이 클수록 더 강한 정규화를 적용합니다. import matplotlib.pyplot as plt import pandas as pd import numpy as np from..

AI/MachineLearning

과적합 방지 기법 - 교차 검증

교차 검증이란? 과적합 방지를 위해 데이터를 분리하는 방법 k-fold 교차 검증 학습용 데이터를 계속 변경하며 모델을 훈련시키는 방법 k-fold 교차 검증 순서 K를 설정하여 데이터 셋을 K개로 나눔 K개 중 한 개를 검증용, 나머지를 학습용으로 사용 K개 모델의 평균 성능 확인 K-fold 교차 검증을 위한 사이킷런 함수/라이브러리 KFold(n_splits) n_splits : 분리할 데이터(fold) 개수 [KFold].split(X) 실제로 데이터를 분리하기 위한 인덱스를 반환합니다. X : 분리하고자 하는 데이터 import numpy as np from sklearn.model_selection import train_test_split from sklearn.datasets import ..

AI/MachineLearning

다항 회귀 모델 구현

다항 회귀란? Y를 X에 대한 임의의 다항 함수로 모델링하는 선형 회귀를 의미합니다. 다항 회귀는 먼저 입력 데이터 X에 대한 전처리를 진행해준 후 다중 선형 회귀를 적용함으로써 구현됩니다. 사이킷런을 이용하면 입력 데이터에 대한 전처리를 편리하게 진행할 수 있습니다. 다항 회귀를 위한 사이킷런 함수/라이브러리 PolynomialFeatures(degree, include_bias) : Polynomial 객체를 생성합니다. degree : 만들어줄 다항식의 차수를 의미합니다. include_bias : 편향 변수의 추가 여부를 설정합니다. (True/False) True로 설정하게 되면, 해당 다항식의 모든 거듭제곱이 0일 경우 편향 변수를 추가합니다. 이는 회귀식에서 베타0와 같은 역할을 합니다. [..

향식이
'파이썬' 태그의 글 목록 (4 Page)