AI

이전 글에서 다중 회귀 모델을 설계하고 특성을 조합하여 새로운 특성을 만들고 alpha 값을 이용한 규제까지 해보았다. 이번 글에서는 어떤 생선에 대해서 이 생선이 얼마의 확률로 7개의 생선들 중 어떤 종류의 생선 일지 추측하는 모델을 설계해보자. K - 최근접 이웃 알고리즘 이전부터 매번 등장해주시는 알고리즘이다. 확률을 구한다는 것은 분류 문제일까 회귀 문제일까? 7개의 생선들 중에서 종류를 추측하는 것이니까 분류 문제일까 아니면 확률이라는 수치를 구하는 것이니까 회귀 문제일까? k-최근접 이웃 알고리즘은 가장 가까운 이웃 샘플로 추측을 해주니까 10개의 샘플을 조사해서 개수에 따라 확률을 매기면 될 것 같다. 판다스의 read_csv() 함수로 CSV 파일을 데이터 프레임(Dataframe)으로 변..
이전 글에서 농어의 길이를 이용하여 무게를 예측하기 위해 다항 회귀를 사용했다. 하지만 훈련 세트의 점수보다 테스트 세트의 점수가 약간 높게 나왔다. 이 과소 적합 문제를 해결하기 위해서는 고차항이 필요하다. 하지만 얼마만큼의 고차항을 더 넣어야 할 지 모르고 수동으로 넣어주는 것도 한계가 있다. 추가로 농어의 높이와 두께 데이터가 주어졌다고 할 때 농어의 무게에 대한 더 정확한 예측을 해보자. 다중 회귀(Multiple Regression) 1개의 특성(농어의 무게)을 사용했을 때 선형 회귀 모델이 학습하는 것은 직선이다. 그렇다면 특성이 1개가 아닌 2개라면 어떤 것을 학습할까? 바로 평면이다. 특성이 2개면 타깃값과 함께 3차원 공간을 형성하고 y = a * x1 + b * x2 + c 형태의 방정..
이전 글에서 농어의 길이 데이터를 이용하여 농어의 무게를 예측하는 K-최근접 이웃 회귀 모델을 구현했다. 앞서 만든 모델을 사용해서 길이가 50cm인 농어의 무게를 예측해보자. K - 최근접 이웃 회귀 모델의 예측 이전에 사용했던 데이터와 모델을 준비한다. import numpy as np perch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0, 22.5, 22.5, 22.7, 23.0, 23.5, 24.0, 24.0, 24.6, 25.0, 25.6, 26.5, 27.3, 27.5, 27.5, 27.5, 28.0, 2..
이전 챕터의 데이터 전처리를 통해 길이와 무게 데이터로 도미인지 빙어인지 구분하는 머신러닝 모델을 개발했다. 이번 에는 K-최근접 이웃 회귀 모델로 농어의 길이와 무게 데이터로 어떤 농어의 길이만 주어졌을 때 무게를 예측해보자. 분류와 회귀 K-최근접 이웃 회귀에 대해 공부하기 전에, 회귀가 무엇인지 알아보자. 지도 학습 알고리즘은 크게 분류와 회귀로 나뉜다. 분류는 이전 챕터에서 다뤘던 것처럼 말 그대로 샘플을 몇 개의 클래스 중 하나로 분류하는 문제이고, 회귀는 임의의 어떤 숫자를 예측하는 문제이다. 내년도 경제 성장률을 예측하거나 배달이 도착할 시간을 예측하는 것도 회귀라고 할 수 있다. K-최근접 이웃 회귀라는 이름에서 알 수 있는 것처럼 앞서 공부했던 K-최근접 이웃 알고리즘이 회귀에도 작동한다..
aodtns
'AI' 카테고리의 글 목록 (2 Page)