반응형

AI/Machine Learning 2

데이터셋을 선택할 때 고려해야 할 "적합성(Suitability)"과 "기반 개념(Underlying Concept)"

Overview머신러닝 프로젝트에서 데이터셋을 고르는 일은 단순히 "유명한 데이터"를 고르는 것이 아니다. 좋은 모델은 좋은 데이터로부터 시작되며, 그 데이터는 문제에 ‘적합’하고 그 구조를 ‘이해’해야만 제대로 사용할 수 있다. 이번 글에서는 머신러닝 실습이나 연구를 할 때 중요한 두 가지 개념인 적합성(suitability)과 기반 개념(underlying concept)에 대해 이야기해보겠다. 적합성(Suitability)이란?적합성이란 간단히 말해, "이 데이터셋이 내 문제를 해결하는 데 적합한가?"를 의미한다. 예시분류 문제를 풀고 싶은데, 타깃(Label)이 없는 데이터셋이라면 적합하지 않다.실제 애플리케이션은 시계열 데이터인데, 정적인 샘플만 있다면 부적절하다. 적합성 판단 기준..

AI/Machine Learning 2025.10.29

지도학습 vs 비지도학습, 과일로 이해하는 머신러닝의 핵심 개념

Overview머신러닝을 처음 접하는 사람이라면 "지도학습과 비지도학습이 뭐가 다른가요?" 라는 질문을 자주 하게 된다.이 글에서는 과일 분류와 붓꽃(Iris) 데이터 예제를 통해지도학습(정답이 있는 데이터로 분류/예측)비지도학습(정답 없이 데이터 패턴만으로 그룹화)유사도(데이터 간의 닮은 정도)호환성(함께 있을 때의 조합 적합도) 등 머신러닝의 핵심 개념을 직관적으로 설명한다. 실제 Python 코드를 통해DecisionTree, SVM, KNN, LogisticRegression 등 다양한 분류 알고리즘KMeans 군집화, Cosine Similarity 등 을 실습하며, 지도학습과 비지도학습의 원리와 차이, 그리고 실전에서의 해석 방법까지 단계별로 경험할 수 있다. 머신러닝의 ..

AI/Machine Learning 2025.10.22
반응형