요즘 AI 그리고 머신러닝라는 용어가 혼재되어 사용되고 있는데 우선 개념부터 잡아봅시다.
[The automation of] activities that we associate with human thinking, activities such as decision-making, problem solving, learning …(Bellman, 1978) |
컴퓨터와 같은 기계가 자동으로 인간처럼 생각하고 행동하고 배우도록 하는 것을 AI라고 할 수 있습니다.
머신러닝은 AI중에서도 배우는 것에 특화된 분야라고 할 수 있습니다. Data를 이용하여 스스로 규칙을 학습하는 것이 머신 러닝 혹은 기계학습이라고 불려지는 알고리즘들 입니다.
요즘 핫한 딥러닝은 머신러닝 중에서도 Neural Network을 이용한 분야이기도 합니다.
머신 러닝은 AI의 한 분야이며 딥러닝은 머신러닝의 한 분야입니다.
머신러닝에 대해서 더 깊이 알아보겠습니다.
머신러닝의 아버지라고 불리우는 분(Arther Samuel)은 머신러닝을 아래와 같이 정의했습니다.
Field of study that gives computer the ability to learn without being explicitly programmed - Arther Samuel, 1959 |
컴퓨터가 학습을 할수 있도록 연구하는 분야가 머신러닝입니다. 전통적인 프로그램은 특정 목적을 두고 만들어집니다. 예를 들면 워드프로세서나 통신용 프로그램, 보안프로그램 등등 모두 각각의 목적에 적합하도록 만들어진 프로그램입니다. 하지만 머신러닝은 특정 목적을 가지는 프로그램이 아니라 학습에 따라 목적이 결정되는 프로그램이기도 합니다.
머신러닝은 크게 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)으로 나눌 수 있습니다.
제가 공부할 땐 지도학습, 비지도학습이 일반적인 분류방법이었는데, 구글 딥마인드의 강화학습이 뜨면서 분류가 하나 더 늘었습니다.
지도학습(Supervised Learning)은 학습 데이터에 정답까지 알려주는 방법입니다. 아래처럼 각 이미지에 고양이, 개, 컵, 모자와 같은 label까지 알려주어 학습 합니다. 학습이 끝난 뒤 머신러닝 알고리즘은 입력되를 이미지가 고양이, 개, 컵, 모자 중 하나로 분류하게 됩니다.
비지도학습(Unsupervised Learning)은 정답이 없는 학습데이터를 알려주는 방법입니다. 학습데이터를 넣어주면 머신러닝 알고리즘이 입력된 데이터를 스스로 clustering합니다. 아래와 같이 비슷한 뉴스를 모아주는 서비스는 비지도 학습입니다.
강화학습(Reinforcement Learning)은 어떤 환경에서 어떤 행동이 최적인지를 학습하는 방법입니다. 행동에 따라 보상(reward)가 주어지는데 보상이 최대가 되는 방향으로 학습을 하게 됩니다. 알파고로 유명한 구글 딥마인드가 강화학습으로 유명합니다.
'머신러닝(Machine Learning) 기초' 카테고리의 다른 글
머신러닝을 시작하며... (0) | 2018.04.10 |
---|