머신러닝 1주차 (03/06) - 인공지능 개념과 머신러닝이란..

머신러닝

vitamin3000 2025. 3. 6. 22:52

딥러닝과 신경망은 완전하진 않지만 같은 의미를 내포한다

어떤 지속적인 자극에 의해 반응이 점차적으로 강해지거나 약해지는 것을 의미

Q-Learning - (강화학습 알고리즘)

문제 : 학습 공간(저장), 학습 시간

Q-table이 아닌 함수 근사(모든 결과를 저장하지 않고 압축하여 저장)에 집중

압축 저장 -> 양이 많아짐에 따라 문제 발생 -> 인공 신경망으로 해결중

오차 역전파법

으로 신경망이 발달하여 Q-table은 신경망으로 대체한 연구가 활발히 진행

문제 : 경사손실 문제 발생, (강화학습 알고리즘이 아닌 신경망 알고리즘의 문제)

원인 : 신경망이 복잡해져서

해결방법 : 알렉스넷으로 해결, 합성곱 신경망

환경
- 정의 : 강화학습을 이용해 풀고자하는 대상이나 문제
  즉 AI(에이전트)를 제외한 나머지
- 이산공간 : 그리드 월드처럼 나눔
- 연속공간: 우리가 생활하는 시간이나 공간이 연속적인 것
- 즉 이산 공간을, 연속공간으로 확장
상태
- 현재의 상태는 현재 선택한 action의 결과로 St + 1로 전이될 수 있으며, 현재의 action에 따라 어떠한 state로 전이 할 수 있을지에 대해 통계적으로 정의된다
액션
- t 시점에서 취하는 액션
- 강의에서는 상 우 하 좌 , 순서로 a1 a2 a3 a4이다. 기억하자!
보상
- t 시점에 받을 수 있는 reward로 강화학습의 매우 중요한 지표이다
  왜냐하면 모든 action set에 대한 reward 합인 total reward를 최대화하는 것이 목적이기 때문이다