티스토리 뷰

IT 공부 및 일상

딥러닝 시작

훈쓰희쓰 2018. 3. 1. 23:42
반응형

************************************************************************************

본 포스팅은 제가 책과 강의를 통해 공부한 내용을 저만의 생각을 담아서 정리하였습니다. 

하지만 저작권 같은 법적 문제의 소지가 있을 시에는 삭제 또는 수정을 하도록 하겠습니다.

************************************************************************************


작년 2학기때 공부를 하기로 마음을 먹었던 인공지능을 이제야 공부를 해봅니다.


일단 인공지능에 대한 전반적인 지식과 머신러닝, 딥러닝, 신경망에 대해서 공부를 해볼려고 하는데요. 그에 관련된책, 강의를 통해서 공부를 할 예정인데 일단 "텐서플로로 시작하는 딥러닝"(저자 : 나카이 에츠지)이라는 책과 유튜브에 나와있는 강의를 활용할려고 합니다. 강의는 "Sung Kim님"이 유튜브에 올리신 강의를 통해서 해볼려고 합니다.


인공지능에 대한 지식과 동시에 관련된 프로그램을 코딩하면서 공부할 수 있는 방법이 어디 없을까하고 생각하다가 구글에서 공개한 오픈소스인 텐서플로우가 인공지능과 관련되있고 파이썬 언어로 코딩을 할 수 있다고 하길래 시작하게 됬습니다. 오늘부터 책을 공부하고 난 후의 후기를 작성할려고 합니다.


딥러닝으로 가기 전에는 먼저 머신러닝과 신경망에 대해서 알아야 하는데요. 순차적으로 한번 알아보도록 하겠습니다.



머신러닝을 먼저 설명드리면 데이터의 속 안을 컴퓨터로 분석하고 계산하여 패턴, 규칙, 등 수학적인 구조를 발견해 내는 구조라고 합니다. 예를 들면 시간에 따라 변화하는 자동차의 속도 그래프가 있다고 합시다. 그 그래프는 불연속적인 형태를 띄고 있는데 상식적으로 생각해보면 속도는 연속적인 형태인 곡선을 띄어야 합니다. 


정리를 하면 데이터들을 곧이 곧대로 바로 받아들이지 말고 데이터 안에 내포낸 패턴, 규칙, 원리를 생각하여 구조를 모델화 시키는 것입니다. 


신경망은 데이터를 모델화 시키는 과정 중에 따져야 할 변수들이 많아질 때 사용되는데요. 예를 들면 두가지의 변수들로 데이터의 특성을 파악해야 할 때와 여러가지의 변수들로 데이터의 특성을 파악해야 할 때가 있다고 합시다. 당연히 후자가 훨씬 어려울 것 입니다. "인공지능으로 데이터의 특성을 파악하면 되지 않느냐"라고 하실 수도 있지만 아직 안타깝게도 그 단계는 인공지능으로는 그 과정은 할 수 없고 사람만이 할 수 있다고 합니다. 


그러니 사람이 데이터의 특성을 파악하여 모델화의 틀을 세워야 되는데 이때 신경망은 복수의 수식을 조합하여 함수를 만들어 복잡한 데이터의 구조를 표현하여 파악할 수 있게 해줍니다.


딥러닝이란 심오한 이론처럼 보이지만 단순하게는 다층 신경망 구조를 말합니다. 하지만 단순히 계층을 복잡하게 쌓는 것이 아니라 해결하고자 하는 문제에 초점을 맞추어서 각 노드에 수행할 독특한 임무를 부여하고 노드 끼리의 연결 방식을 생각한 신경망 구조라고 볼 수 있습니다.


딥러닝에서 합성곱 신경망(CNN)에 대해서 이 책이 주로 다루는 것 같습니다. 합성곱 신경망이란 이미지 필터를 사용하여 사진, 그림을 구별할 수 있게 해준다고 합니다. 원래는 이미지와 수학 공식도 첨부하여 정리를 할려고 하였으나 저작권 문제에 대한 걱정과 저의 아직 부족한 포스팅 실력 때문이니 이해해 주시면 좋겠습니다. 부족한 부분은 나중에 수정하도록 하겠습니다.



위에서는 머신러닝, 신경망, 딥러닝의 기초 개념에 대해서 설명했습니다. 이제부터는 공부하면서 겪은 이해하기 어려웠던 부분들을 중점으로 정리 하겠습니다. 아래의 (숫자p)의 의미는 해당하는 페이지에 그 내용이 있다는 의미입니다.

 

1. 그래프에서 대각선 형태로 그은 직선의 윗 부분이 0보다 크고 아랫 부분이 0보다 작다고 하는데 처음에는 헷갈리다가 X-Y 좌표의 X=0인 직선을 생각해보니 자연스럽게 이해가 갔습니다.(8p)


2. 시그모이드 함수에서 z의 값이 0.5가 되는 부분이 경계선이 된다고 했는데 이 의미는 50%를 기준으로 51%이면 감염자, 49%이면 비감염자로 판단해서 경계선이 된다고 한 것 같습니다.(11p)


3. 편미분을 하였을 때 0으로 하는 값을 찾는 이유는 오차가 0에 가까울 수록 가장 정확한 모델이라서 0을 값으로 하고 연립방정식을 푸는 것 같습니다.(17p)


1장까지 공부 해 보았는데요. 기울기 벡터, 편미분 등 수학적 지식이 너무 짧다라는 것을 통감합니다. 더욱더 분발하여 대학수학과 미적분학을 공부해야 겠습니다.

반응형

'IT 공부 및 일상' 카테고리의 다른 글

아나콘다 사용방법  (0) 2018.03.04
파이썬 아나콘다로 설치하기  (0) 2018.03.02
휴대폰 사망해버리다  (0) 2018.02.21
학생예비군 신청방법  (2) 2018.02.19
인사말  (4) 2018.02.19
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/01   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함