반응형

인공지능 10

[AI 뉴스] 시대를 따라잡기 위한 최신 AI 소식들(1편)

최근에 AI가 미친듯이 성장하고 있으며, 그에 따라 따라가기도 벅찰 만큼 새로운 소식들이나 프로그램 등이 쏟아지고 있습니다. 따라서, 이번 시리즈는 "시대의 변화를 잘 따라가면서 주 내용들을 정리해보자" 라는 취지로 시작하게 되었고, 이 글이 시리즈의 첫 편이 됩니다!! 앞으로 계속 새로운 소식들이 나올때마다 정리해서 올릴 예정이니 많은 관심 부탁드리고, 그럼 시작하겠습니다! 1. ChatGPT, 로스쿨 시험 합격 2023년 1월자 소식입니다. 요즘 엄청나게 핫한 ChatGPT 가 미국의 로스쿨 시험에 응시해서 합격점을 받았다는 결과가 나왔습니다. 앞으로는 변호사를 포함해서 판사, 검사 등 AI에게 법적 심판을 받거나 변호받는 일이 올지도 모르겠습니다... 2. AI가 이제는 연애도 대신? 이것도 마찬가..

책 읽기 끝

드디어... "밑바닥부터 시작하는 딥러닝" 책을 다 읽었다. 사실, 글 작성은 7 챕터에서 마무리하기는 하였지만, 책에는 두 챕터가 더 존재한다. 그러나, 이는 딥러닝 자체를 공부하는데 있어 크게 알아야 할 부분이 아닌 참고용으로 한번 봐두면 좋은 내용들이 주를 이루어서, 고민 끝에 작성을 하지 않기로 결정했다. (귀찮은것도 좀 있고...) 결국은 끝냈지만, 이번 책은 요약글을 작성하는데 있어서 특히 더 힘들었는데 앞선 글에서도 마지막부분에 잠깐 언급했지만 시험도 겹치고, 고등학교도 준비하고, 여러가지로 예습도 준비하는 등 바쁜 개인적인 일들이 갑자기 겹쳐서 시간적 여유가 급격하게 줄었었다. 그래도 생각날 때 마다 꾸준히 정리하여 결국에는 이렇게 마무리지은것 같아 뿌듯하기도 하다. 따라서, 이제부터 생각..

(Chapter 7) 합성곱 신경망(CNN)

합성곱 신경망(CNN) 모델은 이미지 인식과 음성 인식 등 다양한 곳에서 활용된다. 특히, 이미지 인식 분야에서 딥러닝을 활용한 기법은 거의 다 CNN을 기초로 한다. 따라서, CNN에 대해서 자세하게 살펴보도록 하자. (전체 구조) CNN도 일반 신경망과 같이 계층들을 레고 블럭처럼 조합하여 만들 수 있다. 그러나, 새롭게 등장하는 계층이 존재하는데, 바로 합성곱 계층(Convolutional layer) 과 풀링 계층(Pooling layer) 이다. 위의 사진이 CNN의 기본적인 구조이다. 사진과 같이, Conv - Relu - Pooling 계층 흐름으로 연결되는것을 볼 수 있다. 반가운 점은, 마지막 부분에서 Affine - Relu 흐름과 Affine - Softmax 흐름이 사용되었다는 점이..

중간 공지

현재, Chapter 6 까지 올린 상태이고, 앞으로 3개의 챕터가 더 남아있는 상황이다. 나머지 챕터도 빠르게 정리하여 올리고 싶지만, 시험기간이 다가옴에 따라 열심히 시험공부를 하느라 전보다 여유가 확연하게 사라진것은 사실이다. 물론, 여유가 사라진 것 뿐이지 글을 쓸 시간이 아에 없는것은 아니지만, 당장은 시험공부에 집중하고 싶어서 부과 활동은 잠시 내려놓기로 마음먹었다. 따라서, 시험공부 열심히해서 시험 잘 치고, 기분좋게 챕터를 이어가도록 하겠다.

(Chapter 6) 학습 관련 기술들

개인적으로 이 챕터가 가장 중요한 챕터 중 하나라고 생각한다. 딥러닝 모델에 대해 자세하게 배우는것도 중요하지만, 요즘에는 딥러닝 프로그래밍을 돕는 다양한 프레임워크(tensorflow, pytouch, keras 등) 들이 있어 비교적 쉽게 모델을 구현할 수 있다. 그러나, 딥러닝 모델을 잘 구현하더라도 그에 맞는 보조기술들을 알맞게 적용하지 않으면 원하는 방향으로 학습이 이루어지지 않을 수 있다. 그만큼 세세한 부분이지만 결과에 큰 영향을 미치는 이러한 학습에 관련된 기술을 잘 알고 필요에 따라 적절히 적용하는게 중요하므로, 이번 챕터를 집중해서 봐주었으면 한다. (매개변수 갱신) 신경망 학습의 목적은 결국 손실함수의 값을 최저로 낮추는 매개변수를 찾는 것이며 이러한 문제를 추는것을 최적화(optim..

(Chapter 5) 오차역전파법

전 글에서 수치미분에 대해서 알아보았고, 수치미분을 통해 신경망의 가중치와 편향을 조정하여 최적의 값을 찾는 과정까지 알아보았다. 전 글의 마지막에서 SimpleNet 이라는 간단한 신경망을 파이썬 코드로 구현해보았는데, 직접 실행시켜보지는 않았지만, 만약 실행시켜보았다면 학습 속도가 아주 느릴 것이다. 이는 수치미분에 의한 것인데, 수치미분은 비교적 단순하고 구현하기도 쉽지만, 속도가 느리다는것이 단점이다. 따라서, 속도를 향상시켜 효율적인 학습을 위해 오차역전파(back propagation) 에 대해 알아보겠다. 참고로, 오차역전파를 설명하는 방법은 수식을 통한 방법과, 계산 그래프를 이용한 방법이 있는데, 이 책에서는 사용자의 이해를 돕기위해 계산 그래프를 이용해 오차역전파를 설명하고 있다. (계..

(Chapter 4) 신경망 학습

(데이터에서 학습) 전의 퍼셉트론이랑 신경망의 가중치와 편향 값은 목적에 따라 손수 지정해주었다. 그러나, 가중치와 편향이 점점 늘어날수록 복잡도도 배로 늘어나고, 수도 많아져 손수 지정해주는것은 한계가 뚜렷히 존재한다. 따라서, 사람의 수작업 없이 효율적으로 빠르게 학습할 수 있는(신경망에서는 가중치와 편향을 조절하는 것) 방법을 고안해야 하는데, 그 조건에 따라 고안된 학습을 기계학습 이라고 한다. 이 기계학습의 핵심은 데이터에 존재하는데, 사람의 개입을 최소화하고 수집한 데이터로부터 패턴을 찾으려고 시도하는 것이 주 작동원리이기 때문에 그렇다. 그러나 기존의 기계학습은 어느정도 사람의 수작업이 들어간다. 이미지 분류를 예로 들어, 이미지를 원하는 어떠한 기준에 따라 분류하려면 목적에 맞게 이미지의 ..

(Chapter 3) 신경망

(퍼셉트론에서 신경망으로) 위의 사진은 신경망을 그림으로 나타낸 것 이다. 여기에서 가장 왼쪽 층을 입력층, 가운데 층을 은닉층, 가장 오른쪽 층을 출력층 이라고 한다. 그리고, 입력층 은닉층 출력층에 있는 원들을 노드 라고 한다. 전 글에서 퍼셉트론을 위와 같이 그림으로 나타내어 설명하지는 않았지만, 퍼셉트론을 굳이 수식이 아닌 그림으로 나타내면, 위와 같은 신경망의 그림과 똑같다는 것을 알 수 있다. (여기서 말하는 퍼셉트론은 단순 퍼셉트론이 아닌 다층 퍼셉트론이다.) 위 사진은 퍼셉트론 식이며, 이제는 다들 알 것이라고 생각한다. 위의 식은 신경망에 대한 식이라고 볼 수 있다. 결과적으로 앞서 퍼셉트론의 식과 차이가 없다는것을 알 수 있지만, h(x) 라는 새로운 함수의 개념이 추가되었다. 이 함수..

(Chapter 2) 퍼셉트론

(챕터 1은 파이썬의 기초와 문법, numpy와 matplotlib모듈에 대한 내용이며, 이 부분은 다루지 않겠다.) (퍼셉트론이란?) 퍼셉트론이란, 다수의 신호를 입력으로 받아 하나의 신호를 출력하는 구조를 말하며 '단순 퍼셉트론', '인공 뉴런' 등으로 불린다. 위의 사진과 같이 퍼셉트론을 하나의 수식으로 나타낼 수 있으며 x1, x2는 입력 신호, w1, w2는 가중치, y는 출력 신호, 세타(theta)는 임계값을 나타낸다. 수식을 보면 알 수 있듯이 입력값과 그에 맞는 가중치의 곱의 합이 임계값을 넘어서면 1을 출력값을 가지고, 넘지 못하면 0을 가지는 단순한 구조이다. 여기서 각 입력값들은 고유의 가중치들을 가지며(x1 w1, x2 w2) 가중치는 각 입력값들이 결과에 미치는 영향을 조절하는 ..

책 읽기 시작

책 정리글을 올리는게 거의 1년만인것 같다 ㅋㅋ 앞으로 읽은 책들은 다 정리글을 써서 남겨야지 하는 생각을 한게 불과 1년전인데, 그 사이에 읽었던 책들은 귀찮다는 이유로 읽기만 하고 넘겼었다... 이제서야 글을 쓰는 나 자신에게 반성하면서 이번에 읽는 책은 글을 꼭 남겨야지 하는 생각으로 다시 시작을 알리는 글을 작성해본다. 지금 읽기 시작하는 책은 "밑바닥부터 시작하는 딥러닝" 이라는 제목의 책으로, 나름 일본에서 베스트셀러로 선정되기도 하고 방송에 타기도 하며 유명세를 떨쳤던 책이다. 그러나, 딥러닝이 뭔지 아에 모르고 프로그래밍 언어인 파이썬을 다루어 본 적이 없으면 읽는것이 거의 불가능하다. 이 책의 처음 챕터에서 파이썬의 기초와 문법을 다루고 있긴 하지만... 아마 그것으로는 부족해도 한참 부..

반응형