본문 바로가기

인공지능(AI)

자연어처리, 워드임베딩 (Word2Vec, FastText , GloVe 예제)(2) 개념은 1부의 내용과 같습니다. 이제는 언어(자연어)를 수치화 해서 나열하는 방법은 여러가지인데요, 대표적인 3가지로 실습해보겠습니다. Word2Vec, FastText , GloVe 순서입니다. * Word2Vec (https://code.google.com/archive/p/word2vec/) * FastText (https://github.com/facebookresearch/fastText) 빠르고 효율적입니다. 형태학적인 세부 사항도 끝납니다. FastText는 알 수 없는 단어에 대한 단어 벡터를 유도하거나 어휘에서 단어를 추출할 수 있기 때문에 고유합니다. Word2vec과 GloVe 둘 다 모델 사전에 없는 단어에 대한 벡터 표현을 제공하지 못합니다. * GloVe (https://gith.. 더보기
자연어처리, 워드임베딩 (Word2Vec, FastText , GloVe 예제)(1) Word Embedding이란? 워드 임베딩은 단어를 컴퓨터가 이해하고, 효율적으로 처리할 수 있도록 단어를 벡터화하는 기술 워드 임베딩은 단어의 의미를 잘 표현해야만 하며, 현재까지도 많은 표현 방법이 연구 워드 임베딩을 거쳐 잘 표현된 단어 벡터들은 계산이 가능하며, 모델 투입도 가능 워드임베딩은 Deep Learning 분야에서 자연어처리에서 필수적으로 알아야할 개념입니다. 머신러닝, 딥러닝으로 학습을 시킬 데이터는 숫자로 나타낼 필요가 있습니다. 영어나 한국어나 모든 언어(자연어)들은 abcd, ㄱㄴㄷㄹ 이런식으로 수치화되어있지 않기때문에 특징들을 뽑아내서 수치화하게 되는게 이 과정을 워드임베딩 이라고 합니다. 즉 단어를 밀집 벡터(dense vector)의 형태로 표현하는 방법을 워드 임베딩(w.. 더보기
딥러닝에서 가중치(W), 편향(Bias)의 역할 층이 여러겹으로 쌓이는것을 딥러닝이라고 합니다. 인간의 신경망처럼 얽히고 섥히니 정확도가 올라가는 구조 입니다. 인공지능을 처음 공부하게 되면 W를 찾는과정, Bias의 역할등에 대한 단어가 계속 해서 나올것 입니다. 가중치 (W), 편향 (Bias)의 설명과 역할 그리고 이 복잡한 구조에서 어떻게 정확한 예측값이 나오고 어떤 원리로 동작하는지 알아보겠습니다. 가중치 (Weight) 처음 들어오는 데이터(입력층)에서 다음 노드로 넘어갈때 모두 같은값이면 계속 같은 값이 나올것 입니다. 각기 다르게 곱해야 한다는것이 바로 가중치(weight)입니다. 데이터를 각기 다른 비중으로 다음 은닉층(hidden layers)으로 전달시키기 위해 웨이트(weight), 중요도를 다르게 한다고 이해하시면 됩니다. 예를.. 더보기
인공지능, 머신러닝, 딥러닝(AI, ML, DL)이 무슨 말? 요즘 자율주행이다 뭐다 인공지능이란 말이 누구에게나 친숙한 말이 되어버렸어요. 인공지능이 안들어가는 곳이 없고, 가끔 보면 어떠한 문제의 해결하기 위한 수단으로 인공지능이란 단어만 들어가면 뭔가 될 것 처럼 이야기 하는사람들이 많은거 같아요. 공학도들은 ML 이다 DL이다 전문적으로 보이는 말도 쓰는데, 그러면 인공지능이 대체 뭐길래? 어려운 문제의 만병통치약의 해결책으로 떠오르는지 알아보죠 ㅎㅎ 인공지능(AI) 인공지능은 말그대로? 인간이 가진 생각하는 능력을 컴퓨터를 통해 구현하는 기술이라고 말합니다. 사람처럼 생각하는 기계가 인공지능기술로 만들어졌다. 머신러닝이나 딥러닝을 모두 포함하는 큰 범위의 개념이라고 보시면 될것 같습니다. 인공지능의 종류는 3가지로 분류합니다. 약한 인공지능(ANI, Art.. 더보기