Natural Language Processing with Classification and Vector Spaces: sentiment analysis with logistic regression
2022. 5. 19. 11:24
인공지능/Natural Language Process
Supervised ML & Sentiment Analysis logistic regression(로지스틱 회귀) 을 적용하기 [Supervised ML(training)] Labels Y (expected value)와 predicted output Y햇이 얼마나 비슷한지 비교하는 cost funtion cost가 최소화될 때까지 파라미터를 수정하며 업데이트 [Sentiment analysis] - negative : 0 - positive : 1 --> Logistic Regression : 두 개의 클라스 중 하나로 분류 Logistic Regression Classifier 1) raw 학습셋에서 useful feature 로 추출 2) classifier 학습 3) 예측 Vocabulary & ..
Natural Language Processing 특화 과정
2022. 5. 19. 11:06
인공지능/Natural Language Process
Coursera에서 "Natural Language Processing 특화 과정"을 수강하기로 했다. 요건 수료증 받는 걸 목표로 ... 총 네 개 강좌로 이루어져 있는데 각 강좌는 4주차 분량 정도 된다 강좌1) Natural Language Processing with Classification and Vector Spaces - sentiment analysis with logistic regression - sentiment analysis with naive bayes - vector space models - machine translation and document search 강좌2) Natural Language Processing with Probabilistic Models - au..
OCR 입문하기
2022. 5. 18. 17:16
인공지능/OCR
OCR을 tesseract로 테스트 해본 적은 있으나 어떤 원리인지는 잘 몰랐다. Coursera로 간단하게 입문해보고자 한다. 미시건 대학교의 파이썬 전문 과정 중 의 2주차 강의인 tesseract and optical character recognition 를 수강한다. Introduction to Optical Character Recognition optical character recognition(OCR) - conversion of text captured in imges into text usable by a computer - read text in images Tesseract OCR Open-Source Software OSI Apache License GPL The (Py)Tess..
DCGAN 이해하기
2022. 5. 16. 13:01
인공지능/computer vision
UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS (2016) 개요 GAN의 불안정한 구조를 개선하고, 벡터 산술 연산을 가능케 함 기존 GAN의 한계 불안정성 (그다지 좋지 않은 성능) 블랙박스 (어떻게 이러한 결과가 나왔는지 알 수가 없음) 생성모델 평가 (성능을 어떻게 평가할지 정량적 기준이 없음) 안정적인 DCGAN을 위한 아키텍처 가이드라인 - 식별기의 경우 pooling 레이어를 strided convolutions로 대체하고, 생성기의 경우 fractional-strided convolutions로 대체한다 - 식별기와 생성기 모두 batchnorm을 사용한다 - 더 깊은 아키..
GAN 이해하기
2022. 5. 15. 23:38
인공지능/computer vision
Generative Adversarial Nets(GAN) 논문 번역 및 요약 초록 우리는 적대적인 생성 모델을 추정하는 새로운 프레임워크를 제안한다. 여기서 두 모델을 동시에 학습시키는데, 하나는 데이터의 분포를 따라잡는 생성 모델 G 그리고 어떤 샘플이 G가 아니라 학습 데이터에 속할 확률을 계산하는 구별 모델 D이다. G는 D가 잘못 구별하는 확률을 최대화하도록 학습된다. 이 프레임워크는 두 플레이어가 참여하는 최대최소(minimax) 게임과 상응한다. G와 D가 임의적으로 기능하는 공간에서 유일한 해(unique solution)가 존재한다. 이때 G가 학습 데이터의 분포를 찾아내며 D의 확률은 어디서든 50%가 된다. G와 D가 다중레이어 퍼셉트론으로 정의될 때, 모든 시스템이 역전파로 학습될 ..
distinctive image features from scale-invariant keypoints
2022. 5. 11. 18:49
인공지능/computer vision
논문 읽기
Vanishing Points; How to Compute Camera Orientation
2022. 5. 11. 14:35
인공지능/pose estimation
camera projection matrix : 3D space의 point --> 2D image plane 변환 모두 동차좌표계로 나타냄 변환의 두 factor : camera rotation & translation, pixel transformation/camera calibration matrix K " 사진을 바라보되, 단순히 2D 이미지가 아니라 사람 앞에 카메라가 놓여 있다고 생각. 사람은 picture를 통해서 세상을 바라고 보고 있음. 2D plane의 점들에 있어서, 카메라맨과 그 점 사이에 선을 형성함. 그 ray는 3D space 에서 ray를 형성하고, 그 ray 의 집합은 physical space 의 평행선 집합에 해당하며, 무한대의 동일한 지점에 모두 수렴함. 그 무한대 점..