용어정리
Visual QnA(VQA)
이미지에 관한 질문에 대답을 생성하는 딥러닝 기술. 이미지 이해 + 질문 의도 파악 -> 적절한 대답 생성.
필요 모델 : 비전모델(이미지 이해 - 이미지 객체, 색상, 형태 이해. 이미지 특징 추출, 중요 객체/영역 식별)
, 언어모델(질문 이해, 답변 생성)
출처 : 도시공원 운영 및 관리를 위한 VQA 딥러닝 기술 활용 연구 - SNS 이미지 분석을 중심으로, 서울시립대 조경학과 이다연, 박서은, 이재호
MixUp(최적화 알고리즘)
이미지 쌍 사이의 보간(어떠한 데이터들 사이에서 새로운 지점을 선택하는 법.)을 이용해 새로운 train 이미지를 생성하는 것.
nn의 견고성&부드러움 향상시킴.
지도학습에서, mixup은 리스크 최소화에 인접한 nn의 일반화를 향상시킨다.
이는, 원본 이미지 쌍들의 convex한 결합 형태에서 생성된 가상의 이미지들을 사용하는 training 영상 사이의 간단한 선형 행동을 캡처하려는 nn을 정규화함으로써 성취 가능.
출처 : 위키피디아, Mixup-based regularization for self-supervised learning, 양유진
encoder, decoder
인코더 : '부호화'를 수행하는 장치나 회로, SW, 알고리즘.여기서 '부호화' 란, 컴퓨터로 영상/이미지/소리 데이터를 생성할 때 데이터 양을 줄이기 위해 <데이터를 코드화하고 압축>하는 것.
디코더 : '복호화'를 수행하는 장치나 회로, SW, 알고리즘.
여기서 '복호화'란, 부호화(인코딩)된 정보를 부호화 전의 상태로 되돌리는 처리(방식). 보통 부호화 절차의 역방향.
ex)
동영상 파일 압축을 위해, 원본인 압축되지 않은 파일을 압축 알고리즘으로 변환(인코더)했다가 압축을 푼다(디코더).
통신보안을 위해, 원본인 암호화되지 않은 신호를 암호화(인코더)했다가 암호해제로 원래 신호로 변환(디코더)한다.
출처 : 위키피디아
내적(유사도 관련)
벡터의 유사도를 설명하려는 개념 - 벡터의 크기, 두 벡터 사이 거리, 벡터 내적
벡터, 행렬 사이 유사도
문제 1. 파이썬의 대표적 시각화 도구 라이브러리인 matplotlib의 기본 사용법에 대해 숙지하고, matplotlib에서 사용되는 여러 graph들에 대해 조사해 보고, 해당 graph들에 어느 데이터가 실무에서 적합하게 쓰일지 조사해 보자.
[작성 시 유의 사항]
matplotlib 설명
- matplotlib 기본적인 사용법 숙지
- matplotlib graph들의 특징
- 실무에서 해당 graph에 사용되는 데이터 파악
문제 2. 벡터의 노름은 데이터를 정제하는 방법 중 정규화(Normalization), 규제(Regularization) 등에서 유용하게 쓰여진다. 벡터의 노름의 구조와 개념에 대해 더 자세히 알아보고 머신러닝 분야에서 어떻게 쓰이는지 자세히 알아보자.
또한, L1 노름과 L2 노름이 머신러닝 분야에서 어떤 차이점을 가지고 사용되는지에 대해 비교 분석해보자.
[작성 시 유의 사항]
- 노름의 개념 숙지
- L1 노름과 L2 노름의 차이점 비교 분석
'스터디' 카테고리의 다른 글
Pandas - 파이썬으로 데이터 처리 (0) | 2024.06.01 |
---|---|
차원의 저주 - 1주차 (0) | 2024.05.24 |