AI

segmentation method - K-means clustering - Mean shift - Normalized_cut - Graph cut - Random_walk - Markov random field (MRF) optimization Semantic segmentation : 이미지를 분류대로 색으로 나눠서 새로운 그림으로 나타냄. 차는 다 차로, 사람은 다 사람으로..Instance segmentation : 그림 위에 인식된 사물들을 색깔로 덮어서 객체별로 표현. 배경은 따로 인식하지 않음Panoptic segmentation : 위 두 개를 합친 건데, 배경까지 전부 다 나누는데(배경들은 따로 나누지 않음. 예를 들어 나무는 그냥 다 나무), 객체는 따로 분리. ex)사람1, 사람2, ..
Binary image : threshold 정해서 그 값보다 크면 흰색, 작으면 검정색으로 정함 Neighborhoods4-neighborhood : 양, 옆, 위, 아래 이렇게 네 방향으로 갈 수 있음. 8-neighborhood : 4-neighborhood연산에, 대각선 방향까지 합함.24-neighborhood : 만약.. 한 칸 정도 물리적으로 떨어져있어도, 그냥 연결됐다고 봄.. connected component : 연결 가능한 모든 원소를 포함하는 배열.connected component labeling : 연결된 애들끼리는 같은 분류로. Morphology 방식들1. TranslationB는 이진 이미지의 픽셀 집합인데, 벡터인 t = (u, v)에 따라 그 이진 이미지 B를 움직이는 ..
윤곽선 추출해내기! 윤곽선이 머냐? pixel을 봤을 때, 날카롭게 각진 애들이다.이걸 어떻게 찾아내지?이미지의 픽셀값을 그래프로 나타냈을 때, 값이 급격히 변하는 부분이 있다. 근데 이걸 정확히 구하려면?한 번 미분하면, 그 변하는 구간에서 극값이 발생함. 이거로 윤곽선 찾기 가능. 근데.. 이 이미지를 어떻게 미분할 것이냐.. 그건 너무 복잡하잖아잘 생각해보면, 미분은 어떤 식이냐면, 원랜 이런 식임. 근데 얠 좀만 더 변형해보면,   이렇게 쓰기도 함. 그렇담 이 식에서, 만약 h에 2를 넣는다면?  이렇게 됩니당. 근데 이걸 벡터의 곱으로 표현할 수 있단 사실..  어떻게냐면, 이제 x, x-1, x+1값이 있음. 그럼 이 좌표들의 값은 각각 f(x), f(x-1), f(x+1)일 것임.순서대로 ..
downsampling몇 개의 행/열 버림.-> pixelated Aliasingsample 조금만 선택하면, 정보가 손실된다.결국 혼란스러워질 수 있다. 왜냐면, 빈도가 많은 픽셀이 빈도가 적은 것처럼 보일 수도 있다.또, 약간 깨져보임 Anti-aliasing1. signal을 oversample하기. 하지만 이건 내가 하기엔 어려움.2. signal을 smooth하기. signal을 픽셀값이라고 생각하기.-> smoothing을 먼저 하고, 픽셀값 날려버리면 부드럽고 뿌옇게 흐려진다.그냥 짝수 행/열 삭제하는 것보다 filter 적용해 smoothing하고 삭제하는 것이 훨씬 부드럽게 됨.  어떤 이미지를 1/7로 줄이려면, 7*7 pixel 중 하나의 픽셀만 고르면 된다.가운데 픽셀 고르는 것이 ..
Linear filtersfilter의 값들과 선형결합으로 주어진 식을 픽셀 값으로 사용하는 경우를 말한다.근데, 이미지에 필터를 씌워서 계산하면, 결과적으로 가장자리가 빈다. 이러한 가장자리 값들을 구하고 싶다면? 특별한 filter가 있는데, important intuition이다.특정 모양의 filter가 있으면, 그 filter를 순회시키면서 가장 필터와 비슷한 영역을 찾아내는 것.그 필터를 convolution kernel이라 하고, 그 결과를 convolution output이라 하는데,convolution output의 값은, 필터와 비슷한 영역이 가장 높고, 안 비슷하면 낮다. padding을 하면 된다! 이미지 밖에 new값들을 만들어주는 것.보통 zero 패딩을 하는데, 여러 종류가 있..
영상 센서는, 물체의 빛의 양을 캡처한다.CCD camera (Global)High-end DSLR camera동일 시간에 모든 줄을 읽어들인다. CMOS camera (rolling)Smartphone각 줄(행)마다 읽어들이는 시간이 다르다.--> 건물은 가만히 있고, 카메라만 양옆으로 흔들어도, 위아래 시간대가 달라서 건물이 움직여보인다! 이미지를 표현하는 가장 작은 단위가 픽셀인데,좌표는 모두 정수이다.만약, 0~255 사이의 값이라면 픽셀값은 정수이고,0~1 사이의 값이라면 픽셀값은 실수이다.둘 중, 0~255 사이의 값으로 표현하는 방식이 더 정확하다. Sampling, Quantization이미지에서 정수 좌표들을 뽑아내는 것.예를 들어, 어떤 이미지에서 한 선을 추출해서, 그 선을 이동하면서..
기계학습은 지도학습/비지도학습/강화학습으로 나뉜다. 강화학습이란?에이전트가 환경과 상호작용하며 보상을 최대화하는 행동전략을 학습하는 방법론.기계학습+최적화 -> 에이전트가 목표 달성 위해 스스로 학습정답으로부터 학습하는 게 아니라, 보상을 통해 학습함.즉각적인 응답이 오지 않는 경우도 많다. 피드백이 때때로 지연돼서 부여.시간 혹은 순서가 중요.에이전트의 행동이 이후 환경으로부터 받게 될 데이터에 영향 미칠 수 있음.  - 헬리콥터의 스턴트 비행 - 체스, 바둑 등 보드게임 - 투자 포트폴리오 관리 - 휴머노이드 로봇의 보행 RL(강화학습)의 요소1. 보상숫자로 주어지는 피드백 신호. t시점의 보상은 Rt"에이전트가 t 시점에 얼마나 잘하고 있는지"그냥 t시점 바로 다음의 보상을 의미함.--> 누적 보상..
최적화란?주어진 문제에 가능한 방법/해답 중 가장 좋은 방법 찾는 과정.어떻게 가장 좋은지 아냐?- 얼마나 좋은지 수치적으로 측정할 수 있어야 하고, 내가 사용할 수 있는 방법/해답을 변수화해야 한다.[주요 요소]- 목적함수, 제약조건, 변수  - 문제 예시knapsack problem주어진 물건의 무게/가치, 배낭의 수용 가능 무게가 주어졌을 때, 가방에 물건을 어떻게 담는 것이 좋을지 찾아보는 문제 traveling salesman problem이동 경로의 최소화. 한 번 방문하면 그이상 방문 불가. 등등..의 제약조건  전역(Optimal) 최적해 vs 지역(Local) 최적해전역 : 문제의 모든 상황을 고려했을 때 가장! 최고의 해지역 : 특정 구간에서만 최고의 해 탐색 공간 해를 찾기 위해 알고..
김다빈다
'AI' 카테고리의 글 목록 (6 Page)