AI

WWW를 그래프 G=(V, E)를 표현해보자웹 페이지를 정점(vertex)으로, 하이퍼링크를 간선(edge)으로 표현한다.만약 페이지 v1이 페이지 v2에 대한 하이퍼링크를 가지고 있다면 E는 엣지 (v1, v2)를 가지고 있다.만약 특정 페이지 v에 outgoing 링크가 없다면, E에 self-loop (v, v) - 자기 자신으로 가는 간선을 추가한다. 랜덤 서핑 알고리즘1. 초기 페이지 u에서 시작하는데, 우리가 방문하고 있는 페이지이다.2. 동전을 던져 앞면이 나오는 확률을 alpha라 한다.3. 만약 앞면이 나왔다면, u의 랜덤한 아웃링크를 따라서 다음 페이지로 이동한다.4. 만약 뒷면이 나왔다면, 그래프의 임의의 페이지로 이동한다. -> 이걸 리셋이라고 한다.5. step 1에서부터 다시 반..
본 포스팅은 충남대 이종률 교수님의 강의자료를 바탕으로 작성한 글입니다.Artificial Neuronsummation+activationInput이 들어오면 가중치가 곱해진 후 summation unit을 통과하게 되고, 활성화함수를 통과하게 된다.  AND나 OR는 linearly separable하지만, XOR는 그게 안 된다.그럼 이제 더 많은 뉴런이 필요하게 된다. 보통 신경망은 각각 여러 뉴런을 포함하는 층으로 구성되고,각 레이어는 입력 벡터, 가중치 행렬, 편향 벡터, 출력 벡터와 연결된다. 보통 근사 이론은 유한한 수의 가중치를 가진 최소 1개의 은닉층을 가진 신경망에 의해 잘 근사될 수 있다. 딥러닝은 어떻게 작동하느냐 하면,Training- 모델의 가중치 파라미터를 계산해서 학습 오류를..
본 포스팅은 충남대 이종률 교수님의 강의자료를 바탕으로 작성한 글입니다. Vector Space Model concept 벡터로 문서를 나타내는 법- 각 concept는 하나의 차원을 정의한다.- k concept는 높은 차원의 공간을 정의한다.- 벡터의 요소는 concept 가중치에 해당한다.이 concept 공간에서의 벡터간 거리는 문서간 관계를 나타낸다. 뭐 만약 축이 스포츠, 교육, 금융 이라면 (주제) 각 문서가 투영되는 것을 통해 그 문서는 어느 주제에 관련있는지 볼 수 있다.이런 식으로 말이다. 근데 이제 이 VS모델이 나타내지 않는 것이 있는데, 그게 뭐냐면- 기본 컨셉을 어떻게 잡는가 (concept은 직교하는 것으로 가정)- 가중치를 어떻게 할당하는가 (가중치는 concept이 문서를 ..
본 포스팅은 충남대 이종률 교수님의 강의자료를 바탕으로 작성한 글입니다.되게 간단하게 분류하는 모델이다.질문에 대한 답변으로 분류하는 것!예를 들어,동물인가요? yes다리가 몇 개인가요? 2무슨색인가요? white 요런식으로.. 분류함! 이제부터는 이 결정트리에 대해 Iris flower data set을 이용해볼 것이다.여기서 설명변수는 petal length, petal width, sepal length, sepal width가 있다.그리고 목표는 다른 데이터에 대해 종을 구별해내는 것이다. target = species(versicolor, setosa, virginica) 단지 분포표만을 보고도 dt를 생성할 수 있다.이렇게 말이다.위처럼 non-linear하게 나타낼 수 있어서 logistic..
· AI/대회
이건 데이터과학 수업에서 텀프로 진행한 대회이다. 난 데과가 너무 좋기 때문에!!! 정말 열심히 하려고 했다.LLM이랑 물가 예측 이렇게 두 주제 중에 골라서 프로젝트를 진행하는 것인데, 난 이 주제를 선정했다. https://dacon.io/competitions/official/236381/overview/description 데이터·AI를 활용한 물가 예측 경진대회 : 농산물 가격을 중심으로 - DACON분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.dacon.io 1. 문제정의&데이터이건 대회에서 해줫다 ㅎ여러 판매가(공판가, 도매가 등..)을 가지고 미래 이 농산물의 가격을 예측하는 문제. 2. 전처리이게 전처리를 안 하고 모델만 바꿔서 돌려보니.. 성능이 에바였다...
본 포스팅은 충남대 이종률 교수님의 강의자료를 바탕으로 작성한 글입니다.다중 선형 회귀feature가 여러 개인 것! 그리고 feature 수가 p개면 parameter 수는 p+1개. 회귀식에 상수항까지 있기 때문에 +1 모델링 과정은 전에도 말했듯,1. 모델을 고르고, 2. 손실 함수를 고르고, 3. 모델을 적합시키고, 4. 모델 성능을 평가하면 된다.보통 통계에선 1&2과정을 통틀어 OLS(Ordinary Least Squares)라 한다. 1. 모델 고르기우선 이 데이터들을 벡터 형태로 나타낼 건데, 상수항까지 고려해서y_hat = [1, x_1, x_2, ..., x_p] .T * [o_0, o_1, o_2, ..., o_p] 이렇게 나타낼 수 있다!그리고 저 측정값들이 여러 개일 테니, 그들을..
본 포스팅은 충남대 고영준 교수님의 강의자료를 바탕으로 작성한 글입니다. 컴퓨터비전의 task로는, 분류 / semantic segmentation / object detection이 있다.semantic segmentation은 픽셀을 객체별로 구분하는 것이다. Segmentation의미있는 단위로 나누는 작업. 약간의 모호함이 있다. super pixel은 픽셀단위로 나누는 것은 너무 오래 걸리기에, 경계선을 기준으로 픽셀을 뭉쳐준다.그렇게 뭉쳐진 집합이 super pixel이고, 그걸 하나의 node로, 픽셀처럼 사용한다. image segmentation은 비슷한 색/형태가 합쳐진다. 모호하긴 하지만, 최대한 경계선끼리는 안 합쳐지도록 한다. 그리고 뭐 video segmentation, cont..
컴퓨터 비전에서 가장 핵심 과업은 '이미지 분류'이다.일단 이미지와 라벨에 대한 데이터를 모으고, 머신러닝으로 분류기를 훈련시킨 후,테스트 이미지들을 분류한 것에 대한 평가를 진행한다. training 단계에서는 training set을 입력으로 받아 feature를 추출한 후, 그 set의 label들을 feature와 함께 입력받아 분류기의 학습을 진행한다.이후 결과를 낸 것이 학습된 분류기이다. testing 단계에서는 test set을 입력으로 받아 feature를 추출한 후,label을 제외하고, training 단계에서 학습된 분류기에 feature만을 넣은 후,그 feature에 대한 예측을 출력한다.  ConvNet이건 Convolution Layer로 이루어진 모델이다.원래의 1차원 벡터..
김다빈다
'AI' 카테고리의 글 목록 (2 Page)