빈닥스 — 빈닥스

2024.10.19· AI/데이터과학

본 포스팅은 충남대 이종률 교수님의 강의자료를 바탕으로 작성한 글입니다.Box and whisker plot양적 변수에 대한 그래프!First or lower quartile은 25%, Second quartile은 50%, Third or Upper quartile은 75%따라서 First & Third quartile은 항상 middle 50%의 데이터를 포함하고 있다.데이터 분포를 볼 때 자주 쓰이는 box plot의 IQR은, Q3-Q1로 계산된다. 여기서 Whiskers는 이상치 기준선을 나타내는데, Q1-1.5*IQR 부분과 Q3+1.5*IQR 부분을 말한다.이 Whisker를 넘어가는 부분을 이상치로 정한다. HistogramRug plot을 아는가? 이는 1차원 데이터를 쭉 나열한 그래프라..

정규표현식 (Regular Expression)

2024.10.19· AI/데이터과학

본 포스팅은 충남대 이종률 교수님의 강의자료를 바탕으로 작성한 글입니다. 정규표현식은 어떤 문장에서 특정한 형태의 문자열을 뽑고 싶을 때 사용하는 것이다.여러 방식이 있으니, 추출하려는 문자열의 특징을 잘 파악해서 사용해야 한다. [표 정리]//Re pattern/[abcd]대괄호 안의 문자들 중 하나++ 앞의 문자를 하나 이상gGlobally match^^ 뒤의 문자로 시작되는 문자열$$ 앞의 문자로 끝나는 문자열?? 앞의 문자가 하나 또는 없음** 앞의 문자가 없거나 그 이상a|ba 또는 b()()안의 문자들을 그룹으로 처리()()괄호 그룹의 집합.어떤 문자든 하나\s공백\S공백 아닌 문자[^abcd]abcd가 아닌[a-z0-9가-힣]저 범위의 문자들 [실습]이런 다양한 정규표현식을 사용하려면, r..

회귀분석의 기초

2024.10.17· 통계/회귀

"회귀"란?지도학습 중 하나로, 입력과 출력이 주어지면 이를 바탕으로 수치값을 예측하는 모델을 만들어내는 것이다. 예를 들어, 아래와 같은 데이터가 주어졌다면 x값이 7일 때 y값은 어떤 수에 가장 근사할까? 내 생각에는 아무래도 y는 15가 될 것 같다. 물론 아닐 수도 있지만 말이다. 이처럼 x와 y가 주어졌을 때 이 데이터를 가장 잘 나타내는 선을 찾는 것이 회귀라고 할 수 있다.여기서 입력인 x는 독립변수, Input, feature라고 불리기도 하고,출력인 y는 종속변수, Output, Response라고 불리기도 한다. 그럼 이 회귀식은 어떻게 표현할 수 있느냐 하면, 우선 파라미터들이 필요하다.가장 단순한 선형회귀식을 생각해보자.위의 그래프의 데이터들로 회귀식을 만들어본다면, 이렇게 나타내는..

[TIL] 2024-10-17

2024.10.17· TIL

오늘은 강화학습 공부를 했다..그냥 막 요약했을 땐 머리에 들어오지 않았는데, 블로그에 정리하면서 차근차근 이해하니 이해가 조금 된다.내일은 벨만 방정식이랑 DP를 정리할 것이다.그리고 데이터과학 공부!2024.10.16 - [AI/강화학습] - Markov Decision Process

Value function & Bellman equation

2024.10.17· AI/강화학습

2024.10.16 - [AI/강화학습] - Markov Decision Process Markov Decision Process본 포스팅은 충남대 김현 교수님의 강의자료를 바탕으로 쓴 글입니다. 우선 MDP를 들어가기에 앞서, 간단히 강화학습이 무엇인지 알아보고자 한다. 강화학습이란 에이전트(A)가 어떤 환경(S)에bin-dax.tistory.com강화학습의 기초 내용과 MDP에 관한 내용이 담긴 글이다. 본 포스팅은 충남대 김현 교수님의 강의자료를 바탕으로 쓴 글입니다. 환경에 대한 모델, MDP 모델을 아는 상태에서 이 환경 모델을 이용해 최선의 정책을 찾는 것은 계획이다.환경을 모를 때 s에서 a를 취해보고 정보를 얻어 환경과 지속적으로 상호작용하며 최선의 정책을 찾는 것은 강화학습이다. 1. ..

Markov Decision Process

2024.10.16· AI/강화학습

본 포스팅은 충남대 김현 교수님의 강의자료를 바탕으로 쓴 글입니다. 우선 MDP를 들어가기에 앞서, 간단히 강화학습이 무엇인지 알아보고자 한다. 강화학습이란 에이전트(A)가 어떤 환경(S)에서 누적보상(return)을 최대화할 수 있도록 행동(A)을 취하는 순차적 의사결정 문제를 해결하는 학습방법이다.이 과정은 1. 환경을 관찰하고, 2. 관찰된 환경으로부터 현재 상태를 알아낸 후, 3. 최선의 행동을 결정하고, 4. 결과(보상)를 확인한 후, 5. 상태 정보를 변경하는 순서로 이루어진다. 행동을 취하게 되는 두 가지 방법이 있는데, 활용(Exploitation)과 탐색(Exploration)이다.활용은 알고 있는 정보를 활용해 최선의 행동을 하는 것이고, 탐색은 알려지지 않은 행동을 시도해 새로운 경험..

블록체인의 본질

2024.09.06· 정보보안

본 포스팅은 를 읽고 작성한 포스트입니다. 가치 네트워크[블록체인 이전]가치의 전달을 위해 대면 거래 or 은행 거래 (불편)특히, 해외로 거래를 하려면 더 불편함 (추가 정보, 수수료 up) [블록체인 이후]거래자의 위치가 어디든 '블록체인 지갑 주소'만 안다면 빠르고 저렴하게 가치 전달 가능 블록체인에서는 누구나 가치를 생산(채굴, 스팀잇)할 수 있고, 가치를 전달할 수 있고, 소비할 수 있다. NFT란?디지털 가치의 일종이다. 디지털 '아트'로, 블록체인이 아닌 외부 서버에 저장된 영상 혹은 동영상을 인증하는 인증서 역할을 블록체인이 수행하게 된다. 이 그림이 얼마나 예술적인지.. 이러한 가치는 따지지 않으며, '상징성'을 중요시한다. 예를 들어, NFT가 막 생겨나기 시작할 때의 컬렉션을 가지고..

"블록체인"이란?

2024.09.04· 정보보안

본 포스팅은 를 읽고 작성한 포스트입니다. 해시함수블록체인에 대해 설명하기 전에, 해시함수를 먼저 소개하려 한다.블록체인을 이해하기 위해 꼭 필요한 함수이다. 평범한 함수를 생각해보자. 예를 들어 f(x) = 2x+3 이라는 함수가 있다고 하자.x에 100을 넣으면, 출력값이 203이라는 것은 당연하게 알 수 있다.또한, 주어진 함수가 f(x)이고, 출력값이 203이라는 사실을 알면, x의 값이 100이라는 사실도 추론할 수 있다. 보안을 생각한다면, 만약 내가 어떤 사이트의 비밀번호를 1234로 입력하였는데,그 사이트에서 모든 사람의 비밀번호를 저장할 때 g(x) = x+3 이라는 함수를 사용하여 저장한다면,해킹하고자 하는 사람들은 이 저장값만 보고 입력값을 바로 추론해낼 수 있을 것이다.그런 위험한..

전체 글

티스토리툴바