본문 바로가기

분류 전체보기

Time Series Analysis 6 - Double Exponential Smoothing 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc433.htm Double exponential smoothing은 2개의 상수를 사용해서, 트렌트를 다루는데 더 좋은 성능을 낸다. 이전장에서 본것과 같이, Single Smoothing 은 트렌드가 있을때 다음에 올 데이터를 잘 예측하지 못한다. 이 상황은 와의 결합에서 선택 되어야만 하는 두번째 상수를 두번째 방정식에 도입함으로써 향상될 수 있다. 밑에 Double Exponential Smoothing과 결 합한 두개의 방정식들이 있다. 시계열의 현재값이 Double exponential smoothing에서 이것의 Smoothing 된 값을 계산하기 위해 사용된다는 것을 주목해라. 1. .. 더보기
Time Series Analysis 5 - Forecasting with Single Exponential Smoothing 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc432.htm 예측(Forecasting) 공식은 다음 point를 예측하는 공식으로 일반식은 다음과 같다. 위 식을 다시 정리하면 다음과 같이 나타낼 수 있다. 이 식의 해석은 t+1기의 예측은 t기 예측치 더하기 조정오차이다. 여기서 는 t 시점에대한 예측오차(실제-예측)를 말한다. 1. Bootstrapping of Forecast 만약 당신이 어떤 origin(주로 바로 이전기(t)의 데이터포인트)에서 forecast를 하려하고 실제 관찰치들이 없다면, 어떠한 일이 벌어질까? 이 상황에서, 우리는 일반식을 다음과 같이 수정해야 한다. 은 상수이다. 바로 이 기법이 우리에게 bootstrap.. 더보기
Time Series Analysis 4 - Single Exponential Smoothing 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc431.htm Exponential Smoothing(ES)는 미래의 값을 예측하기 위해 과거의 데이터로 갈수록 가중치를 지수적으로 줄여 할당한다.이 smoothing 체계는 를 에 설정하는것으로 시작한다. 여기서 는 Smoothed 된 관찰치 혹은 EWMA(Exponentially Weighted Moving Average)를 나타낸다. 그리고 는 본래의 관찰치를 나타낸다. 밑수는 시기(time periods)를 나타낸다. (1,2,3,...n). 예를 3번째 시기는, 로 나타낼 수 있다. 은 없다. 그 이유는 Smooth된 시계열은 두번째 관찰치가 Smooth 된 것으로 시작하기 때문이다. (.. 더보기
Time Series Analysis 3 - What is Exponential Smoothing? 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc43.htm 이것은 smoothing 한 시계열을 생성하는데 매우 인기있는 scheme 이다. 단순 MA에서 과거의 관찰치들에 가중치를 일정하게 준 반면, Exponential Smoothing은 관찰치가 시점이 더 오래된 것일수록 가중치를 지수적 감소시킨다. 다르게 말하면, 최근 관찰치들은 더 오래된 관찰치들보다 예측에서 상대적으로 더 많은 가중치가 주어진다. MA의 경우에서, 관찰치들에 할당되는 가중치들은 1/N로 같다. 그러나 exponential smoothing에서는 결정 혹은 측정되어야 할 한개 혹은 그 이상의 Smoothing parameter들에 있다. 이 parameter들의 결정.. 더보기
Time Series Analysis 2- Single/Centered Moving Average and Double Moving Averages for a Linear Trend Process 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc422.htm 1. Single Moving Average 과거 데이터를 요약하는 다른 방법은, 다음과 같이 과거 데이터에 대한 연속적인 작은 집합들의 평균으로 계산하는 방법이다. 임의로 선택한 12개의 납품업체들의 비용크기인 9 ,8 ,9 ,12 ,9 ,12 ,11 ,7 ,13 ,9 ,11 ,10 인 한 데이터집합을 기억해보자.작은 집합의 사이즈를 나타내는 M을 3으로 설정하자(마치 SGD 에서 Mini-batch 방식을 하는것과 같은 방식). 그러면 처음 3개 숫자의 평균은 (9+8+9) / 3 = 8.667 이 된다. 이것을 우리는 Smoothing 이라고 한다. (즉 평균의 어떤 형태) 이.. 더보기
Time Series Analysis1 - What are Moving Average or Smoothing Techniques? 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc42.htmMoving Average 또는 Smoothing Techniques 가 무엇인가? 어떠한 형식의 불규칙한 변동은 시간에 따른 데이터집합에서 내재적인 것이다. 이러한 불규칙한 변동 때문에 본래의 효과가 줄어드는것을 막아주는 방법들이 존재하는데, 이것이 Smoothing 이다. 적절하게 적용이 되었을때, 이 테크닉은 기저에 있는 트랜드나 계절성 혹은 주기성 요소들을 더 명확하게 나타내도록 해준다.이러한 Smoothing 방법들에는 크게 2가지 그룹으로 나뉜다. Averaging MethodsExponential Smoothing Methods 먼저 averaging methods에 관해 .. 더보기
Time Series Analysis 0 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc41.htm 시계열의 정의 : 일정한 크기의 시간구간에 한 변수값의 순차적인 연속을 말함. 적용 : 시계열모델의 사용은 2가지로 나뉜다.관찰데이터를 생성하는 구조와 기저에 있는 어떠한 힘들의 이해를 얻는것모델을 적합시켜 예측, 모니터링 혹은 Feedback 과 Feedforward 조절을 하는데 사용된다. 시계열 분석은 주로 산업분야 데이터를 볼때 자주 사용되는데 다음의 분야들에서 사용된다. 경제예측수요(판매)예측예산예측주식시장예측미래산출량예측Process and Quality Control재고조사미래작업량예측공익사업연구전수조사분석 그리고 등등 많은 예측 시계열들에 사용되는 방법들이 있다. 사실 .. 더보기
Time Series Analysis - White noise & Stationary Time Series 1. White Noise White Noise 라는건 Uncontrolable variable 즉 회귀식에서 설명되지 않은 Error의 의미와 유사하다고 볼 수 있다. 시계열에서 White Noise가 통계적 분석이 가능하기 위해서는 몇가지 가정이 필요하다. 1. 특정시점의 데이터와 관련이 없다. 즉 비상관(Uncorrelated)성을 가진다. 식으로 나타내면 이렇게 센터링을 하고 로 나타낼 수 있다. 이렇게 서로 다른 두시간(t,s) 사이에서는 관계가 없다고 본다. 반대로 당연하게도 자기자신과는 1의 공분산,상관관계를 가질 것이다. 2. White noise를 모든 데이터에서 관측했다면 이것의 평균은 0이다.3. 즉 t에 대해서는 상수이다. 이는 특정시점이 아닌 모든 시점에서 분산은 일정해야 한다는 .. 더보기
[강화학습 기반의 자율적인 행동 학습] 링크 : http://www.gameai.net/Article/RLAgent/RLAgent.htm 더보기
SVM (Support Vector Machine) Part 2 3. 슬랙변수를 가진 SVM (혹은 Soft Margin SVM) 위 그림과 같이 학습데이터가 선형분리 가능한 경우에 대해 알아보자. 위 처럼 선형분리가 되지 않고 잘못 분류되는 데이터가 존재하는데 이를 처리하기 위해 먼저 잘못 분류된 데이터로부터 해당 클래스의 결정 경계까지의 거리를 나타내는 슬랙변수를 도입한다. 위 조건은 해당 클래스(+ 또는 -)에 속하는 모든 데이터들은 엄격하게 +또는 -평면보다 윗부분 혹은 아랫부분에 존재해야 한다는 것임에 반해, 슬랙변수를 추가함으로써 클래스에 속하는 데이터가 플러스(마이너스)평면보다 만큼 아래(윗)부분에 존재할 수 있도록 허용하게 된다. 따라서 이 클수록 더 심한 오분류를 허용함을 의미한다. 이러한 의미를 가진 슬랙변수를 추가한 분류조건을 통합하여 나타낸 식이.. 더보기