본문 바로가기

Statistics

Time Series Analysis 9 - Example of Triple Exponential Smoothing 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc436.htm 이 예제는 single, double 그리고 triple exponential smoothing을 비교한 예제이다. 다음 데이터셋은 24개의 관찰치가 있고, 분기 데이터 6년치가 있다 (각 년도마다 4분기를 가진다). 컴퓨터가 각 Smoothing 방법들로 MSE를 최소화하는 방향으로 계수를 업데이트하고 있다. 1. Example of the computaion of the Initial Trend 데이터셋은 분기별 판매 데이터로 구성됐다. 1번째 season이고, 각 연차마다 4분기이기 때문에, L=4이다. 따라서 다음과 같은 식을 얻는다. 2. Example of the comp.. 더보기
Time Series Analysis 8 - Triple Exponential Smoothing 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc435.htm 그렇다면 trend와 seasonality가 있다면 어떻게 할것인가? 이러한 경우에는 smoothing이 작동하지 않을것이다. 따라서 seasonality(또는 periodicity라고도 함)를 다루기 위해서는 3번째 파라미터를 도입해야 한다. 이 방정식을 우리는 발명가의 이름을 따 Holt-Winters(HW) 방법이라고 부른다. 기본적인 방정식은 아래와 같다. 는 관찰치는 Smoothing된 관찰치는 트렌드요소는 계절성 지수(seasonal index)는 m 기후의 예측치는 시간주기를 가리킨다.그리고 그리고 는 상수이다. 이 상수들은 MSE를 최소화해주는 방식으로 측정되어야만 한.. 더보기
Time Series Analysis 7 - Forecasting with Double Exponential Smoothing(LASP) 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc434.htm Forecasting 식은 다음과 같다.1기 예측 은 m기 예측은 1. Example 데이터가 다음과 같다고 가정하자. 이제 우리는 그리고 인 double smoothing model을 적용할 것이다. 본래의 시기와 한 period 앞의 시기를 시계열에서 비교할때, 가능한 가장 낮은 MSE가 측정된 예측치들이 있다. 왜냐하면 이 double exponential smoothing은 smoothing된 값을 계산하기 위해, 현재의 값을 사용하기 때문에, smoothed series들은 최소 MSE를 가진 를 정할 수없다. 즉 이전기의 Smoothing값이 없기때문에 계산을 못한다는 것.. 더보기
Time Series Analysis 6 - Double Exponential Smoothing 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc433.htm Double exponential smoothing은 2개의 상수를 사용해서, 트렌트를 다루는데 더 좋은 성능을 낸다. 이전장에서 본것과 같이, Single Smoothing 은 트렌드가 있을때 다음에 올 데이터를 잘 예측하지 못한다. 이 상황은 와의 결합에서 선택 되어야만 하는 두번째 상수를 두번째 방정식에 도입함으로써 향상될 수 있다. 밑에 Double Exponential Smoothing과 결 합한 두개의 방정식들이 있다. 시계열의 현재값이 Double exponential smoothing에서 이것의 Smoothing 된 값을 계산하기 위해 사용된다는 것을 주목해라. 1. .. 더보기
Time Series Analysis 5 - Forecasting with Single Exponential Smoothing 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc432.htm 예측(Forecasting) 공식은 다음 point를 예측하는 공식으로 일반식은 다음과 같다. 위 식을 다시 정리하면 다음과 같이 나타낼 수 있다. 이 식의 해석은 t+1기의 예측은 t기 예측치 더하기 조정오차이다. 여기서 는 t 시점에대한 예측오차(실제-예측)를 말한다. 1. Bootstrapping of Forecast 만약 당신이 어떤 origin(주로 바로 이전기(t)의 데이터포인트)에서 forecast를 하려하고 실제 관찰치들이 없다면, 어떠한 일이 벌어질까? 이 상황에서, 우리는 일반식을 다음과 같이 수정해야 한다. 은 상수이다. 바로 이 기법이 우리에게 bootstrap.. 더보기
Time Series Analysis 4 - Single Exponential Smoothing 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc431.htm Exponential Smoothing(ES)는 미래의 값을 예측하기 위해 과거의 데이터로 갈수록 가중치를 지수적으로 줄여 할당한다.이 smoothing 체계는 를 에 설정하는것으로 시작한다. 여기서 는 Smoothed 된 관찰치 혹은 EWMA(Exponentially Weighted Moving Average)를 나타낸다. 그리고 는 본래의 관찰치를 나타낸다. 밑수는 시기(time periods)를 나타낸다. (1,2,3,...n). 예를 3번째 시기는, 로 나타낼 수 있다. 은 없다. 그 이유는 Smooth된 시계열은 두번째 관찰치가 Smooth 된 것으로 시작하기 때문이다. (.. 더보기
Time Series Analysis 3 - What is Exponential Smoothing? 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc43.htm 이것은 smoothing 한 시계열을 생성하는데 매우 인기있는 scheme 이다. 단순 MA에서 과거의 관찰치들에 가중치를 일정하게 준 반면, Exponential Smoothing은 관찰치가 시점이 더 오래된 것일수록 가중치를 지수적 감소시킨다. 다르게 말하면, 최근 관찰치들은 더 오래된 관찰치들보다 예측에서 상대적으로 더 많은 가중치가 주어진다. MA의 경우에서, 관찰치들에 할당되는 가중치들은 1/N로 같다. 그러나 exponential smoothing에서는 결정 혹은 측정되어야 할 한개 혹은 그 이상의 Smoothing parameter들에 있다. 이 parameter들의 결정.. 더보기
Time Series Analysis 2- Single/Centered Moving Average and Double Moving Averages for a Linear Trend Process 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc422.htm 1. Single Moving Average 과거 데이터를 요약하는 다른 방법은, 다음과 같이 과거 데이터에 대한 연속적인 작은 집합들의 평균으로 계산하는 방법이다. 임의로 선택한 12개의 납품업체들의 비용크기인 9 ,8 ,9 ,12 ,9 ,12 ,11 ,7 ,13 ,9 ,11 ,10 인 한 데이터집합을 기억해보자.작은 집합의 사이즈를 나타내는 M을 3으로 설정하자(마치 SGD 에서 Mini-batch 방식을 하는것과 같은 방식). 그러면 처음 3개 숫자의 평균은 (9+8+9) / 3 = 8.667 이 된다. 이것을 우리는 Smoothing 이라고 한다. (즉 평균의 어떤 형태) 이.. 더보기
Time Series Analysis1 - What are Moving Average or Smoothing Techniques? 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc42.htmMoving Average 또는 Smoothing Techniques 가 무엇인가? 어떠한 형식의 불규칙한 변동은 시간에 따른 데이터집합에서 내재적인 것이다. 이러한 불규칙한 변동 때문에 본래의 효과가 줄어드는것을 막아주는 방법들이 존재하는데, 이것이 Smoothing 이다. 적절하게 적용이 되었을때, 이 테크닉은 기저에 있는 트랜드나 계절성 혹은 주기성 요소들을 더 명확하게 나타내도록 해준다.이러한 Smoothing 방법들에는 크게 2가지 그룹으로 나뉜다. Averaging MethodsExponential Smoothing Methods 먼저 averaging methods에 관해 .. 더보기
Time Series Analysis 0 원문 : http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc41.htm 시계열의 정의 : 일정한 크기의 시간구간에 한 변수값의 순차적인 연속을 말함. 적용 : 시계열모델의 사용은 2가지로 나뉜다.관찰데이터를 생성하는 구조와 기저에 있는 어떠한 힘들의 이해를 얻는것모델을 적합시켜 예측, 모니터링 혹은 Feedback 과 Feedforward 조절을 하는데 사용된다. 시계열 분석은 주로 산업분야 데이터를 볼때 자주 사용되는데 다음의 분야들에서 사용된다. 경제예측수요(판매)예측예산예측주식시장예측미래산출량예측Process and Quality Control재고조사미래작업량예측공익사업연구전수조사분석 그리고 등등 많은 예측 시계열들에 사용되는 방법들이 있다. 사실 .. 더보기