본문 바로가기

Factorization Machine 요약 이 논문은 Support Vector Machine(SVM) 의 장점과 Factorization model들을 합친 새로운 모델Factorization Machine을 소개한다. SVM같이 FM은 real valued 피처벡터를 사용하는 모델이다. 그러나 SVM과 다른 점은 피처간 상관관계 또한 Factorized Parameter를 통해 사용한다는 것이다. 그러므로 Sparisity가 큰 데이터에서는 작동하지 못하는 SVM과는 달리 FM은 상관관계들을 추정할 수 있다. 이 논문에서 FM의 공식들이 어떻게 선형시간(Linear Time)으로 계산되어 바로 최적화가 될 수 있는지에 대해 설명한다. 따라서 비선형기법인 SVM과는 다르게 Dual form 에서의 변형이 필요없고 support vector.. 더보기
Catboost 1. Introdunction Gradient boosting은 weak learner를 loss function상에서 gradient descent라는 최적화 기법으로 기울기가 가장 큰 (greedy procedure) 방향으로 sub tree들을 반복적으로 추가하여 결합하는 방법으로 성능을 향상시키는 boosting 기법의 중 하나이다. catboost가 다른 gbm 알고리즘보다 좋은 성능을 낼 수 있는 것은 ordering-principle의 개념을 대입하여 기존의 data-leakage로 인한 prediction-shift 에 대한 문제 그리고 high cardinality를 가진 category 변수에 대한 전처리 문제를 해결했다. 첫번째 장점은 범주형변수처리 방법의 개선으로 인한 학습시간 단축.. 더보기
보험개론 - 보험이란? ● 정의 개인, 기업등의 경제주체는 각자 자기의 책임하에 생활과 기업활동을 하고 있다. 이 생활과 기업활동의 원활한 수행을 저해하고 위협하는 것은 예측할 수 없는 사태의 발생 및 불운, 지진, 태풍등의 자연재해, 화재, 교통하고, 질병, 사망, 상해, 실업, 환율변동, 금리변동 같은 경제변동 등의 발생이라 할 수 있다. 과거에는 자연재해가 생활을 위협하는 가장 중요한 요인으로 작용하였으나, 최근 교통사고, 환경오염 등이 중요 위험요인으로 등장하고 있다. 따라서 이러한 위험에 대처하기 위해 각종 수단 및 대책이 나오게 된다. 이러한 위험을 줄이기 위해 나올 수 있는 대책은 첫째 위험발생의 예방, 방지, 둘째 위험의 회피, 셋째 위험의 전가로 크게 3가지를 들 수 있다. 보험은 세번째 케이스로 위험을 전가함.. 더보기