본문 바로가기

분류 전체보기

A Gentle Introduction to XGBoost for Applied Machine Learning 원문 : http://machinelearningmastery.com/gentle-introduction-xgboost-applied-machine-learning/ XGBoost는 최근 Kaggle competition들과 응용기계학습에서 가장 잘나가는 알고리즘이다.XGBoost는 gradient boosted decision trees(속칭 GBM)을 속도와 성능면에서 향상시킨 알고리즘이다.이 포스팅에서, XGBoost가 무엇이고, 어디서 유래되었고, 또 어떻게 학습시키는지 등을 설명할 것이다.이 포스팅을 읽고 난 후, 여러분은 다음을 알게될 것이다. :XGBoost가 무엇이고 이 프로젝트의 목적들이 무엇인지.왜 XGBoost는 따로 머신러닝 툴킷으로 나왔는지.당신의 다음 머신러닝 프로젝트에 사용하기.. 더보기
Using XGBoost For Feature Selection by Mei-Cheng Shih (With Python) 이 커널은 JMT5802의 포스팅에서 영감을 받음. 이 커널의 목적은 boruta 패키지의 중요요소인 RF(랜덤포레스트)를 대채하기 위해 XGBoost를 사용하는 것이 목적이다. 이 Case에서 XGBoost가 RF보다 더 좋은 예측을 내기 때문에, 이 kernel의 결과는 이를 잘 나타낸다. 더욱이, 이 코드는 필자가 사용했던 데이터전처리 과정을 포함한다.먼저 전처리와 데이터를 불러오기 위한 패키지를 불러온다.In [1]:from scipy.stats.mstats import mode import pandas as pd import numpy as np import time from sklearn.preprocessing import LabelEncoder """ Read Data """ train=p.. 더보기
A study on Regression applied to the Ames dataset by juliencs (With Python) https://www.kaggle.com/juliencs/house-prices-advanced-regression-techniques/a-study-on-regression-applied-to-the-ames-dataset/notebook ##########################################################################본 게시글은 Kaggle Competition에서 House prices의 TOP Kernel 중 하나를 번역한 것임.저작권에는 문제가 없어 보이나 문제가 될시 바로 삭제하겠음.########################################################################## Introduction이 커.. 더보기
What is the difference between Bayesian and frequentist statistics? 원문 : http://blog.keithw.org/2013/02/q-what-is-difference-between-bayesian.html #오역이 있을 수도 있으니 주의바람! 보는대로 수정할 것임.. (수정중) 수학적으로 말하자면, 빈도주의론자와 베이지안론자의 방법들은 그들이 '무엇에 신경쓰느냐' 와 그들이 받아들이는 오차의 종류에서 차이가 난다. 일반적으로 말하자면, 빈도주의론자의 접근법들은 세상은 오직 절대적인 한 방법밖에 없다는 것이다. (예를 들어 한 파라미터(모수)가 오직 하나의 특정 참값을 가진다는 것) 그리고 결과가 파라미터의 참값이 뭐든간에 최소한의 확률으로라도 (참값을 향해) 조정될 실험을 실행하려 노력한다는 것이다. 결과적으로, 실험후에 우리가 아는 것에 대한 불확실성을 표현하기 위.. 더보기
RandomForestRegressor by BradenFitz-Gerald (With Python) https://www.kaggle.com/dfitzgerald3/house-prices-advanced-regression-techniques/randomforestregressor/notebook##########################################################################본 게시글은 Kaggle Competition에서 House prices의 TOP Kernel 중 하나를 번역한 것임.저작권에는 문제가 없어 보이나 문제가 될시 바로 삭제하겠음.##########################################################################Import LibrariesIn [1]:import pandas as p.. 더보기
Fun with Real Estate by Stephanie Kirmer (With R) https://www.kaggle.com/skirmer/house-prices-advanced-regression-techniques/fun-with-real-estate-data/notebook ##########################################################################본 게시글은 Kaggle Competition에서 House prices의 TOP Kernel 중 하나를 번역한 것임.저작권에는 문제가 없어 보이나 문제가 될시 바로 삭제하겠음.##########################################################################Fun with Real EstateData Driven Real Esta.. 더보기
Detailed Data Exploration in Python by Angela (With Python) https://www.kaggle.com/xchmiao/house-prices-advanced-regression-techniques/detailed-data-exploration-in-python/comments##########################################################################본 게시글은 Kaggle Competition에서 House prices의 TOP Kernel 중 하나를 번역한 것임.저작권에는 문제가 없어 보이나 문제가 될시 바로 삭제하겠음.##########################################################################OverallIn [1]:# This Python 3 en.. 더보기
Ensemble Modeling : Stack Model Example by J.Thompson (with R) https://www.kaggle.com/jimthompson/house-prices-advanced-regression-techniques/ensemble-model-stacked-model-example ##########################################################################본 게시글은 Kaggle Competition에서 House prices의 TOP Kernel 중 하나를 번역한 것임.저작권에는 문제가 없어 보이나 문제가 될시 바로 삭제하겠음.##########################################################################Ensemble Modeling: Stack Model Exam.. 더보기
Housing Data Exploratory Analysis by AiO (With R) https://www.kaggle.com/notaapple/house-prices-advanced-regression-techniques/detailed-exploratory-data-analysis-using-r##########################################################################본 게시글은 Kaggle Competition에서 House prices의 TOP Kernel 중 하나를 번역한 것임.저작권에는 문제가 없어 보이나 문제가 될시 바로 삭제하겠음.##########################################################################Housing Data Exploratory Analysi.. 더보기
Boruta Feature Importance Analysis by Jim Thompson (With R) https://www.kaggle.com/jimthompson/house-prices-advanced-regression-techniques/boruta-feature-importance-analysis/comments ##########################################################################본 게시글은 Kaggle Competition에서 House prices의 TOP Kernel 중 하나를 번역한 것임.저작권에는 문제가 없어 보이나 문제가 될시 바로 삭제하겠음.########################################################################## Boruta Feature Importance A.. 더보기