https://brunch.co.kr/@cloud09/44
이 글을 읽고 분석을 어떻게 하는지에 대한 전체적 골격을 볼수가 있었다.
문제인식 : 1. 내가 하는 일, 하고 싶은 일을 수행하는 사람들을 어떻게 지칭하는가?
2. 1의 지칭어가 다양하다면, 시계열 별로 어떤 것이 뜨고 있는가?
분석 목적 : 내가 하는일, 하고 싶은 일을 수행하는 사람들을 지칭하는 이름에 대한 시계열 분석
해결 방법 :
1. "데이터를 통해 사용자를 분석하고 서비스를 분석하고 더좋은 서비스로 개선하여 뛰어난 사용자 경험을제공하거나, 최적화된 마케팅을 제공하는 것" 이 정의에 해당하는 핵심 단어를 정의한 후( 데이터, 분석 등등) IT 관련 커뮤니티에서 문서를 크롤링 하여 핵심 단어와 많이 언급되는 직무를 찾을 수 있고, 이 직무들의 언급 빈도를 시계열로 파악할 수 있다. (분석의 한계점 : 크롤링할 여력이 안되므로 패스)
2. 내가 수행하는 일을 하는 직종들을 몇가지 나열, 여기서 후보군을 데이터 분석가, 데이터 과학자, 그로스 해커로 정함, 네이버에서는 연관 검색어가 제공되므로, 각 직종별로 연관어를 비교 해 볼 수도있다. 이 세가지 단어의 언급 빈도를 시계열 별로 추적, 국내에서는 네이버 트랜드를 사용, 국외로는 Google Trend를 사용.
기간 설정 : 2015년 1월 ~ 2016년 1월 26일 (약 1년)
결론 :
연관검색어에서 차이를 찾기 어려웠기 때문에 국내를 대상으로 한다면 데이터과학자로 많이 불리우고, 해외를 대상으로 한다면 어느 지역을 대상으로 할지, 분석 할 데이터의 영역이 Business냐 Science냐에 따라 선택하는것이 나을 것이다.
'기사/블로그 스크랩' 카테고리의 다른 글
Standardization VS Normalization (0) | 2016.02.03 |
---|---|
넷플릭스가 추천 및 검색 알고리즘을 개선하는 방법 (0) | 2016.02.03 |
[수기공모전 최우수상] 누가, 무엇으로 치킨을 튀기는가? - 통계로 튀기는 치킨 [출처] [수기공모전 최우수상] 누가, 무엇으로 치킨을 튀기는가? - 통계로 튀기는 치킨|작성자 통계청 (0) | 2016.01.28 |
바둑 이세돌 vs. 인공지능 컴퓨터...오는 3월 세기의 대결 (0) | 2016.01.28 |
구글코리아 첫 국내 신입 공채 및 신입 요건 (0) | 2016.01.26 |