Monthly Archive: 6월 2017

0

딥러닝(Deep learning)을 R로 구현하기 – Prediction Model

일반에 딥러닝으로 알려져 있는 머신러닝 모델의 가장 기본이 바로 신경망(Neural Network) 모델이다. 다른 글에서 신경망 모델로 Sin(X) 그래프를 추적하는 예제를 하나 풀어봤었는데, 기본적으로 아래처럼 네트워크가 100% 꽉 들어차 있는 Fully Connected Neural Network 모델이 기본형이다. (Deep Neural Network, 일반에는 딥러닝으로 알려져 있다.) 여기서 몇 개의 노드(node)가 사라지는 경우, 또 넣었다 뺐다 하는 경우(Dropout 이라고 한다) 등 다양한 경우로 응용을 할...

0

온라인 공짜 강의들의 실체 (feat. 국비지원)

데이터 사이언티스트가 되려면 얼마나 많은 준비를 해야 할까? 당연하겠지만 필자의 8주 강의 하나를 듣는다고 완벽하게 준비되는 것은 절대로 아니다. 우연히 구글링을 하다가 본 글에서 눈에 확 들어오는 문구가 여기에 딱 맞는것 같아서 소개하고 싶다. 어느 국비지원 IT학원 6개월 과정을 듣고 난 다음에 극소수만 취업한다, 대부분은 중간에 나가 떨어지고, 일부 취업하는 사람들도 엄청나게 악조건으로 채용된다… 는 글이었는데, “취업하고 다들 버티시느냐? 자기...

0

구글 애널리틱스 (Google Analytics)를 쓰다가

밥 먹고 사는 타이틀을 데이터 사이언티스트로 달고 난 이래 줄곧 온라인 유저 데이터를 보고 살아온 탓에 “중독”증상이 좀 있는 것 같다. 처음 이 웹페이지를 만들고 난 다음에 제일 먼저 했던 일이 예쁘게 꾸미는 테마 구하는게 아니라, 데이터 추적하는 구글 애널리틱스 (Google Analytics)를 설치하고, 필자의 IP 주소를 블랙리스트 시켜서 숫자 합산에 포함되지 않도록 하는 일이었다. (필자는 이 페이지에 하루종일 접속해있으니 클린...

0

빅데이터가 금융업에 줄 충격

빅데이터, 보험, 금융업 실리콘 밸리에서 면접 보던 시절에 Fitbit 데이터로 의학 관련 업무를 할려고 하는 스타트업을 본 적이 있다. Fitbit으로 맥박을 추적하면 한 개인의 건강과 생활 습관에 대해서 많은 정보를 얻을 수 있는데, 그걸 제약업체에 넘겨주기 위한 자료 처리를 하는 스타트업이었다. 필자가 워낙 의학 관련 지식이 없어서 솔직히 모르겠다고 대답하고는 더 이상 면접을 못 봤는데, 아쉬우면서도 한편으로는 꼭 그걸 제약업체만...

0

데이터 사이언스 석사 – 이렇게 돌아간다

데이터 사이언스 석사 프로그램에 관심있다면서 어떤 내용을 배우는지, 어떻게 준비해야되는지, 그리고 졸업하고나면 어떻게 진로가 잡히는지 물어보는 분들이 참 많다. 필자는 데이터 사이언스 석사 프로그램에서 공부한 적이 없고, 학위 중에 데이터 사이언스도 없어서 정확한 답변을 해 줄 수 없겠지만, 그래도 일단 알고 있는 내용들을 많은 분들과 공유하는 게 좋을성 싶어 짧게 정리해본다. 다른 의견이 있으신 분들은 아래에 댓글을 달아주시면 좋겠다. (필자의...

0

깨워라! 한국의 빅데이터

빅데이터, 데이터 사이언스, 데이터 사이언티스트 런던 시내 한 가운데에 있는 대학에서 공부하는 대학원생이 아침에 연구실에 “출근”할 때 갖고 나타나는 것은? 어젯밤에 본 교과서? Problem Set? 논문? 땡!땡!땡! 우리가 아침에 갖고 왔던 것은 2리터짜리 물병과 도시락이었다. 런던 물가가 비싸니까, 가난한 대학원생들이 돈을 아끼려고 도시락을 챙기는건 이해가 될 수도 있겠는데, 물은 왜 갖고 왔을까? 2리터면 2키로나 되는데, 그 무거운 걸 왜 갖고...

0

데이터 과학의 대중화 – Citizen Data Scientist

데이터 사이언스, 데이터 과학자, 그리고 Citizen Data Scientist 요즘 데이터 사이언스 동네에서 돌아다니는 키워드 중 하나가 바로 “Citizen” Data Scientist다. 쉽게 이야기하면, 특별히 학위와 경력을 쌓지 않아도 누구나 데이터 사이언스를 할 수 있도록 하자는 움직임이다. 워낙에 데이터 사이언스가 Buzzword가 되어있다보니 이런 표현이 나온 것 같은데, 이 표현의 정확성을 좀 더 살리면 “Citizen” Big Data Analyst로 바꾸고 싶다. 그리고 우리가 특별히...

0

데이터 과학자도 인공지능이 대체한다

데이터 사이언스, 데이터 과학자, 인공지능, Prophet 데이터 사이언티스트가 부족하고, 좋은 사람을 찾기도 힘들어서 (그리고 비싸서), 아예 인공지능으로 대체해보려는 움직임이 많이 있다. 가장 많이 발달한 영역은 시계열 (Time-Series) 데이터를 넣으면 향후 예측치를 보여주는 시뮬레이션 모델인데, 정확성이 꽤나 높게 나와서 이제 다른 영역의 데이터 사이언스도 인공지능으로 대체될지도 모른다는 “설레발”들이 입에 오르내리고 있다. 최근에 모 데이터 사이언스 학회에 가보니 2025년까지 인공지능이 데이터 사이언스...

0

데이터 사이언스는 죽었다

데이터 사이언스는 죽었단다. (Data Science is Dead.) 자칭 데이터 사이언티스트 입장에서 읽기는 좀 불편하지만 공감할 수 밖에 없는 글을 하나 읽었다. 과학의 테두리 안에 들어가는 학문은 어떤 특성을 가지는가? 조건을 지정해서 실험을 하고 그 결과값을 바탕으로 가설을 검증하고, 새로운 가설을 찾는 과정이다. 데이터 사이언스 안에는 A/B Testing이 있지 않냐고 주장할 수도 있을텐데, 이미 데이터를 만드는 사람이 결정한 일을 그냥 해석만...

0

빅데이터 분석의 한계과 미래 (feat, Nate Silver)

데이터 사이언스, 빅데이터, Bad data, 분석의 실패 2012년 미국 대선에서 50개 주의 승패를 모두 맞춘 걸로 유명해진 Nate Silver가 FiveThirtyEight (이하 538)이라는 데이터 블로그를 2008년부터 운영하고 있다. 말이 블로그지 사실 왠만한 신문사 출신 기자들 다 모여있고, 글의 깊이도 상당하다. 글의 대부분은 상당한 내공이 담긴 데이터 분석, 통계 모델링이 들어가 있고, 가끔 보면 어디서 저런 데이터를 찾았을까 싶을 정도로 커버리지 영역도...