데이터 사이언스 Hackathon 모집

자칭 “데이터 사이언스” 학원 하나가 “강사” 모집 중이라고 메일이 왔었는데 (한 땐 이런 메일 여러번 왔는데, 요즘은 좀 뜸하더만…), “실제 데이터를 기반으로 하는 실무형 프로젝트 참여”를 목적으로 하는 기관이라고, 날더러 “강사”에 “지원”해라고 하더라.

뭐… 내가 왜 “지원”해야되는거지? 당신들이 pabii에 지원하시던가 ㅋㅋㅋ 근데 또 개발자들을 “강사”로 모셔놓고서는 “실무형”이라고 우기는 건 아니겠지? 이론을 (몰라서) 안 가르쳐놓고, 데이터만 넣으면 무조건 실무형이 된다고 우기는 그런 종류의 수업은 아니겠지?

 

실무형 프로젝트 참여

정말 “실무형 프로젝트 참여”에 관심이 있는 분들은 모델링 수업에 오시면 된다. 모델링 수업 수강자들 대상으로 3-4개월짜리 Hackathon(?) 같은 걸 진행해볼까 생각중이다. 적으면 1-2명, 많으면 3-4명이 팀, 주제, 나름의 데이터와 모델 설계를 들고 오시면, 필요한 코멘트를 주고, 3-4개월간 계속해서 지도 편달을 해드릴 생각이다. 향후에 어떻게 진행될지는 모르겠지만, 1년에 2차례 정도 모델링 강좌를 Hackaton과 연계해서 운영할 계획에 있다.

모델링 수업 수강자를 대상으로 하는 이유는 당연히 데이터 사이언스에 대한 기본적인 지식모델링이 어떤 개념인지 잘 이해하신 분들일테니 퀄리티 컨트롤이 되었다고 생각하기 때문이다. 미안한 말이지만, 나도 바쁜 사람이고, 성격이 좋은 편이 못 되어서 불가능에 가까워 보이는 주제를 들고 와 놓고는 날 더러 대신 해달라는 식으로 나오거나, 코멘트를 줬는데 무슨 말인지 못 알아먹는 수강생들을 상대하고 싶진 않다.

참고로 데이터 사이언스 메인 강좌의 수준은 ISLR을 학부 3학년이라고 했을 때, 학부 4학년 ~ 석사 1학년 정도의 내용이고 (물론 수학을 좀 빼긴 했지만), 모델링 강좌는 확실히 석사 1학년 수준인 것 같다. 박사 공부를 해 보신 분들은 다 아시겠지만, 수학과 통계학을 다 알고 있다고 해도 다른 학문에서 쓰이는 용어와 철학이 다 다르니, pre-requisite waiver를 해 드리지 못하는 점을 이해해주시길 바란다. 특히 저 위에 살짝 언급한 시중의 “코딩” 스쿨에서 공부하고 왔으니 waiver 해달라고 하시면 정말 화낸다. (쩝~ 성격 안 좋다니깐)

부담스러워서 못 하겠다고, 저 위에 언급한 학원을 가셔도 되는데, 아마 내 수업을 들어본 분들이면 내가 왜 이렇게 저런 학원들에게 강한 거부감을 갖고 있는지 잘 이해하실 것이라고 본다.

가끔보면 모델링 수업 4개 토픽 중에 “나는 하나에만 관심있는데, 왜 4개를 다 공부해야됨?” 이라고 생각하시는 분들도 있던데, Neural net만 배우고 싶다고 그 앞에 배웠던 모델들 안 배워도 되는 게 아니라는 정도는 데이터 사이언스 메인 강좌에서 다 겪어봤지 않나? 주제를 저 순서로 딱 4개 수업으로만 빼낸데는 다 이유가 있다. 어차피 Stochastic 으로 접근하는 고난이도 머신러닝은 고급 수학 공부를 안 한 사람들에게 가르치기 불가능한 내용이고, 머신러닝 모델을 좀 더 수준 있게 쓰려면 남은 옵션은 Bayesian 밖에 없기 때문이다.

앞으로 2-3년 내에 그냥 머신러닝이 아니라 Bayesian 머신러닝을 할 줄 알아야 된다는 식으로 언론 플레이가 나올텐데, 그걸 배우고 응용하는 기본 모델을 단순 Neural net에서 끝내는게 아니라 Reinforcement learning까지 끌어올려보는 수업이다. 빅데이터가 아닌 데이터로 모델을 만드는건 pabii 수업에서 다룰 내용은 아니고, 빅데이터를 활용하는데 데이터를 Dynamic 하게 쓰는 방법들은 어느정도 정해진 코스가 있다. 교수들이 자기 학문으로 잘 훈련된 학생과 논문 주제를 놓고 토론하는걸 생각해주시면 된다.

주제는 어느쪽이건 상관없다. 당연히 IT쪽, 금융업쪽 데이터는 본 적이 많고, 의료업 데이터도 다뤄본 적이 있다. 어차피 데이터는 데이터일 뿐이다. 수업에서 살아남은 분들이니 어떤 데이터가 빅데이터고, 어떤 데이터를 갖고와야 수업에서 배운 테크닉들을 응용할 수 있을지도 잘 이해하고 있으실테고, 필자가 어떤 강점을 갖고 지도를 해 줄 수 있는 사람인지 잘 알고 있으실 것 같아서 더 자세한 내용은 생략한다.

또, Pre-requisite과 모델링 수업을 들은 시점에 이미 내 수업을 2-3개는 들으신 분들에게 더 이상 수강료를 받을 생각은 없다.

몇 달전에 수업을 듣고 가신 모 대기업 중간관리자 분 한 분께 들은 말인데, 회사원들 입장에서 자기가 참여한 프로젝트가 책으로 출판되면 기업에서 좋은 평가를 받는데 도움이 된다고 하시더라. 여태까지 본인이 묻는 질문을 제대로 답해주는 Data Scientist를 만난 적이 없었는데, 여기와서 명확한 답변을 많이 받고 나니 속이 후련하다면서, 이런 걸 아예 프로젝트 지원하는 수업(?) 같은 걸로 운영해보면 어떨까는 아이디어를 주셨다. 그렇게 운영했던 프로젝트 모아서 책 내고, 책에 이름 올라간 직원들을 위에서 좋게 보게되니 선순환 구조가 아닐까라고 하시던데, 정말 그런가? 국내 대기업을 다녀 본 적이 없어서 잘 모르겠다ㅋ

기업 내부 사정이 있는 주제들이야 PCA로 바꿔버린 데이터나 시뮬레이션 데이터로 대체하면 될 것이고, 너무 민감한 주제는 굳이 책으로 내지 않아도 된다. 책을 내는게 목적이 아니라, 책을 내고 싶어하는 분들께, 실력 있는 분들, 정말 데이터 사이언스를 하실 수 있는 분들이 회사에서 인정 받을 수 있도록 지원해드리겠다는 뜻이다. 이 부분을 지원해드리고 수익금(?)이 생기면 불쌍한 후학들을 위해 기부(?)하면 어떨까? 아님 우리끼리 고기파티해도 되고.

가끔씩 주말에 열던 Excel로 하는 기초 강의, 월말 토요일에 하던 수학 & 통계학 강의를 온라인으로 이전하는 이유가, 저 Hackaton 하면서 주말에 모임하시는거 좀 지원해드리고 싶어서였다.

 


아이디어 주신 박X석 차장님 감사드립니다.

 

You may also like...

댓글 남기기