왜 한국은 항상 2류일까?

오래전에 가끔 들어가는 한국 IT 관련 커뮤니티에서 “왜 한국 개발자들이 만들어낸 결과물이 미쿡 애들이 만들어 낸 결과물보다 안 좋으냐?”는 질문이 나왔고, 그에 대해서 수십개의 댓글이 달리는 걸 봤었다. 그 때는 연구에 치여서 길게 못 읽어봤고, 몇 마디 경험담을 읊고 지나간게 전부였는데, 요즘에 한국에서 개발자들 면접보고 IT 업계 돌아가는 방향을 보니까 솔직히 말해서 왜 그런 질문이 나왔는지, 그리고 왜 결과물이 더 안 좋은지가 눈에 보인다. 그리고 같은 스토리가 데이터 사이언스 필드에서 그대로 반복이 되고 있는 것도 눈에 보여서 혼자만의 생각을 좀 정리해보고 싶었다.

우선 경험담 몇 가지를 정리해보자.

 

1. 비 IT – Deutsche Bank에서 iBanker 하던 시절

제일 기억에 남는건 우리팀 MD (10년차 이상, 한국팀 대표지만 사실 대기업 부장급)랑 VP (7년차 이상, 이사?라고 불리지만 차장급)가 소위 말하는 “영어만 잘하는” 아이뱅커였다는거다. Finance 101으라고 할 수 있는 재무관리 수업에서 제일 중요하게 배우는 내용이 Miller-Modigliani (MM) 이론이라고, 주식 or 채권 어떤 조합으로 파이낸싱을 하건 상관없이 회사의 가치는 운영에서 나오는 현금 흐름과 프로젝트들이 노출된 위험의 가치로 결정이 된다는 이론이다. MD, VP뿐만 아니라 그 밑에 MBA 다녀온 Associate 분도 이 개념을 이해 못해서 자사주 매입을 하면 회사 가치가 올라간다고 생각했었다. 심지어 N사의 증권 게시판을 가보면 자사주 매입한 회사의 기업 가치가 올라가서 계산이 되어 있(었)다. 실제로는 발행된 주식을 되사들였으니 외부 공개된 주식 숫자가 줄어서 주식 가격이 올라야 방정식의 등호가 성립하기 때문이라는 걸 이해 못 하는 사람들이었다.

저렇게 만들어라는 압박에 꾹 참고 자료를 만들어서 고객사에 들고가면 또 고객들은 그게 맞다고 철썩같이 믿고 간다. 오히려 그렇게 안 가져가면 화를 낸다. 대학에서 경영학과 졸업장 타이틀만 받았지 실제로 재무관리 수업은 아마 “야매”로 학점을 땄나보다. 당연하겠지만 저런 자료를 다른 나라 팀이랑 공유하면 폭풍 비웃음을 당한다. “Fxxxed up”이라는 표현을 노골적으로 들을 때도 있었고, 니네 나라 왜 그러냐고 놀림들은 일도 많았다. 그 자료를 다른 나라 팀이랑 공유할 때는 내가 이걸 알고 있는데, 이상하게 우리나라 시장이 이렇게 돌아가서 이렇게 만들었음이라고 따로 언급을 해주거나, 아니면 짜증나서 영문 버젼은 아예 다르게 만들기도 했었다.

사람들이 학문적으로 잘 훈련이 안 된 부분은 둘째 문제고, 뭔가 일하면서 대충 배운걸로 버틸 수 있다고 생각하는 사람들이 너무 많았다. 한번은 런던 팀에서 에너지 산업에 대한 굉장히 고급스러운 스터디를 한 걸 공유한 적이 있었는데, 그 모델을 똑같이 만들어서 한국에도 적용시켜보라고 VP 분이 퇴근길에 던지시더라. 정말 밤을 꼴딱새서도 그 내용을 제대로 이해하질 못해서 결국은 “가라”로 자료를 만들었던 적이 있다. 성격상 그걸 그냥 넘어갈 수가 없어서 나중에 런던 팀에 담당자랑 이야기할 때 이것저것 물어봤더니 그 친구는 어디서 배웠는지 계량경제학을 제대로 이용해서 그 모델을 만들었더라. 그리고 런던 오피스 안에 그런 모델 만들 수 있는 사람들이 하나 둘이 아니라 여럿 있었다.

시장 수준이 낮으면 사실 일하면서도 충분히 배울 수 있다. 특별히 복잡한 수학이나 통계학이 들어가질 않으니, 누군가에게 이야기를 듣고, 혼자서 앉아서 가만히 생각해보면 열에 아홉은 그 도리를 깨칠 수 있다. 옛 말에 “독서백편의자현(讀書百遍義自見)”이라고 하던데, 백번 읽으면 그 의미를 알 수 있다는 말이 여기에 잘 적용되는 것 같다. 다만 백번 읽어서 이해하려면 그 시절에는 한자가 무슨 뜻인지를 알아야했고, 뱅킹시절에는 (최소한) 학부 재무관리 수준의 지식은 있어야했다. 그걸 모르고 남들이 만든 자료에 자신의 상식을 결합한 수준으로 직장 생활을 하고 있으니 일하면서 배운다는게 고만고만한 내용밖에 안 되는 것이다.

2. 비 IT – 증권사 Research 팀에 있던 친구의 도전

런던가서 손에 굳은 살이 배길만큼 공부에 몰두하던 시절, 국내의 모 유명 증권사 리서치 팀에 있는 매우 가까운 친구 하나의 전화를 받았다. 모교의 어느 교수님이 우리 나라 산업별로 생산성 분석을 하신게 있는데, 이 자료를 어떻게 만드는지 설명해줄 수 있냐고 묻더라. 거시경제학에서 Productivity를 분석할 때 가장 많이 활용하는 방법은, 전체 생산 (보통 GDP 활용) 증가분 중에서 노동과 자본으로 설명할 수 없는 나머지 잔차 (Residual)을 생산성이라고 보는 경우가 많다. 그 교수님 논문에 몇 가지 특이한 사항이 있기는 했지만 어찌됐건 계량경제학을 적용하는 방법은 굉장히 유사한데, 그 팀의 어느 누구도 그 연구를 복제해낼 수가 없었다.

복제해낼 수 없고, 또 그 자료를 써야한다면 외주 프로젝트를 만들어서 그 교수님께 지적인 노동에 대한 비용을 지불해야할텐데, 내 기억에 따르면 그 친구는 같은 방법을 포기하고 쉽게 덧셈, 뺄셈을 하는 대안을 택했다. 아마도 증권사에서 나오는 자료를 읽을 기관 투자자들 중에 저런 Productivity analysis를 이해할 수 있는 사람도 극소수였을 것이다.

저런 내용은 백번 읽는다고 해결되는 문제가 아니라, 따로 수학과 통계학을 공부해야 이해하고 유사한 스터디를 할 수 있다.

3. IT – 개발자 면접을 보면서

필자의 사업에 요즘 가장 큰 화두는 데이터 베이스 관리 및 연동이다. 하나는 데이터 베이스를 회사의 데이터 작업 시스템과 연동시켜서 필자의 단순한 아이디어도 테스트해보고, 때때로 간단히 장난감 만지듯이 테스트도 해 본다. 다른 하나는 RTB (Real-Time-Bidding)이라고 해서, 광고 지면을 파는 회사에서 받은 AD ID와 내 데이터 베이스에 저장되어 있는 AD ID를 매칭시켜, 내가 갖고 있는 데이터를 바탕으로 그 광고 지면을 살지말지를 70ms 안에 자동으로 결정하는 시스템이다. 앞 부분이 더 간단해 보이고, 뒷 부분은 온라인 광고 시장에서 짬이 좀 있는 사람이 아니면 잘 이해를 못할 내용이라고 생각하고, 실제로도 후자쪽이 공부해야하는 자료가 굉장히 많다. 전자는 (약간 과장법을 쓰면 ) 시간낭비에 가까울만큼 순수하게 코딩으로 시간을 쏟아붓는 일이라면, 후자는 데이터 베이스 연동에 대해서 이론적인 지식이 좀 뒷받침이 되어야하기 때문이다.

개발자 면접을 보던 중에, 이 회사에서는 어떤 일을 하냐고 묻길래 RTB에 관련된 오픈소스 API를 하나 보여줬다. 모델이 작동하는 방식을 간단하게 설명하고, 데이터 베이스를 어떻게 만들어야 쉽게 연동을 시킬 수 있는지 내 아이디어를 설명하고, 면접자의 이해&의견을 구해봤다. 예상대로 표정이 @.@ 상태더라. 좀 모르겠다가 아니라, 아예 모르겠다는 뜻이다. 차라리 아는체 하면서 나한테 자꾸 찔러보기하는 악당들보다 낫다는 생각에 관련된 자료들을 더 보내주면 스터디해서 올 수 있겠냐, 그래서 내가 만드는 걸 옆에서 도와줄 수 있냐고 물어봤다.

예상했던대로 그 다음부터 전화를 안 받더라. 그런데 저런 경우를 벌써 한 손으로 못 헤아릴만큼 겪었다.

그 중 두 명이 가까운 지인을 통해서 만났던 분들이라 뒷 이야기를 좀 들었는데, 자기들은 그렇게 수식이 복잡하게 들어간 거를 만들어 본 적이 없단다. 데이터를 이용해서 광고에 적용하는 사업이라고 들었는데, 정작 하는 일은 “이상한” 수학 쓰는 일이더라면서, 자기가 잘못 알고 찾아갔던 것 같단다. 스타트업에 관심을 갖고 면접을 보는 분들이면 뭔가 도전적이고 진취적인 분들일 줄 알았는데, 필자가 근본적으로 잘못된 기대를 갖고 있었던 거다. 비단 그 두 분 뿐만 아니라, 우리나라에서 대부분의 개발자들이 수학으로 문제에 접근하는 훈련이 전혀 안 되어 있다는 사실을 요즘 조금씩 조금씩 깨닫고 있다.

심지어 증권사에서 현금흐름으로 모델 만들 때도 손으로 수식 써가면서 작업했고, Data analyst 일을 하고 있을 때도 평소에 간단한 수식을 쓰면서 작업을 하는 일이 흔하다. RTB가 돌아가는 메카니즘은 2nd price auction이라고, 좀 난이도 있는 경제학 개념이니 어려워하는게 이해되지만, 위에 말한 오픈소스 RTB API에 들어가는 수식이라고 그래봤자 중학교 때 봤던, 선 3개로 6개 점을 잇는 방법 같은 기본적인 네트워크 모델링과 그걸 풀어낼 수 있는 고등학교 2학년 수준의 1차 미분 밖에 없다.

더 놀라운 사실은 영어로 된 자료들에 경끼를 일으키고, 무슨 말인지 몰라서 Google Translator에 넣어서 어설픈 한국말로 읽는 개발자들이 그렇게 많다고 한다. 우리가 지식을 생산하는 나라가 아니라, 열심히 쫓아가는 나라인데, 영어를 못하면 어떻게 지식을 습득할 수 있을까…

4. IT – 국내의 IT 커뮤니티

문자 메세지 대체재가 아닌 모든 SNS를 끊고 산지 몇 년 되었다. 그러다가 그래도 강의하고 홍보하려면 Fxxxbook 계정은 하나 만들어야되지 않겠나는 생각에 회사 이름으로 SNS 계정을 하나 만들고 데이터 사이언스에 관심을 가질만한 사람들이 있는 커뮤니티 활동을 좀 해보려고 했다. 그런데 그 커뮤니티들에는 코딩을 어떻게 하는지, 코딩 에러는 어떻게 해결하는지에 대한 기초적인 질문만 가득 있더라. 보통 필자가 이런 질문이 생기면 구글링을 해서 답을 찾는데, 필요한 대답의 대부분은 stack overflow가 stack exchange에서 찾는다. stack overflow는 코딩 관련된 내용 위주고, stack exchange는 여러 학문에 대한 깊이 있는 답변들이 공유되어 있다. Fxxxbook 커뮤니티에 올라온 코딩관련 질문들은 구글링하면 길어봐야 5분안에 답을 찾을 수 있는 내용이 거의 대부분이다. 그리고 stack overflow에 답이 있는 경우가 압도적으로 많았다. 말을 바꾸면, 학문적인 질문이 아니라 코딩에 관련된 질문 밖에 없었다.

끽해봐야 “왜 주식가격은 머신러닝 모델로 예측 못 하나요?” 같은 질문인데, 자기 상관성이 없는 데이터에서 무슨 짓을 하건 어떻게 패턴을 찾나? 아주 특정 기간에 모멘텀이 있어서 찾아냈거나, 아니면 거짓말이겠지. 자기상관성이 뭔지 알고, 데이터가 그렇게 생겼다는 걸 알면 애시당초 시간을 쓸 주제가 아니다. 뭔가 고민하고 나오는 질문이나 연습의 수준이라는 것이 수리 통계학 공부를 안 한 테가 너무 심하게 났다.

물론 저기보다 더 심한 영문 커뮤니티들도 있다. 거의 홍보 자료 올라오는 거 막기에 바쁜 커뮤니티도 봤고, 올라오는 질문들이 공부할 수 있는 교재 추천해달라는 이야기 위주인 커뮤니티도 꽤나 보기는 했다. 그런데 그런 커뮤니티에는 뭐 좀 하는 사람들이 다 떠난다. 와서 얻을게 없으니까. 나랑 같은 전공 했던 사람들한테 주가를 RNN의 LSTM으로 예측할 수 있다고 헛소리를 잔뜩 늘어놓는 인도인 유투버 영상을 보내줬더니 이런데다가 시간 쓰는 사업하고 교육하느냐고 비웃더라. 쩝~ 참고로 그 인도인 유투버 영상은 지금도 엄청나게 인기를 몰고 다니는 영상이다.

지금 시장에서 머신러닝을 배우겠다는 사람들, 데이터 사이언스를 배우겠다는 사람들이 딱 코딩 소화하기에 바쁘고 ,그걸로 만족하는 사람들로만 구성된 IT 커뮤니티를 만들고, 자기들끼리 코딩 지식을 공유하고 있는 수준인 것이다. 그리고 영어로 검색은 안 되고, 대답 잘 해주는 것 같으니까 한국말로 운영되는 Fxxxbook 커뮤니티에 질문 올려보는거다.

저 위에 개발자들 수준에 대해서 필자가 씁쓸했던거랑 너무너무 유사한 문제점이 그대로 반복되고 있다는 증거가 아닐까? 근데, 그렇게라도 코딩 많이 배우면 좋은거 아니냐고?

5. IT – 코딩 기계를 양산하는 시스템

글 처음에 언급한 그 IT 게시판의 글로 돌아가보자. 글 내용인즉, 우리나라 초특급 개발 인재들(“KAIST, SNU 같은 명문 컴공 출신” 이라고 하심)이 평소에도 죽어라 공부하고, 밤을 새어가면서 만든 결과물인데, 대학 졸업 때까지 컴퓨터 언어로 코딩은 해 본적도 없고, 어디 코딩 부트캠프 몇 달 다니고 나온 애들이 만들어낸 결과물보다 안 좋아서 너무 충격먹었다는 내용이다.

답 글들을 보면 결국 코딩 실력이 문제가 아니라, 시스템의 문제이고, 그 시스템이 SUM(코딩실력)으로 끝나는 것이 아니라, 최초 프로젝트 디자인부터 마지막 단계의 QA까지 전체를 다 아우를 수 있는 능력이 있어야된다는 이야기가 주류이다. 특히 필자의 시선을 잡았던 부분은 코더가 필요한게 아니라 프로그래머가 필요한 작업이 우리나라에서 과연 얼마나 있냐? 대기업들은 대부분 단순 코더를 원하지 새로운 걸 만들어내는 능력을 요구하지 않는다는 문구였다. 당장 개발자 연봉을 보면, 새로운 걸 만들어내는 사람이 받는 연봉이라고는 납득하기 힘든 숫자다. 필자도 그런 푼돈을 주고 쓸 사람을 구하는 것도 아니고, “사업 파트너”가 될 만한 분을 찾고 있는데, 애시당초 뭔가를 “카피”한 경험이 있는 사람은 많아도 “만들어”본 적이 있는 사람이 나올 수 있는 사회 구조가 아니라는 거다.

iBanker 시절 현금흐름으로 Valuation 모델을 scratch부터 만들었다고 그러면 “뭐하러 시간 낭비하냐?”, “니네 보스는 모델 공유 안 해주냐?”, “할 일이 그렇게 없냐?” 같은 질문을 받았는데, IT업계도 토시하나 다르지 않은 방식으로 작동되고 있다는 뜻이다.

모르긴 몰라도 그 프로젝트에 투입된 인재들의 능력치를 보면 코딩을 제외한 다른 모든 능력치들은 어디 코딩 부트캠프 몇 달 다니다가 나온 사람들이 훨씬 더 뛰어났을 거라고 생각한다. 어차피 코딩으로 프로그램을 만든다는 건, 건축에서 집을 짓는 것과 같은 방식인데, 벽돌을 1층에서 100층까지 빠르게 실어나를 수 있다고해서 집이 더 잘 지어지는 건 아니다. 굳이 따지면 시간이 좀 덜 걸릴 뿐이다. 진짜 집을 잘 지으려면 설계도의 도면 자체를 이해하는 것 뿐만 아니라, 왜 그런 설계를 했을지에 대한 고민을 설계도면 만든 사람보다 훨씬 더 깊은 수준에서 이해를 해야한다. 좋은 논문을 그대로 따라가면서 복사한 모델을 만들다보면 어느 부분에서 어떤 고민을 했을지가 눈에 보이고, 그 논문을 썼던 사람보다 훨씬 더 많은 지식을 갖추고 나면 그 문제를 해결할 수 있는 다른 방법이 보인다. 일에 대한 태도가 이런 사람과, 이걸 최대한 빨리해서 오늘은 밤을 새고 싶지 않다고 생각하는 사람과의 결과물은 어떻게 차이가 날까?

IT 커뮤니티에서 코딩 열심히 배워봐야 위에 말한 프로젝트 같은 사태가 일어날 것이다. 좀 더 나가면 필자가 학부 갓 졸업하고 갔던 그 외국계 증권사 때처럼, 외국 애들하고 만났을 때 니네는 왜 이렇게 작업하냐는 식의 은근한 비웃음에 직면하는 일도 생기겠지.

나가며 – 문화와 교육의 종합적인 산물

좀 더 깊게 들어가면, 이 모든 문제는 문화와 교육의 종합적인 산물이다.

평소에 논문 쓰고, 남의 논문을 까는게 내 일과였던 박사 과정을 돌이켜보면, 시험은 기똥차게 잘 치는데 정작 논문 주제는 못 가져오고, 탈고까지 못 밀고 나가는 아시아인, 특히 한국인 학생들을 정말 너무너무 많이 봤다. 주제라고 가져가는 걸 보면, 그거라도 빨리 쓰고 졸업할 수 있으면 다행이겠다, 교수님이 착해야지 졸업시켜 줄텐데라는 생각이 들고, 지도교수님한테 연구 중간에 까이고 나면 뭘 해야될지 방향 설정도 잘 못 잡는 경우가 대부분이다. 이게 흔히 말하는 주입식 교육의 결과물, 남들이 보여주는 것만 잘 카피하면 성공하는 교육 문화에서 자라왔기 때문은 아닐까? 학창시절에 미시와 거시경제학에서 만점을 받았던 과 친구 하나가 모 금융권 공사에서 낸 보고서를 보면 거시경제학 수업 시간에 교수님이 틀렸다고 몇 번이나 강조했던 유동성 함정 – LM 커브 논리를 그대로 갖다 썼더라. 카피 능력은 만점인데, 이해능력과 응용능력이 제로라는 이야기다.

런던에 유학가서 한번은 만점이라고 생각했던 시험지에 60점이 찍힌 걸 보고 충격먹은 적이 있었다. (참고로 영국의 대학원 과정에서 80점을 넘기면 과 탑을 노릴 수 있을만큼 채점이 짜다) 수업 조교와 앉아서 하나하나 복기를 해보니, 수학 과목이 아니라 경제학 과목인데 왜 수식만 있고 경제학적 함의는 안 적혀 있냐, 니가 여기서 최소한 10점 이상 날렸다, 그리고 가르쳐 주신 내용만 쓸 게 아니라, 니 나름대로 배운 내용이 있을텐데, 그런 내용이 들어가야 가산점을 준다는 식으로 이야기를 들었다. 그 학교 다니는 내내 필자가 제일 잘 친 과목 점수가 79점이었던 걸로 기억하는데, 죽어라 노력해도 주입식 교육의 한계를 완전히 벗어날 수는 없었나보다.

며칠 전에 어느 출판사에서 데이터 사이언스를 수학적으로 다루는 책을 한 권 쓰자고 연락이 왔다. 위에 쓴 것처럼 수학에 관심도 없는 사람들이 대다수인데 뭐하러 책 쓸까, 돈 안 되고 귀찮은데 굳이 하고 싶나요라고 답장을 드렸더니, 자기네들도 돈 안 되는거 알고 있단다ㅋㅋ

그래도 내가 한국의 주입식 교육에서 벗어나볼려고 발버둥을 쳤던 사람인데, 10년동안 발버둥친걸 반년 동안 페이지에 꾸역꾸역 우겨넣으면 누군가는 읽어보겠지, 그래서 코딩 부트캠프만 하고 나와서 정작 더 좋은 결과물 만들어내는 애들이 생기겠지라는 생각으로 책 쓰겠다고 결심을 했다.

 

왜 한국은 2류일까? (2)

You may also like...

15 Responses

  1. capitalist&investor 댓글:

    글이 품격이 없네요. 보는 뷰도 제한적이신듯 하고. 작성자는 그릇을 키우시는게 더 나을듯 합니다. 하긴 이것도 교육을 받았어야 됐겠죠^^

    • Keith 댓글:

      쓴 코멘트 감사합니다. 혹여나 시간 있으시면 어떤 부분이 제한적인 뷰였는지, 어떤 부분이 품격이 없다고 느껴졌는지 지적해주시면 더 좋겠습니다.
      지적을 받고나면 저도 그릇을 좀 키우고 싶어지는데, 구체적인 내용이 없으니 아쉽네요.

  2. mskh 댓글:

    근데 필자님이 까시는 커뮤니티도 보면 수학적 토론도 상당히 많이 있고, 논문 수식 자세하게 검토하는 토론 및 모임도 제법 있는걸로 아는데요.. 그런건 찾아보기라도 하신건지..?
    코딩 관련 질문도 물론 올라옵니다만 스택오버플로에 있으면 애초에 그런 질문 올리면 안되는 걸까요?
    그런 질문이 있다 = 전체 IT커뮤니티 수듄 ㅉㅉ
    이라는 논리 자체가 객관적으로 많이 하자가 보입니다. 일반화가 많이 심한듯
    필자님 좀 운이 없으신건지 주변에 되게 여러종류의 깡통들이 많나보네요.. 다른 글까지 합쳐서 멍청한 소위 ‘필자가 아는 지인’만 몇 명 몇 종류인지 ㅎㄷㄷ
    말투가 일부러 다 깔보듯이 말하시는건지 원래 성격이 그러신건지 솔직히 은근슬쩍 자기외에 사람들 다 까면서 나만 깨어있는 사람이니 자기강의 들으라는 소리로 보입니다..
    이러면 또 자기 강의해봤자 별로 안남고 하고싶지도 않다는 둥 얘기하실텐데 그래보인다는 거지 필자님이 어떻게 생각하시는지에 관계없이 그렇게 보입니다. 쿨병 중증같아보이셔요

    • mskh 댓글:

      솔직히 글 보다보면 공감할만한 부분, 특히 통계쪽 view는 공감하는 부분이 많습니다. 그런데도 말하는 거 보시면 일부러 과장되게 말하시는게 아니라면 심하게 자기만의 세계에 빠져있는 걸로 보입니다.

    • Keith 댓글:

      좋은 지적 감사합니다. 기대했던 지식 레벨의 지적이 아니라 조금 아쉽습니다만, 항상 지적해주시는 분들 덕분에 성장할 수 있다고 생각하고 마음을 열고 듣습니다. 나름대로 답변을 드리겠습니다.

      우선 이 글을 쓰고 난지 1년 남짓이 되었는데, 그 동안 저 위에 올린 IT 커뮤니티를 다시 가 본적이 없었던 것은 사실입니다. 당시에 제가 봤던 포스팅들은 코드 디버깅 하기 귀찮음 or 능력 부족이 드러나는 질문, 특히 구글링하면 첫 링크에 걸린 Stack에 나오는데 왜 안 찾고 저기 올리는거지라는 생각이 드는 질문, 수리통계학 지식이 부족한데 공부할 생각없이 물어보고 기다려보자는 느낌이 드는 질문들, 석사 1학년이 학교서 배우는 통계학 수식들 열심히 정리하는 내용 아니면 홍보성 글들 밖에 없었습니다. 당시 주인장 분께 여러가지로 커뮤니티 업그레이드를 위해서 제안을 드렸습니다만, 사람들이 많이 오는게 더 중요하다고 주장을 하셔서 뜻이 맞지 않다고 느껴 절이 싫으면 중이 떠나야하지 않겠나는 생각에 더 들어간 적이 없었습니다.

      Stack에 있는 질문을 페북 커뮤니티에 올리는 거 자체는 그 분의 자유입니다만, 그걸 구글링 한 번 해 볼 생각하지 않는 유저들이 머신러닝 공부하겠다고 커뮤니티 활동을 하고 있는게 좋게 보이지만은 않았고, 저는 그런 분들과 같은 곳에 있고 싶지 않습니다. Stack이나 GitHub 커뮤니티, Tensor board 같은데 자주 가실 것 같은데, 같은 or 비슷한 질문 올라오면 duplicated라고 한 줄 달리고 최초 질문/답변글 링크만 달리는 경우가 많지 않습니까? 그럼 duplicated 질문을 삭제하거나, 미안하다는 쪽지를 보내는게 정상 아닌가요? 답변해주는 사람에 대한 기본적인 예의는 본인이 최대한 공부를 하고 조사를 한 다음에 몰라서 물어본다는 자세이지 않을까 싶습니다. 모든 걸 다 떠나서 남의 지식과 시간을 요구하는 사람이 최소한의 염치가 있어야죠. 전 그렇게 염치없는 사람들이 퇴출되지 않는 커뮤니티가 싫어서, 절이 싫어서 중이 떠났습니다.

      전체 IT커뮤니티 수준이라는 말씀주셨는데, 이런 이야기 한 번 해 보겠습니다. 며칠전에 모 대기업에서 AI 컨퍼런스(?) 행사를 했는데, 어느 스타트업 CTO가 나와서 Decision Making process에 AI를 적용하는 방식으로 회사가 서비스를 준비하고 있다는 PT가 있었습니다. 계속 Probabilistic modeling을 했다는데 그냥 계산 모듈만 엄청 돌린거 아닌가는 불편함을 갖고 PT를 보다가, 마지막에 게임이론과 Reinforcement learning을 결합해서 택시와 승객 matching 효율을 끌어올린 이야기를 하길래 집중해봤습니다. 근데 거기도 기초적인 게임 모델만 넣고 결국 계산으로 heavily stochastic 인 데이터 매칭을 시도하고 있길래 실망스러웠습니다. 저와 비슷한 백그라운드의 친구들과 이야기하면서 Trembling hand equilibrium 같은 probabilistic 모델로 게임을 먼저 셋팅한 다음, 실제 데이터로 calibration을 Bayesian이나 Adaptive로 조절하는게 계산적인 로드도 덜 걸리고, 모델도 훨씬 더 Elegant해 지지 않냐는 결론으로 흘러가는데, 한 친구가 이렇게 이야기 하더군요. “야, 공대 애들이 게임이론 쓰겠다는게 어디냐, 박수쳐줘야지.” 박장대소하고 대화를 끝냈습니다.

      수학하는 애들의 거만함이 느껴진다구요? 그 분을 무시했냐구요? 저는 그 스타트업 CTO 분이 한국 안에 100명도 안 될 높은 수준으로 이쪽 업계에서 일하고 있는 공학도라는 사실을 잘 알고 있습니다. 제가 수학과 통계학을 좀 더 아는 부분에서 코멘트를 했던만큼 그 분이 Computer Science에 좀 더 깊은 지식을 갖고 제가 하는 업무에 지적하실 수 있을거라고 생각합니다. 이런 정도는 서로의 강점을 내세우고 약점에 대한 지적을 겸허하게 받아들이는 수준이지 누군가를 무시하는 건 아니라고 생각합니다. 문제는, 꼭 온라인에서의 IT커뮤니티 뿐만 아니라, 실제로 업계 내에 대부분의 사람들이 공학도들만이, 심지어 코딩만 하던 코더들이 이걸 하는 거라고 착각하고 있고, 수학, 통계학 기반의 모델을 모르고, 경시한 채로 사업을 진행하고 있습니다. pabii 사업 특성상 여기저기서 강의 요청도 많고, “AI 업계”에 있다는 사람들을 뵐 일이 정말 많습니다만, 위에 언급한 IT커뮤니티에서 실망할 수 밖에 없었던 “계산 마인드” 위주인 사람들이 아닌 경우를 만나기가 매우 힘듭니다. 그런 분은 기억하고, 너무 반갑다고 제가 술 사겠다고 개인적으로 친분을 유지하려고도 합니다만, 안타깝게도 정말 몇 분 안 됩니다. 잘 아시겠지만, 결국 지식이 성장하려면 돌아다니는 Tensorflow 코드를 카피할게 아니라, 수학과 통계학을 이용해서 계산 모듈을 업그레이드 시켜야하지 않겠습니까? 그런 문제의식을 갖고 시장에 접근하는 분들이 거의 없는데 제가 어떻게 만족하고 있겠습니까? 외람됩니다만, mskh님 주변에서 괜찮다고 생각하시는 분들 상당수가 저와 제 주변 분들 눈에 “깡통”일지도 모릅니다. 모든 걸 다 떠나서 수리통계학, 계산통계학 훈련 받은 애들이 하는 Data Science 업무에 코더들이 왜 끼어들겠다고 하는지, 왜 우리나라만 이런 현상이 유독 두드러지는지 뭔가 느껴지는게 없으십니까? CS 아니라 Computer Engineering 라인인 분들이 Data Science 팀에 들어가는 경우가 많은지, 관계없어 보이는 경제학 박사들이 많은지 실리콘밸리가서 한번 구경해보세요. 우리나라 데이터 사이언스 업계가 심각하게 잘못 돌아가고 있습니다. Computer Engineering 전공의 커리큘럼을 봤을 때, mskh님이 말씀하시는 수학적 토론도 하시는 분들이 시장의 주류라면 절대로 생기지 않을 일들입니다. 한국이 프로그래머가 아니러 코더를 양산하는 IT산업 구조를 갖고 있다고, 그게 데이터 사이언스 업계를 망치고 있다고 말한게 바로 이 부분입니다.

      깔보고 무시한다고 하시는데, 저는 실력없이 직위와 명성을 갖고 있는 사람들은 가루가 되도록 까여야된다고 생각합니다. 다른 전공 상황은 모르겠습니다만, Econ 대학원 시절부터 Econ 방법론을 이용하는 Finance, Financial Math, Financial Engineering 같은 분야 연구자들 모두가 자주 보는 econjobmarketrumor.com에 가끔 들어가보는데, 실력없는 박사, 교수들에 대한 구체적인 힐난이 적혀있습니다. 학부 2학년도 알만한 General Equilibrium을 모르고 Market Clearing Condition을 증명해라고 박사생을 긁었던 교수는 소문나서 학교에서 쫓겨난 사례도 있고, 거기서 Normal distribution이 non-random이라고 끝까지 우기다가 유명 박사 프로그램에서 쫓겨난 학생도 있습니다. 실력이 없으면 욕먹고, 무시당하고, 퇴출되는 것은 당연한 겁니다. 제가 실력이 없다고 판단되면 사정없이 힐난해주십시오. 공부를 더 하거나, 데이터 사이언스를 포기하겠습니다. 제가 직접 실명을 거론하면서 명예훼손을 한 것도 아니고, 이렇게 멍청한 소리하면 안 된다는 주의사항 차원에서 글의 소재로 쓰는 것조차 불편하시다면 제 입장에서도 달리 할 말은 없습니다.

      강의는 시장에서 “계산 마인드”가 특히 “코딩 마인드”가 퇴출되고, “모델 마인드”가 정착되면 언제라도 그만둘 생각입니다. GitHub 코드 몇 줄 복사한 수준인 주제에 Valuation 30억 부르면서 학원 팔려고 하는 어느 Data Science 학원에게 저는 눈에 가시같은 존재일겁니다. 저같은 눈의 가시가 좀 많아졌으면 좋겠습니다. 왜 제 수업에만 박사 학위자들이 오고, 강남 일대의 다른 학원들에는 안 가실지 한번 생각해봐주십시오. 여기 블로그 글들은 제 강의를 들으라는게 아니라, 데이터 사이언스를 똑바로 배우고 제대로 알자는 제 나름의 웅변입니다. 요즘 제 마음 상태가 쿨병 중증이라면, 치료제는 두가지 뿐인 것 같습니다. 제가 히키코모리가 되어서 인간관계를 접거나, 아니면 그 스타트업 CTO 분 수준이 아닌 짝퉁 지식인들이 모조리 퇴출되거나요. 저는 2번째를 만들기 위해서 제 나름대로 노력 중입니다.

      • mskh 댓글:

        개인적으로 대부분 제가 말한것과 핀트가 빗나가는 부분이 많은 것 같습니다만..정말 장문의 답글을 주셨군요.
        공손해보이지만 은근 슬쩍 비꼬는 부분도 버무리신게 백미네요.

        ‘한국’에서 머신러닝 제대로 시작한지 별로 안됬습니다. 알파고? 일부 선행자가 아니면 그 이후에 애초에 틀이 제대로 잡히고 퍼지기까지 시간이 오래걸린데다가 중국처럼 정부 지원따위는 존재하지도 않죠. 그런상황에서도 그나마 IT 커뮤니티가 스멀스멀 조그맣게 시작해서 그나마 이정도 왔다고 생각합니다. 아직도 더 커야합니다. 커뮤니티 주인장님이 일단 사람을 더 많이 모아야한다고 하신 것은 필자가 생각하는 ‘오합지졸 수준 낮은 커뮤니티’로 남겠다는게 아니라, ‘더 많은 사람들이 생각을 공유하는 커뮤니티’를 만드는게 적어도 지금 시점에서는 더 필요하다고 판단하신거라고 봅니다.

        필자님이 생각하시는 수학과 통계학을 이용해서 업그레이드 하는 것은 당연히 이상적인 목표이죠. 하지만 그런 사람들은 현재 소수의 사람인 것은 당연한 것 아니겠습니까? 그런 소수의 사람들도 IT 커뮤니티에서 그러한 수학적 설명들과 개인 실험들을 하시고 공유하시는데 인색하지 않았기때문에 여기까지 성장한 것이라고 봅니다. 애초에 성숙되지 않은 커뮤니티에서 너무 많은 것을 바라는 것 같습니다. 아직 많은 사람들은 copy & paste 하는 과정에서 아직 헤메이고 있는게 사실입니다. 다음 스탭으로 넘어가려면 어차피 수학적 통계적 사고가 필요하다는 당연한 커뮤니티에서도 계속 나오는 이야기이고 토론도 많이들 하십니다. 애초에 toy data 벗어나서 실제 데이터 적용할 때 copy & paste만 해서 성과가 나오는 분야도 아니지 않나요..?
        통계쪽 하시던 분들은 코딩때문에 고생하고, 코딩하시던 분들은 수학/통계에서 고생하죠. 저같은 경우에도 학부 시절에 산업공학과를 전공해서 통계를 어느정도 배운상태로 머신러닝을 시작하고 ‘어? 이거 결국 그냥 모두 통계나 선형대수에서 하던 거를 응용한 것 뿐이잖아?’ 라고 생각했던 적이 있고, SAS로만 해봤던 코딩을 python 처음으로 시작하면서 고생도 많이 했었네요. 결국 합쳐진 길로 가게 되는 겁니다. 그 길을 못따라가면 뒤쳐지는 것이고요

        성과 > 이론이라는 논리는 위험하다고 생각하지만 아직 성숙하지 않은 업계에서 회사 입장에서는 ‘이거는 이론적으로 안돼’ 이러는 사람들보다 개똥철학이라도’ 약간의 성과’라도 나오는 사람들을 원하는건 어쩔 수 없는 부분이라고 생각합니다. 회사들의 속내는 사실 AI고 나발이고 관심없고 이윤추구가 목적일테니까요

        그리고 필자가 주장하시는 ‘실력없이 직위와 명성’을 가지고 있는 사람의 정의도 궁금하군요. 적어도 열악한 환경에서 ‘행동’하고 나름대로의 ‘결과’를 만들어 냈으니 직위와 명성을 얻은 것 아닙니까? 물론 진짜 아무 것도 없는 것을 있다고 포장하는 사람들은 사기꾼이니 가루가 되기는 커녕 그냥 이쪽 업계에서 퇴출시켜야 한다고 생각합니다. 하지만 기초적이라도 뭔가를 ‘시도’하는 것 자체를 필자님의 예시처럼 ‘공대생 주제에 게임이론 씩이나 쓰셨어? ㅋㅋ’라는 식으로 현학적으로 비꼬고 우습게 보는 것은 잘못된 것으로 보입니다. 당연히 기초 이론이라도 ‘적용’해보는 것이랑 ‘이론’적으로 가설만 세우는 거랑은 당연히 다르지요.

        한국에서 데이터 사이언스를 가르치는데가 별로 없고, 강남 일대의 다른 학원, 특히 국비지원하는 학원은 비교하는건 여러모로 유감스러운건 당연히 아시겠죠..? 비교하고 싶으시면 차라리 coursera나 Udemy 같은 온라인 강의랑 비교하시는게 나을 것 같습니다.

        저는 필자님의 생각 자체가 틀렸다고 언급한적 없습니다. 오히려 공감하는 부분도 많구요. 하지만 예를 들어 설명해 드리자면 어떤 장소에 ‘쓰레기를 버리지 맙시다’라는 표지판이 있다고 했을 때, ‘착한 여러분은 쓰레기를 버리시지 않으시겠죠?’ 가 아니라 필자님의 글은 ‘니네 보니까 쓰레기 존~나 버려대더라 제발 그러지좀 마라 좀’ 이런 표현이라고 보면 됩니다. 같은 주의사항이지만 표현이 전혀 다르지요? 다시 말하자면 ‘쓰레기 버리지 말자’라는 내용을 비판하는게 아니라 공격적인 말투와 자세를 불편하다고 하는 겁니다. 다른 글에서도 언급하셨지만 본인의 성격문제라고 하시면 더 할 말은 없네요. 우리 나라에서 솔직히 통계에 제대로 base를 두고 있는 사람이 많지 않기에 박사까지 따신 필자님의 열의와 현재 상황에 대한 답답함은 충분히 이해합니다만, 좀 더 너그러운 시선을 가졌으면 좋겠네요. 우리나라는 2류가 맞습니다. 2류에서 1류로 넘어가야하는 거죠. 제가 이렇게 말씀드린다고 한 사람의 성격이 변하는 건 아닐테지만 일단 적어봅니다.

        • Keith 댓글:

          먼저 긴 댓글 감사합니다.
          공감하는 부분이 많습니다만, 생각의 차이가 좀 있는 부분이 있고, 그것 때문에 제 강한 어조가 더더욱 불편하게 느껴지시는 것 같습니다.
          mskh님 시선으로는 열악한 상황에서 뭐라도 하는 사람들에게 칭찬을 해 주는 방식으로 산업을 키워야된다고 보시는 것 같은데요,저는 그 때문에 Computer Engineer들이 이 시장에 진입하는게 당연하다는 착각을 하고 있다고 판단했고,그들이 시장에 진입해서 물을 흐리는게 “열악한 상황~”이 아니라 “잘못되었다”고 보는 겁니다. 쉽게 이야기하면 전 이걸 수학 & 통계학 기반으로 공부하느냐에서 0과 1의 discrete 숫자로 보는거고, mskh님은 코드건 수학&통계학이건 배움의 과정은 0~1의 continuous 숫자로 보는 것 같네요.

          제가 수리통계학 공부하고 계산통계를 Financial math에 적용하는데서 머신러닝 공부를 시작했기 때문에 어느 정도 biased된 관점을 가지고 있다는 점은 인정하지만, 그렇다고해도 코드 위주로 돌아가는 한국 현실이 1로 가는건 철저하게 불가능하다는 점, 잘해봐야 베끼기로 0에서 벗어날 가능성만 가지고 있는 점을 따져볼 때 제 관점이 틀렸다고 생각하지 않습니다. 코드 카피하는건 0에서 탈피해서 0.5가 되는게 아니라, 0인데 0.5인것처럼 거짓말하는거에요. 학부 고학년 수준이라도 모델링 지식을 응용하기 시작하면서 0을 탈출하게 되는겁니다. 다 떠나서 기업이 사업 모델로 적용하는건 무조건 1이어야 하지 않습니까?

          전 이걸 거의 “사기”에 가까운 “범죄”급으로 잘못되었다고 생각하기 때문에 어조가 굉장히 강하게 나오는건데, 관점이 다르다보니 제 어조에 거부감이 있으신 것 같네요. 왜 제가 이걸 범죄라고 생각하는지 경험에 기반한 예시만 하나 드리겠습니다.

          실리콘 밸리 모 스타트업에서 박사 이후 첫 커리어를 아주 짧은 시간동안 밟았습니다. 1주일만에 바로 발을 뺐었거든요.
          제 팀장이 전형적인 Engineer 였는데, 모델 만들어보다가 모르겠으니까 절 뽑은거였고, 회사들어가서도 애시당초 팀 회의가 진행되질 않았습니다.
          면접기간 내내 저한테 경쟁사 모델과 비슷한 걸 계속 만들어내는 숙제를 던지길래 좀 이상했었는데, 아니나다를까, 회사가 데이터만 있고, 사업모델 구현이 안 되더군요.
          그 팀장 분이 DB셋팅 이외에는 잉여인력인데, 회사에서는 경력있는 팀장급이니까 알아서 잘 하겠지, 어차피 수학이나 공대나 STEM 전공들 아냐? 비슷비슷한거 아냐?
          같은 사고방식의 MBA 출신들이 회사를 운영하고 있었습니다.
          제 앞에 스탠포드 통계학 출신이 있었다가 바로 떠났던 기록을 봤었고, 그 친구가 나중에 Uber 가 있던걸 만나서 뒷 이야기도 들었는데 저랑 불만사항이 똑같더군요.
          아뭏튼 저는 바로 회사를 떠났고, 그 회사는 버티다가 작년에 청산 절차에 들어갔다는 소식만 들었습니다. 투자사는 돈을 날린거죠. 저는 당연한 결과라고 생각합니다. 투자사가 똑똑했다면 그런 Engineer가 전 직장이 주장하는 모델을 만드는게 불가능하다는 사실을 인지하고 Data Scientist를 구해오거나, 투자는 못 한다고 했어야됐겠죠. 당시 interested party들이 문제점을 인지하고 있었는지는 잘 모르겠습니다만, 팀 구성상황을 봤을 때 그 사업은 불가능한 걸 가능하다고 우긴 경우에 지나지 않습니다.

          위의 사례가 비전문가인 Engineer가 Data “Science”팀 (“Engineer”팀 말고)을 운영했을 때 나타나는 폐해의 좋은 예시가 되지 않을까요? 그 어떤 Data Scientist도 자기 보스가 교과서의 Correlation 함수를 보고 “Look, how complicated the function is!” 같은 소리를 하고, 무슨 모델인지 이해도 못하면서 엉뚱한 소리만 하는데 즐겁게 회사를 다닐 수는 없습니다.
          한국에 그런 회사들 엄청 많지 않습니까? 얼마전엔 똘똘한 Data Scientist 하나 없으면서 Engineer랑 Analyst 인력만 갖고 5천억 투자받는 대기업 자회사도 봤습니다. 그 회사에 직접 강의도 가 봤기 때문에 인력 수준에 나름대로 View가 있었는데, 5천억 투자 소식은 정말 충격적이었습니다.

          뭐라도 좀 해봤으니까 칭찬해주는데 최소한의 필요조건은 하다못해 학부 고학년 수준의 수학, 통계학 지식을 갖고 머신러닝 모델을 응용하는거라고 봅니다. 지금처럼 수학, 통계학 지식은 Zero에 수렴하면서 코드 베끼기만 해 놓은 상태로 뭔가를 만들어냈다는 이유로 칭찬하고 직급을 높여주기 시작하면
          회사 하나가 아니라 한국의 업계 전체를 제가 일찌감치 떠났던 회사 꼴로 만들어 버릴 것이라고 생각합니다. 계속 0으로 가는거죠. 그래서 제가 이런 상황을 “사기”라고 보고 “범죄”급으로 취급하고 어조를 높이는거죠. 적당히 못해야 “좀 잘해보자”는 식으로 응원하고 사기를 북돋아주지 않겠습니까?

          코딩경력 10년, 15년, 다룰 수 있는 프로그래밍 언어의 종류 같은 내용을 넣은 소개글과 함께 데이터 사이언스를 해 보고 싶다는 개발자 분들 메일을 한 두번 받은게 아닙니다. 그 분들은 수학, 통계학은 그냥 적당히 하는 흉내만내면 되고, 코드 잘 베껴서 예전에 프로그래밍 하듯이 일하면 되겠지라는 생각을 갖고 있기 때문에 저한테 코딩 경력을 정리한 소개를 하시는거라고 봐요. 저 분들은 모델을 만드실 분들이 아니라, 만든 모델이 서버에서 동작하도록 처리하시는 분들인데, 그걸 인지 못하고 저한테 그런 메일을 보내시는 이유가 뭘까요? 저는 그런 IT 커뮤니티들의 문제, 현재 한국 IT회사들이 데이터 인력을 활용하는 문제가 복합적으로 연결되어 있다고 생각합니다. IT 커뮤니티들에서 수학 & 통계학 못하면 바보취급 당할 수준으로 문화가 바뀌어야 개발자 분들이 저한테 그런 메일 안 쓰시지 않겠습니까?

          좀 더 깊숙한 곳을 찌르면, 여기 약간 “Engineer 카르텔” 있어요. “통계돌이 카르텔”이 생겨도 시장 수준이 올라갈지 확신할 수 없는 판국에, 더 갑갑한거죠. 정말 외면하고 살 생각하지 않으면 보기 너무 불편합니다. 최소한 컴공이 아니라 컴싸 사람들이 시장 장악을 하고만 있어도 응원하겠는데… 에효. 블록체인 scalability 업그레이드할 기술에 들어갈 수학 & 통계학 토론&이해는 안 하고, 그냥 코인 거래소만 만들고, 거래소 숫자가 전세계에서 제일 많은 나라가 된 걸 보면 뭔가 느껴지는게 없으십니까? 파이낸스 업계는 나름대로 “데이터 분석”한지 30년이 넘었는데 여전히 저 수준이라는 예시들을 원 글에 써 놨지 않습니까? 첫 단추가 잘못 꿰인 사람들이 높은 자리에 올라가 있으니까 고치는데 얼마나 오랜 시간이 걸려요?

          “현재의 트렌드는 문제가 있는 것 같다”는 식의 단조로운 비판이 아니라, “이거 정말 미친거 아냐?” or “너네 다들 바보지?” 같은 급의 폭언을 들어야할 상황이라고 생각합니다. 제가 그렇게 점잖은 말 못해서 안 하는 사람이 아니에요. 당장 4차 산업 혁명 지원을 위한 정부 지원안 보세요. 그게 Data Science는 통계학 지식이 필수적이다는 관점에서 나온 정책입니까? 제 전 직장 C-level들 처럼 Engineer나 Stat이나 Math나 전부 STEM이니까 서로 다 잘 아는거 아냐? 정도의 지식 수준인 사람들이 개발자가 IT 산업의 핵심이고, 그 사람들이 당연히 Stat, Math 지식을 풍부하게 갖고 있을 것이라고 “가정”하고 만든 정책들이에요. 제 평생에 공학 배운적 한 번도 없는데, 왜 저는 머신러닝 교과서가 쉽게 보이고, 관련 논문들이 어렵지 않게 읽히겠습니까?

          참고로 지난 정권의 “창조 경제” 설명을 한참들은 노벨 경제학상 수상자 Sargent가 “Bull~ Shit!” 이라고 그랬습니다. 심지어 정부 관계자들이 다 듣고 있는 자리에서요. 명성 있으신 분이 그런 상스러운 단어를 공식적인 자리에서 읊었다고 욕을 할 수도 있겠지만, 저는 “창조 경제”라는 말도 안 되는 경제 정책을 대통령 선거의 프로파간다로 내세우고, 경제 정책을 밀고 나갔던 전반적인 과정을 봤을 때, 정부 관계자들이 그런 욕을 먹어도 싸다고 생각합니다. 수준이 적당히 낮아야 근엄한 표정으로 “다른 방법을 취해보자”고 좋게 표현하지, 이건 해도해도 너무한, 수준 낮은 것과 별개로 아예 관점이 잘못 잡힌 상황이에요.

          그나마 통계학과 출신이 저한테 데이터 사이언스 해보고 싶다, 혹은 전공을 컴퓨터 과학으로 할지, 통계학으로 할지 고민이 된다는 메일을 받으면 반갑습니다. 원래는 컴퓨터 공학 가야되는 줄 알았는데, 여기 블로그 글을 읽고 생각이 바뀌어서 컴퓨터 과학으로 방향을 틀었다, 산업공학 전공 중인데, 블로그 글 읽고나니 통계학을 잘해야 산공 대학원에서 살아남을 수 있겠다는 생각이 들었다는 메일 받으면 다행이라고 생각합니다. mskh님은 몇 년 안에 그런 분들이 시장의 주류가 될 거라고 생각하시는거 같은데, 제 보기엔 가만히 두면 “Engineer 카르텔”이 Data Science 고위직에 올라가서 미래의 시장 주류들을 좌절시키는 시간이 매우 길게 지속될거라고 봅니다. Engineer 카르텔 위에서 핵심 의사 결정 내리는 우리나라 IT업계의 거물들이 Engineer 카르텔을 만들었던 2000년대 초 닷컴 버블 창시자들이니까요. “머신러닝 = Engineer”라는 컨셉이 “윗레벨”들 머리 속에서 붕괴되기 전까지는 답 없어요. 대통령이 탄핵 당하기 전까지, 경제가 골로 갈 때까지 안 되는 줄 알면서도 언론이 “창조 경제” 노래를 불렀던거처럼요.

          끝으로 두 개만 덧붙이면, Coursera나 Udemy에 있는 강의들도 제가 정말 많이 들어보는데 (돈 받고 가르치면 남들이 안 and 못 가르치는걸 가르쳐야된다고 생각해서 나름대로 시장조사합니다)
          많은 수업들이 수준이 높지 않습니다. 보고 있으면 괴로워요. 그거 몇 개 들은 수준으로 Data Scientist하겠다면 역시 시장 퇴출감이라고 생각합니다.

          댓글 내용 중에 산업공학과 출신인데 SAS로 하던걸 Python으로 하게된다고 코딩 배우는게 불편하셨다는 말씀을 하신걸로 봐서는 학부만 하신 것 같습니다. 더 코드치는 것과 멀어보이는 경제학 대학원에서도 석사 1학년 때부터 MATLAB, R을 배우고 그걸로 논문쓰느라 디버깅하면서 밤 새는 일이 잦았었으니까요. 수학한 사람이 코드가 불편하고, 코드하던 사람이 수학이 불편하다는 생각은 둘을 다 결합해야 연구 or 일을 할 수 있는 환경에 있지 않으셨던 분이기 때문에 가지는 관점이라고 생각합니다. Computer Engineer과 사회학, 철학 방법론을 쓰는 경우가 아닌 거의 모든 대학원에서는 각 학문별로 수학&통계학 모델링은 필수고, 그걸 코드로 구현하고 그래프 그리는 건 지극히 당연한 연구 과정입니다. 그래서 더더욱 Engineer쪽 백그라운드가 아니라 모델링할 수 있는 훈련을 받은 사람이 이 시장에 진입해야한다고 주장하는거구요. 실리콘 밸리의 어지간한 Data Scientist 포지션들이 quantitative 전공으로 최소 석사 학위가 있는 사람을 요구하는 것도, 그런 훈련을 받은 사람들이라는 걸 알기 때문이겠죠. 참고로, 그런 전공들은 코딩 실력으로 대학원생 뽑지 않고, 자기 전공의 내용을 모델로 만들 수 있는 능력, 모델링 능력을 갖고 있는지로 학생 선발합니다. 몇 십년간의 데이터가 쌓인 학교들이, 뭐가 중요한 스킬인지 몰라서 코딩 실력 안 보고 학생 뽑겠습니까?

  3. emily 댓글:

    사람마다 경험이나 의견이 다 다르기 마련이지만, 이렇게 긴 글을 남긴다는 것은
    두 분 다 이 분야에 애정이 깊기 때문이겠지요?

    가끔 저도 그래요,
    필자가 겪은 일들이 제게 일어난 것도 아니고, IT종사자로 일하고 있는 저로서는 글과 반대되는 일을 몇 번 겪기도 하는데(물론… 공감으로 비슷한 사연이 오버랩되는 때가 더 많다는 게 문제지만;;)
    굳이 이런 표현까지 써야했을까 싶을 때도 있어요. 정말 양심적이 똑똑하신 우리 박사님 모셔오고 싶을 때도 있구요 🙂

    하지만 한 편으로는,
    이 사람이 이렇게까지 표현하는 이유에 대해 고민해볼 필요도 있다고 봅니다.
    – 표현이 거친 부분에 대해 이해하라는 것이 아니라, –
    저는 언제부턴가 그 표현이 나오기까지의 과정들을 생각해보며
    그 사람의 성격으로 치부해버리기 전에
    나는 IT종사자로서, 일반 사회인으로서 이러한 이슈에 대해 갖았던 방향과 시선은 과연 올바른 것이었는지, 편협하거나 장점에만 호도되지는 않았는지,
    혹은 내가 섣부른 판단으로 중요한 개발과제에서 세금을 낭비하진 않았는지,
    앞으로 내 생각은 어떻게 균형을 잡아 나갈지 고민하는 계기로 삼을 필요는 있다고 생각했어요.
    (>> 결국 충격적인 몇몇 단어들에 정신이 흔들려서(?) 지금 다시 대학원 준비하고 있거든요 🙂 )

    그리고 내 경험이 nothing이 아니였던 것 처럼
    필자가 학생일 때부터 현재 사업에 이르기까지의 겪었던 일들이 모두 nothing은 아니였으니까요. 일부가 전체로 일반화시켜서 인식하는 것도 경계해야 하지만, 그 일부가 실은 주류로 자리잡아가는 것은 아닌지 경계하는 것도 필요할 것 같네요.

    뭔가 mskh님과 대화하고 싶은 부분이 많긴 하지만,
    ‘표현력, 냉담한 시선’ 혹은 인성(? 블로거님 죄송해요;;)에서 오는 불편함 때문에
    여러 가지 생각해볼 만한 주제들을 놓치실 것 같아서
    노파심에 긴 글 적어보았어요.

    혹시 반론이나 제가 잘못 이해한 부분이 있다면, 메일 부탁드려요.
    (>> 작업거는 거 아님-_-;; 집에서 애보느라 정신없는 사람입니다.)
    좋은하루되세요.

    • mskh 댓글:

      저는 개인적으로 오히려 필자님한테 공감하는 부분이 많습니다. 딥러닝이니 뭐니 하면서 feature engineering 및 기본적인 EDA과정도 안거치고 바로 그냥 신경망모델이 알아서 해주것지 하고 적용하는 사람들도 분명히 많으니까요..
      다만 저는 이것이 과도기에서의 현상이고 과거 닷컴버블마냥 약간 chasm상태라고 생각하는데 결국에는 필자님이 추구하는 방향으로 나아갈거라고 생각합니다. 오히려 그것에 못따라가는 사람들은 결국 제풀에 지쳐 쓰러지겟지요..
      다만 첫 댓글분이 적엇듯이 굳이 적을 만드는 말투라서 조금 신경쓰인 부분이 많아서 적게 되엇네요..
      성격 운운한건 필자님 본인께서 다른글에서 굳이 자신을 그렇게 표현하셧길래 언급한 것 뿐입니다 ㅎㅎㅎ..

      • mskh 댓글:

        EDA조차 하지않는 멍청한 방식이 주류로 자리잡지는 않을거라고 확신하는 것이 그러면 애초에 garbage in garbage out 밖에 안나오고 copy & paste로 실전적인 결과는 진짜 절대로 나올 일이 없으니까요..

      • emily 댓글:


        그러셨구나:)

        저는 속상해하시는 부분 많은 게 느껴지긴 했는데
        깊이있게 속뜻까지 헤아리진 못 했어요.
        답글 적어주셔서 감사
        보다 분명하게 글쓰신 거 맥락읽기가 되네요
        ^^

        * 근뎅
        첫글 댓글도 임팩트가 넘 세서
        이 분야 애정 넘치시는 분들 두렵;;
        (논문심사보다 더 떨림)

      • Keith 댓글:

        Finance guy들이 보통 “very shallow patience for stupid people”을 갖고 있다고 놀림을 듣습니다. 저도 아직 그런 생각의 틀을 벗어나고 있질 못하다보니 제 기준선보다 매우 낮은 상황에 냉소적인 시선이 강하게 뿜어져나오는 글을 쓰고 있는 것 같네요.

        지적해주시는 분이 있다는 건 언제나 고마운 일이라고 생각합니다. 앞으로 나올 글들은 좀 덜 강한 어조를 취하도록 고민해보겠습니다.

    • emily 댓글:

      *ps)
      제가 쓴 글 문장 내 주술호응ㅠ 맞춤법 틀린 게 업로드하고나니 여기저기 보이는데;;
      운영자님” 편집기능 없나봐요.ㅠ
      혹 제 댓글 읽으시는 분들.
      죄송합니다ㅜ

  4. Keith 댓글:

    며칠지나 제 댓글보니 제가 요즘 정말 많이 열받아 있는게 느껴지네요 ㅋㅋㅋ
    갑갑함이 지나치다보니 “쓰레기 X나 버려대더라~” 같은 격한 말투가 나온거 같긴한데,
    굳이 변명하자면, 현장에서 당하다보면 한숨 쉴 일이 정말 너무너무 많습니다.
    성격 안 좋은건 사실이지만 “빡침”도 상황이 있기 때문에 생기는거 아니겠습니까? ㅋㅋ

    mskh님이 현재 어떤 레벨로 공부하고 일하고 계신지는 모르겠습니다만, 다른 박사님들이 그랬듯이 제 수업에서 지적 충격으로 놀랄 일이 여러번 있을 것이라는 것에, 그만큼 격차가 크기 때문에 제가 분노하고 있다는 것에, 그리고 제가 요즘 하고 있는 외부 관계자와의 연락을 함께 겪으시면 저 이상으로 분노하게 되실 것에 꽤나 강한 확신이 있습니다.

    참고로, 컴공 (컴싸 아님) 출신 VC 한 분이 제 이메일 로그랑 미팅 몇 번 따라오시고는 “우와~ 진짜 화 안 나세요? 정말 너무 심한데요?” 같은 말씀 하시더라구요. 연구소 가 있는 박사 시절 친구 하나는 메일 함보고 “니가 맨날 욕하는거 너무 이해된다. 이건 정말…허~” 라고 위로해주고 갔었습니다.

    암튼 여긴 지식 전달하려고 쓰는 블로그지, 제 빡친 감정 토로하려고 글 쓰는 곳 아니니까 문장에 손을 좀 대겠습니다.

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다