데이터 사이언스의 적폐(敵弊), (꼰대) 개발자들

매번 하는 이야기지만, 데이터 사이언스를 하기 위한 최고의 학부 전공은 통계학이고, 관련 내용을 충실하게 배운 컴퓨터 과학, 산업공학, 경제학 출신들이 좋은 성과를 낼 수 있는 토대를 쌓고 졸업한다. 같은 맥락에서, PPT 만들다가 졸업하는 경영학과나, 코드 치다가 졸업하는 컴퓨터 공학과는 데이터 사이언스와 별 관련 없는 전공들이다.

그런데 왜 오해들을 할까? Data “Science”가 데이터 “분석”이나 “해석”으로 곡해되어 있기도 하고, 아이디어를 체계화 하는 작업에 코딩이 들어가니 컴공들이 하는거라고 잘못된 생각을해서 일 수도 있다. 좀 더 나가면 머신러닝 “패키지”라고 이름 붙은 것들 중에서 “자동화” or “정형화”된 코드를 그냥 “갖다 쓰면” 되는 부분들이 좀 보여서 일 수도 있다.

지금까지 사업차 미팅을 가거나, 저녁 시간에 짬을 낸 강의에서 만난 사람들 중 경영학과 출신들은 수식이 좀 나오면 대부분 “알아서 꼬리를 내리”더라. 모르는거니까, 학부 때도 깊이 없는 공부하는거 같아서 찜찜했는데, 정말 저런 지식들이 쓰이는 영역이 있구나, 눈치껏 도망가자는 생각을 하는게 눈에 보인다.

근데, 개발자들은 도무지 알아먹질 못하는 눈빛이다. “개발자 부심”이라고 하던데 (속칭 “개부심”….), 끝까지 다 할 수 있다고 바득바득 우기고, 심지어는 통계학이 뭐가 중요하냐, 머신러닝이 모든 걸 다 자동화 할 수 있다고 광신도처럼 믿고 있는 사람들도 수두룩하다. (정말로 그랬으면 인류가 지난 몇 백년간 쌓아올린 모든 학문의 연구자들이 전부 “알파고”로 대체되어야 한다. 한마디로 박사과정, 교수, 연구직 등등의 업무가 하나도 필요없다는 말과 같다. 겨우 데이터를 이용한 패턴 매칭하는 코드 카피하는 개발자 주제에 꿈도 크다고 말해주고 싶다 ㅋㅋ)

 

(꼰대) 개발자들의 거만함 – 개발자 부심 or 개부심

몇 줄 코딩 베끼기 지식에 대한 그런 퐝당한 거만함은 도대체 어디서 나오는걸까? 경영학과 친구들처럼 옆 동네 경제학과 애들한테 학부 시절부터 “PPT나 만들던 X보들ㅋㅋ”이라는 모욕을 한 번도 들어본 적이 없어서일까? 공대도 자연대 앞에서 기죽지 않나? 공대 안에서도 다른 전공들 대비 코드치는 컴공의 (수학적인) 학문적 깊이가 얕다는 사실을 인지할 기회가 없나? 그동안 만나봤던 컴공, 전기공 교수들도 인정을 하던데, 왜 박사 받고 와서 가르치는 레벨도 아니고 학부 갓 졸업하고 직장생활 n년 했던 개발자들이 그렇게 거만한거지? 님들 진짜 수학 하나도 모르시던데, 왜 수학이랑 수리통계학 엄청 쓰는 분야와서 물 흐리고 있냐? 수학 공부나 좀 하고 거만해지던가?

개발자들의 거만해빠진 메일을 받는 경우가 자주 있는데, 보통은 데이터 사이언스라는거 그냥 쉽게 코드 카피해서 쓱쓱쓱~ 하면 전문가 될 수 있는 것처럼 착각하는티가 팍팍 난다.

아래는 국내 어느 유명 IT 기업에 다닌다는 개발자가 쓴 메일이다.

제목: 개발자 관점에서 데이터 사이언스를 좀 더 이해하고자 문의 메일 드리게 되었습니다.

내용: 안녕하세요. 블로그 글 잘 읽어 보았습니다. 매우 알차게 읽었습니다. ^^; 저는 현재는 XX라는 회사에서 개발자로 일하고 있고, 데이터를 다루는데 있어서 여러 일에 흥미를 느끼고 있습니다. C++, Python, Lua, C#, Javascript 등의 언어 스킬과 Docker, Kubernetis, Mesos (DC/OS), Spark의 운영과 분산 잡모델, 빠른 데이터 검색 등에 대한 오픈소스 개발 지식을 가지고 있습니다. 최근 저는 YY와 관련한 정보를 전반적으로 다루는데 흥미를 느끼고 있고, 이를 위한 개인 프로젝트 및 회사를 창업하는데까지도 목표를 두고 데이터를 바라보고 있습니다. 데이터를 다루는 기술에 대해서 보다가, 일개 개발자 이지만 데이터 사이언스라는 것에 대한 올바른 인식이 좀 필요해서 개인 인터뷰를 해보고 싶은 생각이 들었습니다. 혹시 괜찮으시다면, 인터뷰가 가능할지 문의하고자 메일 드리게 되었습니다.

 

거만함? 모자람!

초딩이 수학과 교수한테 “3+2=5정도는 알고 있고, 친구들 사이에서 암산 속도 빠르다는 평가 받고, 당신 블로그 글은 좀 읽어봤는데, 수학 박사에 대한 올바른 인식이 필요해서 개인 인터뷰가 가능할지” 라고 묻는 걸 초딩의 거만함이라고 불러야할까? 모자람이라고 불러야할까?

올바른 인식 쌓으라고, 제발 좀 읽고 정신차리라고, 써 놓은 글만해도 100개가 넘는데, 글을 다 읽고 이해했으면 저런 메일을 썼을까? 읽어봤는데도 “올바른 인식이 필요해서 개인 인터뷰가 가능할지” 물어보는 메일을 쓸 용기가 나는건 거만함일까? 모자람일까? 내 밥벌이할 시간도 부족한데, 하다못해 통계학 석사하고 요즘 고민이 많습니다도 아니고, 완전히 비관련 업무에 종사하는 개발자가 뜬금없이 개인 인터뷰라니? 대기업에서 임원 자리 제시한다고 미팅 요청받던 날도 이런식으로 뻣뻣한 요청을 받은 적이 없다.

더 문제는, 저런 (거만함 가득찬) 개발자들 이메일받는게 한 두번이 아니라는거다. 심지어 찾아와서 면담하겠다고 약속도 없이 사무실에 들이닥치는 개발자들도 있었다.

개발자들이 잘 몰라서 저런 메일을 썼다고 변경하기에는, 정말 개발자 말고 다른 직군에서 저런 도전적인 메일을 받은 적이 거의 없다는 점을 강조하고 싶다. (보통 다른 직군분들께는 수업을 듣고 싶은데 수학 훈련이 덜 되어서 자신이 없다는 메일은 꽤나 받아봤고, 메일 안에 블로그 글의 맥락을 이해라도 한 티를 낸다.)

개발자가 아닌 다른 집단에서 필자에게 개인 시간을 내달라고 “부탁”하는 메일을 받는 경우는 갑질하기로 유명한 A급 언론사에서도 차장급 기자, 머신러닝을 응용해야하는 프로젝트를 이끄는 대기업 부장급 고위직들이다. 이름 알려진 스타트업은 대표들이 직접 찾아오기도 한다. 대학 계시는 교수님들이 지인 통해서 질문하면서 시간을 더 뺏기 미안하니, 특정 부분 강의 노트 좀 공유해달라고 하는 경우도 있긴 했다. 필요하다면 돈을 충분히 낼테니 자기 논문에 공동 저자로 올라와 달라고 머리 숙여 부탁하는 분들도 있다. 한발자국 나아가 교수직에 계신 분들이 머리를 숙이고 Pabii 수업에 오시는 경우도 은근히 있다. 그동안 박사학위자들 모인 연구소나 관련 기관에서 강의한 경험을 미뤄볼 때, 공부를 어지간히 한 분이라도 수업에서 놀라고 가는 부분이 꽤나 될 것이다.

“업력 = 내공 = 나이”는 아니겠지만, Best proxy라고 했을 때, 필자보다 최소한 5-10년 정도는 윗 줄이신 분들도 그렇게 고개숙인 메일을 보내주신다. 그정도 되시는 분들도 남의 시간을 뺏는걸 미안해하는티가 나고, 어떻게 반대급부를 제시해야하는지 조심스레 타진을 하는데, 도대체 개발자들은 무슨 정신상태길래 저런 메일을 보내는 걸까?

내가 특별히 잘난 인간도 아니고, 사회적으로 성공하신 높은 직위에 앉으신 분한테 그런 공손함이 가득한 메일을 받으면 죄송스럽다. 그럼에도 회사 대표가 회사 이익에 도움이 되지 않는일을 하기가 어렵다고 거절을 하더라도 최대한 예의를 지키게 되는데, 저런 “개부심” 가득한 개발자들 메일 받고 예의를 지킬 수 있는 성인군자는 못 되는거 같다.

(Source: CommitStrip.com)

– 개발 방식의 If-Then으로 “인공지능”을 주장하는 허구에 대한 조롱

 

 

왜 그럴까? – 한국 IT업계의 수준이 낮아서?

건설현장의 노가다꾼이 설계도면 그리는 건축가한테 “설계도면 그리는 건축학 지식에 대한 올바른 인식이 필요해서 개인 인터뷰가 가능할지” 물어보면 건축가가 뭐라고 대답할까? 건축공학과 말고 건축학과 5년 학부 과정에서 배우는 내용이 물리학, 화학 같은 자연과학부터 미술, 조경같은 예술적인 내용까지 어마어마한 내용을 배우던데, 노가다 10년 출신이 벽지, 배관, 씽크대, 화장실 타일 공사 등등을 해 봤다면서 건축가랑 1-2시간 이야기하고나면 건축학에 대한 조예를 얻을 수 있을 것이라고 생각하면 뭐라고 해 줘야하나?

긴 고민 끝에 내린 결론이 나왔다. 우리나라 IT 회사들이 데이터 작업을 개발 경력과 동일시하는 저급 인력 풀로 돌아가고 있기 때문이다. N모 게임 회사의 데이터 관련 부서는 부서장이 전직 개발자인데, 내세우는 경력이 어느 코딩 대회 우승이더라. 그리고 회사 안에서 “데이터 = 자신”이라는 명성을 긴 시간 쌓아올렸다고 하던데, 관계자들을 통해서 가만히 들어보면 여러방식으로 1차원적인 그래프 그려보고 고민하는 경영학과 애들 수준의 분석을 해 놓고는 그걸로 데이터에 대한 내공을 쌓아올렸다고 주장하고 있더라.

1차원에 살고 있다보니 2차원이나 3차원에서 일어나고 있는 일들을 전혀 이해 못하고, 그런 일을 시도할 수도 없는 문화가 조성된 상태가 계속되니 1차원 세계에서 간단하게 뚝딱뚝딱 코드쳐서 만들 수 있는 일들을 하는 개발자들에게 데이터 업무를 주고 있는 것이다. 그러니 1차원 사람들이 반응률 0.0x% 알고리즘에 머물고 있는 동안 3차원에 사는 사람들이 반응률이 1%가 넘는 알고리즘을 만들고 있는거다.

그런 프레임을 못 벗어나고 있으니 “Data Science라는 것도 코딩 들어가고 개발 비슷한 모양새인데, 저 사람이랑 1시간 정도 이야기해보면 쉽게 이해할 수 있는 거겠지”라는 사고에서 벗어나고 있질 못하는거 아닐까? 1시간 이야기할게 아니라 한 학기 동안 수학 + 통계학 고학년 전공 수업을 꽉꽉 채워서 듣고와도 힘들꺼라고 본다. Pabii의 데이터 사이언스 수업 수강생 분들은, (우리회사 직원들은 더더욱) 공감할 것이다.

좀 더 나아가면, 우리나라 IT업계 자체가 2000년대 초반에 컴퓨터 공학과 출신들이 간단한 아이디어를 “선점”하는 방식으로 사업 확장을 하는데서 한 발자국도 못 나가고 있다는 반증이라고도 볼 수 있다. 왜 실리콘 밸리와 큰 격차가 나고, 우리나라는 언제나 Follower 밖에 못하냐고? “연구”할 수 있는 능력, 기초 체력에 해당하는 자연과학 지식은 “이론적인 건 쓸데가 없다”는 식으로 철저하게 업무에서 배제하고, (베껴쓰기는 했지만) “하루만에 해냈다”고 칭찬하는 문화, 베껴쓰기 빨리하기를 권장하는 기업 문화가 그대로 유지되고 있기 때문이다. 구글이 2008년부터 도입했던 이미지 인식 기반의 검색기능을 2018년에 국내 최고 포털 서비스에서 겨우 시도하는게 딱 좋은 예시인 것 같다.

수업에 오는 IT업계 사람 비중, 개발자 비중이 대단히 낮은 이유도 마찬가지다. 코드 베끼기가 주 업무인 그 산업이 가장 지적인 도전의 수준이 낮기 때문이다. 정말 미안한 말이지만, 수업하고 난 다음에 받는 질문들을 보면 박사 학위자들 제외하고, 금융권에 계신 분들의 질문 수준이 제일 높다. 더 미안한 말인데, 컴공 출신들의 질문 수준보다 공대에서 경영학과라고 무시당하는 산공과, 문과라고 무시당하는 경제학과 출신들의 질문 수준이 훨씬 높고, 당연하겠지만 통계학과 출신들의 질문 수준이 더 높다. 가끔은 날카로워서 오싹했던 질문도 있었다. 지난 1년 반 동안 200명 정도의 학생을 최소 1달간 가르치면서 나온 stat이다. 수학 모르면 오지마라고 엄포를 놓았던 그 수업에서.

위의 설명이 틀렸다면 남는 답안은 한 가지 뿐이다. 사회성 결여 레벨 높다고 놀림 듣는 박사들보다 개발자들이 더 심하게 사회성이 결여된 집단이라는 답. 나는 잘났으니 니가 쓴 글 따위는 읽지 않고 니가 직접 시간을 내서 내 앞에서 설명해달라고 할 수 있다는 식의 갑질하는 메일 쓰고, 약속도 안 잡고 사무실에 무작정 쳐들어와서는 미팅을 요구하는 무례한 짓에 대한 다른 합리적인 설명이 있나?

 

 

나가며 – 적폐 Out! 개부심 Out!

개발자들한테 정말 미안한데, 그냥 개발만 열심히 하셨으면 좋겠다. 코딩 실력만으로는 데이터 사이언스를 이해할 수 없다는 냉혹한 현실을 블로그 다른 글에서 여러번 목격할 수 있을 것이다. 한국의 강남, 판교의 현실이 미국의 실리콘 밸리나 영국의 City of London 수준으로 잘 훈련된 Data Scientist를 소화할 레벨이 아니라는건 알지만, 당신들이 Data Science 하겠다고 달려드는 걸 보면, 선형대수학 증명 하나 제대로 못하는 경영학과 친구들이 Finance 박사가겠다고 까불던 학부 4학년 시절이 오버랩된다. MIT 물리학 박사, 수학 박사 하고 난 다음에 Post-Doc 대신에 박사 하나 더 하겠다고 들어가야할만큼 수학적인 훈련에 대한 요구사항이 높던 Finance 박사에 경영학과 출신이고 증권사 2-3년 다녔다고, 수학은 몰라도 업계의 지식이 있다고 까불던 그 친구들 ㅋㅋㅋ

증권사가서 세일즈 or 주식 트레이딩이나 해라고 놀려줬던 그 경영학과 친구들이 증권사에서 이제 차장급, 팀장급 짬이 되어있는데, 한국 증권사들 수준이 10년전의 그것과 똑같음에 냉소를 짓고 있는 오늘의 내 모습이 10년 후에 한국의 IT업계를 바라보는 모습과 오버랩이 될지, 아니면 우리나라 IT업계가 정신을 차릴지는, 아이러니컬하게도 코더들이 Data Science 업계에서 얼마나 빨리 쫓겨나느냐에 달려있을 것 같다.

이걸 코딩이라고 생각하는 당신들, 미안하지만, 정말 미안하지만 당신들이 적폐다. 당신들이 쫓겨나야 한다.

앞으로 pabii 블로그 글 안 읽고 위의 저런 메일 쓰는 개발자들 있으면 RTFM과 이 글 링크만 보내준다.

 


우리회사 채용 공고는 항상 블로그 글을 읽고 감상 소감을 써 내라는 요구조건이 포함되어 있다. 당연하겠지만 감상 소감이 부실하면 면접 안 본다. 사람을 뽑겠다고 시간을 쓸 작정을 하고 있을 때도 블로그 글을 읽고, 회사의 성장 방향과 사업 내용, 회사 대표의 생각을 읽고 찾아오기를 요구하는데, 바쁜 사람한테 시간 내 달라고 요구하면서 정작 블로그 글 1-2개만 읽고 연락하는 무례한 분께 시간을 내 드릴 수 있을만큼 착한 사람은 못 되는 것 같다. 상대방에게 예의를 요구한다면 그만큼의 예의를 지켜주셨으면 한다.

You may also like...

33 Responses

  1. (익명) 댓글:

    그럭저럭 대학 공대(기계공학) 나오고 석사마치고, 운좋게 공기업 들어가서 연구 비스무리하게 하고 있는데,

    제 삶이 항상 뭔가 답답했었거든요.

    근데 블로그 글을 읽고 나서 돌이켜보면,

    교수님들 중에서 유체에서 중요한 편미분, 고체에서는 텐서등에 대해서 제대로 강의하셨던 분이
    단 한분도 없었고, 수학적인 베이스가 없이 시험 공부하면 사실상 암기위주일 수 밖에 없고, 재미도 없고,

    나이 서른 먹고나서 뭔가 후련한 느낌이 듭니다. 블로그 글 볼 때마다 🙂

    근데 저는 이미 적폐인거 같아요. (공대계열에서 정말 아무 백그라운드도 없이 4차산업 과제 하는 거 보시면 놀라실 거에요)

    음 고민이 많아지네요 ㅎㅎ

    나름 공기업이라서 익명으로 글 쓰니 죄송합니다.

    새해복 많이 받으시고 건강하세요 🙂

    • Keith 댓글:

      뭐 이미 너무 많이봐서요.
      그냥 보고 있으면 딱합니다.
      공대 출신 분께는 정말 미안합니다만, 데이터 사이언스를 왜 공대 찾아가서 해달라고 하는지 잘 이해가 안 되네요.

  2. 앵벌이버드 댓글:

    연구소에서 인턴 중인데… 저를 뽑으신 박사님께서 바쁘셔서 본인 이름으로 신청한 매트랩 머신러닝 교육을 대신 갔었습니다…
    이 글 뿐만아니라 블로그에서 항상 욕하시는 부류의 사람들을 실제로 마주하고 왔는데… 어마무시 하더군요…
    ‘교차검증’이랑 ‘하이퍼 파라미터 튜닝’과 같은 기본 개념에 대해서도 모르고, 걍 데이터 모형에 때려박고 ‘성능’ 얘기만을 하며 ‘딥러닝’을 입에 달고 살던…

    • Keith 댓글:

      제가 이런 글을 쓸 수 밖에 없는 상황을 인지해주셔서, 또 공감해주셔서 너무 감사합니다.
      가끔은 정부 조직 주최로 그런 일들을 보는데, 자기들 딴에는 4차산업 발전을 위한 투자지만, 제 눈에는 밑빠진 독에 물 붓는 것 같은 세금 낭비거든요.
      왜 공대, 특히 개발자같은 “비전공자”들이 이 분야의 주류가 되었는지… 무슨 인류학과 출신한테 금감원장 자리 주는걸 보는 기분입니다…

  3. Traveler 댓글:

    저는 석사 전공으로 자연어 처리를 하고 박사 전공으로는 홍채인식을 하고 현재 미국에서 데이터 사이언티스트로 일하고 있습니다. 이곳에서도 어떻게 하면 데이터 사이언티스트가 될수 있냐는 질문을 숱하게 받구요, 저한테 책좀 추천해 달라고 하는데 Duda의 Pattern classification 과 Harman의 Statistical Learning theory를 내밀면 몇페이지 읽고 질색 팔색을 하더군요. 여기도 개발자들 중에 Python의 Scikit-Learn이나 Pytorch 라이브러리나 몇개 쓰는게 데이터 분석이라고 착각하는 사람들이 부지기수입니다. Deep learning이 요술봉 인줄 아는 사람들도 많구요. 제가 가서 기초 통계학부터 듣고 오라고 하면 머리 아프다고 지레 포기를 하더군요. 심지어 SQL만 쓸줄 알면 데이터 사이언티스트가 될수 있다고 생각하는 사람들도 많습니다. 꼰대들은 인종 나이 불문이더라구요. 저는 설명하기도 귀찮아서 그러려니 합니다. 블로그에 올리신 글들은 잘 보고 있습니다. 공감되는 부분도 많구요. 늦었지만 새해 복 많이 받으시길 바랍니다.

    • Keith 댓글:

      꼰대들은 인종 나이 불문ㅋㅋㅋㅋㅋ 너무 공감됩니다ㅋㅋ
      2016년 상반기에 실리콘밸리 잡 인터뷰를 본게 마지막이니까 저도 Outdated 정보를 갖고 있는 것 같기는 합니다만, 그 시절에 네트워킹 모임 같은데서 제가 Data Scientist 면접본다고 그러면 PhD 전공 묻고, 코드치는 플랫폼 질문이 꼭 나왔던게, 수학이랑 통계학 훈련이 된 사람인지, 아니면 Python에 있는 라이브러리 몇 개 쓰면서 “우기기”를 시전하는 개발자 출신인지 확인하려고 했던 거라고 생각합니다. 한국은 그런 질문조차 나올 상황이 아니었으니 제가 이런 글을 계속 써 왔던거구요. 요샌 조금씩 바뀌는거 같아서 그래도 희망을 갖고 있습니다 ^^

  4. Traveler 댓글:

    사실 제가 박사 학위를 하던 15년 전만해도 지금같은 머신러닝이나 데이타 분석을 위한 라이브러리가 전무했습니다. Feature를 뽑고 모델을 트레이닝 시키고 싶으면 theory를 전부 이해해서 직접 프로그램을 짜야했죠. 기계 번역을 위해서 NLP의 기본 인식 모델인 HMM을 만들거나 LDA, PCA, ICA등을 이용해 feature를 뽑거나 dimension을 reduction하고 뉴럴 네트웍을 이용해 training을 하고 싶으면 일일이 레이어 디자인을 하고 weight value에 매번 변화를 줘서 결과를 확인하고 Cross validation을 해서 직접 결과 그래프를 그려야 했으니까요. 그덕에 정말 통계분석 공부는 신물나게 했네요. 요즘 데이타 사이언티스트 자리 인터뷰 하러 오는 사람들이 NLP나 데이터 분석을 했다고 경력에 써내는거 보면 솔직히 기가 차지도 않더군요. 타이틀만 데이타 사이언티스트지 허접한 사람들 정말 많습니다. 이런 불평은 저만 하는게 아니구요 저희쪽 사람들 대다수가 공감하는 점입니다. 미국도 이런데 한국은 더 하겠죠. 척박한 환경에서 고생 많으십니다.

  5. Traveler 댓글:

    아 그리고 개발자들이 예의가 없는건 못배워서 그런겁니다. Dunning Kruger effect 아니겠습니까.

  6. ㅋㅋ 댓글:

    내가볼땐 님이 수학부심 개쩌는듯 ㅋㅋ;; 수부심이노? 이거야 수학 거 증명좀 한다고 실생활에서 얼마나 쓰인다고 ㅋㅋ

  7. ㅋㅋ 댓글:

    모든것은 기회비용이 있고 통계 공부할시간이 컴퓨터 공부한 사람도 있고 경영 공부한 사람도 있는건데 그런건 다 잡학이거 내가배운 통계학만이 최고다? ㅋㅋ 다른사람들은 다 꼰대? ㅋㅋ 누가 진짜 꼰대노 이거

    • Sebin Kim 댓글:

      축구선수보고 축구 못한다고 하면 그건 비아냥 이지만
      축구선수보고 농구 못한다고 하면 축구선수는 웃고 지나갈겁니다.

      왤까요?

      축구선수가 농구를 전혀 잘 할 필요도, 이유도, 심지어 대부분의 축구 선수는 관심 조차도 없을 것이기 때문입니다.

      지금 블로그 주인장님께서 하시는 말씀은

      컴퓨터 공학 하시는 분들이 컴퓨터 공학 안하고

      통계학 공부한 사람들이 하는 범위를 자기분야라고 주장하는 경우가 많기 때문에 하시는 겁니다.

      컴퓨터 공학 공부한 사람들이 통계학 못한다고 부끄러워 하거나 화가 나야합니까?

      요점을 잘못 잡으신것 같습니다.

      • ㅋㅋ 댓글:

        “경영학과 친구들처럼 옆 동네 경제학과 애들한테 학부 시절부터 “PPT나 만들던 X보들ㅋㅋ”이라는 모욕을 한 번도 들어본 적이 없어서일까? 공대도 자연대 앞에서 기죽지 않나” 누가봐도 수학우월주의 꼰대인데요 ㅋㅋ 수학 = 고수 = 최고

      • ㅋㅋ 댓글:

        나 이렇게 어려운 수학문제 푸는데 니들은 못풀지? ㅋㅋ 나이렇게 어려운거 한다~~ 내가 최고다~~ ㅋㅋ 네 다음 힙스터

      • 공돌이 댓글:

        지나가던 컴퓨터공학을 공부하는 학생입니다. 블로그에서 여러가지 좋은 글과 피드백을 읽다 잘 이해가 가지 않는 글이 있어서 질문을 남기게 되었습니다. 수학과 통계학 정말 중요하다고 생각합니다. 컴퓨터를 공부하면서 코드를 작성하는 것은 수학적 증명을 하는 것과 가 다는 말씀을 들으며 과목을 배웠기 때문에 수학과 통계학의 중요성이 크다는 것을 알고 있습니다.

        궁금한 점은 컴퓨터 공학을 전공한 사람들이 해야하는 컴퓨터공학이라는게 정확히 어떤 부분이 컴퓨터공학이라고 말씀하시는지 잘 모르겠습니다. 컴퓨터공학을 공부했다고 전부 개발자가 되는 것은 아닙니다. 그리고 개발자분들 중에서도 남의 코드를 배껴 사용하거나 예전부터 자신이 버릇처럼 코드를 작성하신 분들도 계시지만 계속 공부하시면서 더 좋은 프로그램 혹을 코드를 작생하기 위해 노력하시는 분들도 있다고 생각합니다.

        컴퓨터를 공부한 사람들의 범위, 통계학을 공부한 사람들의 범위가 딱 정해져있나요? 예를 들어 Machine Learning은 컴퓨터를 공부한 사람들도 통계학을 공부한 사람들도 전부 연구하는 분야입니다. 학문간에 한쪽이 이미 하는 연구이기 때문에 다른쪽에서 이건 자기 분야다 라고 하면 안된다 라고 말씀하시는 것은 학부생인 저도 잘 이해가 가지 않습니다. (물론 학부생이라고 니가 뭘안다고 라고 무시하실수도 있지만요.)

        컴퓨터 공학을 공부하는 사람들 중 통계학 못한다고 부끄러워 하는 사람들이 몇이나 될까 모르겠습니다. 반대로 통계학 공부하는 사람들이 프로그램 코드 못만든다고 부끄러워 하지 않는다고 생각합니다.

        • Myghal 댓글:

          저한테 물은거는 아니지만…

          데이터 사이언스에서는 코드는 그저 통계/수학적 모델링을 컴퓨터에서 실행시키기 위한 수단일 뿐이에요. 그걸 본말전도 해서 통계학/수학이 부수적인 것이고 코드를 더 우선시 여겨지는 상황이 어이가 없어서 이런 글을 작성하신거죠. (특히나 컴공과 출신 개발자들이 마치 데이터 사이언스를 데이터 관련 프로젝트로 여기고 덤비는 상황이 비일비재하니까요.)

          예를 더 들자면
          만약에 외국에서 사업을 한다고 할 때 외국말 능력이 더 중요할까요? 아니면 사업 모델이 더 중요할까요? 물론 외국말과 그 나라의 문화를 어느정도는 알고 있어야겠죠. 하지만 본질은 어떤 사업을 할 것인지 또 구체적 수익 모델을 어떻게 만들 것인지 이런게 더 중요하지 않을까요?

          • 공돌이 댓글:

            답변 달아 주셔서 감사합니다. 우선 블로그 주인님의 글에 제가 답변을 단 것이 아니라 컴퓨터공학은 통계학의 영역인 데이터 사이언스를 하면 안된다라는 식의 댓글을 보고 의아하여 글을 남긴 것입니다. 이 부분에 대해서는 오해가 없으시길 바라겠습니다..

            사실 개발자라고 해서 무조건 다 같은 개발자라고 생각하지 않습니다. 흔히 오해를 하시는 것이 컴퓨터 공부하는 애들은 코딩만 잘한다는 것인데, 그런 사람도 있고 오히려 이론적인 부분을 잘하는 사람들도 있습니다. 사실 컴퓨터는 공부하면 공부할수록 수학과 땔 수 없는 관계라고 알고 있습니다. 앨런 튜링이나 폰 노이만 같은 위대한 수학자들이 컴퓨터 과학에 막대한 영향력을 끼쳤기도 했고요.

            결론적으로 데이터 사이언스에 중요한 것은 수학적 모델링이라는 것에는 백번 동의를 합니다. 그리고 그러한 아이디어를 구현하기 위해서 코딩을 하는 것이 맞다고 생각하고요. 컴퓨터 공학을 공부하는 사람들은 수학이고 뭐고 아무것도 없이 코드만 작성하는 사람들이라는 느낌을 댓글에서 봐서 속상한 마음에 작성한 글이었습니다. 단순 프로그래밍 언어 몇개만 다룰 줄 안다고 나서는 (자칭)개발자분들에게는 죄송하지만 코드만 몇줄 만드는건 누구나 할 수 있다고 생각합니다.

          • Keith 댓글:

            외부인의 눈이라 정확한지는 모르겠습니다만, 아래 MJ님 말씀처럼 컴공과 컴싸는 다른 전공이라고 생각해요. 컴싸는 데이터 사이언스하기에 매우 좋은 전공이죠. 학부 경제학 출신입장에서 경영이랑 같이 묶어 “상대”라고 하면 솔직히 좀 심하게 자존심 상하는데, 공대에서 컴싸와 컴공은 서로 구분하지 않나요? 전 Finance, Quant Marketing 등의 몇몇 세부 전공을 제외하면 경영에 “학문”이라는 타이틀 달아주기 싫은데, 졸업생들의 진로나 교수님들 리서치를 보면 분명히 컴싸랑 컴공도 비슷한 관계일 것처럼 보입니다.

  8. MJ 댓글:

    컴공 컴싸는 다른 전공이라고 봐요
    학부 때 경영학 이중전공했었는데 경영 경제도 과 분위기 많이 다르더군요
    DS는 수학이랑 통계 기반이니 컴싸나 경제처럼 수학 통계학 훈련이 많은 전공이 관련이 많고, 컴공 경영처럼 학부 시절 도구 학문의 종류가 코딩이나 케이스 스터디인 학문은 솔까말 관련이 별로 없죠

    • 공돌이 댓글:

      답변 달아주셔서 감사합니다. 뜻하지 않게 약간의 오해가 있던 것 같습니다.

      미국에서는 CS, ECE, CSE 등 다양한 컴퓨터 관련 전공이 있는 것으로 알고 있습니다. 미국에 있는 친구에게 들은 말이지만 CS, CSE는 학교마다 이름만 다를 뿐 크게 다른점은 없지만 ECE의 경우에는 전자공학의 성격, 즉 공학적인 성격이 있다고 들었습니다.

      한국에서는 CS를 컴퓨터 공학, 컴퓨터 과학, 전산학, 컴퓨터학과 등 다양한 이름으로 사용하고 있다고 알고 있습니다. 왜그런지는 모르겠지만 영어명은 computer science인데 한국어명은 컴퓨터공학이라고 써서 한국에서는 그냥 통용적으로 컴공 = CS 라고 하는 경우가 많아 그렇게 이야기 하였습니다. (저도 솔직히 왜 공학이라는 단어를 붙이는 건지 모르겠습니다…)

  9. 이승철 댓글:

    음… 대단하신분들 많습니다.
    블로거님은 기초부터 하나하나 탄탄하게 쌓아오신분 같습니다. 글에서 그런것들이 느껴집니다. 요즘에는 비전공자도 프로그래밍의 중요성을 느끼며 파이썬이나 기타언어들을 습득하려는 분들이 많아졌습니다. 마찬가지로 데이터 사이언스라고 하면 거창할 수 있지만 수학에 대한 기반지식 없이 잘 나와있는 api를 사용하여 적절히 활용하시는 분들도 많습니다. 물론 블로거님이 말씀하신 내용은 통계학을 잘 알고 능수능란하게 다룰줄 아는 정통 데이터 사이언티스트를 예로 들으신것 이겠지만, 앞으로는 더욱더 비전공자들이 머신러닝이나 데이터 사이언스 분야를 공부하고 활용할 일이 많을것입니다. 물론 표준편차에 대한 개념정도는 알아야 하겠지만 전공자 수준을 알아야 잘 활용할수 있다라고는 동의할 수 없습니다. 혹시 블로거님이 작성하신 내용은 선행개발이나 코어를 개발하는 특정 분야에 대해 말씀하신건 아닌지요? 기준을 조금 낮추고 관용을 베푸시면 부정적인 것들이 줄어들고 사람들이 모일것이라 생각됩니다.

    • Keith 댓글:

      굳이 사람들을 모아야하나요?
      이 블로그는 저희 Pabii가 데이터 사이언스 역량이 압도적으로 뛰어난 R&D형 스타트업이라는 점을 알리려는 목적으로 운영되는 회사 블로그입니다. 회사 홍보 차원에서 블로그와 더불어 이승철님께서 말씀하신 “정통 데이터 사이언티스트”를 목표로 하는 분들이 찾아다녔을법한 강의를 부가 서비스로 제공하는 상태이구요. 굳이 다수를 위해서 기준을 낮추기보다 소수의 뛰어난 인재들과 높은 수준의 컨텐츠를 소화하실 수 있는 분께만 열려있는 프리미엄 공간으로 운영하고 싶습니다.

  10. Traveler 댓글:

    이게 결국은 업무에 대한 정의와 바운더리 문제로 귀결이 되네요. 참고로 미국같은 경우 Developer와 Data Scientist, Data analyst, Data architect의 업무 범위가 확실히 구분되어 있고 개발자들은 Data Scientist의 업무에 관여하지 않습니다.
    그런데 수학에 대한 기반 지식이 없이 API를 어떻게 적절히 활용하는지 참 궁금하네요. 예를 들어 이미지 노이즈의 경우 데이타 형태가 indepedent random variable이고 gaussian, Rayleigh, Gamma, exponential, uniform, impulse 등의 pdf 형태로 모델링이 되는데 degree of noise를 정의하기 위해 이런 데이터를 quantification 하는 문제 같은걸 수학적 지식이 없이 적절한 API 뭘 써서 해결을 하나요?
    저는 학부부터 박사까지 전공이 CS고 코딩이라면 신물나게 한 사람인데 수학과 통계학에 대한 지식없이 뭘 어떻게 문제를 푼다는 건지 이해가 안되네요. 그게 바로 개발자들이 기초 지식 없이 머신 러닝을 쓰면 모든게 해결된다고 착각하는 지점이죠. 블로그에서 주구장창 이야기를 하는데도 못 알아듣는 분들이 정말 많다는걸 느낍니다.

  11. ㅋㅋ 댓글:

    어떤개발자가 이런 마인드를 가진 사람들하고 협업하고 있는지 궁금하긴하네요ㅋㅋ

    • Traveler 댓글:

      글쎄요. 어떤쪽에서 일하시는지는 모르겠지만 지금까지 답글 다신걸로 봐서는 제가 같이 일하는 개발자들이 ㅋㅋ님보다 경험이 적거나 지식이 떨어지거나 개발하는 시스템이 질적으로 밀릴것 같지는 않습니다만
      원래 댓글을 안달려고 했는데 본문의 내용이 맘에 안 드실수도 있지만 답글에 기본적인 예의 정도는 갖추셨으면 합니다. 글에도 글쓴이의 인격이 드러나는 법이니까요.

    • emily26 댓글:

      저도 개발자이지만, 제가 의사결정자라면 pabii랑 협업추진할 것 같습니다 🙂
      && 제가 어느 정도 이해력을 갖추게 된다면 연봉에 상관없이 이 곳에서 일하고 싶을 정도인데,
      음..그럼, 저는 어떤 개발자에 속하게 되는 건가요? ㅋㅋ

      ‘ㅋㅋ’님의 말씀도 존중하지만.
      ‘이런 마인드’를 정의하는 폭을 조금 더 넓혀보시면 좋겠어요.

  12. Traveler 댓글:

    아. 그리고 저도 개발자 출신입니다. 그래서 양쪽의 시각차를 잘 이해하고 있는 편이구요. 같은 문제에 대해서 서로 보는 시각이 다르지만 데이터 사이언스쪽은 원래 개발자의 영역은 아닙니다. 블로그 주인분의 어조가 강하시긴하지만 틀린말은 하나도 없다고 봅니다.
    화가 나실수도 있지만 조금만 이 분야에서 더 일하시다보면 어느날 왜 주인장분이 이런 블로그를 열고 저런 글을 썼는지 이해하실 날이 올거라는 생각이 드네요.

    • Keith 댓글:

      항상 좋은 말씀 너무 감사합니다.
      저도 개발자 면접보다보면 너무 화가나는 일이 많다보니 어조에서 감정을 갈무리하기가 쉽지 않습니다만, 이런 공격적인 글을 쓰면서 욕을 안 먹을거라고 생각한 것도 아닙니다. 강한 의견을 제시했으면, 설령 옳은 내용이라고해도 일반의 관점과 다르다면 응당 반발을 감수해야죠. 예상했던터라, 또 많이 겪은터라 이젠 가벼운 마음으로 바라보고 있습니다.

  13. Digda 댓글:

    이건 뭐.. 문과계열 출신 개발자를 컴공 출신이 무시했던 현상이 통계학 분야, 데이터 사이언스 분야에서도 똑같이 벌어지는거로 느껴지네요. 개발자들의 기고만장함에 대한 반발이라는 생각과 함께 자업자득이라는 생각이 들면서도 별로 좋게 보이진 않네요. 이런 글이 블로그의 질과 회사의 명예를 높이는 글이라고 생각이 되지도 않구요. 주인장 분이 무슨 말씀 하고 싶은지, 왜 이런 글을 쓰시게 됐을지도 어느정도 이해는 갑니다만 이에는 이 눈에는 눈 같은 느낌입니다.

  14. ㅋㅋ 댓글:

    ㅋㅋㅋ 왜 글썻는지는 이해는 간다만 역설적으로 본인도 통계꼰대 아닌건가

    • Keith 댓글:

      타이틀이 경제학 교수나 경제학 연구소 연구위원인데 그 사람 경제학 모른다고 비판하는 글 쓰면 경제학꼰대 되는건가요?

      타이틀이 원자력핵공학 교수나 원자력 연구소 연구위원인데 그 사람 원자핵공학 모른다고 비판하는 글 쓰면 원자핵공학꼰대 되는건가요?

      타이틀이 데이터 사이언티스트인데 그 사람 수리통계학, 계산통계학 모른다고 비판하는 글 쓰면 통계꼰대 되는건가요?

      • MJ 댓글:

        팩력배 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
        속이 뻥~ 뚫립니다 ㅋㅋㅋㅋㅋㅋㅋㅋ

        저런 프로불편 댓글러는 무시하는게 답이라고 생각하는데, 이런 뚫어뻥 댓글도 가끔은 필요한듯요 ㅋㅋㅋㅋㅋㅋ

        • 앵벌이버드 댓글:

          최우추정도 모르면서 로지스틱 회귀 코드 돌리고, KKT 조건도 모르면서 SVM 코드 치면서 ‘이게 더 성능이 좋네’하는 수준의 개발자 or 경영학과 출신이 자기 얘기 엄청 써놓은 블로그글에 상심이 컸나봅니다… ㅋㅋㅋ

댓글 남기기