데이터 사이언스 블로그 Blog

3

굳이 블록체인이어야 할까?

몇 달전 어느 대기업 부장님께 회사 사업 모델을 설명 드리는 자리가 있었다.  Pabii 사업 모델에 주어진 도전을 크게 3가지로 구분할 수 있는데, 첫째는 스마트폰의 OS가 막아놓은 일부 정보를 불법적이지 않게 받아오는 개발자의 도전, 둘째는 그 데이터를 개인정보보호법에 저촉되지 않도록 가공처리한 후에도 타게팅 광고가 돌아가는 알고리즘에 대한 도전, 셋째는 우리 앱을 많이 설치하도록 유도하는 도전이다. 그동안 만나뵈었던 대기업 부장님과는 다르게 굉장히...

5

Blockchain 시리즈 – Smart Contract

비트코인 가격 (대)폭락으로 코인에 대한 일반 대중의 관심은 많이 시들해졌지만, 여전히 “차세대” 코인이라는 이더리움 (Ethereum) 류의 가상화폐에는 관심이 남아있는 걸 종종 보게 된다. “앞으로 기술이 더 발전하면 나아지지 않을까?” 라는 뒷맛을 남기는 코멘트에는 언제나 이더리움이 등장하더라. 이더리움이 Smart Contract를 상징하는 대표 코인이라는 점을 미뤄볼 때, 슬슬 블록체인 Hype이 한풀 꺾이고, 요즘은 Smart Contract가 대세로 자리잡고 있는 것 같다. (Source: SmartContract)...

7

빅데이터 vs. 스몰데이터

언론사 기자 분이 취재 요청이 왔다. 요청 내용 중에 빅데이터 시대가 끝나고 스몰데이터 시대가 온다는 주장에 대한 코멘트를 해달라고 하시더라. 모르는건 모른다고 시원하게 지르고, 전화를 끊으면서 스몰데이터가 뭔지 구글링을 해 봤다. 이미 단순 대용량 데이터가 빅데이터가 아니라는 주장, 개인화 + 동적 데이터가 결합되어서 Multi-pattern을 추적할 수 있는 데이터일 때 “빅데이터”라는 Label을 붙일 수 있다는 주장을 했었던 만큼, 제대로 오지도 않았던...

10

Data Scientist 면접 질문들

오랜만에 WorkingUS.com을 들어가봤다. 미국에서 일하는 한인들의 모임인데, 가끔은 Data Science 관련 분야에 대한 질문 & 답변도 올라오고, 한국 상황이 아니라 미국 상황에 맞는 답변이 많기 때문에 필요하신 분은 참고하시면 좋겠다. 링크의 어느 댓글을 보다가 필자기 2016년에 받았던 여러가지 질문들이 생각나서 한번 정리해본다. 참고로 링크를 보면 느끼게 되겠지만, 한국처럼 코딩을 얼마나 해 봤냐, C언어는 쓸 줄 아느냐, 알고리즘 한번 짜봐라 같은...

4

타겟 마케팅 – 1.기업들이 DSP를 써야하는 이유

기업들 세일즈 미팅이나 외부 특강을 가면 꼭 듣는 질문들이 있다. 우리가 가입자들 데이터를 내부적으로 굉장히 많이 갖고 있는데, 우리보다 더 많은 데이터를 갖고 있는가? 우리가 자체 DMP를 만들어서 광고할 유저를 뽑아내는 것보다 타게팅 알고리즘이 더 나은가? 어차피 구매할려고 했던 유저들에게 다시 광고 보여줘놓고 효율 좋다고 우기는건 아닌가? 우리가 모든 앱 이용자들에게 광고 메세지를 보내는 건 공짜인데, 타게팅은 돈이 든다. 그만한...

34

한국은 왜 2류일까 (2)

아래의 2개 예시는 판교의 어느 초일류 게임사에서 개발자로 밥벌이를 하는 친구의 질문에 대한 답변을 거의 그대로 옮겨 놓았다. (Source: Harnesslink)   1. Information equivalence “데이터의 해상도를 높이면 숨겨져 있는 데이터 속 패턴을 찾을 수 있다.” 와 같은 생각으로 요즘 회사 안에서 DB 기록 시간 단위를 좀 더 세분화하는, 이른바 “해상도를 높이는” 프로젝트를 진행 중이란다. 그러면서 정말 이게 효과가 있는거냐, 아무리...

1

Blockchain 시리즈 – ICO의 명암

가까운 변호사 친구들과 만난 자리에서 들었던 이야기다. 변호사 친구: “야, XXX형이 이번에 ICO해서 몇 십억 벌었다더라. 돈 벌 사람은 따로 있는거 같단 말야.” 필자: “형님 사업모델에 왠 ICO냐? 그거 뭐 사무실 공유같은 서비스 아님? 나중에 고소당하는거 아냐?ㅋ” 변호사 친구: “형은 자기 지분은 다 정리하고 나왔다던데? 아무 문제 없지 않을까?” 필자: “변호사인 니가 더 잘 알겠지 ㅋㅋ 근데 코인은 주식하곤 달라서...

15

Case study 좀 그만 찾으세요

학부시절 B모 전략 컨설팅 회사 인턴을 한 후, 평생 다시는 전략 컨설팅을 하지 않겠다고, 내가 그런 서비스를 쓰지도 않겠다고 결심했었다. 여기저기서 “사례”라는 걸 긁어 붙인 후, “분석”이랍시고 화려해보이는 그림 몇 개를 더 추가한 ppt 100장을 제공하는게 전략 컨설팅이라는 걸, 그런 풋내기 시절에 이미 보았기 때문이다. 나이를 먹고 점점 더 경험의 폭과 배움의 깊이가 깊어지면서, 요즘은 유명 전략 컨설팅 회사 출신이고...

4

국내 금융 산업에 Big Data Hub가 도입된다면?

사업하는 친구 하나가 그러더라. 보험 아줌마들을 대체할 수 있는 인공지능 서비스 만들어 볼 수 있지 않겠냐고. 필자의 반박 질문은 2가지였다. 개인 동의를 받아봐야 신용등급에 관련된 정보 밖에 긁어올 수가 없는데, 그 데이터로 맞춤형 보험 추천이 가능할까? 보험 아줌마들로 가입하는 채널이 전체 비중의 절반도 넘을텐데, 직접 찾아오는 사람들에게 정보 제공하는것만으로 세일즈가 가능할까? 첫번째 질문에 대한 대답은 빅데이터에 대한 정의를 “대용량”으로 볼...

9

비전문가들도 데이터 사이언스 공부해야하는 이유 (2)

몇 달전에 자살사고 관련된 설문조사를 몇 년동안 했다는 분의 데이터 모델링 요청을 받았다. 스트레스 받기 싫어서 보통은 일언지하에 거절하는데, 비트코인 가격 움직임 예측해서 돈 벌고 싶다는 헛소리도 아니고, 자살사고 예방이라면 취지가 좋은 것 같아서 일단 한번 말이나 들어보자는 생각에 뭘 원하는지 정리해서 보내달라고 했다. 아래는 그 때 받은 엑셀 파일에 있던 내용이다. 이런거 공개하면 메일 보내셨던 분께 무례가 될 수도...