인공지능인가? 고급 자동화 기술인가?

블록체인 투자 전문이라는 VC를 한 분 만났다. 인공지능이 세상을 이끄는 시대가 왔고, 그런 기술을 블록체인에 접목시켜서 비지니스의 혁신이 계속 일어날 것이란다. 곧 특이점이 오고, 그 때부터는 인류가 뭔가를 개발하는게 아니라, 프로그램이 자체 개발을 다 해서 지금까지 인류가 수백만년에 걸쳐 쌓아온 노하우와는 비교도 안 되는 어마어마한 발전이 앞으로 10년안에 일어날 거란다. (푸흡~)

VC와의 미팅은 언제나 둘 중 하나다. 필자의 블로그를 읽고, 괜히 아는체 했다가 다음 블로그 글의 비판 대상이 될까봐 눈치를 보는 VC와, 필자가 누군지 알지 못한 채 다른데서 열심히 떠들었던 말을 반복하는 VC들로 나뉘어진다. 아마 어지간한 스타트업 대표라는 사람들 수준이 다들 고만고만하니까 필자도 비슷한 수준으로 봤을테니 그렇게 자신감 넘치는 “세상 모르는 소리”를 읊으셨을 것이다. “혹시 머신러닝 말고 딥러닝이라는 신기술도 할 줄 아세요?”라고 묻던 스타트업 대표 하나 생각나네 ㅋㅋ

Pabii.co 블로그를 계속 읽으신 분들, 특히 수업에 찾아와서 직접 코드를 보신 분들은 더 깊게 공감하시겠지만, 인공지능 (AI)이라고 불리는 “기술”들은 엄밀하게 따지면 데이터를 바탕으로한 “자동화 알고리즘”이다. 말을 좀 바꾸면, AI라고 불리는 “프로그램”은 주어진 정보들을 바탕으로 “생각”하는게 아니라, 주어진 정보에서 뽑아낸 “규칙”을 “저장”하고 있다. “지능”이라는 단어를 붙여놓으니 마치 복잡하게 생각하는 능력을 갖춘 것처럼 들리지만, 사실은 빅데이터와 시뮬레이션을 바탕으로 예상 가능한 상황에 대한 매뉴얼을 마련해놓은 프로그램들이 돌아가는 것이다. 주먹구구식으로 if-then 조건만 걸었던 단순 자동화에서 데이터의 패턴으로 좀 더 다양한 경우의 수를 커버할 수 있는 자동화, 쉽게 말하면 데이터 기반의 (좀 더 고급) 자동화 시스템을 “인공지능”이라고 부르고 있다.

20세기 최고의 발명품을 세탁기라고 하더라. 가정 주부의 시간 대부분을 뺏던 옷 세탁 작업을 자동화한 덕분에 주부의 여가 시간이 대폭 늘어났고, 주부가 사회 경제 활동에 참여하거나, 남/여 독신 가구가 유지될 수 있는 조건이 갖춰지는데 결정적인 기여를 했다고 한다. 갑자기 인공지능 이야기를 하던 중에 왜 뜬금없이 세탁기가 나왔냐고? 둘 다 본질은 “자동화”이기 때문이다.

자율주행차? 차 주변에 달린 카메라가 눈의 역할을 하고, 내부 알고리즘으로 카메라의 영상과 데이터 베이스 안에 있는 다른 사물을 매칭한다. 덕분에 인간이 눈으로 직접 보고, 손과 발을 움직이지 않아도 되었다. 그럼 인간이 아예 운전을 안 해도 될까? 아직도 차량 속도가 빨라지면 카메라가 잡아내는 이미지의 수준이 떨어지고, 계산 모듈이 비슷한 사물을 매칭하는 시간 소모가 커서 상용화하기 힘들다는 비판이 나온다. 처음 가는 길, 혹은 도로가 미세하게 울퉁불퉁한 길에서 인간은 적절하게 반응할 수 있지만, 알고리즘은 데이터가 쌓여야 반응할 수 있다. 마치 팔만 얼룩이 진 세탁물을 세탁기에 넣었을 때 우리의 기대는 팔 부분만 세탁하는 거지만 옷 전체가 세탁되는 것처럼, 자율주행차 같은 “인공지능” 제품들도 “생각”해서 작동하는게 아니라 “암기”된 기준대로 작동할 뿐이기 때문이다.

(Source: GCN)

 

인공지능 개발의 난제? – by 모 전략컨설팅 회사

아래의 2개 (혹은 4개) 꼭지는 Mc모 유명 글로벌 전략 컨설팅 회사가 인공지능의 미래를 이야기하는 보고서에서 따온 것이다. 보고서 전체가 문돌이들의 풍부한 상상력이 담긴 글이라는 생각에 Trash Can으로 직행시켰다가, 이번 글에서 조목조목 비판해보고 난 다음에 Can 안으로 집어넣자고 스스로를 달래봤다.

  1. 인공지능은 현재 정체기인 성장율을 폭팔적으로 급등시켜줄 기폭제가 될 수 있다
  2. 하지만 투자대비 효율이 높은 상태는 아니고, 1-2년 사이에는 해결되기 힘든 많은 문제들이 여전히 존재하고 있다
    1. 생각하고 발전하는 AI를 만들었을 때, 그 통제 문제
    2. AI 개발을 통해 사라지는 노동 수요의 문제
    3. First mover advantage에 대한 믿음 때문에 서로간 연구 결과를 공유하지 않음

이게 단순히 데이터를 쌓아놓고 패턴을 찾아서 각 패턴별로 다른 액션을 끌어내는 프로그래밍에 불과하다는 사실을 전혀 모른채, 진짜 “지능”의 초기 단계인 것처럼 심각한 메세지를 던지는 이른바 “문돌이”들이 엄청나게 많다. (뭐, 필자도 문돌이다 ㅋㅋ)

 

1. 인공지능은 정말로 경제 성장율을 폭발적으로 급등시켜줄 기폭제가 될 수 있을까?

필자가 장기간 설명한대로, 인공지능은 데이터에 기반한 (쪼끔 더 고급) 자동화 기술이다. 그럼 자동화가 진행되면 경제 성장율이 폭발적으로 증가하나는 질문으로 바꿔볼 수 있을 것이다. 참고로, 인류 역사에서 1,2,3차 산업 혁명 모두 기계의 힘을 빌린 생산성의 증대로 부양 인구 숫자를 늘리고, 잉여 노동력을 만들어냈었다. 지금보다 더 자동화가 이뤄진다면 부양 인구는 늘어날 수도 있겠지만, 정작 잉여 노동력이 늘어날지는 잘 모르겠다. 무슨 말이냐고?

고령화 사회에 대한 대비를 해야한다, 출산율이 무서운 속도로 떨어지고 있다는 류의 인구 구조 변화에 대한 경고 메세지가 언론을 타고 다닌지도 이제 20년이 다 되어가는 시점이다. 생활 수준은 향상되었는데, 정작 생산성 증가 속도가 그에 따라오질 못하니 인구를 감당하지 못해서 생긴 현상인데, 세대별로 배운 기술 수준도 천차만별이고, 당연히 세대별 생산성도 크게 차이가 난다. 말을 바꾸면, 경제 성장율 폭발은 잉여 노동력이 된 구세대들이 4차 산업시대에 걸맞는 수준의 노동 생산성을 유지할 수 있느냐에 달려있다고 본다.

그 동안은 인구가 계속 증가했으니 구세대의 저생산성이 감춰졌겠지만, 이렇게 빠른 속도로 고령화되고 있는데, 구세대가 시대 흐름에 맞는 생산성을 보여주지 못한다면 잉여 노동력이 아니라, 잉여 소비력만 갖춘 인력으로 남게 될지도 모른다. MS-DOS나 Linux 같은 운영체제도 아니고 윈도우에 스마트폰 같은 쉬운 UI도 버거워하시는 세대들에게서 과연 그런 기대를 할 수 있을지는 잘 모르겠다.

(Source: Medium)

 

2-1. 생각하고 발전하는 AI를 만들었을 때, 그 통제의 문제는?

인공”지능”은 정말로 “생각”하고 “발전”하나? 그냥 데이터에 있는 패턴들을 매칭하는 “암기” 수준인데? 차라리 생명공학 연구실에서 복제 인간을 만들어냈을 때, 그 생명체의 인권이 있냐는 질문이 좀 더 적합하다고 생각한다.

애시당초 언론이 열심히 받아적기하고 있는 AI는 “지능”이 아니라 “패턴 매칭 알고리즘”에 불과하기 때문이다. 인간도 반복학습을 통해 뭔가를 배우니 “패턴 매칭 알고리즘”을 갖고 있는 생명체가 아니냐고? 그런데 인간은 정말로 “생각”하는데, “인공지능” 알고리즘은 어떻게 “생각”하는거지?

한 가지를 보면 열 가지를 깨닫는 “천재”는 어떻게 만들어 내야할까?

인공지능이라고 불리는 “패턴 매칭” 수준의 자동화 시스템이 진정한 “지능”으로 거듭나기 위해서는 반드시 “문일지십”을 할 수 있는 형태가 되어야한다.

Bayesian 통계학이 머신러닝에 적용되면서 이제 겨우 걸음마를 뗀 상태인 Dynamic updating도 새로운 정보를 생산해내는 능력은 없다. 단순히 snapshot 정보만 가공하다가 시간의 흐름에 맞춰서 가공되는 모델값을 업데이트할 수 있을 뿐이다. 최소한 지금 우리가 알고 있는 지식의 체계 아래서는 “생각하고 발전하는 AI”란 꿈꾸는 자들의 망상일 뿐이다.

 

2-2. AI 개발을 통해 사라지는 노동 수요의 문제

자동화가 이뤄지면 필연적으로 노동 수요가 기계로 대체될 수 밖에 없다. 말을 자동차로 대체하고 나니 승마는 귀족들의 전유물이 된 것처럼, 아마 자율주행차가 상용화되면 운전은 넷기어에서 나오는 드리프트처럼 부유층의 오락으로만 남을지도 모른다. 자율주행차 덕분에 택시, 트럭 등의 운전수가 알고리즘으로 교체되면 그런 인력들을 어디에서 소화할 수 있을까? 그보다, 사용자들이 계속 고용을 하려고 할까?

임금은 계속 오르고, 노동자들에게 보장해줘야하는 권리는 계속해서 추가된다. 투표로 먹고사는 정치인은 유권자의 대다수인 고용 노동자들의 복지를 개선하는 정책을 취하고, 노동력을 최대한 짜내야하는 기업가는 노동 비용이 더 저렴한 나라로 탈출하거나, 자동화 시스템에 의지할 수 밖에 없다.

여기까지만 들으면 노동자들이 21세기판 러다이트 운동이라도 해야할 판국이 아니냐고 생각하겠지만, 저런 자동화 시스템은 누가 만드는지 한번 되물어 보시라. 로봇 설계하고 제작하는 엔지니어가 필요하지 않을까? 산업 구조의 변화는 노동자를 해고하기만 하는게 아니라, 새로운 노동력을 고용하는 방식으로도 작동한다. 데이터 사이언스에 대한 붐이 불어서 석사 프로그램이 우후죽순처럼 생겨나고, 필자같은 허접 블로그 운영하는 사람에게도 문의 메일이 몰려드는건 사람들이 시대에 맞춰서 변화하고 있다는 증거라고 봐도 무방할 것이다.

산업혁명으로 농경지에서 쫓겨난 농노들이 런던, 맨체스터, 글래스고 같은 대도시들에 몰려들면서 새로운 노동력을 흡수했고, 도시 내에서 생활 공간을 제공해주는 고층 건물, 빠른 이동을 도와주는 도로 포장, 자동차, 지하철 공급이 덩달아서 이뤄졌다. 정보화 혁명이라고 하더니 컴퓨터 프로그래밍이 갑자기 각광을 받게 됐고, IT산업으로 억만장자가 된 사람들이 생겨나면서 예전에는 컴퓨터 수리공으로 입에 풀칠하기 바쁜 사람들 몇 명만 있던 산업이 미국 실리콘 밸리와 중국의 선전을 이끌어가게 됐다.

노동 수요가 사라졌다고? 실리콘 밸리의 1-bed flat 한 달 렌트비가 지난 10년 사이에 3배도 더 뛰었다는건 무슨 뜻일까?

(Source: Paragon Real Estate)

 

2-3. First mover advantage에 대한 믿음 때문에 서로간 연구 결과를 공유하지 않음

이건 도대체 또 무슨 뚱딴지 같은 분석인지 모르겠다. 당장 Github을 보라. 필자도 모든 아이디어를 Scratch부터 다 만들지 않고, 다른 박사들의 논문도 뒤져보고, Stack에 물어보고, Github 코드들을 보면서 계속 고민한다. 가끔은 학회에 가서 비슷한 고민을 했을 법한 사람들과 대화도 나누고, 내가 했던 리서치의 결과물을 공유하면서 상대방의 Insight도 얻어온다.

First mover advantage는 네트워크 효과로 사람들이 모이기 시작하면 성장 속도가 기하급수적이 되는 SNS 서비스 같은 분야 정도 밖에 없다. ARJ, ZIP 같은 압축 프로토콜을 한번 생각해보자. 비전문가들은 당연히 모르겠지만, 이게 대표적으로 PCA의 아이디어를 파일 시스템에 적용하는 방식인데, 일반에 널리퍼진 ZIP 계열의 프로토콜만 있는게 아니라, 계속해서 빠르고 고효율을 지향하는 새로운 프로토콜이 전세계 곳곳에서 생겨나고 있다. 요즘들어 안드로이드 운영체제에 많이 쓰이는 lz4라는 압축 프로토콜은 기존의 lz의 문제를 해결하려는 엔지니어들의 Joint work의 산물이기도 하다.

내 논문을 잘나가는 교수들에게 뺏긴 경험이 있기 때문에 무조건 협업 시스템을 긍정하고 싶지는 않지만, 내 논문을 뺏어갔던 교수도 그걸 Publish해서 명성을 쌓기 위함이지, 그걸 훔쳐서 자기 방구석에서 혼자만 낄낄거릴려고 하지는 않았을 것이다. 그런 연구가 산업에 적용되고 특허만 갖고 있으면 독점 이윤을 오래 누릴 수 있는 시대도 아니다. 수만명의 연구자가 같은 주제에 달려들어서 새로운 Notch를 하나 더 얹으려고 노력하고 있기 때문이다.

연구 결과물을 Publish해서 학문적인 명성을 쌓고 싶은 욕심과, 산업에 적용해서 큰 돈을 벌고 싶은 금전적인 욕심 사이에 어느 쪽이 더 고상한지, 속물스러운지 따위에 대한 논쟁을 하고 싶은 생각은 없다. 다만 어느 쪽이 되었건 인간의 욕심을 충족시켜주는 시스템이 다른 산업에 비해 굉장히 잘 작동하고 있는 분야에 “서로간 연구 결과를 공유하지 않음”이라는 평가를 내리는건 너무 섣부른 판단인 것 같다.

 

나가며 – 기술력이란?

얼마전, CTO 면접자리에서 자기가 인공지능에 대해서 엄청나게 많이 알고 있는 것처럼 주장하는 전형적인 코더를 한 분 만난적이 있다. 본인은 논문들을 계속 읽는다면서 새로운 지식을 빠르게 흡수하는 개발자인 것처럼 포장하시던데, 외람된 표현이지만 정말 “속 빈 강정”인게 너무 훤히 눈에 보이더라. 낙하하는 물체에 대한 이미지 스캔 데이터를 바탕으로 스캔된 물체가 어떻게 이동하고 있는지를 가르쳐주는 새로운 인공지능이 곧 나온다면서, 인공지능이 발전하는 속도가 무시무시하다, 니가 하는 사업은 인공지능이 안 들어간 것 같다, 그 사업 포기하고 새로운 인공지능을 활용하는 사업 모델로 갈아타라는 식으로 이야기 하시더라.

인공지능이라는게 데이터를 처리하는 알고리즘이라는 걸 제대로 인지하지 못한 채, 단순하게 코딩이 인공지능인 것처럼 착각하는 바보를 또 만났다는 생각에 허탈함이 차오르더라. (얼굴에도 드러났을라나? ㅋㅋ) 더 황당했던 부분은 물건이 낙하하는 걸 인지하는 인공지능은 새로운 레벨의 인공지능이고 이걸 자기는 정말 잘 아는 것처럼 주장하는 사람이 정작 그 알고리즘의 핵심인 Bayesian 통계학을 배운 적이 있기는 커녕, 용어조차도 처음 들어보는 표정을 지었다는 거다. 특정 사물에 대한 Dynamic image scan (시간적 순서를 달리하면서 움직임을 파악하기 위한 스캔 작업)의 결과물로 움직임을 계산하는 작업은 Bayesian 통계학의 대표적인 적용 분야다. 시간적 순서에 따라 새롭게 업데이트 되는 데이터를 바탕으로 여러 sub-model / sub-hypothesis에 대한 가중치를 바꿔가면서 모델을 업데이트하는 작업이기 때문이다. (필자의 모델링 수업 1번째 시간에 나오기도 한다.)

요즘 필자의 CTO 면접은 노동 수요가 사라지는게 아니라, 노동 수요의 요구 사항이 바뀐다는 좋은 예시, 과거 세대의 생산성은 미래 세대의 생산성을 따라올 수 없다는 좋은 예시가 아닐까 싶다.

 


(추가)

위에서 언급한 CTO 면접자가 자기가 수학을 모르는것과 상관없이 낙하하는 물체의 방향을 인지하는 “직관 물리학”을 소개한 것에 지나지 않는다고, 베이지안은 그거랑 무슨 관련이냐고 따로 (분노의) 연락을 하시길래, 왜 Bayesian이 중요하다고 했는지, 왜 수학 모르면서 아는체 하지말라고 했는지 좀 배우시라고 몇 줄 더 부연설명한다.

물체가 어느방향으로 움직이는지 직관적으로 알아내는 그런 “지능”이 들어간 시스템이 인공지능이 아니라, 입력되어 있던 데이터 모델과 새로운 데이터가 얼마나 매칭되는지를 계산하는게 요즘의 인공지능이라고 위에 길게 설명했으니 이 부분은 패스한다. 그럼 물체 사진을 입력했을 때, 하방이동 중인지 상방이동 중인지 구분하려면 기존의 데이터 모델은 어떻게 만드는걸까? 당연히 하방이동 중인 사진, 상방이동 중인 사진들로 내 모델을 “Learning” 시켜놨어야하지 않을까? 그렇게 움직이는 동체의 사진을 여러장 입력하는 작업이 바로 Dynamic image scan이다. 그리고 그런 데이터로 모델을 업데이팅 시키는 방식이 위에 언급한대로 Bayesian 통계학이고.

한참후에 연락이오더니, Neural net으로 이걸 맞출 수 있다면서 또 물체의 이동 방향도 모르는채로 Un-supervised learning을 하는 “인공지능”이라고 주장하시던데, 첫째, neural net은 feed forward, back propagation 계산 방식의 특성상 무조건 Supervised learning이 될 수 밖에 없다. Hobfield net처럼 내부적으로 뱅뱅돌아가는 시스템이면 또 모를까. 둘째, Bayesian을 안 쓰고 모델링을 한다고 해도, 모든 사진들에 대해서 이동 방향의 반대방향으로 잔상이 남는다는 점을 입력값으로 넣어줘야한다. 사진 1번은 하방 잔상이고 상방 이동 중, 2번은 우방 잔상이고 좌방 이동 중 등등. 이런 방식으로 Learning의 기초 데이터를 입력하지 않고 어떻게 모델링을 한단 말인가?

개발자들이 일반적으로 Un-supervised learning에 대한 맹목적인 기대를 갖고 있는데, (복잡하고 어려운 통계학을 알고 싶지 않으니 그냥 데이터랑 코드가 좀 알아서 척척척 해 줬으면 좋겠다는 희망일 것이다.) 이렇게 만들려면 사진마다 방향을 일일히 다 지정해줘야하고, Outlier 데이터들을 다 제거해야한다. 방향 잡을 때 방위는 몇 개인가? 동서남북만 잡을래? 더 복잡하게 8개? 16개? 속력에 따라 사진에 남는 잔상이 다를텐데? 직선으로 움직이지 않고 곡선으로 움직이는 물체는? 야구공, 축구공처럼 스스로 고속 회전이 있는 물체는? 잔상 모양이 다들 제각각일텐데? 이러느니 Bayesian 알고리즘으로 데이터 전처리를 하는게 훨씬 더 Intellectual & Efficient한 작업이라고 생각한다. 그래서 테슬라가 자율주행차에 Bayesian 알고리즘을 도입하고 있는 것이다.

수학과 통계학을 모르면 “우와~ 새로운 인공지능이다. 이거봐라, 이렇게 빨리 발전한다.” 이런식의 반응을 보이겠지만, 밑바탕의 모델을 잘 알고 있으면 “어? 이건 이런 모델을 이용했겠네, 비슷한거 만들려면 어떤 방식으로 데이터를 만들고, 어떻게 데이터 입력구조를 만들어야할까?” 같은 질문을 하게 된다. 위에서 언급했듯이, 이게 기술력이고, 이게 내공이다. 필요한 능력은? 코딩인가? 수학/통계학 모델링인가? (참고로 위에 언급한 아이디어들 대부분이 맥락만 다른 방식으로 우리 회사 모델에 적용되고 있다. 그럼 이 사업이 인공지능 기반이라고 부르는데 좀 더 공감해주실 수 있는가?)

모든 사람은 본인이 대단히 똑똑하다는 착각 속에 빠져산다. 박사가서 지도교수에게 후드려맞고, 논문 발표장에서 다른 연구자들에게 폭격을 맞으면서 스스로를 절차탁마하는 시절을 보내지 않으면, 회사에서 상사에게 쿠사리를 먹어가며 본인의 부족함을 메워넣는 지난한 시간을 보내지 않는 한 그런 착각을 벗어나기가 참 어렵다. (다 겪어봤고, 필자도 멘탈 박살나서 괴로웠던 경험이 평생에 걸쳐 쌓여있다.) 자기가 “소개”(라고 하지만 지식 자랑으로 느껴졌던)한 지식이 상대방의 눈에 어떤 방식의 알고리즘인지 한 눈에 각이 나오는 걸 본 적이 없었던 탓에, 또 본인이 그런 수학적인 내공을 쌓은 적이 없었던 탓에 위의 저런 비판이 기분이 나빴을 수는 있다. 근데, 더 늦기 전에 깨우쳐야 필자같은 사람들한테 욕 먹는 횟수가 줄지 않을까? 앞으로 그 분과의 대화에서 느낀 당황스러움이 몇 차례 더 후속 포스팅에 등장한다. (물론 개인의 권익 보호를 위해 개인정보는 제공하지 않는다.) 기분 나쁘다고 불평하는 연락하시기 전에, 이걸 배워서 남 앞에서 부끄러울 일을 좀 줄여야겠다고 스스로 다잡는 기회가 되시길 바랄 뿐이다.

You may also like...

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다