본문 바로가기
베를린 라이프

[문송 안한데요] 문과 출신이 데이터 사이언티스트로 취직하는 법

by 벨리너린 2021. 5. 14.
728x90

'문송합니다'는 밈이 되었다

문과 출신으로 취업이 잘 안되는 '문송합니다'는 일종의 밈(짤)이 된지 오래다. 나도 이십대 초반 당시 일명 '문과'로서 이런 밈을 재밌게 소비하기도 했다. 그러나 이제 이십대 후반이 되고, 본격적으로 먹고 사는 문제가 또래 사이에서 가장 중요한 문제가 되고 나니 '문송합니다'라는 밈을 재밌게만 바라볼 수 없게 되었다. 

 

재밌게만 바라볼 수 없던 이유는 단지 내가 문과라서 취업이 잘 되지 않을 것 같아서가 아니었다. 진짜 문제는 주변의 문과생들이 사회적 현상과 밈을 자신의 한계와 동일시하면서 부터였다. 문과생들이 실제로 취업시장에서 어려움을 겪고 있는 명백한 현실과 고통을 부정하고, 노오력하면 누구든 성공할 수 있단 이야기를 하려는게 아니다. 단지 지금 내 손에 쥐고 있는 패를 담담하게 인정하되, 나라는 개인이 거기서 어떻게 앞으로 나아갈지는 사회 통계를 넘어서 고민해야한다는 것이다

 

애초에 내가 왜 나 자신을 문과생이라고 정체화하게 되었는지부터 생각해보자. 나는 태어날때부터 문과인이었나? 아니면 고등학교때 문이과 중 하나 정하라고 하는데, 수학이 싫고 자신 없으니 골랐나? 내가 들어간 문과 대학 학과는 왜 골랐나? 그 학과에 대한 열정과 궁금증이 있어서 골랐나, 아니면 내가 받은 수능 점수 중 그나마 어른들이 괜찮다고 하는 과를 골랐나? 사실 그 이유가 어떻게 되었든 당신 탓을 하려는 것은 아니다. 그 당시의 당신은 아마 자기가 할 수 있는 최선의 선택을 했을 것이다. 단지, 내가 지금보다 어렸을 때 했던 선택에 대한 책임은 져야한다. 그리고 그 책임을 진다는 것은 별 거창한게 아니다. 그 선택은 다른 누구도 아닌 내가 했다는 것을 인정하고, 그런 선택을 한 과거의 나를 존중해주고, 미래의 나의 행복까지 내 책임이라는 것을 인식하면 된다. 

 

사실 나는 문과 출신이 이과 출신보다 좋은 데이터 사이언티스트가 되지 못할 이유는 1g도 없다고 생각한다. 그런 면에서 이 포스팅의 제목은 약간은 어그로였다. 애초에 각종 사회과학 학문에서 통계학적 방법으로 하는 연구가 엄청 많고, 실력있는 사회과학자들 중 실력있는 통계학자가 정말 많다. 그런 이유로 통계학, 데이터 사이언스, 머신 러닝의 선구자들 중 사회과학자들 역시 정말 많다. 생물학자가 돌리는 통계 모델링 코드가 사회과학자가 돌리는 통계 코드보다 복잡할 이유는 별로 없다. 오히려 공학에서 '무조건 내가 지은 다리가 무너지지 않아야한다'라는 100% 확신할 수 있는 계산적 논리를 '~할 확률이 얼마정도 있다'라는 통계적 논리보다 훨씬 중요시 하기 때문에 사회과학보다 통계적 사고를 덜 훈련받을 수도 있다.

 

데이터 사이언스에는 숫자와 코딩이 들어가기 때문에 이공계적인 분야라고 생각될 수도 있겠지만, 애초에 숫자와 코딩은 이공계만의 전유물이 아니었다. 코드는 내 생각을 구현해주는 연필 쯤이라고 생각하면 된다. 연필로 1000만원에 팔리는 그림도 그릴 수 있고 수학의 난제 증명도 풀어낼 수 있다. 그러나 내가 미대생만큼 연필을 자유자재로 다루지 않고, 화학 전공자만큼 흑연의 탄소구조를 이해하지 못한다고 해도 연필로 장 볼 리스트 적는 것이 내가 못할 일이라고 생각하지 않는다. 코딩도 마찬가지이다. 이미 많은 디자이너들이 코딩으로 시각적 비전을 표현하고, 사회과학자들이 코딩으로 학문적 발견을 하고 있다. 봉준호 감독이 미국 관중들에게 "1인치 자막의 장벽만 뛰어넘으면 여러분이 훨씬 더 많은 영화를 즐길 수 있습니다"라고 한 것 처럼, 어려워 보이는 숫자와 코딩의 장벽만 뛰어넘으면 데이터 사이언티스트가 될 수 있다. 

 우리가 데이터로 도달하고자 하는 바는 바로 인간에 대한 통찰이다

'나는 수학을 못하는데 어떻게 데이터 사이언티스트가 돼?'라고 생각할 수도 있다. 그러나 사실 대한민국에서 수능 시험 볼 정도의 수학 실력이면, 아니 중학교 수학을 이해할 수 있는 수준이면 데이터 사이언티스트가 되는 데에는 별로 큰 문제가 없다. (데이터 사이언티스트들 중에서 이 말에 반대하는 분들도 많이 계실거다.) 계산은 어차피 컴퓨터가 해주기 때문이다. 계산 능력보다 중요한 것은 논리적인 사고 능력이다. 나도 중고등학교 때 수학을 혐오했고, 중3때 수포자를 선언하고 고1때는 수학 점수가 40점대로까지 떨어졌었다. 미국 고등학교에서는 쪽지 시험에서 아예 F를 받아서 선생님이 방과후에 앉혀놓고 재시험도 보게 해서 겨우 C를 받은 적도 있다. 그 뿐인가, 학부 때는 통계학이 세상에서 제일 재미없는 학문이라고 생각했고, 통계학 개론 시험에서 울면서 나오면서 내 삶에 통계학은 다신 없을거라고 다짐한적도 있다. 그러나 불과 몇년 후 데이터 사이언스를 배우면서 깨달은 것은, 내가 여태까지 수학과 통계학을 싫어한다고 생각했던 것은 내가 그걸 내 인생에서 어떻게 사용할 수 있을지 몰라서였다는 사실이었다. 내가 데이터 사이언티스트로서 얼마나 많은 세상의 궁금증을 풀 수 있을지에 대한 가능성에 가슴이 설레기 시작한 순간, 그리고 그 궁금증을 풀기 위해 정확히 어떤 수학을 알아야 하는지 명확해진 순간, 그 과정이 훨씬 즐겁고 쉬워졌다. 

 

서론이 길었다. 이제부터 바로 내가 어떻게 문과 출신으로 데이터 사이언티스트로 취직했는지 써보도록 하겠다. 

 

1. 문과 출신이라는 점이 핸디캡이 아니라 프리미엄이라고 생각하자 

한 분야에서 최고가 되는 방법엔 두 가지가 있다. 첫 번째는 평생을 한 분야에 바쳐서 수 많은 사람들 중 맨 위에 올라가는 방법이다. 어릴 적 부터 평범한 일상과 유년기를 바쳐 혹독한 트레이닝으로 한 분야의 정상에 올라가는, 올림픽 금메달리스트, 세계적 피아니스트, 그리고 글로벌 무대로 활약하는 K-POP 스타 등이 그 예이다. 그런 1%의 장인들이 있기 때문에 99%의 우리는 특별한 감동을 받는다. 그러나 나머지 99%는 아무리 노력해도 유전과 환경이 맞물려주지 않으면 그렇게 되기 힘들다. 두 번째 방법은, 여러 분야를 겹쳐서 탁월함을 역치까지 훈련하고, 그 겹친 niche 영역을 할 수 있는 사람은 나 자신밖에 없게 하는 것이다. 어떤 일을 할 수 있는 사람이 나밖에 없으면 절대적 실력과는 상관 없이 내가 그 niche에서는 최고가 된다.

 

몸값은 사실 절대적 실력이 아니라 희소성에 비례한다. (희소성이란 단지 얼마나 적은 수가 존재하느냐가 아니라 수요에 비해 얼마나 공급이 적은가를 말한다.) 그 결과 나는 첫 직장 초봉부터 컴퓨터 공학 석사 출신의 7년차 시니어 풀스택 개발자보다 많은 연봉을 받게 되었다. 참고로 베를린을 비롯한 전세계는 현재 개발자 역시 인력난으로 희소한 상태이고, 따라서 개발자도 연봉이 높다. 문과 출신임에도 '불구하고' 이런 결과가 나온게 아니라, 기업이 필요로 하는 문과적 능력과 데이터 사이언스를 적극적으로 결합하였기 '때문에' 이런 결과가 나온 것이다. 

 

'취직'을 한다는 것은 내가 한 일의 결과물이 회사에 월급의 3배가 넘는 돈을 벌어줘야한다는 것이다. 실력이 좋으면 회사에 돈을 잘 벌어다 줄 수 있는 확률이 늘겠지만, 내 실력만 역치 이상으로 늘린다고 해서 회사가 항상 그에 비례하는 돈을 버는 것은 아니다. 코딩 실력만으로 놓고 보면 7년차 풀스택 개발자가 당연히 나보다 코딩을 열배는 잘할 것이다. 그러나 막상 컴공 출신들과 일하다보니, 조직에서 해결해되어야 하는 문제 정의와 파악 능력, 내 작업물의 가치를 어필하는 커뮤니케이션 능력, 조직과 업계에서 일어나는 정치와 비즈니스에 대한 통찰력 등은 순수 이공계 출신들 사이에서는 굉장히 희소한 능력이라는 것을 깨달았다. 그러나 회사는 돈을 벌기 위해 이 모든 문과적 능력 역시 필요로 한다. 데이터 사이언스도 인간과 사회에 대해 더 잘 이해하기 위한 도구일 뿐이고, 애초에 좋은 질문을 던지기 위해서, 그리고 진정으로 가치있는 결과를 도출하기 위해서는 인간과 사회에 대한 통찰이 선행 되어야한다. 자기 회사에서 풀타임으로 코딩하면서 배워나가라고 월급 주는 곳은 있지만 하루종일 인문학 서적을 읽으면서 인간에 대한 통찰을 높이라고 월급을 주는 곳은 없다. 그런면에서 대학교 때 문과를 전공하며 몇년을 통째로 투자해서 치열하게 인간과 사회에 대해 읽고 쓰고 토론할 수 있었던건 소중한 기회였다. 학부를 졸업하고 치열하게 생업 전선에서 일하다보면 인생에서 그럴 수 있는 기회는 흔치 않으니까. 그래서 지금 다시 학과 선택하던 고3시절로 돌아가도 똑같이 문과대 진학을 선택할 것이다.

 

제일 안타까운 점은, 문과 출신으로 데이터 사이언티스트가 되려고 하는 친구들이 대부분 문과적 배경이 페널티라고 생각하고 공대 출신들만큼 코딩의 전문가가 되려고 하는 데에 총력을 기울인다는 점이다. 내 장점을 부정하고 타인의 장점만을 베끼려고 하면 아무리 노력해도 처음부터 내가 질 수 밖에 없는 게임을 플레이하는 것이다. 게다가 9n년생에 태어난 우리는, 위로는 우리가 가나다 배울때 부터 코딩을 하던 시니어들과, 아래로는 가나다와 코딩을 동시에 배우는 코딩 네이티브들 사이에 낀 샌드위치 세대다. 문과 출신이던 아니던, 코딩 실력 자체만으로는 평생 먹고 살 경쟁력을 갖추기 힘든 세대라는 것이다. 거기서 정말 역치 이상으로 코딩 실력을 최대한 높이는게 내 젊음을 가장 잘 사용하는 법인지, 아니면 거기에 다른 능력을 얹어 나만의 가치를 개발할 것인지 잘 판단해야한다. 

 

세상은 앞으로도 훨씬 빠르게 변할 것이다. 우리가 고등학생일 때 아무도 우리에게 유튜버나 데이터 사이언티스트가 되라고 하지 않았고, 열심히 공부해서 의사나 변호사만 되면 평생 잘 먹고 잘 살 수 있을 거라고 말한 어른들은 자기가 살아본 세상에 대해서만 조언해줄 수 있을 뿐이었다. 나는 운이 좋아서 초봉부터 대학병원 의사보다 많이 벌게 되었지만, 머지 않아 내 직업도 수요가 떨어질 수도 있고, 아마 우리는 급변하는 시대에 맞춰 평생에 걸쳐서 몇 번을 더 직업교육을 다시 받아야 할 것이다. 그렇게 필연적으로 직업이 바뀔 때, 우리는 여태까지 해왔던 일을 버리고 처음부터 다시 시작하는 것이 아니라 우리만의 특별한 경험을 새로운 직업에 결합해서 더 발전된 가치를 창출해야한다

 

2. 코드는 원래 복붙해서 돌리는거다. 내 데이터셋에 맞춰 살짝 변형할 수 있을 수 있으면 된다.

원래 인류의 지식은 다른 모든 먼저 살아간 사람들이 일구어놓은 지식에 1mm 를 더 높게 쌓아 올리면서 발전한 것이다. 현대의 예고생들이 모차르트보다 피아노를 더 잘 친다는 이야기가 있다. 모차르트가 살던 시대로부터 피아노 교수법이 더 축적되며 발전했기 때문이다. 논문을 써본 경험이 있는 사람은 잘 알겠지만, 학문적 업적이라는 것도 결국엔 대단한 스타 학자의 천재성보다는 수많은 선행연구에 수많은 평범한 학자들이 1mm의 가치를 더해서 이뤄진것이 더 많다. 모든 사람들이 처음부터 모든 것을 새로 알아내고 만들어내야 했다면, 달 착륙은 커녕 인류는 아직도 부싯돌로 불을 떼는데에 제자리걸음 하고 있을 것이다. 

 

코딩, 특히 데이터 사이언스를 위한 코딩도 마찬가지이다. 코딩을 배우기 전에는 코드를 쓰는 사람들은 나와는 근본적으로 다른 대단한 천재같이 느껴진다. 수많은 할리우드 영화에서 해커들을 코드를 술술 써내는 천재 프로그래머로 묘사하니까. 그러나 내가 직접 코딩을 시작하고 나서 깨달은 사실은, 데이터 사이언스 실무에서 그렇게 직접 복잡한 코드를 외워서 술술 써내려 갈 일은 별로 없다는 것이다. 구글링을 해서 다른 사람이 만들어 놓은 코드를 복붙을 하고, 내 데이터셋에 맞게 변형하는 것이 95%를 차지한다. 대기업에선 심지어 아예 자주 쓰이는 모델 코드들을 라이브러리화 해서 최대한 자사의 데이터 사이언티스트들이 코드 쓰는 비효율적인 시간을 줄이려고 노력한다. 우리가 세상을 바꿀거라고 말하는 인공지능도 이렇게 구글링과 복붙으로 만들어진다. 

 

이렇게 말하면 누구나 데이터 사이언티스트가 될 수 있을 것 같다. 그러나 구글링을 잘 하는 것도 흔치 않은 능력이라는 것도 깨달았다. 내가 원하는 답이 나올 때 까지 치열하게 검색어를 바꿔가면서 구글링하고 답을 찾는 것은, 적어도 현대 사회에서는 무엇인가를 실제로 알고있는 것 만큼 중요한 능력이다. 따라서 다시 문과생의 능력이 강조되는 것인데, 결국 '좋은 질문을 던지는 사람'이 데이터 사이언티스트로서도 유망한 가능성이 있는 것이다. 구글링만 잘 할 수 있다면 세상에 배울 수 없는 것은 별로 없다. 

 

728x90

 

3. 20년 경력 개발자에게도 에러메시지는 뜬다. 될 때 까지 계속 도전하는 끈기가 더 중요하다.

처음 코딩을 시작할 땐 에러 메시지가 뜨는게 내 실력의 반증인것 같아 좌절했다. 내가 문과생이라서 그런가? 이건 역시 내겐 무리인 일인가? 하는 자괴감도 들었다. 그러나 20년 경력 개발자와 함께 일해보고 깨달았다. 20년을 코딩해도 에러 메시는 뜰 것이다. 그러나 시간이 갈 수록 에러 메시지를 이해하고 트러블슈팅하는 능력은 늘 것이다. 문제 없이 굴러가는 코드를 처음부터 써내는게 성장이 아니라 (애초에 이런 사람은 없다) 에러 메시지를 해결하기 위해 노력하는 시간동안 내 실력이 점점 늘어나는 것이다. 

 

앞서 구글링해서 다른 사람이 만들어 놓은 코드를 복붙하고, 내 데이터셋에 맞게 변형하는게 실무의 95%라고 했는데, 사실 여기에 에러 메시지를 보면서 왜 안될까 궁리하고 또다시 문제 해결을 위해 구글링하는게 추가된다. (물론 데이터 정리도.) 안 되면 될 때까지, 포기하지 않고 여러 각도에서 문제의 원인을 생각해보고 해결하는 끈기가 결국 실력이 되는 셈이다. 

 

윤여정 선생님이 그러시지 않았나. 결국 오래 살아 버티는게 이기는거라고. 20대 시절 가장 사랑받던 여배우가 아니었을지라도, 오래 자기 일을 하며 버티다보니 한국인 최초로 오스카상도 수상하게 되셨다. 코딩도 마찬가지인것 같다. 계속 포기하지 않고 '존버'하면서 어떻게던 코드를 돌아가게 만드는게, 처음부터 잘 하는 것 보다 중요하다. 

 

윤여정 선생님은 존버의 아이콘이 되었다

 

4. 코딩에 앞서 이론적인 논리를 먼저 생각해보자. 왜 그럴까? 

대학원 통계학 첫 학기 때, 교수는 그 어떤 통계학적 모델에서도 가장 중요한 것은 실질적으로 이론적인 배경이라는 것을 강조했다. 내가 이 분야에 대해서 알고 있는 사회과학적인 상식과 이론들을 생각해 봤을 때, 이 결과값이 말이 되는가? 그리고 이것은 반드시 직접적인 인과관계를 뜻하는가?

 

실무에서 빅데이터를 다루다보면 엄청나게 방대한 양의 데이터셋을 다루게 되고, 정보값을 조금이라도 잃기 주저하면서 그냥 무조건 그 많은 데이터를 모델에 때려넣고 돌리고, 그 후 가장 예측 정확도가 높은 모델을 기계적으로 선택하는 데이터 사이언티스트들을 많이 보게 된다. 특히 통계학적 사고 위주로 훈련되지 않고, 최대한 좋은 성능을 위주로 훈련된 똑똑한 공대 출신 데이터 사이언티스트들도 이런 오류를 많이 범한다. 또한 인간과 사회에 대한 실질적인 이해가 충분히 이뤄져야 내가 다루는 데이터셋도 이해하고 좀 더 정확한 모델링을 할 수 있는데, 데이터셋을 인간으로 보는게 아니라 숫자로만 바라보면 아무리 복잡한 모델링과 분석을 하더라도 결과를 제대로 해석하고 이해할 수 없다. (게다가 무조건 방대한 양의 데이터를 넣고 돌리는 모델링의 시간적, 경제적 손실은 물론이고, 어마무시한 탄소배출량 때문에 환경적 손실도 엄청나다.) 

 

문과 출신의 데이터 사이언티스트로서의 강점도 바로 여기서 나온다. 내가 애초에 수학을 싫어했는데도 데이터 사이언티스트가 되기로 결심한 이유는, 데이터가 현대사회에서, 공대생만이 다루기엔 너무나 막강하고 중요해졌다고 판단해서였다. 얼마나 많은 인공지능이 부정적인 사회적 편견과 차별을 그대로 학습한다는 기사가 연이어 나오는가. 이공계 출신을 디스하려는게 아니라, 최대한 다양한 배경 지식을 가진 사람들이 데이터를 다뤄야 데이터 분석 결과가 인류에게 더 가치있게 작용할 수 있다는 뜻이다.

 

5. 학력보다 프로젝트를 이력서 맨 위에 올려놓자. 

이력서에서 제일 중요한것은 경력과 학력이라고 생각하겠지만, 사실 문과 출신이라면 내 기술적인 실무 능력 먼저 증명을 해야 예선이라도 통과할 수 있다. 사실 데이터 사이언스라는게 생긴지 오래되지 않은 분야이기 때문에, 전세계 많은 유명 대학에서 아예 관련 학과가 없거나 이제야 신설하는 추세이기도 하다. 

 

그래서 나는 이력서 맨 위에 아예 데이터 사이언스 관련 프로젝트들과 해커톤 수상 경력 등을 올려 놓아 실무적 능력과 데이터 사이언스에 대한 열정을 어필했다. 학력은 구석에 가장 조그맣게 쑤셔놨다. 이력서 순서만 바꿨을 뿐인데도, 서류 통과율이 거의 0%에서 40%로 수직상승했다. (그 동안 엄청나게 서류 광탈을 했다는 소리이다.) 먼저 서류전형을 통과해야 면접에서 내 역량을 어필할수도 있으니까, 이 부분이 꽤 중요했다는걸 깨달았다. 


급변하는 세상을 살아가면서 점점 깨닫는건, 그 어떤 타이틀이나 성취도 평생 잘 먹고 잘 사는 것을 보장해주지 않는다는 것이다. 끊임 없이 변하는 세상을 읽고, 그에 맞춰 나의 능력을 계발하지 않으면 살아남기 힘들다는 것이다. 설령 소위 '금수저'로 태어난다고 해도, 부자로 태어난 사람의 20%만이 부자로 죽는다는 것을 아는가? 건물주가 된다고 해도, 공실률이 높아 적자를 보는 건물주가 얼마나 많은지 아는가? 그 어떤 삶이든 환상으로서 동경할 때는 막연히 완벽해보이지만, 현실이 되어보면 지구에 미생으로 태어난 이상 살아남기 위한 발버둥은 피할 수 없다. 

 

물론 인생에 더 불리하고 유리한 출발선을 가지는 사람의 차이는 크다. 당연히 애초에 극빈하게 태어나서 평생을 교육의 기회조차 박탈되어 살아가는 사람의 고통과 적자가 난 건물주의 고통을 동일선상에서 비교하려는 의도는 추호도 없다. 그러나 '문송합니다'라고 자조할만큼 인문대학에 진학할 정도의 지적 능력과 사회경제적인 뒷받침을 가진 사람이라면, 아무리 이과 출신 친구들보다 내가 취업이 안되는 것 같아도 사회에서 가장 불리한 출발점을 가진 사람과는 거리가 멀다. 현재 내가 내 손에 쥐고 있는 패는 바꿀 수 없다. 그리고 내가 받아든 패가 불공정하게 분배된 불리한 패일수도 있다. 그러나 불공정한 사회구조적 문제가 해결되어야함을 백번 인정하면서도, 그게 해결되는 동안 나라는 개인의 인생은 나만이 바꿀 수 있다. 더군다나 문과 졸업생이라는 패는 그 누구도 아닌 내가 선택한 카드가 아닌가. 나 자신만이 갖고 있는 능력이 뭔지 생각하고 그걸로 내가 살 수 있는 최선의 삶을 살아보자.

728x90

댓글