자기계발 Diary

오늘의 공부day_7(주니어 데이터사이언티스트에게 하고 싶은 이야기들)

siron94 2024. 11. 12. 18:51

어떤 역량을 특화할 것인가?

데이터 사이언티스트에게 요구되는 역량의 종류 만큼이나 다양한 성장 경로가 있다. 필자가 생각하는 주된 성장 경로는 1) 도메인 전문성과 네트워크를 키워 PM 혹은 경영자와 같은 도메인 전문가 2) 통계 및 머신러닝 방법론에 특화된 분석 전문가 3) 개발 및 시스템 역량을 키워 분석 역량을 갖춘 엔지니어로서 성장하는 길 등이다. 여기에 업종 및 기업 규모라는 변수를 더하면 세상에는 정말 다양한 성장의 기회가 존재한다.

개인에 따라 이중 여러가지를 겸할수도 있고, 여러 회사를 거치며 장기적으로는 다양한 역량을 쌓을 수 있지만, 커리어 및 배움의 방향성이라는 측면에서는 한번에 하나씩 선택해서 집중하는 것을 권하고 싶다. 물론 동시에 여러 기회를 제공하는 포지션도 있을 것이고, 이를 모두 잡는 것은 본인의 역량에 달린 문제다. 

 

커리어의 방향성을 결정하면 자신에게 맞는 기회를 찾는 과정이 더 쉬워진다. 예를 들어 데이터 역량을 갖춘 도메인 전문가의 길을 간다면 해당 업종 내에서 다양한 비즈니스 문제를 접하며 좀더 전문성을 쌓을 수 있는 방법을 고민해야 할 것이다. 반면 분석 혹은 엔지니어로서의 성장을 원한다면, 해당 기술의 트렌드를 선도하는 프로젝트를 할 수 있는 환경을 찾아서 전문 역량을 키우는 편이 바람직할 것이다. 

 

여기서 추가적으로 고민할 부분은 커리어에서의 깊이와 넓이의 균형인데 특정 도메인의 전문가가 되기 위해 깊이를 쌓는 노력과 기술 및 시장 트렌드 변화에 대응하기 위해 두루두루 배우고 경험을 쌓는 노력간의 균형이다.

 

 

어떤 업계/회사/팀에 지원할 것인가?

필자가 생각하는 가장 중요한 조건은 회사의 미래에 데이터 활용이 얼마나 중요한 전략적 위치를 점하는지다. 요즘 데이터에 관심이 없는 회사는 없겠지만, 업계 및 회사의 사정에 따라 얼마나 큰 투자가 이루어지는지, 이런 투자가 가치를 만들어낼 수 있는지는 다른 문제이기 때문이다. 이를 판별하는 손쉬운 방법은 채용 규모가 어떤지, 혹은 매니저와 팀원을 동시에 뽑는지 등을 확인하는 것이다.

 

데이터 활용을 중요하게 생각하는 회사라도 가치를 만들기까지는 여러 단계를 거쳐야 한다. 따라서 확인할 부분은 내가 합류해서 가치를 만들 수 있는 포지션인지다. 이를 확인하는 방법은 인터뷰에서 팀의 현재 니즈 및 전략적 방향에 대해 상세히 물어보는 것이다.

 

회사가 얼마나 기술적인 성장에 초점을 맞추는지도 장기적인 커리어 성장의 관점에서 중요한 문제다. 어렵게 들어간 회사에서 주어진 업무가 레거시 파이프라인을 유지보수하는 일이거나 매일 수동으로 아무도 읽지 않는 리포트를 작성하는 일이라면그리고 이를 새로운 기술 도입이나 자동화를 통해 개선하겠다는 노력도 묵살된다면 회사나 개인이나 밝은 미래를 장담하기 어려울 것이다. 이를 확인하기 위해서는 채용 공고에 나타난 회사의 기술 스택이 어떤지, 혹은 회사의 기술 역량이 외부적으로 공유된 자료가 있는지 보면 된다.

 

데이터 업계에서 신기술에 전혀 관심을 기울이지 않는것 만큼이나 위험한 것이 신기술을 무조건 추종하는 것이다. 기술의 도입은 장기적인 비즈니스 가치를 만들기 위한 최적의 수단인지의 관점에서 고민해야 할 부분이며, 유행을 쫒기 위한 위한 기술 도입 혹은 연구를 위한 연구 프로젝트 등은 가치를 파괴하는 일이기 때문이다. 그리고 당연한 이야기지만 지속적인 비즈니스 가치를 만들어내지 못하는 회사나 조직은 장기적인 생존을 보장받지 못한다. 그런 관점에서 지원하는 조직이 회사에 어떤 기여를 하고 있는지, 스타트업이라면 비즈니스 성장 커브 및 건강성은 어떤지 따져볼 일이다.

 

 

코딩과 모델링은 얼마나/무엇을/왜 잘 해야 할까?

데이터 사이언티스트의 시장 가치에 대해 얘기해보자. 리포팅은 데이터 사이언스 업무의 핵심 중 하나이고, 도메인 지식 및 데이터에 대한 이해가 기반이 된 제대로 된 리포팅을 하는 것은 매우 어렵고 그만큼 많은 가치를 만들어내는 일이다.

 

하지만 직업이 아니라 커리어라면 시장에서의 자신의 가치를 지속적으로 키울 수 있는 기회를 제공해야 할 것이며, 필자는 단순 리포팅이 업무의 거의 100%를 차지하는 포지션은 이런 기회를 제공하기 힘들다고 생각한다. 데이터 분석과 관련된 인프라와 툴은 계속 좋아지고 있으며, 최근에는 데이터에서 인사이트를 자동으로 뽑아주는 다양한 기법도 연구 개발되고 있기 때문이다.

 

데이터 사이언티스트가 지속적인 가치를 만들어낼 수 있는 방법은 분석의 스케일링과 자동화라고 생각한다. 분석의 스케일링은 개발된 분석 기법을 다른 사람들을 쓸 수 있도록 라이브러리 및 템플릿을 만들거나 인프라에 해당 기능을 추가하는 것이다. 이를 통해 데이터부서 일원이 아니라도 필요에 따라 분석을 수행할 수 있다. 다른 방법은 반복되는 의사결정을 단순화 및 자동화할 수 있는 모델을 만드는 것이다. 예를 들어 지표 이상을 모니터링하고 알람을 주는 알고리즘은 매일 대시보드를 보는 수고를 덜어줄 것이다. 그리고 이런 분석의 스케일링 및 자동화를 위해서는 데이터 사이언티스트의 개발 및 모델링 역량이 필수적이며, 이런 인력들은 사내 모든 구성원이 분석가의 역할을 수행하는 것을 가능하게 한다

 

예를 들어 AB테스트의 결과를 제대로 분석하기 위해서는 최소 수십, 수백개의 지표의 움직임을 이해하고, 개별 지표에 대해 전체 혹은 일부 사용자 그룹이 어떻게 반응하는지에 대한 분석을 수행해야 한다. 그리고 AB테스트 도입 초기에는, 혹은 중요한 테스트에 대해서는 이런 분석을 분석가가 직접 수행하는 것이 필수적이다. 하지만 AB테스트 도입이 가속화되어 수많은 실험이 수행되는 환경에서는 비슷한 유형의 실험에 대한 분석은 템플릿화 및 자동화되고, 분석 조직의 역량은 새로운 지표나 좀더 도전적인 분석 기법 개발에 집중되어야 한다. 이처럼 실무에서는 이런 분석가의 노력과 자동화가 유기적으로 결합될 때 최선의 결과가 나온다. 

 

이런 분석의 스케일링과 자동화가 개인의 노력으로 이루어지지는 않는다. 이를 위해서는 신뢰할 수 있는 인프라 및 데이터 파이프라인, 분석 코드의 라이브러리화 및 재사용을 강조하는 문화, 이 모든 것을 뒷받침하는 데이터 엔지니어와 분석가의 협업이 필요하다. 마지막으로 실력있는 엔지니어과 분석가들이 함께 일할 수 있는 환경을 찾는 것이다.

 

 

면접은 어떻게 준비할 것인가?

많은 회사에서 기술 블로그 등에 팀의 기술적 상태와 챌린지에 대해 공유하는 추세인데도 생각보다 많은 지원자들이 지원하려는 회사와 제품, 팀에 대해서 이해하려는 충분한 노력을 기울이지 않는다는 점이다.

채용 면접은 지원자의 기본 소양과 함께 함께 일하는 동료로서 어떤 모습을 보일지 예측하는 과정이다. 

아래와 같은 질문에 대해서 충분히 생각해보자

  • 이 회사에서 나는 어떤 인프라와 데이터를 사용하게 될 것인지
  • 지원하는 팀이 당면한 분석 및 엔지니어링 문제는 무엇인지 
  • 내 스킬셋과 관심사에 부합하는 부분은 무엇인지
  • 지원 회사/팀/분야에 대한 공개된 자료는 어디서 찾을 수 있는지
  • 내 성장 목표는 지원 회사의 목표를 맞출 수 있는지

특히 많은 회사의 데이터 사이언스 / 엔지니어링 면접은 가상의 케이스에 대한 문제 해결력을 평가하는 방식으로 이를 예측하려고 한다.

이력서 작성의 요령 및 경력 사항에 대한 질문을 준비하는 과정을 알아보자. 보통 이력서가 길고 화려할수록 좋다고 생각하지만 채용하는 입장에서는 지원자의 경험과 역량을 가늠할 수 있는 핵심적인 이력 몇개가 있는지가 더 중요하며, 관련성이 떨어지는 경력 사항이 많이 보일수록 이런 '핵심'을 발견하기가 어려워진다. 따라서 이력서는 최대한 핵심만으로 간결하게 작성하며 면접은  면접관의 어떤 질문에도 대답할 수 있는 준비가 되어 있어야한다.

 


데이터 관련 직군의 다양성과 채용하는 회사들을 필터링하는 방법을 알았고 자신의 역량을 성장시킬수 있는 환경과 올바른 배움의 방향성이 중요하다는 것을 느꼇다.