Scribble

Data Scientist 소개

sokki 2021. 10. 21. 12:53

내 직업에 대해서 소개를 하고자 한다. 사실 나는 대학원생이다. 연구하고 있는 분야는 의료 분야에서의 데이터 처리와 모델링, 변수 선정 등 데이터 관련된 업무들을 주로 하고 있다. 뭐, 쉽게 얘기해 데이터 사이언티스트라는 말이다.

데이터 사이언티스트를 소개하고자 한다. 내 생각에는 데이터 사이언티스트란 굉장히 쉽게 정의하기 어려운 직업이다. 왜냐하면 같은 이름을 가직 있다고 하더라도 실제로 현장에 나가보면 하는 일이 저마다 조금씩 다르기 때문이고, 이것을 하나로 통칭하기가 쉽지 않다. 용어들도 신용어들도 있는 것 같다.
그래서 나는 나만의 쉬운 정의를 제시하고 싶다. 특별히 데이터 사이언티스트로 입문하고자 하는 분들을 위해서다.

  • 데이터 사이언티스트(쉬운 정의)
    • 데이터만을 갖고 새로운 가치를 창출 할 수 있는 사람

꽤 간단한 정의다. 여기서 내가 하고 싶은 말은 "데이터만"과 "새로운 가치의 창출"이다. 데이터 사이언티스트는 데이터로만 일한다. 데이터에 관련된 지식이 있어야 한다. 그리고 이 데이터들을 어떻게 취급하고, 보완하고, 활용하여 의미있는 결과를 도출할지에 대한 모든 프로세스에 대해서 잘 알고 있어야 한다.

from Medium

내가 대학원에서 수업을 듣고 있었을 때, 우리 학과의 교수님이 데이터 사이언스가 정확히 뭐라고 생각하느냐고 물었었다. 그 분은 통계를 가르치는 분이었다. 느낌상 그 분은 데이터 사이언스는 통계라는 것을 멋있게 포장한 것이라고 여기는 듯했다. 그러나 현재 데이터 사이언스를 공부하는 학생으로서 데이터 사이언스는 단순히 통계가 아니다. 물론, 통계학의 도움이 없이는 데이터 사이언스는 설 수 없다. 그러나 통계 말고도 필요한 것이 CS 지식과 domain knowledge이다.

데이터 사이언스는 응용학문이다. 우리는 흔히 CS, 통계가 응용학문이라고 생각한다. 지금까지는 그렇게 생각해 왔을지도 모르지만, 이제는 CS, 응용학문들 조차도 새로운 분야를 여는 베이스 학문이 되는 시대가 온 것이다.

아무튼, 내가 생각하는 데이터 사이언스에 대해서 적어보았다. 입문자들에게 도움이 되었음 좋겠다!