home

[인턴] Data Analyst

Product Development Division

콴다의 Product Development Division은 누적 가입자 수 6,000만 명의 글로벌 프로덕트 콴다(QANDA) 개발을 책임지고 있는 조직입니다. 높은 수준의 제품 퀄리티를 유지하는 것과 제품을 빠르게 개선하는 것을 매우 중요한 가치로 생각합니다. 이를 달성하기 위해서 실험하는 것을 좋아하며 데이터에 기반한 접근을 하기 위해 노력합니다.
Data Team은 콴다의 구성원들이 목표를 달성하는 데 필요한 데이터를 적절히 사용할 수 있도록 서포트하고, 서비스/비즈니스가 올바른 방향으로 나아가고 있는지 데이터 관점에서 점검합니다.
데이터 웨어하우스로 Bigquery를 사용합니다. Bigquery의 뛰어난 성능을 활용하여 ETL 보다는 ELT paradigm 으로 데이터 파이프라인을 구현하고 있습니다. Extract/Load 단위 작업은 Apache Spark 어플리케이션으로 개발하여 AWS Fargate 로 실행합니다. 단위 작업들의 Workflow Orchestration 도구로 Apache Airflow (Cloud Composer) 를 사용합니다. 이외에도 로그 수집을 위해 Amazon API Gateway 와 Amazon Kinesis 서비스를 사용합니다. BI 는 Holistics 라는 서비스를 사용합니다.

콴다 Data Analyst의 역할은?

목적 조직이 맡은 서비스/비즈니스 주제의 성패를 가늠할 수 있는 적절한 최상위 metric을 정의합니다. 최상위 metric은 "최상위"인 만큼 여러가지 요소들이 결합된 복잡한 & 가장 output (뒷단의) metric 입니다. 그러니 이의 증/감을 설명할 수 있는 적절한 하위 metric 을 고민합니다. 그렇게 depth 를 늘려나가며 일련의 metric hierarchy (metric들 간의 계층 구조)를 정의합니다. 그렇게 정의한 hierarchy에 맞춰 metric을 tracking할 수 있는 dashboard 등의 장치를 만들고, 이 metric을 이렇게 개선한다면 최상위 metric 이 이렇게 바뀔 것이다 같은 projection도 합니다.
목적 조직이란?
상관관계 분석, 유저 테스트 등을 통해 가설을 세웁니다. 앞서 정의한 metric hierarchy에 따라, 최상위 metric을 개선할 수 있는 가설이어야 합니다. 여러 가지 가설들이 가능할 텐데, 그 중 어느 가설이 impact가 클지를, 과거 데이터를 가지고 가늠할 수 있다면 좋을 것입니다. 그렇게 추려낸 가설들의 인과관계를 확인할 수 있는 실험을 설계하고, 목적 조직의 동료들과 협업하여 실제 실험을 진행하고, 실험 결과를 가지고 통계적 유의성 등을 적절히 고려하여 최선의 의사결정을 내립니다.
의사결정을 위해 필요한 metric, 그 metric 을 조회할 수 있는 dashboard, 그 dashboard를 만들기 위해 필요한 데이터에 대한 수집 계획을 세웁니다. Backend engineer, Frontend engineer (android, iOS, web), Data engineer 등과 협업하여 데이터 수집 계획을 데이터 파이프라인으로 만듭니다. 그 과정에서 rdbms의 table schema나 클라이언트 로그 schema를 함께 설계하고, 계획대로 데이터가 잘 수집되는지 data QA를 합니다. 그렇게 수집한 raw data를 그대로 사용하는 복잡한 SQL을 작성하기보다, 사용하기 편리하고 목적 조직이 다루는 주제 내에서 범용적으로 사용할 수 있는 data mart table을 modeling 합니다.

Data Analyst와 Data Analyst 인턴의 차이는?

회사에서 Data Analyst로서 일해본 경험이 없거나 저희가 생각하는 Data Analyst와는 역할이 달랐어서 저희가 생각하는 이상적인 Data Analyst의 모습으로서 성과를 낸 경험은 없지만, 그럴 수 있는 포텐셜이 있다고 생각되는 분들께는 인턴 포지션으로 제안을 드리고 있습니다.
Data Analyst 인턴으로 합류하시면, 목적 조직 1개를 온전히 맡지는 않고, 여러 종류의 task들이 모아진 queue의 task들 중 가장 impact가 클 것 같은 task를 맡아서 진행합니다. queue에는 아래 종류의 task들이 모이게 됩니다.
목적 조직이 없는 주제의 data 관련 task들
목적 조직의 task이고 진행하면 좋을 task이지만 우선순위가 낮아서 담당 Data Analyst가 아직 진행하고 있지 못한 task들
task를 진행하면서 병렬적으로 목적 조직을 온전히 맡기 위해 필요한 배경 지식과 일하는 practice에 대해, Data Team 내에서 커뮤니케이션하며 습득할 수 있게 됩니다.

이런 분이면 좋겠습니다.

Raw data를 가지고, 원하는 schema 의 data로 가공하는 데 능숙하신 분이면 좋겠습니다.
현재 저희는 Google Cloud의 BigQuery라는 데이터 웨어하우스 솔루션을 사용하고 있고, BigQuery는 SQL로 사용하는 데이터 웨어하우스여서, 이왕이면 "SQL 로" data를 가공하는 데 능숙하신 분이면 좋겠습니다.
서비스/비즈니스를 개선하는 것에 대해 수시로 생각하는 분이면 좋겠습니다.
앱/웹 서비스를 사용하며, '이 업데이트의 의도는 무엇일까?', '관련해서 이 서비스를 운영하는 회사에서는 어떤 데이터를 어떤 schema 로 수집하여 어떤 metric 을 집계하고 있을까?', '서비스에 이러한 기능을 추가해보면 좋지 않을까?', '그 성과는 어떻게 측정할 수 있을까?' 같은 것들을 많이 생각하는 분이면 좋겠습니다.
새로운 도구를 탐색하고 익혀서 사용하는 것에 두려움이 없는 분이면 좋겠습니다.
예를 들어, BigQuery 에서 SQL 을 작성하다가 어떤 구문이 계속 반복되는 것을 경험 → BigQuery 에 UDF 기능이 있는 것을 알게 됨 → 써본 적은 없지만, data team 동료들에게 물어보고 관련 문서도 읽어보며 익혀서 → 반복되는 구문을 UDF 로 만들어 → 이를 재사용하여 일을 더 효율적으로 하게 되는, 이러한 cycle 이 불편하지 않고 익숙한 분이면 좋겠습니다.
적극적으로 질문하며 커뮤니케이션하는 분이면 좋겠습니다.
단순히 '요청 받은 데이터 관련 task를 처리한다.'가 아니고, '이 task를 통해 궁극적으로 달성하고자 하는 goal이 무엇인지?', '어떤 의사결정을 위한건지?', '이를 위해 이 task를 하는 게 최선인지?', '아니면 더 나은 방법이 있는지?'를 늘 생각하고, 질문하고, 대화하여, 조직이 최선의 방향으로 나아갈 수 있도록 애쓰는 분이면 좋겠습니다. 그 과정에서 모르는 것들이 있더라도, 이를 부끄러워하거나 물어보는 것을 주저하지 않고 빠르게 얘기를 꺼내서 해소하여 더 빠르게 앞으로 나아가는 것을 추구하는 분이면 좋겠습니다.

근무 형태

6개월 인턴 계약을 맺습니다.
6개월이 끝나가는 시점에, 혹은 중간에, 상호 합의 된다면 정규직으로 전환합니다.
근무 지역: 서울시 강남구 선릉로 428, 17층

제출 서류

자유 양식의 국문 이력서(PDF)

채용 절차

서류 전형 → 과제 전형 → 1차 면접(SQL Test 포함) → 최종 면접 → 최종 합격 → 입사
1. 서류 전형: 서류를 제출해 주시면 Data Team Lead가 검토합니다.
2. 사전 과제를 드립니다. 실제 콴다 Data Team의 Data Analyst가 목적 조직에서 일하며 고민하게 되는 문제를 다루는 과제입니다. 기한은 일주일을 드리고 있습니다.
3. Data Team Lead 와 1차 인터뷰를 진행합니다. 제출해주신 사전 과제에 대한 discussion을 포함한 정성 인터뷰와, 데이터 집계 능력을 확인하기 위한 SQL 테스트를 진행합니다.
4. Data Team 에서 함께 일하게 될 Data Analyst와 최종 면접을 진행합니다.

콴다 팀의 근무 환경과 복지가 궁금하시다면?