주제 : 실시간으로 스트리머의 게임 방송 데이터를 수집하여 스트리머가 게임 흥행에 미치는 파급력을 확인
주제 선정 이유
라이브 스트리밍의 인기와는 달리 게임 산업계는 소비자의 게임 라이브 스트리밍 시청이 게임 플레이에 어떤 영향을 미치는지 명확한 답을 내리지 못하고 있다. … 분석 결과, 게임 라이브 스트리밍과 게임 플레이는 긍정적인 상관 관계를 보였으며, 스토리 장르 게임 역시 라이브 스트리밍이 게임 플레이 에 긍정적인 영향을 주는 것으로 나타났다.
출처 : 게임 라이브 스트리밍 시청이 게임 플레이에 미치는 영향에 관한 연구 : 스토리 장르와 비 스토리 장르의 비교를 중심으로 (2021)
데이터 수집
데이터 처리
시각화
이름 | 담당 업무 | Github |
---|---|---|
공통 | 데이터 수집 및 처리 전반적인 과정 | |
장태수 | 스트리밍 데이터 수집·전처리(ETL, ELT, Spark) | https://github.com/poriz |
이서림 | Dashboard, Data Catalog 생성 | https://github.com/srlee056 |
박단이 | ERD 설계, Lambda 적용, ELT DAG 작성 | https://github.com/Danee12 |
이영호 | 게임 데이터 수집·전처리 (ETL, ELT, Spark) | https://github.com/mediwind/ |
정헌수 | AWS(Terraform) & GCP(Docker) Infra / Github Actions | https://github.com/hunsoodev |
분류 | 기술 |
---|---|
사용 언어 (Programming Language) | Python, SQL |
클라우드 서비스 (Cloud Service) | GCP, AWS (Terraform) |
데이터 베이스 (Database) | AWS S3, AWS Redshift, AWS RDS(MySQL) |
프로세싱 (Data Processing) | Airflow, AWS Glue(Spark), AWS Athena, AWS Lambda |
시각화 (Visualization) | Grafana(dashboard service) |
협업 도구 (Collaborative Software) | GitHub, Notion, Slack |