1. 개요
- 기간 : 2023.3.8 ~ 3.13 (총 6일)
- 과제 : 게임 회사 데이터팀 직원으로서 주어진 데이터로 인사이트를 얻고 의사결정을 진행하여 "다음 분기에 어떤 게임을 설계해야 할까"라는 고민을 해결해주세요
- 코드 보러가기
1-1. 문제 정의
현 시점은 2016년. 우리 희희게임즈는 비디오(콘솔)게임 전문업체이지만 한국의 게임 소비자들은 모바일과 PC를 주로 이용한다. 이에 해외 시장을 공략한 비디오게임을 내기로 결정했다. 어떤 콘솔 기기와 장르의 게임을 기획해야할까?
1-2. 데이터
- 대상 : 1981년부터 현재까지 전세계에서 발행된 16000여개의 비디오게임
- 사용 특성 (Feature) : 콘솔 기기(플랫폼), 발행연도, 장르, 퍼블리셔, 지역별 판매량
2. 데이터 정제
- Unnamed, Publisher 컬럼은 분석에 필요없다고 판단해 삭제
- 결측치 처리
- 이상치 수정 및 삭제
- Feature Engineering
- Total Sales 컬럼 : 지역별로 나누어져있는 판매량을 모두 합친 '총 판매량' 컬럼 생성
- Times 컬럼 : 발행연도 기준 1990년대, 2000년대, 2010년대로 게임 분류
3. 데이터 분석
3-1. 어떤 지역을 타겟으로 삼을 것인가
- [그래프] 1990년대부터 현재까지 지역별 판매량을 모두 합산하여 비교
- 점유율로 환산해보면 미국은 44%, 유럽은 33%. 두 시장이 전체 비디오게임 시장의 77%를 차지
- 타깃 시장을 북미와 유럽으로 특정하고, 특성 파악 필요
3-2 어떤 플랫폼의 게임을 만들 것인가
- [그래프] 북미, 유럽 시장에서 판매량을 토대로 시대별 플랫폼 매출액 비교
- PS2는 2000년대 판매 1위, 2010년 들어 급락
- 현시점엔 X360, PS3 게임의 판매량이 두드러진다
- PS4은 2013년 출시로 보급률 확대 기대
- X360, PS3, PS4 플랫폼으로 결정
3-3. 지역별로 어떤 장르를 선호하는가
[북미]
- [그래프] 2000년대와 2010년대 북미 플랫폼별 점유율 비교 (판매량 기준)
- 2000년대에는 Action, Sports, Shooter 장르가 강세를 보인다. 2010년대에도 이 세개 장르는 순위 지키며 판매량 확대
[유럽]
- [그래프] 2000년대와 2010년대 유럽 플랫폼별 점유율 비교 (판매량 기준)
- 미국과 마찬가지로 Action, Sports가 강세지만, Racing 장르가 점유율 3위. 2010년대에도 순위 변화 없이 판매량 확대
- 북미-유럽 모두 Action 장르가 강세
3-4. 클러스터링으로 본 북미-유럽 강세 장르
- 유럽과 북미 두군데 모두에서 높은 판매량을 보인 21개 게임 분석 (위 그래프에서 1번 그룹)
- 1번 그룹의 대부분은 Shooter 게임
4. 의사결정 과정
- 지역 - 전체 비디오게임 시장의 77%를 점유하고 있는 북미, 유럽 시장으로 타깃 특정
- 플랫폼 - 2010년대에 강세를 보인 PS3, X360과 새롭게 떠오르는 PS4
- 장르
- 지역별 선호 장르를 확인했을 때는 Action 장르가 부동의 1위
- 클러스터링을 통해 살펴본 인기게임 21개 중에서는 Shooter 장르가 10개로 1위
- “Action vs Shooter” 가설검정 진행
4-1. 가설검정으로 게임 장르 결정
- Mu_Sh = Shooter 장르 표본분포의 평균 / Mu_Ac = Action 장르 표본분포의 평균
- 귀무가설 : Mu_Sh >= Mu_Ac
- 대립가설 : Mu_Sh < Mu_Ac
- [그래프]Shooter 판매량 표본평균에서 Action 판매량 표본평균을 뺀 값들의 분포
- 빨간선은 샘플 데이터의 평균치 차이
- 귀무가설이 참인데 기각할 확률 92%
- 귀무가설을 기각 불가
- Shooter 장르로 결정
5. 판매량 기대
- 지역-플랫폼-장르 결정을 토대로 게임을 만들었을 때 매출 기대치가 어느정도일까?
- [그래프]북미-유럽 시장에서 X360, PS3, PS4 기반 중 Shooter 장르인 게임 판매량 표본분포
- 표본분포의 95% 신뢰구간에 따르면, 최소 57만장에서 최대 225만장의 판매를 기대해볼 수 있다
- 이에 따라 예산을 책정하고 유통판로를 확보해야
'My Project' 카테고리의 다른 글
[코드스테이츠 / Flask] 머신러닝 모델을 웹서비스로 구현하기 (0) | 2023.06.26 |
---|---|
[코드스테이츠 / 딥러닝] 도배 하자 이미지 분류 (ResNet, EfficientNet) (0) | 2023.05.26 |
[코드스테이츠 / 머신 러닝] 신용카드 고객 연체 예측 모델 구축 (Random Forest, XGBoost) (0) | 2023.05.26 |