Projects 3

[P2.2_Wow the Brazil] 브라질 이커머스 데이터와 RFM 군집 분석

분석 결과 1. 고객 별 군집 머신러닝 군집 모델 선발 우리는 기본적으로 k-means 머신러닝 알고리즘을 통해 군집화 분석을 진행했으며,전처리된 RFM을 통해 군집화를 진행하기 앞서, 더 나은 모델을 선발하기 위해 기준점을 잡기 위해전처리 (Transfomation 및 Scaling)가 되지 않은 RFM의 모델 성능을 먼저 확인해보았다.    이 때 최고 실루엣 점수는 k=3일 때 0.337이었으며, 군집의 시각화도 위와 같았다.  우리는 나아가 분석가의 재량 하에 유연성을 보이는 RFM 군집법의 특성을 이용해각각의 R, F, M에 따로 가중치를 주었다.이 중 Frequency의 경우, 그 쏠림이 제일 심했으며,우리는 이를 완화하기 위해 곱해준 "도시 별 인구수" 데이터가 군집 시 너무 큰 영향을 주지..

Projects 2024.09.03

[P2.1_Wow the Brazil] 브라질 이커머스 데이터와 RFM 군집 분석

프로젝트 개요 프로젝트에 들어가기 앞서, 우리 팀은 "브라질 이커머스 기업을 인수한 쿠팡의 현지에서의 기업가지 제고를 위한 데이터 분석"을 맡은 분석가들이라고 페르소나를 정했다. 나아가 해당 데이터들을 기반으로 브라질 고객들을 군집하고 군집 별 아이디어를 도출하는 것을 최종 목적으로 했다. 문제점 가설과 목적분석 절차 이번 프로젝트는 위와 같은 절차로 이루어졌다. 데이터 전처리 및 EDA1. 데이터 병합 먼저 위와 같이 기본으로 주어진 5개의 테이블과, 외부에서 따로 얻은 2개의 데이터를 병합하는 과정을 가졌다.외부 데이터는 customer_city, 즉 도시 이름으로 분류 되어있는 도시 별 인구수 (population) 자료와zip_code, 즉 우편 변호로 이루어진 위도와 경도 (geolocation..

Projects 2024.09.03

[P1_기본 프로젝트] Spotify 고객 분위 별 맞춤 전략 제시안

프로젝트 개요 프로젝트에 들어가기 앞서, 우리 팀은 우리를Spotify의 미국 데이터를 다루는 데이터 분석가들 이라고 페르소나를 정했고, Spotify의 수익성 개선을 위해 이용 고객들의 행동 데이터를 기반으로 고객 분위별 맞춤 개선안들을 제시해보기로 했다. 문제점 스포티파이의 문제점은 세계 시장 장악성과는 다른 수익성이었는데,이는 대부분의 유저들이 무료 이용자인데 반해,스포티파이의 수익의 대부분은 구독자에서 오기 때문이다. 가설과 목적 이에 우리는 스포티파이의 주 수입은 구독이다 라는 가설을 기반으로구독률 향상을 최종 목표로 고객 분위 별 맞춤 전략을 제시하기로 했다. 분석 절차1. 전처리 및 EDA  우선 우리가 갖고있는 데이터는 결측치는 따로 없었기에 결측치 처리는 진행하지 않았다.허나 이 중 눈여..

Projects 2024.09.03