오늘 나는 (TIL) 31

[TIL 240806] Python의 Collections 라이브러리

오늘은 여러가지 쓰기 좋은 메쏘드들이 내장되어있는Python의 Collections 라이브러리에 대해 알아보겠다.  1. Counter List나 Tuple의 Element들의 수를 카운트해 Counter Dictionary로 바꾸어준다.pandas의 Series.value_counts()와 유사하다. from collections import Counterlst = [1, 2, 3, 3, 2, 1, 1, 1, 2, 2, 3, 1, 2, 1, 1]counter = Counter(lst)print(counter)# >>> Counter({1: 7, 2: 5, 3: 3})  1.1 elements() 메소드 개수만큼 반복되는 요소에 대한 iterator 반환한다. 요소의 개수가 1보다 작으면 무시한다. c ..

오늘 나는 (TIL) 2024.08.05

[TIL 240805] CRM과 RFM 고객 세분화 분석

데이터 분석 프로젝트를 진행하며CRM과 RFM에 대해 알 수 있었다.  CRM이란 Customer Relationship Management의 약자로, 고객 관계 관리를 뜻한다. CRM은 고객 및 잠재고객과 회사 관계 사이의 상호작용을 관리하는 기술로, 비즈니스 관계를 개선해 비즈니스를 성장시키는 목적이 있다.  CRM의 일환으로 RFM 을 예로 들 수 있다. RFM은Recency: 얼마나 최근에 구매했는가?Frequency: 얼마나 자주 구매했는가?Monetary: 얼마나 많은 금액을 지출했는가?를 뜻하며,  기본적으로 고객의 구매 패턴을 기반으로 해점수를 부여하고 사용자들의 분포를 확인하거나 사용자를 그룹으로 나누어 분류하는 분석기법으로,  고객들을 근거를 통해 분류하고각 그룹에 따라 특성을 파악하고..

오늘 나는 (TIL) 2024.08.05

[TIL 240723] 시간복잡도

코드카타를 풀다보면 '시간 초과'가 뜰 때가 있다.하드코딩의 결과이겠지만, 시간복잡도의 개념을 파악하고 있다면이런 일을 줄일 수 있다. 시간복잡도란 한마디로 "시간이 얼마나 걸리느냐?"다. 복잡한 정도는  와 같고, 아래의 그래프로도 확실하게 알 수 있다. 또한 자료형 마다 사용되는 함수 각각이 시간복잡도가 배정되어 있다. 1. 리스트 자료형 2. 집합 (Set) 자료형 3. 딕셔너리 자료형

오늘 나는 (TIL) 2024.07.24

[TIL 240722] 직관적인 데이터 시각화 만들기

오늘은 아티클스터디로 "직관적인 데이터 시각화 만들기" 를 스터디 했다.https://yozm.wishket.com/magazine/detail/1792/ 데이터 시각화 101: ②직관적인 데이터 시각화 만들기 | 요즘IT데이터를 시각화하여 전달하면 우리의 뇌는 빠른 속도로 많은 양의 정보를 처리할 수 있고, 데이터 테이블에 비해 트렌드나 패턴, 아웃라이어 등을 쉽게 파악할 수 있습니다. 때문에 데이터를yozm.wishket.com  시각 정보를 처리하는 과정 1.     뚜렷한 시각 요소 파악하기색, 질감, 두께, 방향 등 기본적 시각 요소를 파악 2.     패턴 알아차리기그 시각 요소들의 공통점과 차이점을 파악 3.     해석하기그 패턴들을 활용해 의미를 부여하고 해석  전주의적 속성 이해하기  ..

오늘 나는 (TIL) 2024.07.22

[TIL 240718] Excel vs Pandas

오늘은 데이터 전처리 강의를 들으며 Excel과 Pandas의 차이 들을 알았고,왜 Pandas를 활용해야 하는가를 배웠다. 데이터 전처리에서의 Pandas 활용에 대한 내용은 다음 링크에 정리되어 있다.https://thebuck104.tistory.com/51 [데이터 전처리] thebuck104.tistory.com 데이터 시각화에서의 matplotlib과 seaborn 활용에 대한 내용은 다음 링크에 정리되어 있다.https://thebuck104.tistory.com/53 [데이터 시각화] Python 라이브러리 Matplotlib thebuck104.tistory.com Pandas가 Excel보다 좋은 이유 1. 자동화와 프로그래밍 가능Pandas는 Python과 함께 사용되어 데이터 조작과..

오늘 나는 (TIL) 2024.07.18

[TIL 240717] 데이터 시각화는 왜 중요할까? 와 정성적 데이터 시각화

오늘의 아티클 스터디는 "데이터 시각화는 왜 중요할까?"https://yozm.wishket.com/magazine/detail/1750/ 데이터 시각화 101: ① 데이터 시각화는 왜 중요할까? | 요즘IT데이터의 양이 늘어나고 복잡해질 수록 데이터를 좀 더 쉽게 이해하고 인사이트를 발견하는 것의 필요성이 높아지고 있는데요. 데이터 시각화란 말 그대로 데이터에서 발견한 정보를 시각적으yozm.wishket.com  슈퍼 요약1.     시각 정보는 쉽게 알 수 있다.2.     그래서 인사이트의 발견이 빠르다.3.     그래서 의사결정에 도움을 준다. 나의 인사이트보통 시각화라고 하면 정량적인 데이터를 주로 생각할 수 있다.A부터 B까지의 최단거리와 움직일 때의 예상 시간태풍이 얼마나 센지 그리고 어..

오늘 나는 (TIL) 2024.07.17

[TIL 240715] 데이터 분석가에게 중요한 것들과 EDA

오늘은 "데이터 분석가가 되어보니 중요한 것들" 이라는 아티클의 스터디를 진행했다.출처: https://yozm.wishket.com/magazine/detail/1863/ 데이터 분석가가 되어보니 중요한 것들 | 요즘IT개발자, 디자이너, 기획자, HR, 오퍼레이션 등 대부분의 직무에서 우리가 일하기 전 예상했던 업무와 실제 업무에는 차이점이 존재합니다. 비즈니스는 빠르게 변화하기 때문에, 학생 때 배운 교yozm.wishket.com 또한, SQL 챌린지 반 1회차를 수강했다.https://thebuck104.tistory.com/48 [SQL챌린지] 01. thebuck104.tistory.com 오늘의 TIL에는 아티클 스터디에 관해 작성해 보겠다.데이터 분석가란? 데이터에 기반해 성공확률이 높은..

오늘 나는 (TIL) 2024.07.15

[TIL 240712] 날짜를 요일로, strftime() 함수

오늘은 날짜를 요일로 변경해주는 python 함수인 strftime() 을 알아보았다.날짜형 데이터에 대한 활용이 많을 것으로 예상되는 실무에서잘 사용될 수 있을 듯 하다. import datetimedef solution(a, b, c = 2016): month = a day = b year = c ans = datetime.date(year, month, day) #숫자들을 날짜 형태로 바꿔준다 return ans.strftime("%a").upper() #날짜 형태를 요일로 반환해준다 strftime()함수는 위와 같이 사용할 수 있으며, 다음과 같은 굉장히 많은 파라미터들을 ("") 안에 대입해요일 말고도 수많은 형태를 반환할 수 있다. 파라미터의미%a축약된 요일명.%A..

오늘 나는 (TIL) 2024.07.12

[TIL 240711] 입양 시각 구하기 (2), Set

SQL 문제, 입양 시각 구하기 (2)를 풀며 set에 대해 알 수 있었다.  문제 ANIMAL_OUTS 테이블은 동물 보호소에서 입양 보낸 동물의 정보를 담은 테이블입니다. ANIMAL_OUTS 테이블 구조는 다음과 같으며,ANIMAL_ID, ANIMAL_TYPE, DATETIME, NAME, SEX_UPON_OUTCOME는 각각동물의 아이디, 생물 종, 입양일, 이름, 성별 및 중성화 여부를 나타냅니다. NAMETYPENULLABLEANIMAL_IDVARCHAR(N)FALSEANIMAL_TYPEVARCHAR(N)FALSEDATETIMEDATETIMEFALSENAMEVARCHAR(N)TRUESEX_UPON_OUTCOMEVARCHAR(N)FALSE 보호소에서는 몇 시에 입양이 가장 활발하게 일어나는지 알..

오늘 나는 (TIL) 2024.07.11