전체 글 73

[TIL 240808] Python의 Itertools 라이브러리 순열과 조합

오늘은 iteration에 도움이 되는 여러가지 메소드가 있는 Python의 itertools 라이브러리를 소개해보겠다. itertools란 " 효율적인 루핑을 위한 이터레이터를 만두는 함수 " 1. combinations()list를 n 수 만큼 컴비네이션들을 튜플 형식으로 만들어준다.from itertools import combinationsl = [1,2,3]for i in combinations(l,2): print(i)# 출력 결과:# (1, 2)# (1, 3)# (2, 3)# 리스트화해서 인덱싱 콜 하기combi = list(combinations(l, 2))print (combi[0])# 출력 결과:# (1, 2) 2. combinations_with_replacement() list를 n..

오늘 나는 (TIL) 2024.08.07

[TIL 240806] Python의 Collections 라이브러리

오늘은 여러가지 쓰기 좋은 메쏘드들이 내장되어있는Python의 Collections 라이브러리에 대해 알아보겠다.  1. Counter List나 Tuple의 Element들의 수를 카운트해 Counter Dictionary로 바꾸어준다.pandas의 Series.value_counts()와 유사하다. from collections import Counterlst = [1, 2, 3, 3, 2, 1, 1, 1, 2, 2, 3, 1, 2, 1, 1]counter = Counter(lst)print(counter)# >>> Counter({1: 7, 2: 5, 3: 3})  1.1 elements() 메소드 개수만큼 반복되는 요소에 대한 iterator 반환한다. 요소의 개수가 1보다 작으면 무시한다. c ..

오늘 나는 (TIL) 2024.08.05

[TIL 240805] CRM과 RFM 고객 세분화 분석

데이터 분석 프로젝트를 진행하며CRM과 RFM에 대해 알 수 있었다.  CRM이란 Customer Relationship Management의 약자로, 고객 관계 관리를 뜻한다. CRM은 고객 및 잠재고객과 회사 관계 사이의 상호작용을 관리하는 기술로, 비즈니스 관계를 개선해 비즈니스를 성장시키는 목적이 있다.  CRM의 일환으로 RFM 을 예로 들 수 있다. RFM은Recency: 얼마나 최근에 구매했는가?Frequency: 얼마나 자주 구매했는가?Monetary: 얼마나 많은 금액을 지출했는가?를 뜻하며,  기본적으로 고객의 구매 패턴을 기반으로 해점수를 부여하고 사용자들의 분포를 확인하거나 사용자를 그룹으로 나누어 분류하는 분석기법으로,  고객들을 근거를 통해 분류하고각 그룹에 따라 특성을 파악하고..

오늘 나는 (TIL) 2024.08.05

[TIL 240723] 시간복잡도

코드카타를 풀다보면 '시간 초과'가 뜰 때가 있다.하드코딩의 결과이겠지만, 시간복잡도의 개념을 파악하고 있다면이런 일을 줄일 수 있다. 시간복잡도란 한마디로 "시간이 얼마나 걸리느냐?"다. 복잡한 정도는  와 같고, 아래의 그래프로도 확실하게 알 수 있다. 또한 자료형 마다 사용되는 함수 각각이 시간복잡도가 배정되어 있다. 1. 리스트 자료형 2. 집합 (Set) 자료형 3. 딕셔너리 자료형

오늘 나는 (TIL) 2024.07.24

[TIL 240722] 직관적인 데이터 시각화 만들기

오늘은 아티클스터디로 "직관적인 데이터 시각화 만들기" 를 스터디 했다.https://yozm.wishket.com/magazine/detail/1792/ 데이터 시각화 101: ②직관적인 데이터 시각화 만들기 | 요즘IT데이터를 시각화하여 전달하면 우리의 뇌는 빠른 속도로 많은 양의 정보를 처리할 수 있고, 데이터 테이블에 비해 트렌드나 패턴, 아웃라이어 등을 쉽게 파악할 수 있습니다. 때문에 데이터를yozm.wishket.com  시각 정보를 처리하는 과정 1.     뚜렷한 시각 요소 파악하기색, 질감, 두께, 방향 등 기본적 시각 요소를 파악 2.     패턴 알아차리기그 시각 요소들의 공통점과 차이점을 파악 3.     해석하기그 패턴들을 활용해 의미를 부여하고 해석  전주의적 속성 이해하기  ..

오늘 나는 (TIL) 2024.07.22

[데이터 시각화] Python 라이브러리 Matplotlib, Seaborn

Matplotlib과 Seaborn은 Python 내의 라이브러리 중 하나로, 데이터의 시각화에 주로 활용 된다.Matplotlib을 위주로 작성을 해보겠다.  Matplotlib 예시 코드들기본import matplotlib.pyplot as pltx = [1,2,3,4,5]y = [2,4,6,8,10]plt.plot(x,y)plt.xlabel("x-axis")plt.ylabel("y-axis")plt.title("Example")plt.show()  도구들import pandas as pddf = pd.DataFrame({ "A": [1,2,3,4,5] , "B": [5,4,3,2,1]})df.plot(x = "A", y = "B")plt.show()  스타일 설정하기df.plot(x = ..

Datalogy 2024.07.18

[TIL 240718] Excel vs Pandas

오늘은 데이터 전처리 강의를 들으며 Excel과 Pandas의 차이 들을 알았고,왜 Pandas를 활용해야 하는가를 배웠다. 데이터 전처리에서의 Pandas 활용에 대한 내용은 다음 링크에 정리되어 있다.https://thebuck104.tistory.com/51 [데이터 전처리] thebuck104.tistory.com 데이터 시각화에서의 matplotlib과 seaborn 활용에 대한 내용은 다음 링크에 정리되어 있다.https://thebuck104.tistory.com/53 [데이터 시각화] Python 라이브러리 Matplotlib thebuck104.tistory.com Pandas가 Excel보다 좋은 이유 1. 자동화와 프로그래밍 가능Pandas는 Python과 함께 사용되어 데이터 조작과..

오늘 나는 (TIL) 2024.07.18

[데이터 전처리] Python 라이브러리 Pandas

Python Library - Pandas파이썬은 다음과 같은 유용한 라이브러리들이 많다  Pandas는 데이터를 전처리 할 때 사용할 수 있는 Python의 라이브러리 중 하나로,크게 다음과 같은 데이터 오브젝트 형태를 가진다.   Pandas 기본 코드들불러오고 저장하기import pandas as pdimport seaborn as snsdata = sns.load_dataset('tips')data.to_csv("tips_data.csv", index = False)df = pd.read_csv("tips_data.csv")#df = pd.read_csv("tips_data.csv", index_col = 0)df.to_excel("tips_data.xlsx", index = False)  Ind..

Datalogy 2024.07.18

[TIL 240717] 데이터 시각화는 왜 중요할까? 와 정성적 데이터 시각화

오늘의 아티클 스터디는 "데이터 시각화는 왜 중요할까?"https://yozm.wishket.com/magazine/detail/1750/ 데이터 시각화 101: ① 데이터 시각화는 왜 중요할까? | 요즘IT데이터의 양이 늘어나고 복잡해질 수록 데이터를 좀 더 쉽게 이해하고 인사이트를 발견하는 것의 필요성이 높아지고 있는데요. 데이터 시각화란 말 그대로 데이터에서 발견한 정보를 시각적으yozm.wishket.com  슈퍼 요약1.     시각 정보는 쉽게 알 수 있다.2.     그래서 인사이트의 발견이 빠르다.3.     그래서 의사결정에 도움을 준다. 나의 인사이트보통 시각화라고 하면 정량적인 데이터를 주로 생각할 수 있다.A부터 B까지의 최단거리와 움직일 때의 예상 시간태풍이 얼마나 센지 그리고 어..

오늘 나는 (TIL) 2024.07.17