분류 전체보기 73

[STAT 101] 잔차와 오차, 그리고 결정계수

[STAT 101] 단순선형회귀, 공분산과 상관관계 에서 이어지는 포스트입니다.https://thebuck104.tistory.com/35 [STAT 101] 단순선형회귀, 공분산과 상관계1.     단순선형회귀단순 선형 회귀는 두 변수 사이의 관계를 모델링하는 통계기법이다.이 때, 하나는 독립 변수 X (설명 변수), 나머지 하나는 종속 변수 Y (반응 변수)로 하며, 선형 회귀는 둘thebuck104.tistory.com  3.     잔차와 오차잔차 (Residual)와 오차 (Error)는 데이터 분석 및 회귀 분석에서 중요한 개념으로 모델이 실제 데이터를 얼마나 잘 반영하는지 평가하는 데 사용된다. 잔차와 오차는 실제 관측값과 회귀모델이 추정한 예측값의 차이를 뜻한다.하지만, 둘은 비슷한 개념이..

Statistics 2024.07.16

[TIL 240715] 데이터 분석가에게 중요한 것들과 EDA

오늘은 "데이터 분석가가 되어보니 중요한 것들" 이라는 아티클의 스터디를 진행했다.출처: https://yozm.wishket.com/magazine/detail/1863/ 데이터 분석가가 되어보니 중요한 것들 | 요즘IT개발자, 디자이너, 기획자, HR, 오퍼레이션 등 대부분의 직무에서 우리가 일하기 전 예상했던 업무와 실제 업무에는 차이점이 존재합니다. 비즈니스는 빠르게 변화하기 때문에, 학생 때 배운 교yozm.wishket.com 또한, SQL 챌린지 반 1회차를 수강했다.https://thebuck104.tistory.com/48 [SQL챌린지] 01. thebuck104.tistory.com 오늘의 TIL에는 아티클 스터디에 관해 작성해 보겠다.데이터 분석가란? 데이터에 기반해 성공확률이 높은..

오늘 나는 (TIL) 2024.07.15

[TIL 240712] 날짜를 요일로, strftime() 함수

오늘은 날짜를 요일로 변경해주는 python 함수인 strftime() 을 알아보았다.날짜형 데이터에 대한 활용이 많을 것으로 예상되는 실무에서잘 사용될 수 있을 듯 하다. import datetimedef solution(a, b, c = 2016): month = a day = b year = c ans = datetime.date(year, month, day) #숫자들을 날짜 형태로 바꿔준다 return ans.strftime("%a").upper() #날짜 형태를 요일로 반환해준다 strftime()함수는 위와 같이 사용할 수 있으며, 다음과 같은 굉장히 많은 파라미터들을 ("") 안에 대입해요일 말고도 수많은 형태를 반환할 수 있다. 파라미터의미%a축약된 요일명.%A..

오늘 나는 (TIL) 2024.07.12

[TIL 240711] 입양 시각 구하기 (2), Set

SQL 문제, 입양 시각 구하기 (2)를 풀며 set에 대해 알 수 있었다.  문제 ANIMAL_OUTS 테이블은 동물 보호소에서 입양 보낸 동물의 정보를 담은 테이블입니다. ANIMAL_OUTS 테이블 구조는 다음과 같으며,ANIMAL_ID, ANIMAL_TYPE, DATETIME, NAME, SEX_UPON_OUTCOME는 각각동물의 아이디, 생물 종, 입양일, 이름, 성별 및 중성화 여부를 나타냅니다. NAMETYPENULLABLEANIMAL_IDVARCHAR(N)FALSEANIMAL_TYPEVARCHAR(N)FALSEDATETIMEDATETIMEFALSENAMEVARCHAR(N)TRUESEX_UPON_OUTCOMEVARCHAR(N)FALSE 보호소에서는 몇 시에 입양이 가장 활발하게 일어나는지 알..

오늘 나는 (TIL) 2024.07.11

[TIL 240710] "개발 블로그는 어떻게 써야 하는가?" 와 SEO

오늘은 아티클 스터디를 진행했고,개발 블로그는 어떻게 써야 하는가? 에 대해 리서치를 해보았다.출처: https://f-lab.kr/blog/graduate-interview-habihow-write-developer-blog 개발 블로그는 어떻게 써야 할까? 행위 그 자체 보다는 무엇을?  왜?  어떻게? 1.     공부한 내용 보다는 활용한 내용코드 예제 및 최신 정보 반영 2.     개념정리는 깊게주제에 대해 깊이 있게 다루되, 독자가 이해하기 쉽고 바로 적용할 수 있게 3.     이미지를 활용하자그림, 스크린샷, 그래프 등등을 활용 (draw.io) 4.     문단을 잘 나누자서론 본론 결론 구조 5.     링크를 잘 활용하자외부의 유용한 리소스로 연결되는 링크 삽입 6.     글의 스..

오늘 나는 (TIL) 2024.07.10

[TIL 240708] 데이터 분석가로써 하면 안 되는 것들

오늘의 아티클 스터디는"데이터 기반 의사결정의 장점" 이라는 아티클을 주제로 했었다.  아티클의 내용은 다음과 같았다. Data-Driven Decision-Making, DDDM 아래와 같은 효과를 볼 수 있음 1.     더 확실한 결정을 내릴 기회앞으로 내릴 의사 결정에 영향을 주는 기반이 되면서, 기존의 역량을 평가하는데 활용 2.     진두지휘적 통솔력 탑재 가능 3.     비용 절감 효과비용 절감 프로그램 활용 등등  우리가 매일매일 할 것은? 1.     예상치 못한 곳에서 패턴 찾기데이터 포인트 사이에 존재하는 일정한 패턴이나 연관성을 발견하는 것 2.     데이터 기반으로 결정하기직관 보다는 분석적인 태도로 수치에 의존해서 결정하는 것 3.     데이터의 중요성 시각화하기더 빠른 ..

오늘 나는 (TIL) 2024.07.08

[TIL 240704] 파이썬 통합 강의, 아티클 스터디

오늘은 파이썬 통합강의를 완강했고, 아티클 스터디를 했다. 파이썬 통합강의는 https://thebuck104.tistory.com/category/Python 'Python' 카테고리의 글 목록데이터 분석가가 되어가는 저의 한 걸음, 두 걸음 입니다.thebuck104.tistory.com파이썬 카테고리에 [Python 101]  로 정리해놨다. 아티클 스터디는 데이터 분석가가 갖춰야 할 9가지 역량 | 요즘IT (wishket.com) 로 진행했다.내용은 다음과 같다. 데이터 분석가가 갖춰야 할 9가지 역량 데이터 분석가에게 필요한 하드 스킬1.     사용 언어2.     통계학3.     도메인 및 비즈니스에 대한 이해4.     툴을 다루는 역량5.     업무 자동화와 데이터 엔지니어링 데이터..

오늘 나는 (TIL) 2024.07.04

[Python 101] List Comprehension, Lambda, glob, os

List Comprehension# 기본적인 구조[표현식 for 항목 in iterable if 조건문]# 예시: 1부터 10까지의 숫자를 제곱한 리스트 생성squares = [x**2 for x in range(1, 11)]print(squares) # 출력: [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]# 예시: 리스트에서 짝수만 선택하여 제곱한 리스트 생성even_squares = [x**2 for x in range(1, 11) if x % 2 == 0]print(even_squares) # 출력: [4, 16, 36, 64, 100]# 예시: 문자열 리스트에서 각 문자열의 길이를 저장한 리스트 생성words = ["apple", "banana", "grape", "or..

Python 2024.07.04

[STAT 101] 단순선형회귀, 공분산과 상관관계

1.     단순선형회귀단순 선형 회귀는 두 변수 사이의 관계를 모델링하는 통계기법이다.이 때, 하나는 독립 변수 X (설명 변수), 나머지 하나는 종속 변수 Y (반응 변수)로 하며, 선형 회귀는 둘 사이의 선형관계를 찾는다.  Beta-0는 Y 절편 (Y-intercept)Beta-1은 기울기 (Slope)ϵ은 오차 항(Error Term), 혹은 확률변동 (Random Disturbance) 라고 한다.  ㄴ 실제 자료와 참회귀선 (y = beta0 + beta1 x) 의 차이를 나타낸다. 최소 제곱법위는 최소 제곱법 (Least Square Method)을 활용해서각 점으로부터 구하고자 하는 최적의 직선까지의 수직거리의 제곱합을 최소로 하는 직선방정식을 구한다. 이는 RMSE (Root-mean ..

Statistics 2024.07.04