전체 글 31

(2025-11-11) 데이터분석 DAY17: Python Comprehention

파이썬 따라쓰기# 컴프리헨션, 예외 처피 -> 파이썬이라서 더 중요한 문법# 파이써닉(pythonic) 깔끔하고 읽기 좋은 코드로 작성, 일단 시도하고 처리# 컴프리헨션: 반복문을 한 줄로 줄이는 문법# for, if### 주의사항: 식 자체가 너무 복잡해지면 사용하면 안 됨.# 리스트 컴프리헨션# [ 표현식 for 변수 in 반복대상 if 조건문 ]result = []for i in range(1, 5): result.append(i)print(result) # [1, 2, 3, 4]print([i for i in range(1, 5)]) # [1, 2, 3, 4] 리스트 선언, appendresult2 = []for i in range(1, 6): result2.append(i**2)pri..

카테고리 없음 2025.11.11

(2025-11-07) 데이터분석 DAY15: ERD, 파이썬 기초&문제풀기

데이터분석 캠프 15일차ERD란?아티클 스터디를 하는 중 ERD 에 관한 이야기가 있어서 간단하게 요약 해보았다.**ERD(Entity Relationship Diagram)**는 데이터베이스 구조를 시각화한 다이어그램으로, 설계 단계에서 데이터 간 관계를 쉽게 이해하기 위해 사용된다.핵심 요소는 Entity(개체), Relationship(관계), Attribute(속성) 세 가지다.Entity는 관리하고자 하는 실체(예: 사람, 사물, 개념)이며, 고유 식별자(UID)를 가져야 한다.Weak Entity는 독자적으로 식별 불가능하고 다른 개체에 의존하는 개체다.Attribute는 Entity를 구성하는 속성으로, 데이터 타입과 함께 정의된다.Attribute 종류에는 Key, Composite, Mu..

카테고리 없음 2025.11.07

(2025-11-06) 데이터분석 DAY14: 파이썬 기초

데이터분석 캠프 14일차파이썬 따라쓰기더보기# 함수를 사용하는 이유# 틀 -> 반복 재사용에 용이'''def 함수이름(): 실행문 -> 자주 쓰이는 코드호출함수이름()'''# def print(출력할 내용)# def say_hello():# print("Hello")# name = 'hannah'# print(f"{name}, hello")# 선언부# 매개변수# def say_hello_to(name1, name2, name3):# print(f"{name1, name2, name3}, hello")# 호출부# 인자값# say_hello_to("a", "b", "c")'''def 함수이름(): 실행문 return 결과값result = 결과값'''# def add(a, b):..

카테고리 없음 2025.11.06

(2025-11-05) 데이터분석 DAY13: 파이썬 기초

데이터분석 캠프 13일차아티클스터디https://yozm.wishket.com/magazine/detail/1667/ https://yozm.wishket.com/magazine/detail/1680/직관과 통계가 다를 수 있다.“두 구룹의 차이가 아무리 적어도 표본만 크면 충분히 유의미할 수도 있다.”표본을 얼마나 모아야 할까?: 매번 다르다. 표본이 많을 수록 좋기는 하지만 기댓값을 충족한다면 적은 표본으로도 유의미한 결과가 나올 수 있다.A/B테스트 실패를 줄이는 방법최대한 표본을 많이 모으기승패를 예측해서 실험을 조기 종료하기같은 조건에서 테스트 시작하기표본수가 많을수록 통계적 신뢰도는 늘어나겠지만, 적은 표본으로도 최적의 의사결정을 통해 높은 효율을 낼 수도 있다. 표본의 크기와 그에 따른 효과..

카테고리 없음 2025.11.05

(2025-11-04) 데이터분석 DAY12: SQL 문제 풀기, 파이썬 기초

데이터분석 캠프 12일차SQL 과제 6문제문제1select i.name, i.datetimefrom animal_ins ileft join animal_outs oon i.animal_id = o.animal_idwhere o.animal_id is nullorder by i.datetime asc limit 3 문제2select u.user_id, u.nickname, sum(b.price) as total_salesfrom used_goods_board bjoin used_goods_user uon b.writer_id = u.user_idwhere b.status = 'done'group by u.user_id, u.nicknamehaving sum(b.price) ..

카테고리 없음 2025.11.04

(2025-10-31) 데이터분석 DAY10: SQL 문제 풀기

데이터분석 캠프 10일차select distinct page_locationfrom gawhere page_location not like '%\_%' # where page_location not regexp '_' (가능)order by 1 asc'_'를 단순한 문자로 인식하게 만드는 방법을 배웠다. regexp(사용법이 조금 복잡해 보인다.)라는 새로운 내용도 알게됐다.select round((count(*) / (select count(*) from artworks)) * 100, 3 ) as ratiofrom artworkswhere lower(credit) like '%gift%'lower upper를 생각 못해서 한참동안 문제를 붙들고 있었다. 대문자로 출력해야 하는 문제에서 u..

카테고리 없음 2025.10.31

(2025-10-30) 데이터분석 DAY9 : SQL 문제 풀기

데이터분석 캠프 9일차아티클 스터디AB Testguide 이용하기test data 에 수치입력hypothesis 에 단측, 양측 검정 선택confidence 에 신뢰수준 선택양측검정이 p-value가 높게 나오기 때문에 실험 결과가 유의미하지 않다고 나올 가능성이 높다.보수적이고 안전한 실험을 위해 AB테스트에는 보통 양측 검정을 택함.A/B테스트에 단측 검정을 굳이 사용 할 필요는 없지만ex) 결과를 도드라지게 보이기 하기 위해서, 확신을 얻기 위해서 (회사에서 데이터 보여주기 식으로라도)다양한 목적을 위해 단측 검정을 사용하는 경우도 있다는 얘기가 나왔다.SQL세션 union 과제select date_format(sales_date, '%Y-%m-%d') as sales_date, prod..

카테고리 없음 2025.10.30

(2025-10-29) 데이터분석 DAY8 : 통계학 기초

데이터분석 캠프 8일차통계가 필요한이유데이터 이해와 해석 요약하고 패턴을 발견 추론을 통해 결론 도출 데이터 기반의 의사결정 +기업이 수익 창출을 위한 결과를 내기위해통계가 어떻게 사용될까? 기업 전략 수립, 마케팅 진행, 신제품 개발 ex) 고객 만족도 설문조사 분석 ,고객 유형별 세그먼트 상품 추천기술통계와 추론통계 기술통계 : 데이터를 요약하고 설명하는 통계 방법 평균, 중앙값, 분산, 표준편차 등 특정 대표값으로 요약 추론통계 :신뢰구간 가설검증 등을 사용 데이터의 일부로 데이터 전체를 추측 신뢰구간 :일반적으로 95% (p-value가설검정 귀무가설 : 가설이 틀렸음을 나타냄 대립가설 : 주장하는 바를 나타냄 p-value 를 통해 결정통계학 기초 강의에 파이썬 실습이 많아서 파이썬 강의를 먼저..

카테고리 없음 2025.10.29