Today I Learned (55) 썸네일형 리스트형 240222 / 데이터 분석 부트캠프 45일차 (내일배움캠프 Data_1기) ♣ 이번주 목표 : 데이터 분석 숙련 - 태블로 '실습으로 배우는 태블로' 강의 수강 'SQLD 자격증 대비반' 강의 복습 태블로 필터별 작동 원리 추출 필터 : 데이터 소스에서 추출된 데이터 필터링 (데이터 연결을 추출로 선택했을때만 사용 가능) 데이터 원본 필터 : 데이터 원본 소스에서 일부 데이터만 필터링 컨텍스트 필터 : 특정값에 대한 데이터만 필터링 차원 필터 : 차원을 기준으로 데이터 필터링 측정값 필터 : 측정값 기준으로 데이터 필터링 테이블 계산 필터 : 특정 계산 결과를 기준으로 데이터 필터링 LOD식 현재 화면(VLOD)에 영향을 받지 않고 원하는 세부 수준에서 값을 계산 기본 문법 구조 { FIXED | INCLUDE | EXCLUDE [차원1], [차원2] : AVG([측정값] } .. 240221 / 데이터 분석 부트캠프 44일차 (내일배움캠프 Data_1기) ♣ 이번주 목표 : 데이터 분석 숙련 - 태블로 '실습으로 배우는 태블로' 강의 수강 'SQLD 자격증 대비반' 강의 복습 데이터 시각화(Data Visualization) 데이터를 그래프 형식으로 나타내 직관적으로 이해하기 쉽게 만듦 그래프를 활용해 데이터의 추세, 분포, 상관 관계 등을 시각적으로 표현 데이터 시각화의 장점 데이터를 빠르게 이해하고 의사결정 가능 실무 협업 시 효과적인 커뮤니케이션 가능 직관적인 데이터 이해를 통해 인사이트 도출 📊 태블로 시각화 실습을 통해 만든 기본 그래프 워크시트 240220 / 데이터 분석 부트캠프 43일차 (내일배움캠프 Data_1기) ♣ 이번주 목표 : 데이터 분석 숙련 - 태블로 SQL 코드카타 73번 풀이 복습 (Oracle) '실습으로 배우는 태블로' 강의 수강 'SQLD 자격증 대비반' 강의 복습 계층형 쿼리 Oracle에서 사용되는 특수한 구문으로 계층형 데이터를 조회하기 위한 쿼리 계층형 데이터 : 동일 테이블에서 계층적으로 상위와 하위 데이터가 포함된 데이터 계층형 쿼리 형태 START WITH 조건 CONNECT BY [NOCYCLE] 조건 [ORDER SIBLINGS BY 컬럼]; START WITH : 계층형 데이터 시작점 지정 CONNECT BY : 부모-자식 관계를 갖는 데이터를 쿼리 LEVEL : 현재 쿼리 결과에서 행이 어떤 계층에 속하는지 나타내는 가상의 열, 1부터 시작 DUAL : 단일 행과 단일 열을 .. 240219 / 데이터 분석 부트캠프 42일차 (내일배움캠프 Data_1기) ♣ 이번주 목표 : [심화 프로젝트] 데이터 수집 및 전처리 & 분석을 집중하여 수행하고 분석을 토대로 결론을 도출 Python 코드카타 36번 풀이 복습 'SQLD 자격증 대비반' 강의 복습 프로젝트 기간동안 정신없이 바빠서 TIL을 쓸 시간이 없었다... 여러 방면으로 아쉬움이 많았다. 특히 파이썬 분석할 때 어려움을 많이 겪고 머신러닝은 시도해보지도 못해서 아직 능력치가 많이 부족하다고 느꼈다. 그래도 오늘 발표까지 이번 프로젝트도 무사히 마무리를 했다 :) [SQLD 자격증 대비반] 챕터 3. 데이터 모델링의 요소 엔터티(Entity) "개체" 라고 표현하며 정보의 세계에서 의미있는 하나의 정보 단위를 뜻함 데이터베이스에서 레코드가 개체에 해당 엔터티와 인스턴스 엔터티는 인스턴스(Instance).. 240207 / 데이터 분석 부트캠프 36일차 (내일배움캠프 Data_1기) ♣ 이번주 목표 : [심화 프로젝트] 데이터 수집 및 전처리 & 분석을 집중하여 수행하고 분석을 토대로 결론을 도출 Python 코드카타 34-36번 풀이 데이터 전처리 및 시각화 isdigit() 문자열이 모두 숫자로 이루어져 있으면 True를 반환하고, 숫자 외의 문자가 하나라도 포함되어 있다면 False를 반환하는 메소드로 부호나 소수점, 지수 또한 숫자로 처리하지 않는다. try / except 문 예외 처리를 위해 사용되는 구문 코드 실행 중 오류가 발생했을 때 해당 오류를 처리하고 프로그램이 중단되지 않도록 하는 기능 제공 try 블록 : 예외가 발생할 수 있는 코드를 포함하는 블록으로 코드가 실행되는 동안 발생한 예외는 except 블록으로 넘어간다. except 블록 : 예외를 처리하는 코.. 240206 / 데이터 분석 부트캠프 35일차 (내일배움캠프 Data_1기) ♣ 이번주 목표 : [심화 프로젝트] 데이터 수집 및 전처리 & 분석을 집중하여 수행하고 분석을 토대로 결론을 도출 프로젝트 주제 선정 데이터 확인 및 간단한 전처리 어제는 공부를 너무 안 해서 TIL을 건너뛰었다... 오늘도 TIL에 쓸 내용은 딱히 없지만 프로젝트 진행 때문에 데이터 전처리를 조금 했다. 심화 프로젝트가 조금 막막하지만 이번에도 좋은 팀원들이 있으니 어떻게든 되겠지 하는 마음이 있다 :) 내일부터는 시간 배분을 해서 프로젝트와 개인 공부를 병행하도록 해야겠다. POSIX 시간 1970년 1월 1일 00:00:00 (UTC)부터 경과한 시간을 초 단위로 나타낸 것 # POSIX 시간을 date type으로 변경 train_1['visitStartTime'] = pd.to_datetime.. 240202 / 데이터 분석 부트캠프 33일차 (내일배움캠프 Data_1기) ♣ 이번주 목표 : 데이터 분석 입문 - 머신러닝 '머신러닝의 이해와 라이브러리 활용 심화' 강의 수강 머신러닝 개인 과제 풀이 의사결정나무(Decision Tree, DT) 의사결정규칙을 나무 구조로 나타내어 전체 자료를 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석 방법 장점 쉽고 해석하기 용이 다중분류와 회귀에 모두 적용 가능 이상치에 견고하며 데이터 스케일링 불필요(데이터의 상대적인 순서를 고려해서) 단점 나무가 성장을 너무 많이 하면 과대 적합의 오류에 빠질 수 있음 훈련 데이터에 민감하게 반응하여 작은 변화에도 나무의 구조가 크게 달라짐(불안정성) Python 라이브러리 sklearn.tree.DecisionTreeClassifier sklearn.tree.DecisionTreeRegre.. 240201 / 데이터 분석 부트캠프 32일차 (내일배움캠프 Data_1기) ♣ 이번주 목표 : 데이터 분석 입문 - 머신러닝 '머신러닝의 이해와 라이브러리 활용 심화' 강의 수강 머신러닝 개인 과제 풀이 교차 검증(Cross Validatoin) 데이터 셋을 여러 개의 하위 집합으로 나누어 돌아가면서 검증 데이터로 사용하는 방법 > 과적합 예방? K-Fold Validation Train Data를 K개의 하위 집합으로 나누어 모델을 학습시키고 최적화하는 방법 K는 분할 개수 데이터가 부족할 경우 유용함 (반복 학습) 함수 sklearn.model_selection.KFold sklearn.model_selection.StrifiedKFold : 불균형한 레이블(Y)을 가지고 있을 때 사용 하이퍼 파라미터 자동적용 - GridSearchV 하이퍼 파라미터(Hyper Parame.. 240131 / 데이터 분석 부트캠프 31일차 (내일배움캠프 Data_1기) ♣ 이번주 목표 : 데이터 분석 입문 - 머신러닝 Python 코드카타 32-33번 풀이 '머신러닝의 이해와 라이브러리 활용 심화' 강의 수강 Python 코드카타에서 종종 수학 문제같은 것들이 나와서 코드로는 어렵지 않은데 수학 개념을 다시 배우게 된다. 제곱수의 약수가 홀수개라는 말이 이해가 안 되어서 직접 파이썬으로 출력해 봤다. 예를 들어 주어진 수가 4일 경우 4의 약수는 1, 2, 4로 총 3개 홀수이다. 2처럼 같은 수끼리 곱해져서 n이 되는 제곱수는 약수의 개수가 홀수개가 되는 것이다. n=4 print(int(n**0.5)) print(n**0.5) ## 2 ## 2.0 n=5 print(int(n**0.5)) print(n**0.5) ## 2 ## 2.23606797749979 머신러닝.. 240130 / 데이터 분석 부트캠프 30일차 (내일배움캠프 Data_1기) ♣ 이번주 목표 : 데이터 분석 입문 - 머신러닝 Python 코드카타 30-31번 풀이 '머신러닝의 이해와 라이브러리 활용 기초' 강의 수강 머신러닝 기초 강의를 이어서 들었는데 하나씩 따라 해보고 정리하면서 학습하느라 진도가 더딘 것 같다. 그래도 강의를 이해하고 따라가는데에는 큰 문제가 없다 :) 선형회귀 단순선형회귀 : x 변수가 1개 다중선형회귀 : x 변수가 2 수치형 데이터 vs 범주형 데이터 수치형 데이터 연속형 데이터 : 두 개의 값이 무한한 개수로 나누어진 데이터 ex) 키, 몸무게 이산형 데이터 : 두 개의 값이 유한한 개수로 나누어진 데이터 ex) 주사위 눈, 나이 범주형 데이터 순서형 자료 : 자료의 순서가 의미 있음 ex) 학점, 등급 명목형 자료 : 자료의 순서가 의미 없음 e.. 이전 1 2 3 4 ··· 6 다음