| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
- 박스 플롯
- Til
- zip 함수
- 데이터 리터러시
- 퍼포먼스 마케터
- CRM마케터
- 데이터활용직무
- 산점도
- 비즈니스분석가
- 탐색적 데이터 분석
- 관습형
- 그로스 해커
- 진취형
- 데이터분석가
- active user
- 리스트 컴프리헨션
- Python
- Exploratory Data Analysis
- 비즈니스 분석가
- f-string
- CRM 마케터
- 북극성 지표
- 스파르타클럽
- 부트캠프
- 퍼포먼스마케터
- 데이터 전처리
- 라이브러리
- 고용24
- 파이썬
- SQL
- Today
- Total
목록분류 전체보기 (33)
손은 머리보다 기억력이 좋다
오늘은 기초 파이썬 강의가 끝나는 날이다.파이썬을 이용해 (pandas와 같은 라이브러리 없이) 일련의 데이터 전처리 과정을 수행하는 것이 오늘 수업 내용이었다.학생들의 과목별 성적이 있는 csv 파일을 불러와 이름, 평균, 합격 여부를 담은 리스트로 바꾸고, json 파일로 내보낸다.이번에 사용한 csv 데이터는 다음과 같다.# school_scores.csvname,kor,eng,mathHannah,90,95,85Minjun,80,88,92Yujin,75,85,100Dohyeok,100,70,88Suyun,88,90,93Jiwon,95,97,99Hojun,65,75,60Yuna,78,82,85Taeyang,92,89,91Seojin,55,70,68name은 학생의 이름이고, kor, eng, math..
1. datetime 라이브러리datetime 라이브러리는 시간 데이터를 다뤄야 할 때 사용할 수 있는 라이브러리이다.날짜 단위의 계산을 해야 되는 경우(ex. 특정 일자를 기준으로 N일을 더한다) 반드시 날짜형 데이터를 이용해 계산해야 하기 때문에, 문자열을 날짜로 바꿔 주어야 한다. 또한 출력할 때 포맷 상의 문제로 문자 형태로 출력해야 하는 경우도 날짜형 데이터를 문자열로 바꿀 수 있다.import datetime# 현재 날짜와 시간now = datetime.datetime.now()print(f"Current date and time : {now}")# 특정 날짜 생성some_date = datetime.date(2025, 4, 3)print(f"Specific date : {some_date}"..
1. 컴프리헨션 (Comprehension)컴프리헨션은 파이썬 코드를 파이써닉(Pythonic)하게 작성할 수 있는 주요한 스킬이다.리스트, 딕셔너리, 셋을 만드는 반복문을 한 줄로 간결하게 표현하는 것이 컴프리헨션의 핵심이다.컴프리헨션의 기본 구조는 다음과 같다.# 리스트 컴프리헨션[표현식 for 변수 in 반복대상 if 조건문]# 딕셔너리 컴프리헨션{key 표현식 : value 표현식 for 변수 in 반복 대상 if 조건문}# 셋 컴프리헨션{표현식 for 변수 in 반복대상 if 조건문} 컴프리헨션 중 가장 많이 사용되는 리스트 컴프리헨션에 대해 알아보자.리스트 컴프리헨션을 사용하면 몇 줄짜리 반복문을 사용하는 것보다 간결하게 코드를 작성할 수 있으며, 처리 속도도 빨라진다.단 반복문 식이나 조건..
1. EDA란?EDA(Exploratory Data Analysis, 탐색적 데이터 분석)는 초기 데이터 분석 단계에서 데이터를 다각도로 관찰하고 이해하는 모든 과정을 말하며, 벨 연구소의 수학자 존 튜키가 개발한 데이터 분석 방법론이다.EDA는 단순히 초기 단계에서 데이터에 대한 전반적인 특징을 보는 것 뿐만 아니라, 데이터 분석과 결론 도출 과정에서 지속적으로 데이터를 탐색하고 이해하는 모든 과정을 일컫는다.데이터를 수집하고 전처리(preprocessing)한 뒤, 본격적으로 데이터 분석을 시작하기 전 전체 데이터를 시각화하거나 기본적인 통계값(평균, 표준편차, 중앙값 등)을 만들어 자료를 전체적으로 바라보고 이 데이터가 어떤 데이터인지 살펴보는 것이다. 2. EDA가 필요한 이유1) 데이터의 문제점..
이제 SQL은 주니어 데이터 분석가에게 필요한 수준은 갖춘 것 같다. 짧은 시간 안에 엄청난 양의 내용을 공부했던 것 같은데, 캠프에서 튜터님이 하나하나 자세하게 잘 가르쳐주신 것도 있고, 나도 매일 코딩테스트를 풀며 복습했고 SQLD도 같이 공부하면서 실력이 많이 늘은 것 같다.3주 동안 열심히 프로그래머스 코팅테스트를 풀었더니 LV.4까지는 풀 수 있게 되었고, LV.5도 도전해서 성공했다. 덕분에 이제 프로그래머스 SQL은 2문제밖에 남지 않았다..남은 두 문제를 다 풀고 나면, 이전에 풀었던 내용들을 SQL 응용 내용을 바탕으로 보다 간단하게 작성하는 연습을 할 것이다.실제 코딩테스트가 얼마나 어렵게 나오는지는 잘 모르겠으나, 이 정도면 그래도 신입 입사시험을 보는데 문제는 없지 않을까..라고 스..
1. MatplotlibMatplotlib은 데이터 시각화 툴(Tableau, Power BI) 없이도 파이썬에서 데이터 시각화를 할 수 있게 도와주는 패키지이다.기본적인 선 형태의 plot부터 바그래프, 히스토그램, 산점도, box plot 등 다양한 데이터 시각화가 가능하다.파이썬의 데이터 시각화 패키지는 matplotlib 외에도 seaborn, plotly 등이 있고 각각 강점이 있다고는 하나, 제일 기본적으로는 matplotlib을 쓴다.오늘은 파이썬 데이터 시각화의 기본인 matplotlib에 대해 공부해 보았다.그럼 matplotlib을 불러오는 것으로 시작해보자.import matplotlib.pyplot as plt 2. 선형 그래프(line plot)중학교 때 배우는 1차함수 그래프를 ..
1. 오늘의 코드카타1) 연간 평가점수에 해당하는 평가 등급 및 성과금 조회하기https://school.programmers.co.kr/learn/courses/30/lessons/284528WITH grading AS( SELECT emp_no, CASE WHEN AVG(score) >= 96 THEN 'S' WHEN AVG(score) >= 90 THEN 'A' WHEN AVG(score) >= 80 THEN 'B' ELSE 'C' END AS grade FROM hr_grade GROUP BY emp_no ) SELECT h.emp_no, h.emp_name, g.grade, ..
1. 나의 역량 분석하기 (직업선호도검사 S형 + MBTI)오늘은 복습이 주된 일과였어서, 남는 시간에 자아성찰 및 포트폴리오 작성을 위해 나의 강점을 분석하는 시간을 가졌다.사실 나는 자신에 대해 생각하는 습관이 없어서(어릴 때부터 그런 생각을 거의 안 했던 것 같다) 이런 성격유형검사나 직업선호도검사를 할 때 내가 맞게 하고 있는 건가 싶을 때도 있고, 결과에서 '너는 이러이러한 사람이야'라고 말해주면 어색하기도 하고 "그래요?"라는 생각이 들 때도 있고 하다.1) 나의 직업선호도 검사(참고 : 직업선호도검사는 고용24 사이트에서 로그인 후 무료로 할 수 있다. 아래 사이트 참조)https://www.work24.go.kr/wk/r/c/1000/jobPsyExamList.do취업가이드>직업심리검사>직..
