플레이데이터 18일차 1/31(월)
팀원 : 우상욱, 김기훈, 서영호, 이병호, 이호진
파이썬의 기초를 배운 이후 pandas와 seaborn 라이브러리를 활용하여 데이터 시각화를 했다.
bar, pie 등의 다양한 구조로 시각화 연습을 해보고
Stack Overflow Annual Developer Survey 2022년 설문 자료를 다운 받아 의미 있는 데이터로 뽑아내는 작업을 했다.
의미가 있다는 것은 돈이 되는 자료라는 것과 거의 일치하는 것을 알았다.
그중 개발자 직업 분포와 개발자 사용 언어 분포가 부족한 나의 식견을 넓히는 좋은 자료가 됐다.
아래는 시각화한 데이터 자료들이다.
- 2022년 개발자 직업 분포(전세계)
1위 풀스택 개발자(17.4%)
2위 백엔드 개발자(16.1%)
3위 프론트엔드 개발자(9.6%)
그외
데이터 엔지니어(2.1%)
데이터 사이언티스트(1.06%)
- 2022년 개발자 언어 분포(전세계)
1위 JavaScript(12.6%)
2위 HTML/CSS(10.8%)
3위 SQL(9.5%)
4위 Python(9.2%)
그 외
Java(6.4%)
- 2022년 개발자 언어 분포(한국)
1위 JavaScript(12.8%)
2위 Python(10.3%)
3위 HTML/CSS(9.3%)
4위 Java(8.5%)
그 외
SQL(7.4%)
위와 같이 자유 주제를 정해 의미 있는 자료로 시각화 하는것이 이번 미니 프로젝트이다.
프로젝트는 수, 목, 금 3일간 진행되고 금요일 오후 3시부터는 발표를 하니 그 전까지 마무리해야 한다.
오늘은 오후 5시30분 수업이 끝나기 전 조를 나누고 잠깐의 대화 시간을 가졌다.
잠깐의 대화 결과 나온 주제는 이렇다.
1. 금융
주식과 비트코인의 상관관계, 종목토론방 대화에 따른 주식 변화 추이 등
기훈님이 금융관련 전공
2. 의료
암에 따른 병원 선택 추이
영호님이 의료 관련 전공
3. 음악
멜론 등 음악 사이트에서 성별과 나이대에 따른 음악 선호도 조사 등
나 자신이 음악 전공
잠깐 생각해 나온 결과라 내일 오전중으로 카테고리를 정리하여 투표를 통해 결정할 예정이다.
파이썬을 가르쳐주시는 이기수 선생님이 데이터를 받을 수 있는 사이트를 알려주셨다.
데이터를 받을 수 있는 사이트들:
https://www.kaggle.com/competitions
https://dacon.io/competitions
https://www.data.go.kr/
https://data.seoul.go.kr/
https://www.index.go.kr/
https://kosis.kr/index/index.do
https://bigdata.seoul.go.kr/main.do
https://kostat.go.kr/portal/korea/index.action
https://datasetsearch.research.google.com/
https://data.worldbank.org/
위 사이트들도 방문해 보면서 의미 있을 만한 데이터를 찾아보려 한다.
상욱님은 작은 데이터는 엑셀로도 다룰 수 있으니 큰 데이터를 다루는게 더 의미가 있을 것 같다고 했다.
더 생각을 해보려 한다.
'개인 회고 > 프로젝트 회고' 카테고리의 다른 글
# 1 미니 프로젝트, 데이터의 시각화 2일차 (0) | 2023.02.02 |
---|---|
# 1 미니 프로젝트, 데이터의 시각화 1일차 (0) | 2023.02.01 |