플레이데이터 20일차 2/2(목) 팀원 : 우상욱, 김기훈, 서영호, 이병호, 이호진 팀의 주제와 방향성을 정한 이후 데이터 셋을 통일하기 위해 나도 여러 라이브러리들을 설치해서 작업을 시작했다. # Data Analysis and Visualization import pandas as pd import numpy as np from sklearn.preprocessing import MinMaxScaler import talib # TA-Lib은 금융 시장 데이터의 기술적 분석을 수행하는데 필요한 멀티플랫폼 라이브러리 입니다. # Visualization from matplotlib import font_manager, rc import matplotlib.pyplot as plt import seab..
플레이데이터 19일차 2/1(수) 팀원 : 우상욱, 김기훈, 서영호, 이병호, 이호진 상욱님의 주도로 카테고리 선별 작업이 이뤄졌다. 좋은 데이터셋을 찾는 것이 이번 프로젝트를 수월히 할 수 있는 열쇠라고 생각해 주제 선정보다 큰 데이터 셋을 찾는 작업을 먼저 했다. 기훈님이 AI 경진대회를 주도하는 웹 사이트 DACON에서 코스피 데이터 셋을 찾아냈는데 경진대회 참가자 중 이병헌씨가 진행한 '코스피 지수에 따른 탐색적 데이터 분석' 글에 영감을 받아서 차용하기로 했다. 이병헌씨의 '코스피 지수에 따른 탐색적 데이터 분석' https://dacon.io/competitions/official/235980/codeshare/6770?page=1&dtype=random 코스피 지수에 대한 탐색적 데이터 분석..
플레이데이터 18일차 1/31(월) 팀원 : 우상욱, 김기훈, 서영호, 이병호, 이호진 파이썬의 기초를 배운 이후 pandas와 seaborn 라이브러리를 활용하여 데이터 시각화를 했다. bar, pie 등의 다양한 구조로 시각화 연습을 해보고 Stack Overflow Annual Developer Survey 2022년 설문 자료를 다운 받아 의미 있는 데이터로 뽑아내는 작업을 했다. 의미가 있다는 것은 돈이 되는 자료라는 것과 거의 일치하는 것을 알았다. 그중 개발자 직업 분포와 개발자 사용 언어 분포가 부족한 나의 식견을 넓히는 좋은 자료가 됐다. 아래는 시각화한 데이터 자료들이다. - 2022년 개발자 직업 분포(전세계) 1위 풀스택 개발자(17.4%) 2위 백엔드 개발자(16.1%) 3위 프론..