TIL 10일차 (22.01.14)
필자도 배우는 입장이라 틀린점, 잘못된 점이 있을 수 있습니다. 그러니 지적, 피드백 환영합니다. 4. Exploratory Data Analysis¶ 탐색적 데이터 분석을 통해 데이터를 통달해봅시다. with Titanic Data 라이브러리 준비 분석의 목적과 변수 확인 데이터 전체적으로 살펴보기 데이터의 개별 속성 파악하기 0. 라이브러리 준비¶ In [1]: ## 라이브러리 불러오기 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline In [4]: ## 동일경로에 "train.csv"가 있다면: ## 데이터 불러오기 titanic_df = pd.rea..
2022.01.15
TIL 9일차 (22.01.13)
필자도 배우는 입장이라 틀린점, 잘못된 점이 있을 수 있습니다. 그러니 지적, 피드백 환영합니다. 온라인 세션 복습¶ In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt In [ ]: %matplotlib inline In [112]: bit = pd.read_csv('./Bitcoin.csv') bit['Date'] = list(reversed(pd.date_range (pd.to_datetime('2013-04-28'), periods=1609))) # 2013년 부터 1609개의 데이터를 정렬함 In [113]: bit = bit.sort_values(by='Date') # date열을 오름차순으로 정리 bit..
2022.01.14
TIL 8일차 (22.01.12)
필자도 배우는 입장이라 틀린점, 잘못된 점이 있을 수 있습니다. 그러니 지적, 피드백 환영합니다. FLASK FLASK를 이용해서 RESTFUL API를 구성한다 RESTFUL API란? REpresentational State Transfer Application Programming Interface 의 준말 프로그램 - 컴퓨터 사이의 연결에서 객체지향 프로그래밍처럼 개발자끼리 일정한 개발 약속같은 느낌 from flask import Flask, jsonify, request app = Flask(__name__) # jsonify : 파이썬의 dictionary를 java에서 쓰는 json으로 바꿔주는것 # request : HTTP 리퀘스트를 담당 menus = [ {'id':1, "name":..
2022.01.13
TIL 7일차 (22.01.11)
필자도 배우는 입장이라 틀린점, 잘못된 점이 있을 수 있습니다. 그러니 지적, 피드백 환영합니다. virtual Environment (가상환경) 로컬에서는 다양한 패키지를 쓰는데 가상환경을 구축하면 아무 패키지도 없는 상태에서 시작함 아무 패키지도 없는 상태 -> 무슨 패키지가 필요한지 알 수 있음 설치법 pip install virtualenv 실행 방법 virtualenv 이렇게 하면 현재 폴더 내에서 가상환경 폴더가 만들어짐 \scripts\activate 그 후, 가상환경을 작동시킬 수 있음 가상환경을 작동시킬 경우 (venv)가 CLI커맨드 앞에 붙게 됨 서버와 클라이언트 client -> server : 요청 ( ~~ 신발 있나요?) server -> client : 요청의 처리 (신발이 없..
2022.01.12
TIL 6일차 (22.01.10)
필자도 배우는 입장이라 틀린점, 잘못된 점이 있을 수 있습니다. 그러니 지적, 피드백 환영합니다. Mission: 가즈아!!¶ 다음 데이터가 주어졌을 때 2016.6 ~ 2017.6 기간의 5-MA(Moving Average) 비트코인 가격 그래프를 그려주세요. 선의 색깔은 노란색(#f2a900) 으로 해야합니다. x-axis label과 y-axis label은 적절한 텍스트로 추가되어야 합니다. 이동평균의 기준은 Open Column으로 계산합니다. 이외에도 그래프를 알아보기 쉽게 하기 위한 정보(Text, Facet 등)을 추가하는 것도 좋습니다. 💡 이동평균(Moving Average)법은 시계열 데이터를 표현하는 데에 많이 사용하는 방법 중 하나입니다. 접근¶ 일단 데이터를 열어서 시간을 x 축..
2022.01.10
TIL 5일차 (22.01.07)
필자도 배우는 입장이라 틀린점, 잘못된 점이 있을 수 있습니다. 그러니 지적, 피드백 환영합니다. Matplotlib으로 데이터 시각화하기¶ 데이터를 보기좋게 표현해봅시다. 1. Matplotlib 시작하기¶ 2. 자주 사용되는 Plotting의 Options¶ 크기 : figsize 제목 : title 라벨 : _label 눈금 : _ticks 범례 : legend 3. Matplotlib Case Study¶ 꺾은선 그래프 (Plot) 산점도 (Scatter Plot) 박스그림 (Box Plot) 막대그래프 (Bar Chart) 원형그래프 (Pie Chart) 4. The 멋진 그래프, seaborn Case Study¶ 커널밀도그림 (Kernel Density Plot) 카운트그림 (Count Pl..
2022.01.07
TIL 4일차 (22.01.06)
필자도 배우는 입장이라 틀린점, 잘못된 점이 있을 수 있습니다. 그러니 지적, 피드백 환영합니다. 넷 후- 릭스¶ Mandatory Part¶ 한국 작품은 총 얼마나 있는가? Bonus Part¶ 넷플릭스 데이터가 주어졌을 때, 다음 질문에 답하시오 가장 많은 작품이 올라간 국가는 어디이고, 얼마나 많은 작품이 있는가? country column을 기준으로 한다 단일 국가 인 경우를 기준으로 결과를 구해보자 문제 접근 (Mandatory Part)¶ 일단 데이터 열어서 country column에서 South Korea의 개수를 세면 되겠네 문제 접근 (Bonus Part)¶ 일단 데이터를 열어서 안에 뭐가 들었는지 보고 질문이 원하는 바가 뭔지 -> 단일국가를 기준으로 가장 많은 작품을 올린 나라, 작..
2022.01.06
TIL 3일차 (22.01.05)
필자도 배우는 입장이라 틀린점, 잘못된 점이 있을 수 있습니다. 그러니 지적, 피드백 환영합니다. I. pandas 시작하기¶ Prerequisite : Table¶ 행과 열을 이용해서 데이터를 저장하고 관리하는 자료구조 (컨테이너) 주로 행은 개체, 열은 속성을 나타냄 Pandas 시작하기¶ inport pandas 통해서 진행 In [1]: import pandas as pd II. Pandas로 1차원 데이터 다루기 - Series¶ Series?¶ 1-D labeled array 인덱스를 지정해 줄 수 있음 In [3]: s = pd.Series([1,4,9,16,26]) print(s) 0 1 1 4 2 9 3 16 4 26 dtype: int64 In [5]: t = pd.Series({'on..
2022.01.05
TIL 2일차(22.01.04)
필자도 배우는 입장이라 틀린점, 잘못된 점이 있을 수 있습니다. 그러니 지적, 피드백 환영합니다. 1. Numpy 시작하기¶ numpy모듈 불러오기¶ In [5]: import numpy as np # 넘파이는 속도가 정말 빠름 왜 numpy를 쓰는 지 ?¶ numpy와 array를 활용하여 비교함 list¶ In [3]: L = range(1000) %timeit [i**2 for i in L] # %는 노트북 특수의 매직 키워드(주피터노트북의 특수 함수) 206 µs ± 2.51 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each) numpy array In [9]: N = np.arange(1000) %timeit N ** 2 # 넘파이가 진짜 뒤지..
2022.01.04