본문 바로가기

코딩 개발자의 하루/Python Data Science

(3)
[데이터분석 기초] 차트 그리기 [ Review - Series/DataFrame ] from pandas import Series import pandas as pd - 1차원 배열 추가/삭제 s.loc['w'] = '라' s = s.drop('w') 시리즈 생성 s = Series(['가','나','다'], index=['x','y','z']) from pandas import DataFrame 데이터프레임 생성 df = DataFrame({'a':[1,3], 'b':[2,4]}, index=['x','y']) 데이터 타입 구분하기 print(type(df.columns)) --> index 타입 print(type(df['a'])) --> Series 타입 인덱싱 print(df['b'].loc['x']) print(df.loc[..
[데이터 분석 기초] Series, DataFrame, Groupby [Pandas] - 데이터 분석을 위한 라이브러리 [Series] - dict 형태의 pandas 라이브러리. 1차원 배열을 나타냄. - Series(data, index) : Series 데이터 타입 생성 (index 활용 가능) - s.loc[ 'index' ] / s.iloc[ 0:3 ] : Series 인덱싱/ 슬라이싱 - s.iloc[ [0, 2] ] : 불연속적인 index에 해당하는 값 추출도 가능하다. - s.loc['index'] = value : 새로운 딕셔너리 값 추가 (dict['key'] = value 와 유사한 형태) - s.drop['index'] : 데이터 삭제 ======================= - broadcasting : 시리즈간 연산을 지원한다. - Series..
[데이터분석 기초] 자료형(list, dict), 반복문, 함수 Jupyter notebook [Key] b : cell 추가 dd : cell 삭제 shift + Ent : 코드실행 shift + Tab @괄호 : 함수에 대한 설명 [Info.] - 아나콘다는 파이썬 버전과 상관없이 사용 가능하다. - list 인덱스는 데이터 타입이 str 이고, 슬라이싱은 list 타입이다. - 매서드 -> 함수(append, split, replace, index, sort, count ...), 키워드 -> in, del [string/int/float Func.] - a.strip() : 양쪽 공백 제거 - a.replace('a','b') : string 문자열 대체 - a.split(' ') : 공백 기준으로 값 나누기 (list로 저장) - f.'안녕하세요. {변수명 ..