Python 문법 39

[NaN 데이터] isna(), dropna(), fillna(), notna()

(* df == dataframe 의 변수라고 가정) NaN 생성 import numpy as np np.nan NaN이 있는 지 확인 : 데이터가 비어있는 지 확인 df.isna() 컬럼별로 NaN 확인하는 방법 : 데이터 개수 파악 df.isna().sum() 데이터프레임 전체로 비어있는 항목의 개수를 알고 싶을때 df.isna().sum().sum() NaN을 처리 1. 삭제 1-1 NaN이 있는 행이 다 삭제 df.dropna() 1-2 NaN이 있는 열을 다 삭제 df.dropna(axis= 1) 2. 특정 값으로 채움 df.fillna( '채우려는 데이터' ) 2-1 앞의 행 데이터로 채움 df.fillna(method= 'ffill', axis= 0) 2-2 앞의 열 데이터로 채움 df.fi..

[데이터 삭제, 변경] drop(), rename(), set_index(), reset_index()

(* df == dataframe 의 변수라고 가정) 삭제 : 행삭제/인덱스, 열삭제/column 삭제 df.drop('변수이름' , axis= 0) df.drop('변수이름' , axis= 1) 이름 변경 : 사람용 인덱스, 컬럼 df.rename(index = { '변경 전 인덱스이름' : ' 변경 후 인덱스이름' } ) df.rename(columns = { '변경 전 컬럼이름' : ' 변경 후 컬럼이름' } ) 컬럼생성 : 새로운 컬럼을 만들고 데이터세팅하기(저장하기) df['새로운 컬럼 이름'] = '데이터' 변경 : 컬럼을 인덱스로 변경해서 저장 df = df.set_index('변경할 컬럼 이름') 또는 df.set_index('title', inplace = True) df.index = ..

[데이터 Access] df[], loc[], iloc[]/ df=pd.DataFrame()

(* df == dataframe 의 변수라고 가정) 불러오기 import pandas as pd 데이터 생성하기 : 판다스의 1차원 데이터를 Series(시리즈) 라고 부른다. 시리즈의 왼쪽부분을 index 라고 부른다. (리스트에서의 인덱스는 컴퓨터가 자동으로 매기는 인덱스) 판다스에서의 인덱스는 사람용 인덱스! 시리즈의 오른쪽 값들을 values 라고 부른다. np.array() pd.Series(data= data, index= index) Dataframe 만들기 df = pd.DataFrame(data= 행(데이터)의 변수들 , index= 열의 변수들) dict의 key= columns, values= index & data로 (* df == dataframe의 변수라고 가정) 데이터 acc..

[파이썬] 딕셔너리

딕셔너리 만드는 법 변수 = {} 변수 = dict() 형식 변수 = { key : value } 데이터 추가 변수[key] = value 데이터 access 변수[key] 출력 print(key, 변수[key]) 수정 변수[key] = 수정된 value 삭제 del 변수[key] 2개 이상 values (value 리스트를 만들어라) { key : [value1, value2] } 2개 이상 values의 dict에서의 access 변수[key][인덱스] 2개 이상 values의 데이터 추가 변수[key] = [value1, value2] key데이터 : 변수 = 변수.keys() value데이터 : 변수.values() keys() 메서드 - key 값으로만 구성된 리스트 생성 만들 key 변수 = ..

[파이썬] 튜플

튜플 = 리스트랑 같지만 데이터 추가, 삭제, 저장, 수정이 안된다. 변수 = () 변수 = tuple(데이터) 숫자 튜플은 숫자에 ,를 추가해야 저장된다. 튜플 언팩킹 ,로 구분한 데이터는 자동으로 튜플로 저장된다. 양쪽에 대응 하는 개수가 같아야 한다! 예) temp = ('apple', 'banana', 'cake') a, b, c = temp print(a, b, c) 튜플의 데이터를 수정하기 위해서는 통으로 새로 저장해야 한다. 리스트 -> list(튜플) 튜플 -> tuple(리스트)

[파이썬] 리스트

리스트 변수 = [ 데이터 ] 리스트에 데이터 추가 (저장되는 함수) 변수.append(데이터) 리스트 중간에 데이터 추가 (저장되는 함수) 변수.insert(인덱스위치, 데이터) 리스트에서 데이터 삭제 (저장되는 함수) del 변수[인덱스위치] 변수.remove(데이터) 변수.pop(인덱스위치) 최대값, 최소값, 전체합, 데이터의 개수, 평균 max(변수) min(변수) sum(변수) len(변수) sum(변수) / len(변수) 슬라이싱 변수[시작 : 끝 ] 변수[시작 : 끝 : 간격 ] 역방향 변수[시작 : 끝 : -1] 공백으로 놔두면 맨처음, 맨마지막으로 적용 데이터 사이에 삽입데이터를 넣어서 하나로 합쳐준다 ' 삽입데이터 '.join (데이터 스트럭쳐의 변수) 정렬 (저장되는 함수) 변수.so..

[파이썬] 문자열

문자열 붙이기 + 문자열 곱하기 * -대입하기 " a : {} b : {} ".format(변수1, 변수2) a: 변수 -슬라이싱 변수.split(자를 기준) 변수[ 시작 : 자를 위치 + 1 ] -문자 제거하기 변수.replace(제거할 문자) strip rstrip -공백제거 변수.strip(제거할부분) 재저장 필요! -대문자로 변경 변수.upper() -소문자로 변경 변수.lower() -맨앞만, 단어의앞만 대문자로 변경 변수.capitalize() 변수.title() -끝이 이걸로 끝나는 지,시작하는지, 끝나는지 확인 변수.endswith(확인할 끝부분 데이터) 변수.startswith(확인할 시작부분 데이터) 데이터 in 변수

[파이썬] 변수와 연산

*DB와 Storige의 Data를 분석하는 것과 인공지능을 API라는 서버로 배포(DevOps, 운영개발) 하는 과정을 백엔드라고 하고 AWS(아마존 클라우드)를 통해 구현되는 PC, Web, Phone(ios, 안드로이드)등을 프론트엔드라고 한다. *프로그래밍은 일종의 컴퓨터와 인간사이의 통역이다 파이썬 기본 문법들에 대해 배웠다. 1. 연산 파이썬 연산 기호들을 수학과 연산과 비교해서 이해하고 숙지 암기. 10/7 = 1.4285714285714286 10//7 변수(Variables) 할당 변수할당은 ( = ) 기호를 사용한다. 왼족이 변수의 이름이다. 오른쪽이 변수의 값이다. 3000원짜리 고등어를 프로그래밍언어로 표현하면 fish = 고등어 price = 3000 라고 쓸 수 있고, fish와..