[Python] Pandas Dataframe 기본 (데이터프레임 불러오기/저장하기, 데이터 개수 구하기, 데이터프레임 연결하기, column 목록 확인, pd.Series value

PL(Programming Language)/Python

[Python] Pandas Dataframe 기본 (데이터프레임 불러오기/저장하기, 데이터 개수 구하기, 데이터프레임 연결하기, column 목록 확인, pd.Series value_counts로 열의 value 확인하기)

탱젤 2021. 1. 13. 21:55

pandas 파일 불러오기

- csv 형식 파일 불러오기

import pandas as pd

df = pd.read_csv('파일명.csv') # csv파일형식은 간단하게 불러와짐

- 탭으로 분리된 txt 파일 불러오기

import pandas as pd

df= pd.read_csv('파일명.txt', delimiter = '\t')

# 탭으로 분리된 txt(tsv 형식도 가능) 불러오기

- 공백으로 분리된 파일 불러오기

import pandas as pd

df = pd.read_csv(‘파일명.확장자’, delimiter = ' ')

# 공백으로 분리된 파일 불러오기

Dataframe의 data 개수 세기

print(len(df.index))

print(df.shape[0])

print(len(df))

위의 세 개 중 하나 이용하면 됨

※ 참고

shape[0]: 행 / shape[1]: 열

Dataframe 2개 연결하기

import pandas as pd

pd.concat([df1, df2])

- 열 기준, 행 기준 merge 와 다른 개념으로 그냥 연결만 해주는 코드

- 만약 한 데이터프레임에 다른 데이터프레임의 열이 없다면, NaN(없음)으로 값이 들어감

- 열이 다를 때 굳굳

Dataframe csv나 txt로 저장하기

df.to_csv('파일명.csv') # 그냥 csv로 저장

df.to_csv('파일명.txt', sep = '\t') # 탭으로 분리된 txt 파일로 저장

df.to_csv('파일명.확장자', index = False) # index 빼고 저장하기

Dataframe 열의 value 확인하기

import pandas as pd
f1 = pd.read_csv('9606.protein.actions.detailed.v9.1.txt', sep = '\t')

lists = f1['action']

temp = pd.Series(lists)
print(temp.value_counts())

- pd.Series.value_counts() 이용

action 열의 vaue 확인

Dataframe의 column_name 보기

column_name = list(df.columns)
#column_name 보기

dataframe.columns 이용해 column_name 보기

728x90

'PL(Programming Language) > Python' 카테고리의 다른 글

[Python] Multiple arguments function에 병렬처리(Multiprocessing) 적용하기 (0)	2021.01.14
[Python] Pandas Dataframe 기본(merge, concat, concat 행, 열 기준으로 병합, 연결) (0)	2021.01.14
[Python] 파이썬 multiprocessing package로 병렬 처리, 연산 속도 개선 (0)	2021.01.13
[Python] REST API (Ensembl 사이트에서 DNA Sequence 불러오기) (0)	2021.01.13
[Python] Pandas Explode, Pandas Dataframe, column split 바이오데이터 처리로 다지는 Pandas 라이브러리 (0)	2021.01.13

현재글[Python] Pandas Dataframe 기본 (데이터프레임 불러오기/저장하기, 데이터 개수 구하기, 데이터프레임 연결하기, column 목록 확인, pd.Series value_counts로 열의 value 확인하기)

TY_IT💻

[Python] Pandas Dataframe 기본 (데이터프레임 불러오기/저장하기, 데이터 개수 구하기, 데이터프레임 연결하기, column 목록 확인, pd.Series value_counts로 열의 value 확인하기)

'PL(Programming Language) > Python' 카테고리의 다른 글

'PL(Programming Language)/Python'의 다른글

티스토리툴바

[Python] Pandas Dataframe 기본 (데이터프레임 불러오기/저장하기, 데이터 개수 구하기, 데이터프레임 연결하기, column 목록 확인, pd.Series value_counts로 열의 value 확인하기)

'PL(Programming Language) > Python' 카테고리의 다른 글

'PL(Programming Language)/Python'의 다른글

관련글

티스토리툴바