How to check NaN in Pandas Dataframe
null ๊ฐ ํ์ธ
-
df.isnull()
-
isnull(df)
null ์๋ ๊ฐ ํ์ธ
-
df.notnull()
-
notnull(df)
1. ์์ dataframe ์์ฑ
import pandas as pd
import numpy as np
dates = pd.date_range("20130101", periods=6)
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list("ABCD"))
2. null ๊ฐ ์ถ๊ฐํ๊ธฐ
'NaN' ํน์ None์ ํตํด null๊ฐ์ ์์๋ก ์ถ๊ฐํ ์ ์๋ค.
df['A'][1] = 'NaN'
df['B'][2] = None
df['C'][2] = 'NaN'
df['D'][3] = None
3. isnull ์ด์ฉํด ๊ฒฐ์ธก๊ฐ ํ์ธ
pd.isnull(df)
df.isnull()
์์ ๋๊ฐ๋ ๊ฐ์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ธ๋ค.
4. notnull ์ด์ฉํด ๊ฒฐ์ธก๊ฐ ์๋ ๊ฐ ํ์ธ
pd.notnull(df)
df.notnull()
์์ ๋๊ฐ๋ isnull์์ ๊ทธ๋ฌ๋ ๊ฒ์ฒ๋ผ ๊ฐ์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ธ๋ค.
5. ๋ฐ์ดํฐํ๋ ์ ์ ์ฒด์ ๊ฒฐ์ธก๊ฐ ์ธ๊ธฐ
df.isnull().sum()
6. ๋ฐ์ดํฐํ๋ ์ column ๋ณ๋ก ๊ฒฐ์ธก๊ฐ ์ธ๊ธฐ
df['A'].isnull().sum()
์์ฒ๋ผ []์์ column๋ช ์ ๋ฃ์ผ๋ฉด ๊ฒฐ๊ณผ๊ฐ ๋์จ๋ค.
728x90