df.drop_duplicates()
df ์ ์ฒด์ ์ค๋ณต ์ ๊ฑฐ๋ ํ ์ ์์ง๋ง, ์ด ๋ผ๋ฆฌ ์ค๋ณต ์ ๊ฑฐ๋ ๊ฐ๋ฅํ๋ค.
์์ ๋ฐ์ดํฐ๋ pert_iname์ด๋ผ๋ ์ด์ ์ค๋ณต๋ ๋ฐ์ดํฐ๋ค์ด ๋ง์ด ์๋๋ฐ, ์ฌ๊ธฐ์ df.drop_duplicates()๋ก distinctํ ๊ฐ์ ๋ช ๊ฐ์ธ์ง ํ์ธํ ์ ์๋ค.
์๋ 13553๊ฐ์ ๋ฐ์ดํฐ๊ฐ ์ค๋ณต๊ฐ์ ์ ์ธํ๋ฉด 6798๊ฐ๋ผ๋ ๊ฒ์ ์ ์ ์๋ค.
๋ค๋ฅธ ๋ฐฉ๋ฒ์ผ๋ก
df.value_counts()
๋ฅผ ์ด์ฉํ๋ฉด distinctํ ๊ฐ์ ์ฐพ์์ฃผ๋ฉด์ ๋ช ๊ฐ๊ฐ ์ค๋ณต๋์ด์๋์ง ํ์ธํ ์ ์๋ค.
728x90
'PL(Programming Language) > Python' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Python] ํ๋ค์ค concat, append, join, merge ์ฐจ์ด (0) | 2021.03.07 |
---|---|
[Python] 2์ฐจ์ ๋ฆฌ์คํธ 1์ฐจ์ ๋ฆฌ์คํธ๋ก ๋ณ๊ฒฝ, sum (0) | 2021.03.07 |
[Python] ์ฝ๋ ์คํ ์๊ฐ ์ธก์ (0) | 2021.02.16 |
[Python] sys.path ๋ชจ๋ ์ฌ์ฉ, ์๋๊ฒฝ๋ก (0) | 2021.02.15 |
[Python] Pandas dataframe ๊ฒฐํฉ, ์กฐ์ธ, ๋ณํฉ(Join, Merge) (0) | 2021.01.28 |