Join
1. ์์ ๋ฐ์ดํฐํ๋ ์ ์์ฑ
import pandas as pd
df = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3', 'K4', 'K5'], 'A': ['A0', 'A1', 'A2', 'A3', 'A4', 'A5']})
other = pd.DataFrame({'key': ['K0', 'K1', 'K2'], 'B': ['B0', 'B1', 'B2']})
2. ์ด์ Index ์ง์ ํด์ Join
df.join(other, lsuffix = '_caller', rsuffix = '_other')
3. Key๋ฅผ index๋ก ์ง์ ํด Join
df.set_index('key').join(other.set_index('key'))
4. join ๋ฉ์๋์ parameter ์ด์ฉํด join
df.join(other.set_index('key'), on = 'key')
Merge
1. ์์ ๋ฐ์ดํฐํ๋ ์ ์์ฑ (์์ ๋์ผ)
2. ์ค๋ณต๋ key๋ฅผ ๊ธฐ์ค์ผ๋ก merge (= ๊ต์งํฉ, inner join์ด default ๊ฐ์)
# pd.merge(df, other, how = 'inner')
pd.merge(df, other)
์์ ๋ ๋ฌธ์ฅ์ ๊ฒฐ๊ณผ๋ ๋์ผ
3. ๊ธฐ์ค์ด ๋ ์ด์ ์๋์ผ๋ก ์ง์ ํด merge
pd.merge(df, other, left_on = 'key', right_on = 'key')
4. Merge Outer join, ๋ค๋ฅธ ์ชฝ์ ์๋ ๊ฐ์ NaN(๋น๊ฐ)์ผ๋ก ์ฑ์
pd.merge(df, other, how = 'outer')
5. Merge Left join, ์ผ์ชฝ ๊ทธ๋๋ก ์ ์งํด merge
pd.merge(df, other, how = 'left')
6. Merge Right join, ์ค๋ฅธ์ชฝ ๊ทธ๋๋ก ์ ์งํด merge
pd.merge(df, other, how = 'right')
728x90