โป python(version 3 ์ด์) ์ค์น๋์๋ค๋ ๊ฐ์ ํ์ ์ค์น
- JAVA ์ค์น
- SPARK ์ค์น
- winutils ์ค์น
- pyspark ์ค์น
- ์ค์น ํ์ธ
1. JAVA ์ค์น
SPARK 3.0.1์ java 11์ ์ง์ํ๋ฏ๋ก ๋ฐ์ url์ ๋ค์ด๊ฐ ์ค๊ฐ์ 11 JDK ๋ค์ด๋ก๋๋ฅผ ์ ํ.
๊ทธ ์ ์ ์ค๋ผํด ๊ณ์ ๋ง๋ค๊ธฐ ํ์
www.oracle.com/java/technologies/javase-downloads.html
์๋์ฐ ๋ฒ์ ํด๋ฆญ ํ next, next ๋๋ฅด๋ฉด์ ์ค์น.
์ ์ดํ - ์์คํ ๋ฐ ๋ณด์ - ์์คํ ๋ค์ด๊ฐ์ ๊ณ ๊ธ ์์คํ ์ค์ , ํ๊ฒฝ ๋ณ์ ํด๋ฆญ
ํ๊ฒฝ ๋ณ์, ์์คํ ๋ณ์ ํธ์ง
- ํ๊ฒฝ ๋ณ์ ํธ์ง Path์ %JAVA_HOME%bin์ถ๊ฐ
- JAVA_HOME ์์คํ ๋ณ์ ์ถ๊ฐ C:\Program Files\Java\jdk-11.0.9
๋ณ์ ์ถ๊ฐ ํ ์ ์ค์น๋์๋์ง cmd์์ ํ์ธ: java -version
์ค์น ์๋ฃ
2. ์คํํฌ ๋ค์ด๋ก๋ (ํ๋ก 2.7)
spark.apache.org/downloads.html
tgz ํ์ผ ๋ค์ด๋ก๋ ๋งํฌ ๋ค์ด๊ฐ๋ฉด HTTP ๋ฑ ์ฌ์ดํธ ๋์ค๋ ๋ฐ ๊ทธ ์ค ํ๋ ํด๋ฆญํด์ ๋ค์ด๋ก๋ ์์
๋ด PC์ C: ๋๋ผ์ด๋ธ ์์ Spark ํด๋ ์์ฑํด tgz ํ์ผ์ ํด๋ ์์ผ๋ก ์ฎ๊ฒจ์ค๋ค.
์ดํ tgz ์์ถ ํด์ ํ๊ธฐ
3. Winutils ์ค์นํ๊ธฐ
๋ด PC - Windows(C:) ๋ฐ์ Hadoop ํด๋ ์์ฑ ํ ๊ทธ ์์ bin ํด๋ ์์ฑ
winutils.exe ํ์ผ ๊ทธ ํด๋์ ๋ค์ด๋ก๋
http://github.com/cdarlint/winutils
SPARK ์ค์น ์ ํ๋ก 2.7 ๋ฒ์ ์ ํํ์ผ๋ฏ๋ก ํ๋ก 2.7 ํด๋์ ๋ค์ด๊ฐ winutils.exe ๋ค์ด๋ก๋
์ด์ ๋ค์ ํ๊ฒฝ๋ณ์ ํธ์ง(๊ณ ๊ธ ์์คํ ์ค์ - ํ๊ฒฝ ๋ณ์)์ผ๋ก ๊ฐ์ ์์คํ ๋ณ์ ํธ์ง
์์คํ ๋ณ์ ์๋ก ๋ง๋ค๊ธฐ - SPARK_HOME์ด๋ฆ์ผ๋ก C:\Spark\spark-3.0.1-bin-hadoop2.7 ๋ณ์ ์ถ๊ฐ
์์คํ ๋ณ์ ์๋ก ๋ง๋ค๊ธฐ - HADOOP_HOME ์ด๋ฆ์ผ๋ก C:\Hadoop ๋ณ์ ์ถ๊ฐ
์ด์ Path ์์คํ ๋ณ์์ %SPARK_HOME%\bin ๊ณผ %HADOOP_HOME%\bin ์ถ๊ฐ
์์์๋ถํฐ ์ถ๊ฐํ๋ ํ๊ฒฝ ๋ณ์๋ค๊น์ง ํ์ธ ๊ฐ๋ฅ
4. cmd์์ pyspark pip์ผ๋ก ์ค์น 'pip install pyspark'
5. cmd์์ ์ค์น ํ์ธ 'pyspark'