참조 : https://computingforgeeks.com/how-to-install-apache-spark-on-ubuntu-debian/
1. 자바 설치
sudo apt install curl mlocate default-jdk -y
java -version
2. 아파치 스파크 다운로드
https://archive.apache.org/dist/spark/에서 버전확인
curl -O https://archive.apache.org/dist/spark/spark-3.1.1/spark-3.1.1-bin-hadoop3.2.tgz
tar -xvzf spark-3.1.1-bin-hadoop3.2.tgz
sudo mv spark-3.1.1-bin-hadoop3.2/ spark
3. path 설정
nano .bashrc
----------
export SPARK_HOME=/home/stat/spark
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
-----------
source ~/.bashrc
4. master server 작동
start-master.sh
sudo ss -tunelp | grep 8080
5. Worker Process 작동
start-worker.sh spark://ubuntu:7077
sudo updatedb
locate start-worker.sh
* 웹페이지 확인 localhost:8080
6. python 쉘명령어 사용
pyspark
도움말 help()
종료 exit()
7. Spark shell 명령 사용
spark-shell
:help
:quit
8. 정지시 stop-worker.sh, stop-master.sh 순으로 정지
댓글 없음:
댓글 쓰기