[AWS/Ubuntu/Linux/Anaconda/Selenium] aws에서 작동하는 selenium 패키지를 활용한 python 실행 파일 만들기
aws에서 selenium 패키지를 활용하여 웹 크롤링 혹은 스크래핑을 진행하는 데 있어 정말 여러가지 오류들이 있어서, 이참에 아예 한번 싹 정리해봅니다.
아예 완전히 aws 인스턴스를 처음 만들었다고 가정합니다.
관련 페이지: https://omnil.tistory.com/67, https://omnil.tistory.com/144
1. 아나콘다 다운로드 및 설치
- 관련페이지의 설명과 같이 Anaconda3-2019.10-Linux-x86_64.sh 이 부분만 원하는 버전으로 바꿔주시면 됩니다.
wget https://repo.continuum.io/archive/Anaconda3-2019.10-Linux-x86_64.sh && sh Anaconda3-2019.10-Linux-x86_64.sh
2. 배쉬 리프레시 및 설치파일 제거
source ~/.bashrc && rm Anaconda3-2019.10-Linux-x86_64.sh
3. 새 폴더 생성 및 이동
mkdir sandbox && cd sandbox
4. unzip과 chromium-browser설치
sudo apt update && sudo apt install unzip && sudo apt-get install -y chromium-browser
5. chromium-browser version확인
- 여기서 확인한 버전으로 크롬드라이버를 깔아주어야 합니다.
chromium-browser --version
6. (위에서 확인한 버전에 맞는) 크롬드라이버 다운로드, unzip, chromedriver 실행권한 변경 및 기본 path로 이동
- 위에서 확인한 버전에 맞는 크롬드라이버 다운로드 링크는 >>여기<<서 확인하실 수 있습니다.wget https://chromedriver.storage.googleapis.com/79.0.3945.36/chromedriver_linux64.zip
unzip chromedriver_linux64.zip && chmod +x chromedriver && sudo mv chromedriver /usr/bin/chromedriver && rm chromedriver_linux64.zip
7. 크롬드라이버 버전 확인
- chromium-browser --version과 동일해야 합니다.
chromedriver --version
8. 파이썬 파일에서 사용할 패키지 설치
pip install selenium telepot
9. 스크린 작동
- 스크린에 관련하여서는 >>페이지<< 하단에 자세하게 나와있습니다.screen -S noti
10. 파이썬 파일 실행
- 파이썬 파일 이름은 watch_key.py입니다.
python watch_key.py
11. 파이썬 파일 내부에서 selenium을 사용할 경우에는 반드시 아래와 같은 옵션을 주고 드라이버를 실행하여야 합니다.
from selenium.webdriver.chrome.options import Options
chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--disable-dev-shm-usage')
driver = webdriver.Chrome(options=chrome_options)
'Software > AWS' 카테고리의 다른 글
[AWS/Linux] wget으로 아나콘다 깔기 (0) | 2019.09.20 |
---|