selenium, Scrapy links

|

각종 셀레니움 강좌나 링크

네이버 로그인등: https://beomi.github.io/2017/02/27/HowToMakeWebCrawler-With-Selenium/

위 사이트의 code snippet중 하나는 다음과 같다.

from selenium import webdriver
from bs4 import BeautifulSoup

# setup Driver|Chrome : 크롬드라이버를 사용하는 driver 생성
driver = webdriver.Chrome('/Users/beomi/Downloads/chromedriver')
driver.implicitly_wait(3) # 암묵적으로 웹 자원을 (최대) 3초 기다리기
# Login
driver.get('https://nid.naver.com/nidlogin.login') # 네이버 로그인 URL로 이동하기
driver.find_element_by_name('id').send_keys('naver_id') # 값 입력
driver.find_element_by_name('pw').send_keys('mypassword1234')
driver.find_element_by_xpath(
    '//*[@id="frmNIDLogin"]/fieldset/input'
    ).click() # 버튼클릭하기
driver.get('https://order.pay.naver.com/home') # Naver 페이 들어가기
html = driver.page_source # 페이지의 elements모두 가져오기
soup = BeautifulSoup(html, 'html.parser') # BeautifulSoup사용하기
notices = soup.select('div.p_inr > div.p_info > a > span')

for n in notices:
    print(n.text.strip())

구글 결과를 가져오는 사이트

https://medium.com/@peteryun/python-selenium을-활용한-크롤러-만들기-b055cefd1195 아래 wiki를 크롤링함

네이버 로그인 참고 사이트 http://yumere.tistory.com/75

이미지

소방방재청 자료 가져오기?

https://medium.com/@nsh235482/python-selenium으로-웹사이트-크롤링하기-2-웹-사이트-제어해보기-1ffc5e05179d

이미지22

유튜브 줄줄이 크롤링

http://code-ing.tistory.com/6

셀레니움 기본

https://medium.com/shakuro/adopting-ipython-jupyter-for-selenium-testing-d02309dd00b8 이미지23

네이버 뉴스 수집을 위한 도구 https://forkonlp.github.io/N2H4/

네이버 api 사용 https://ericnjennifer.github.io/python_crawling/2018/01/21/PythonCrawling_Chapt9.html

Scrapy URLs

scrapy data 저장 으로 검색하면 수 많은 강좌가 뜬다.

크롤링 후 firebase에 저장하기

https://medium.com/@wayfinders/scrapy를-활용한-crawler를-만든-후-firebase-database에-저장하기-a73f4e4ab70d

웹사이트 크롤링해서 파일 저장 하기(분양정보수집사례)

[U’s Lifelog]http://uslifelog.tistory.com/45

아래도 최신 정보가 많다

https://l0o02.github.io/2018/06/19/python-scrapy-1/

Scrapy를 이용한 뉴스 크롤링 하기

http://excelsior-cjh.tistory.com/86

newScrapping

스크래핑개념 & 셀레니움

http://nittaku.tistory.com/133?category=727207

http://nittaku.tistory.com/136 XPATH에 대한 여러가지 예제도 있다. pipeline설명도 있다. 좋은 그림

기타

pycharm 세팅법들

http://nittaku.tistory.com/category/빅데이터%20관련%20프로그래밍/웹%20크롤링%20-%20기초

Comments