목록분류 전체보기 (113)
달리는 자동차
동적페이지 크롤링하기 #메모 0520동적크롤링 #동적페이지와 정적페이지는 구별이 어렵다. #브라우저 드라이버로 IE/크롬/파이어폭스/사파리/오페라 가 있다. #구글 -> 상단에 점세게-> 설정 -> 크롬정보 -> 크롬 버전체크 (현재 : 81.0.4044) 1)selenium다운받기 www.selenium.dev/downloads/ Downloads Firefox GeckoDriver is implemented and supported by Mozilla, refer to their documentation for supported versions. Internet Explorer Only version 11 is supported, and it requires additional configuratio..
정적인 페이지 크롤링하기 저장한 경로로 들어가면 아래와 같은 엑셀파일로 열린다. #메모 0519 -공용api나 뉴스 언론사등 보고 싶은 것만 모아서 수집을 할때 사용하는 것이 스크랩핑이다. 기존라이브러리를 그대로 사용할 수 없고 설치를 해야한다. -추가적으로 패키지를 설치방법 tools->install packages-> install.packages("rvest") 실행시 다운로드가 되면 성공 오류: 경로가 잘못되어 설치가 안되는 경우가 있다. 그럴 땐 #라이브러리 설치 경로 변경 을 해주어야한다. library(rvest)실행시 콘솔창에 필요한 패키지를 로딩중입니다: xml2 나온다. 우리가 이용하는 웹은 동적인 페이지와 정적인 페이지로 나뉜다 정적인 페이지: 스크립트 , 네이버 영화페이지 ,실시간 ..