달리는 자동차
[R]0519 크롤링하기. 본문
정적인 페이지 크롤링하기
저장한 경로로 들어가면 아래와 같은 엑셀파일로 열린다.
#메모 0519
-공용api나 뉴스 언론사등 보고 싶은 것만 모아서 수집을 할때 사용하는 것이 스크랩핑이다.
기존라이브러리를 그대로 사용할 수 없고 설치를 해야한다.
-추가적으로 패키지를 설치방법
tools->install packages-> install.packages("rvest") 실행시 다운로드가 되면 성공
오류: 경로가 잘못되어 설치가 안되는 경우가 있다.
그럴 땐
#라이브러리 설치 경로 변경 을 해주어야한다.
library(rvest)실행시 콘솔창에 필요한 패키지를 로딩중입니다: xml2 나온다.
우리가 이용하는 웹은 동적인 페이지와 정적인 페이지로 나뉜다
정적인 페이지: 스크립트 , 네이버 영화페이지 ,실시간 검색어
동적인 페이지: html/css
정적인페이지로 긁어 왔을때 정보가 나오지않는경우 동적인 페이지로 바꿔야한다.
# 크롤링할 페이지에서 f12 누르명 Elements 나온다
가져올 정보에서 마우스 우클릭 copy -> copyselect
R studio에서 붙여넣기
#경로변경하는방법 13,14
'R > 학원 수업' 카테고리의 다른 글
[R] 0525 java에서 R언어 사용하기. (0) | 2020.05.25 |
---|---|
[R]0522 R과 java 연결하기 (0) | 2020.05.22 |
[R]0521 데이터시각화 (0) | 2020.05.22 |
[R]0520 크롤링하기. (2) | 2020.05.20 |
[R]0513 (0) | 2020.05.18 |
Comments