달리는 자동차

[R]0519 크롤링하기. 본문

R/학원 수업

[R]0519 크롤링하기.

@또또 2020. 5. 19. 20:22

정적인 페이지 크롤링하기 

 

저장한 경로로 들어가면 아래와 같은 엑셀파일로 열린다. 

 

#메모 0519

-공용api나 뉴스 언론사등 보고 싶은 것만 모아서 수집을 할때 사용하는 것이 스크랩핑이다.
기존라이브러리를 그대로 사용할 수 없고 설치를 해야한다.
-추가적으로 패키지를 설치방법
tools->install packages-> install.packages("rvest") 실행시 다운로드가 되면 성공
오류: 경로가 잘못되어 설치가 안되는 경우가 있다. 
그럴 땐 
#라이브러리 설치 경로 변경 을 해주어야한다.

library(rvest)실행시 콘솔창에 필요한 패키지를 로딩중입니다: xml2 나온다.

우리가 이용하는 웹은 동적인 페이지와 정적인 페이지로 나뉜다
정적인 페이지: 스크립트 , 네이버 영화페이지 ,실시간 검색어
동적인 페이지: html/css

정적인페이지로 긁어 왔을때 정보가 나오지않는경우 동적인 페이지로 바꿔야한다. 

# 크롤링할 페이지에서 f12 누르명 Elements 나온다

가져올 정보에서 마우스 우클릭 copy -> copyselect

R studio에서 붙여넣기

#경로변경하는방법 13,14

 

'R > 학원 수업' 카테고리의 다른 글

[R] 0525 java에서 R언어 사용하기.  (0) 2020.05.25
[R]0522 R과 java 연결하기  (0) 2020.05.22
[R]0521 데이터시각화  (0) 2020.05.22
[R]0520 크롤링하기.  (2) 2020.05.20
[R]0513  (0) 2020.05.18
Comments