본문 바로가기
Programming/google 스프래드시트

[구글스프레드] 웹사이트의 데이터를 가져오기 (importhtml)

by 느리게 걷는 즐거움 2021. 1. 17.
728x90
반응형

importhtml

HTML 페이지에서 표 또는 목록에 있는 데이터를 가져옵니다.

 

함수 구문

importhtml( URL, 쿼리, 색인)

 

파라메터

1. URL

: 목록 또는 표 정보를 가져올 html 주소 정보

 

2. 쿼리

: 웹페이지의 정보가 들어있는 html tag정보 선택 합니다. 테이블과 목록만 사용가능하며

"list" 또는 "table"을 입력으로 사용가능합니다.

 

3. 색인

: 웹페이지에서 사용된 table과 list tag의 순서를 의미합니다. 자신이 원하는 정보가 들어 있는

table과 list의 순서를 나타냅니다.

 

사용 예제

국고채(3년)금리 정보를 알아보기 위해서 네이버 금융 사이트로 이동합니다.

주소는 finance.naver.com/marketindex/ 입니다. 국고채(3년)정보는 table tag로 관리되고 있는 것 알 수 있습니다.

 

 


국고채(3년)정보는 table tag로 위치하며 첫번째 table에 정보가 있습니다. 따라서 아래의 파라메터를 이용하여 정보를 가져올 수 있습니다.

URL 쿼리 색인
"https://finance.naver.com/marketindex/" "table" 1

 

importhtml 실행결과

 
importhtml은 table과 list정보 전체를 가져오는 함수입니다. 국고채(3년) 정보만 추출하기 위해서는 index함수를 사용하여 필요한 정보만 다시 추출할 수 있습니다.

 

importhtml 함수로 얻어진 table의 4번째 row, 2번째 column에 국고채(3년) 금리 정보가 있습니다. 따라서 index함수의 row, column정보를 추가하여 최종 목적인 국고채(3년)정보를 확인할 수 있습니다.

 importhtml() 함수를 사용하는 경우 웹페이지의 정보가 table또는 list로 표현되어야 합니다. 그 외의 다른 html tag로 이루어진 정보는 importxml()함수와 xpath정보를 이용하여 가져올 수 있습니다. importxml()에 대한 정보는 아래 글 참고 부탁드립니다.

▷ [구글스프레드] 웹사이트 정보가져오기 (importxml)

 

[구글스프레드] 웹사이트 정보가져오기 (importxml)

웹사이트 정보가져오기 (importxml) 구글스프레드 시트에서 웹사이트 정보를 가져와서 데이터 처리를 해보고 싶은 경우가 종종 있습니다. 예를 들어 "지금 국고채 3년물 금리를 이용해서 데이터

thinkingtool.tistory.com

 

읽어 주셔서 감사합니다.

728x90
반응형