AI를 활용한 재밌는 것들을 개발합니다

2020년 8월 21일 금요일

R로 네이버금융에서 코스피지수 크롤링하기 (빌어먹을 야후...)

매매전략이 고도화 되면서 코스피 지수로 상승장, 하락장을 판별하고 있습니다.


특히 하락장에서는 보유하고 있는 종목을 빠르게 매도하는 것이 수익률을 방어하는데 도움이 되죠. ( 관련 글 : https://euhyeji.blogspot.com/2020/06/kospi.html )


현재 코스피지수를 가져오는 코드는 아래와 같습니다.

library(quantmod)
getSymbols('^KS11', src='yahoo')
KS11 = KS11[,4]


오늘 2020년 8월 21일 오전 11시 현재 위 코드를 실행해서 코스피 지수를 보면 아래와 같습니다.


빌어먹을 NA!!! 이런 경우가 자주 발생되고 있습니다... 

전 NA 후처리를 NA 전날과 다음날의 평균값으로 대체하고 있는데요. 후처리 결과는 아래와 같습니다.


(그 사이에 코스피지수가 좀 하락했네요) 

8월 20일 NA 값이 2323으로 대체되어 오늘 코스피가 하락으로 보여지게 되는 것입니다. 실제 20일 코스피지수 값은 2274여서 오늘은 상승장인데도 말입니다.(아 빡쳐)


이제 그냥 넘길 수가 없어서 네이버금용에서 코스피 지수를 크롤링 하려고 합니다. 크롤링은 이미 종목별 주가, 외국인순매수현황 등을 읽어오는데 사용하고 있습니다. 이미 기본 코드가 있으니 빠르게 한 번 코스피지수 읽어오는 크롤링 코드를 만들어 보겠습니다.


크롤링 해서 가져올 웹주소는 아래와 같습니다.


https://finance.naver.com/sise/sise_index_day.nhn?code=KOSPI&page=1


마지막 page=1 인 부분의 숫자만 바꿔주면서 코스피 일별 지수값을 읽어 올 수 있습니다.

한 페이지에 6일치의 코스피 지수가 있으니... 전 20page 120일치의 코스피 지수를 크롤링 해 보겠습니다.

이제야 제대로 된 코스피지수 값을 읽어오게 되었네요!


R 소스코드는 아래에 있습니다.


https://cafe.naver.com/conerquant/213


댓글 없음:

댓글 쓰기

가장 많이 본 글