개미들을 위한 퀀트 자동 매매 프로그램 개발자 블로그입니다. 프로그래밍과 퀀트 투자를 합니다.

방구석퀀트

네이버카페 : 방구석 퀀트 놀러오세요^^ https://cafe.naver.com/conerquant 가입해 주세요.

2022년 10월 9일 일요일

방구석지니 퀀트 자동매매 퀀트킹 백테스트 히스토리 이미지에서 텍스트 추출 OCR 기능 업그레이드 중

 방구석지니는 원래 일봉 데이터를 이용한 자동매매 목적으로 만들어졌었다. 하지만 코로나 폭락 이후 폭등과 대상승장이 계속 되면서 자동매매보다는 매수 후 보유하는 게 수익률이 더 좋았었기 때문에... 자동매매 기능을 버리고 매수후보유 할 때 필요한 기능들을 더 추가했고 그 결과가 리밸런싱, 분할매매, 추가매수 등의 현재 방구석지니가 되었다.


2021년 중반 즈음부터 대상승장이 마감되고 폭락, 폭등이 반복되다 현재는 코스피 고점대비 1000 포인트가 빠지는 하락장이 되어버렸다. 2022년 올해만 보더라도 4월까지는 10%가량 수익을 내다가 10월 현재 -10%정도로 손실을 보고 있다.


다시 마켓타이밍이나 기술지표를 이용한 자동매매 기능들의 필요성이 많이 대두 되고 있으니 손실을 최소화 하려는 개미투자자들의 니즈 또한 어느 때보다 커져 있는 상태인 거 같다. 그래서 그 니즈를 충족시키기 위해 방구석지니에 백테스트 기능을 추가하고 있다.


문제는 방구석지니는 퀀트킹처럼 따로 퀀트 데이터를 가지고 있지 않기 때문에 기간에 따른 종목선정을 자동으로 할 수 없다는 것. 퀀트킹의 방대한 퀀트데이터를 따로 DB화 시키는 것은 사실상 힘들기 때문에 아이디어 낸 것이...


퀀트킹에서 백테스트를 하면 결과 창 [히스토리] 탭에서 월별 매수된 신규 종목들을 볼 수 가 있다. 그 월별 종목 데이터를 이용해서 일봉 백테스트를 하면 좋겠다는 생각이 들었다. 퀀트로 선정된 종목으로 자동매매를 하는 것이다.


문제는 퀀트킹 백테스트 히스토리에 보이는 월별 종목을 복사 할 수 없다는 것이다. 그렇다고 일일이 다 옮겨 적을 수도 없고... 그래서 다시 생각한게 퀀트킹 월별 종목을 캡쳐한 이미지를  OCR ( 광학 문자 인식, Optical Character Recognition ) 기술을 이용해서 텍스트로 자동으로 뽑아내는 것이다.


C# OCR 로 구글링하니 여러가지 OCR 라이브러리가 나오는데 난 그 중에서도 무료인 Tesseract를 이용해 봤는데 숫자 9를 3으로 인식하는 경우가 많았다. 무료라서 성능이 안 좋구나 하고 그냥 포기 할 수도 있었겠지만... 요즘 Image Processing 과목을 듣고 있기 때문에... 포기하지 않고 캡쳐한 이미지 전처리를 몇 가지 해보니 오류 없이 인식이 잘 되는 결과를 얻을 수 있었다.


자 이제 더 개발해야 할 일은 캡쳐한 이미지를 한 폴더에 넣고 해당 이미지 파일을 모두 선택해서 불러오기를 하면 자동으로 백테스트 구간에 기간 들이 자동 입력되도록 하는 것이다. 그렇게 되면 사용자들의 편의가 아주 확 올라가지 않을까 생각된다.








댓글 없음:

댓글 쓰기

가장 많이 본 글