시스템 트레이딩
과최적화를 피하는 방법 - 표본을 늘려라
시스템 트레이딩을 하면 당연히 백테스트 또는 시뮬레이션이 수반되어야 하고, 백테스트를 하다 보면 과최적화를 피하는 것이 굉장히 중요하고 어렵다는 것을 느끼게 된다. 과최적화를 피하기 위해 여러 가지 방법들이 동원되는데, 크게 두 방향으로 접근한다. 하나는 표본은 늘리는 것, 다른 하나는 아이디어를 단순하게 가져가는 것. 여기서는 표본을 늘리는 것에 대해 이야기한다. 통계학적으로 최저표본은 보통 30개 이상으로 본다. 물론 많으면 많을수록 수학적으로 정확한 통계적 추론이 가능해진다. 백테스트도 마찬가지다. 몇 개 이상이면 과최적화를 벗어날 수 있는지 정확한 기준선을 잡을 수는 없지만 표본은 많으면 많을수록 좋다. 그럼 트레이딩에서 표본의 숫자는 어떻게 정해지는 것인가? 테스트 기간과 매매주기, 그리고 종목..
시스템 트레이딩에 대한 오해
시스템 트레이딩 관련하여 좋은 인사이트를 얻을 곳이 혹시 있을까 하여 유튜브나 구글에서 가끔 시스템 트레이딩을 검색해보곤 한다. 이미 알고 있는 몇몇 고수분의 블로그를 제외하고는 인터넷에 돌아다니는 많은 정보는 대부분 수박 겉 핥기식으로 시스템 트레이딩을 설명하고 있는 듯 하다. 걔 중에 워낙 바보같거나 틀린 말들은 웃고 넘어가지만, 아래 영상에서는 그럴듯 하게 설명은 하지만 실제로 여러 개념을 혼동하거나, 착각하고 있는 부분이 있는 것 같아 생각을 정리해본다. 해당 유튜버를 공격하거나 비난할 생각은 없고, 대부분 이런 시행착오를 겪겠구나 싶어 오히려 안타까운 마음이 든다. https://youtu.be/97h-bpJPxM4 1. 과거의 데이타로 미래를 예측한다는 전제가 잘못 됐다. > 과거의 데이타로 ..
Data가 시키는 대로
시스템 트레이딩에 입문하는 사람들이 공통적으로 하는 상상이 있다. 내가 만든 프로그램이 돈은 알아서 벌어주고, 하와이에서 휴양을 즐기고 있는 나의 모습.. 그러나 조금만 진지하게 공부해 보면 이 상상이 얼마나 허황된 것인지, 또는 이 정도 경지에 다다르는 것이 얼마나 까마득한 것인지 깨닫게 된다. (이런 경지가 불가능한 것은 아닌데, 굉장히 많은 시간과 노력을 투입한 후 얻어지는 달인의 경지라고 생각된다. 나도 아직 멀었다.) 당장 이번 주말에도 신년 개장을 준비하며 종일 작업에 매달렸다. 전략별로 한 해 성과를 정리하고, 어떤 놈을 살처분할지 어떤 놈이 예쁜지 확인하고, 매매로그를 체크하고, 전략마다 개선할 부분이 있는지 확인하고, 연도별로 관리되는 DB 설정을 바꿔주고, 개장일(새해 첫 개장일) 시간..