중단4 이미 비슷한 아이디어가 적용되어 있다. http://psygement.github.io/ecor_finpy 선례를 보고 이쪽으로 배울 지 고민해볼 것. 2017. 10. 30. 아이디어 정리 이슈 1. 어떤 전처리가 옳은지는 직접해보고 결과를 비교해보지 않는 한 완벽한 답을 모른다. 그렇다면 Brute force한 방법으로 모든 전처리가 가능한 가능성이 적용된 데이터 셋을 미리 준비하는 방식은 어떨까?- 물론 경우의 수가 너무 많은 만큼, 어느정도 합리적인 수준에서 할 수 있도록 경험적인 기준을 마련해줄 필요가 있다.-- 단순히 통계책에서 "경험적으로는 결측치를 통계적 방법으로 바꿔선 오류가 커진다"라는 말에서 벗어나, 온라인으로 실제 이러한 처리 결과 어떤 전처리가 상대적으로 유효한가에 대한 설문을 자동적으로 받아서 데이터베이스에 기록하게 할 수 있을 것이다. 2017. 10. 29. 통계 검정 플로우 차트 http://accesspharmacy.mhmedical.com/content.aspx?bookid=438§ionid=40428533 추후 자동 전처리 시스템을 위한 참고자료 2017. 10. 29. 17년 4월 5일 대학생 빅데이터 아이디어 발표대회를 보고 느낀점 이를 토대로 추후 빅데이터 관련 부문의 대회에서 입상을 위한 가이드 라인을 삼을 필요가 있음.응모한 팀은 199팀. 1차 통과후 2차에서 발표한 인원은 11팀. 최종 시상자는 6명. 이전에 1백여명정도 하던 대회 사례를 볼 때 생각외로 많은 수가 접수됨.심사위원은 월간 지방자치(잡지사로 보임), 한국신용정보원, ETRI, 건강보험심사원 연구원, 행자부 데이터 분석과에서 한명씩.발표는 1인당 6분씩. PPT는 7페이지 정도로 정해짐.의외로 구글 검색 1페이지에 나온 내용과 별 다를 바 없는 걸 발표했는데도(디테일은 다를 것으로 추측하지만) 당선된 것으로 보아 담당자들만 모르면 참신성에 대한 문제는 없을 것으로 보임.그다지 빅데이터 스케일의 문제가 아닌 것으로 보이는 것도 당선된 것으로 보아 공무원의 귀찮음.. 2017. 4. 9. 이전 1 다음