데이터 분석부터 시스템 구축까지
40건 이상의 공공·민간 프로젝트 경험으로, 귀 기관의 데이터를 의사결정 근거로 바꿉니다.
01
데이터 분석
Problem
데이터는 쌓이는데, 현황 파악에서 끝나고 있다면.
Method
R, Python으로 탐색적 분석, 가설 검정, 회귀·시계열 분석까지. 보건의료·교육·공공 분야 20건 이상.
Output
분석 보고서(표·그래프 포함), 시각화 대시보드, 실행 제안서.
02
AI/ML 모델링
Problem
과거 데이터로 수요를 예측하거나, 반복적인 분류 작업을 자동화하고 싶을 때.
Method
XGBoost, Random Forest 등 머신러닝과 딥러닝, 자연어 처리를 목적에 맞게 설계. 토픽모델링·텍스트 분류 다수.
Output
예측 모델, 성능 평가 보고서(정확도·재현율), 모델 적용 가이드, 배포 파일.
03
컨설팅
Problem
데이터를 활용하고 싶은데, 어디서부터 시작해야 할지 모르겠을 때.
Method
보유 데이터 진단, 분석 우선순위 설정, 기술 스택 선정. 이후 분석·개발까지 연계 가능.
Output
현황 진단서, 분석 로드맵, 실행 계획서, 비용 추정표.
04
소프트웨어 개발
Problem
분석 결과를 실제 시스템에 반영하거나, 수집·처리·시각화를 자동화해야 할 때.
Method
Python, R 기반 데이터 파이프라인, 웹 대시보드(Shiny, Streamlit), API 서버. 분석팀이 직접 개발하므로 별도 연동 불필요.
Output
애플리케이션 또는 자동화 시스템, 소스 코드, 기술 문서, 사용 매뉴얼.
05
통계 조사 분석
Problem
설문조사·실태조사 결과를 정책 근거나 사업 판단 자료로 만들어야 할 때. 조사 설계부터 보고서까지 전 과정.
Method
SAS, R로 기술통계, 교차분석, ANOVA, 요인분석, 구조방정식(SEM). 공공기관 보고서 다수.
Output
통계 분석 보고서(결과표·그래프 포함), 정책 제언 보고서, 원자료, 분석 코드.
06
데이터 구축
Problem
분석할 데이터 자체가 없거나, 여러 출처의 데이터를 하나로 합쳐야 할 때.
Method
수집 설계 → 크롤링·OCR → 코딩 체계 수립 → 정제·변환 → 품질 검증. 바로 분석에 쓸 수 있는 상태로 전달.
Output
정제된 데이터셋(CSV 또는 DB), 코드북(변수 정의서), 품질 보고서.