SOFTWARE CAMPUS 로고
아이티윌
모집마감

머신러닝을 활용한 데이터 분석 부트캠프

모집기간~2026-05-26
수업기간2026-05-27 ~ 2026-11-17
지역서울 강남구
수업방식오프라인
수업시간월, 화, 수, 목, 금 / 09:00 - 18:00

👇 신청 페이지에서 10초 이상 머물면 +100P

복귀 후 30~60초 내 적립

이런 역량을 키울 수 있어요
  • 엑셀 고급 기능을 활용하여 데이터 구조를 해석하고 1차 가공하는 능력을 키울 수 있어요
  • Python과 핵심 라이브러리를 사용하여 대용량 데이터를 효율적으로 처리하는 실력을 쌓을 수 있어요
  • SQL을 활용하여 기업 데이터베이스에서 필요한 데이터를 직접 추출하고 관리하는 능력을 갖출 수 있어요
  • 웹 크롤링 및 API 연동을 통해 데이터 분석에 필요한 외부 데이터셋을 직접 구축하는 역량을 키울 수 있어요
  • 데이터 결측치와 이상치를 정제하고 분포 패턴을 파악하여 데이터 품질을 향상하는 실력을 쌓을 수 있어요
  • 머신러닝 알고리즘을 적용하여 과거 데이터 기반으로 미래 수치를 예측하는 능력을 갖출 수 있어요
  • 데이터 시각화 도구를 활용하여 이해관계자를 위한 인터랙티브 대시보드를 구현하는 역량을 키울 수 있어요
교육기관 정보
아이티윌
기관 소개가 없습니다.
일정 & 수업
모집기간~2026-05-26
수업기간2026-05-27 ~ 2026-11-17
수업방식오프라인
수업시간월, 화, 수, 목, 금 / 09:00 - 18:00
모집정원30
총 수업115일(920시간)
수강료 & 지원금
내배카 여부필요함
자기 부담금400,000원
정부 지원금8,333,560원
훈련수당(월)300,000원
이런 절차로 지원할 수 있어요.
서류심사
면접
훈련 목표
1
일반적인 신입 데이터 분석가보다 뛰어난 SQL 활용 능력을 갖춰, 현업에서 DB에 쌓인 데이터를 직접 추출하고 가공할 수 있습니다
강사진 소개

미상

강사진에 대한 소개가 없습니다.

지원 서비스
교재 제공
이력서 첨삭
모의 면접
취업 지원
수료 후 지원
프로젝트 정보
프로젝트 수3
프로젝트 기간4주
팀 구성자율구성
협업 도구Notion
멘토 지원
멘토 지원 있음
커리큘럼

📢 각 항목을 클릭하면 세부 내용을 확인할 수 있어요.

메인 커리큘럼

R 기본 문법
R 기초 문법: 변수 할당, 데이터 타입, 데이터 프레임 데이터 처리 및 변환: 데이터 전처리, 변환, 문자열 처리 기초 통계 분석: 통계량 계산, 분포 분석, 가설 검정
파이썬 기본문법
Python 기본: 내장 함수, 데이터 타입, 제어문 모듈 및 패키지 사용: 모듈 임포트, 주요 라이브러리, 패키지 관리 파일 입출력: 파일 읽기 및 쓰기, CSV, JSON
파이썬 판다스
Pandas 기본 문법: Series와 DataFrame, 데이터 로딩 및 저장 데이터 분석 및 처리: 정렬, 그룹화, 결측치 처리 고급 Pandas 기법: 시계열 데이터, 멀티 인덱스, 데이터 병합

SQL
Oracle DBMS: 오라클 설치 및 SQL 기본문법 SQL 문법 및 함수: DML, DDL, 트랜잭션 관리 고급 SQL 쿼리: 뷰, 인덱스, With절, 정규식 함수
리눅스&하둡
Linux 기본: 파일 시스템, 사용자 관리, 쉘 스크립트 작성법 Hadoop 기본: 설치 및 구성, HDFS 이해 및 사용, MapReduce 실습 하둡 에코시스템: Hive, Pig, HBase, 스파크 연동
몽고DB&스파크
MongoDB 기본: 설치 및 몽고디비 기본 구조의 이해 고급 MongoDB: 몽고디비 기본 명령어 100문제 풀이 및 공공 데이터 활용 Spark 기본: 설치 및 설정, RDD와 DataFrame, SQL 및 데이터 처리

파이썬 웹스크롤링
Python 데이터 분석: 웹 스크래핑 기초, BeautifulSoup, 데이터 전처리 크롤링 실습: HTML 구조, 데이터 추출 및 저장 고급 웹 스크롤링: AJAX 처리, 동적 페이지 크롤링, 자동화
도커
컨테이너 관리: 설치 및 기본 명령어, 이미지 관리, 컨테이너 배포 고급 Docker 사용법: Compose 사용, 네트워킹, 볼륨 관리 도커와 클라우드: 이미지 배포, 클라우드 사용, Kubernetes

R 머신러닝
머신러닝 개념 이해: 지도 학습, 비지도 학습, 수치예측을 위한 회귀분석 실습 및 응용: 기계학습 방법의 이해, 기계학습의 성능을 높이는 방법 학습 고급 머신러닝 기법: 앙상블 기법, k-hold 교차검정, kaggle 우승조 모델의 이해
파이썬 판다스 머신러닝
Pandas를 활용한 데이터 전처리: 데이터 정제, 데이터 시각화 기본 머신러닝 알고리즘 적용: 회귀 분석, 분류 모델, 클러스터링 모델 평가 및 개선: 교차 검증, 성능 평가, 하이퍼파라미터 튜닝
딥러닝
Python 딥러닝: 텐서플로우 및 케라스 기초, 신경망 구현, 모델 평가 고급 딥러닝: CNN 및 RNN 이해, 모델 튜닝, 모델 배포 딥러닝 데이터 전처리, 기본 딥러닝 모델 설계구현

R 데이터 시각화
기초 시각화: 기본 그래프, ggplot2 패키지 활용, R 내장 함수 그래프 사용 고급 시각화: 복합 그래프, plotly 패키지 사용, 공공 데이터 시각화
테블로 시각화
데이터 시각화 도구: 설치 및 사용법, 대시보드 작성, 데이터 시각화 실습 고급 딥러닝: CNN 및 RNN 이해, 모델 튜닝, 모델 배포 데이터 스토리텔링: 시각화 자료 해석, 보고서 작성, 스토리텔링

사회 이슈 통계자료를 활용한 데이터 분석과 예측 프로젝트(중간 프로젝트)
선택1 : 전국 의료 불균형 실태 분석과 예측 [데이터 수집]- 데이터 출처: 정부 공개 데이터, 건강보험심사평가원, 통계청, 공공 의료 데이터베이스- 데이터 종류: 인구 통계 데이터 (연령, 성별, 지역별 인구)- 의료 기관 분포 데이터 (병원, 의원, 약국 등)- 의료 자원 데이터 (의료진 수, 병상 수, 의료 장비 현황)- 건강보험 청구 데이터 (진료 과목별, 질병별, 지역별) [데이터 전처리]- 결측치 처리- 데이터 정규화- 이상치 탐지 및 처리 [데이터 분석]- 기술적 분석: 지역별 의료 자원 분포 분석 (병원 수, 의료진 수, 병상 수 등)- 인구 대비 의료 자원 비율 분석- 질병 발생 빈도와 의료 서비스 접근성의 상관관계 분석- 시각화: 지도 시각화 (지역별 의료 자원 분포도), 히트맵, 바차트 등을 통한 데이터 시각화- 통계적 분석: 회귀분석을 통한 의료 서비스 접근성과 건강 지표 간의 관계 분석, 군집분석을 통한 의료 서비스가 부족한 지역 식별 [예측 모델 개발]- 모델 선정: 다중 회귀분석, 시계열 분석 모델 (ARIMA, LSTM 등), 머신러닝 모델 (랜덤 포레스트, XGBoost 등)- 모델 학습 및 평가: 훈련 데이터와 테스트 데이터로 분리하여 모델 학습 교차 검증을 통한 모델 성능 평가- 평가 지표: RMSE, MAE, R^2 등 선택2 : 인구수 감소에 따른 통폐합될 학교 예측 데이터 수집]- 데이터 출처: 교육부, 통계청, 지방자치단체, 학교 정보 공개 데이터베이스- 데이터 종류: 인구 통계 데이터 (연령, 성별, 지역별 인구 변화)- 학교별 학생 수, 교사 수, 학급 수- 학교 시설 현황 및 이용률- 지역별 출생률 및 유입/유출 인구 데이터- 과거 통폐합 사례 데이터 [데이터 전처리]- 결측치 처리- 데이터 정규화- 이상치 탐지 및 처리 [데이터 분석]- 기술적 분석: 지역별 인구 변화 추이 분석- 학교별 학생 수 및 교사 수 변화 분석- 학급 규모 및 시설 이용률 분석- 통폐합된 학교들의 특성 분석- 시각화: 지역별 인구 변화 지도 시각화, 학교별 학생 수 및 교사 수 변화 그래프, 학급 및 시설 이용률 히트맵- 통계적 분석: 회귀분석을 통한 인구 변화와 학교 통폐합 간의 관계 분석, 군집분석을 통한 통폐합 위험이 높은 학교 식별 [예측 모델 개발]- 모델 선정: 다중 회귀분석, 시계열 분석 모델 (ARIMA 등), 머신러닝 모델 (랜덤 포레스트, XGBoost 등)- 모델 학습 및 평가: 훈련 데이터와 테스트 데이터로 분리하여 모델 학습 교차 검증을 통한 모델 성능 평가- 평가 지표: RMSE, MAE, R^2 등 선택3 : 가뭄의 빈도에 따른 우리나라 국내 댐별 물 보유량 예측 {데이터 수집] [데이터 전처리] [데이터 분석] [예측 모델 개발] 선택4 : 서울시 부동산 실거래가 분석을 통해 가격에 가장 큰 영향을 미치는 요인 분석 [데이터 수집] [데이터 전처리] [데이터 분석] [예측 모델 개발] 선택5 : 자유주제 또는 음원 차트 히트곡들의 특징 추출 및 패턴 찾기 [데이터 수집] [데이터 전처리] [데이터 분석] [패턴 찾기 및 모델 개발] * 굴자수 부족으로 상세내용 훈련운영계획서 및 사업개요서 참조
바이오 이미지 데이터 분석 프로젝트_바이오, 얼굴, 상품 분석(파이널 프로젝트)
선택1: 진단킷 바이오 이미지 데이터 분석을 활용한 질병 분석 [데이터 수집]-애완동물 및 질병정보-진단킷 색상정보 [데이터 전처리]-이미지 정규화 및 스케일링-이미지 이진화 및 라벨링-데이터 증강(Data Augmentation) 기법 적용-잡음 제거 및 이미지 개선(필터링, 해상도 조정 등)-메타 데이터와의 매칭 및 통합 [데이터 분석]-이미지 데이터의 기본 통계 분석-주요 특징 시각화(히스토그램, 분포 그래프 등)-이상치 탐지 및 처리-이미지 처리 기법을 활용한 주요 특징 추출 (경계선 검출, 텍스처 분석 등)-CNN을 활용한 자동 특징 추출 [모델 개발 및 평가] 1) 모델 선정-머신러닝 모델: 랜덤 포레스트, SVM 등-딥러닝 모델: CNN, ResNet, VGG 등 2) 모델학습-훈련 데이터와 검증 데이터를 통한 모델 학습-교차 검증을 통한 모델 성능 평가 3) 모델 평가-정확도, 정밀도, 재현율, F1 스코어 등 평가 지표 계산-ROC 커브 및 AUC 분석 [결과 분석 및 시각화]-모델의 최종 성능 요약-주요 특징 및 패턴 분석 결과-애완동물 질병 진단 모델의 실용성 평가-진단 결과 및 주요 특징 시각화-모델 성능 평가 그래프(ROC 커브 등) 선택2 : 실시간 얼굴인식 인디케이터를 활용한 신원(범죄)조회 시스템 [데이터 수집]-공개 데이터셋 활용-예시 데이터셋: LFW (Labeled Faces in the Wild), CelebA, VGGFace2 등-장점: 다양한 얼굴 이미지가 포함되어 있어 모델 학습에 유용-카메라 설치 및 데이터 수집: 프로젝트 진행을 위해 카메라를 설치하여 다양한 환경에서 얼굴 이미지를 수집-고해상도 카메라를 설치하여 얼굴 이미지 데이터를 수집-온라인 데이터 수집: 웹 크롤링 및 스크래핑 기술을 활용하여 인터넷에서 얼굴 이미지 데이터 수집 [데이터 전처리]-중복 데이터 제거: 중복된 얼굴 이미지와 신원 정보 제거-노이즈 제거: 이미지 데이터에서 노이즈 제거 및 품질 향상 [데이터 데이터 레이블링]-신원 정보 라벨링: 수집된 얼굴 이미지와 신원 정보를 매칭하여 라벨링-범죄 기록 라벨링: 범죄 기록 데이터를 신원 정보와 연결하여 라벨링 [데이터 증강]-이미지 증강: 다양한 조명, 각도, 표정 변화를 적용하여 데이터 증강-기법: 회전, 확대/축소, 밝기 조절, 노이즈 추가 등-모델의 일반화 능력 향상 [데이터 저장 및 관리]-데이터베이스 구축: 효율적인 데이터 관리를 위해 데이터베이스 구축-선택 기술: SQL, NoSQL 데이터베이스-관리 방식: 데이터 백업, 정기적인 데이터베이스 점검 및 최적화 [평가 계획]-기능성 평가: 시스템의 주요 기능이 제대로 동작하는지 평가-성능 평가: 얼굴인식 정확도, 실시간 처리 속도 평가-사용성 평가: 사용자 인터페이스의 사용성 평가-보안 평가: 데이터 보안 및 접근 제어 평가 선택3: 제품 이미지 분석을 활용한 제품정보 제공 프로젝트 또는 자유주제 [데이터 수집]-웹스크래핑: BeautifulSoup, Scrapy를 사용하여 웹에서 제품 이미지를 수집하고, 필요한 데이터를 추출. [데이터 전처리]-데이터 정제: Pandas를 활용하여 결측치 처리, 데이터 정규화, 중복 제거 등 데이터 정제 수행-이미지 전처리: OpenCV, Pillow를 사용하여 이미지 크기 조정, 색상 보정, 노이즈 제거 등 이미지 전처리 [데이터 분석]-CNN을 활용하여 제품 이미지에서 특징을 추출 [모델 개발]-딥러닝 모델: TensorFlow, Keras, PyTorch를 사용하여 CNN, RNN 등의 딥러닝 모델을 설계하고 학습

후기

후기를 불러오는 중...