교육 기간은 얼마나 되나요?

2026-05-27T00:00 ~ 2026-11-17T00:00, 총 115일, 총 920시간

수강료는 얼마인가요?

수강료 400,000원, 국비지원 8,333,560원

머신러닝을 활용한 데이터 분석 부트캠프

이런 역량을 키울 수 있어요

엑셀 고급 기능을 활용하여 데이터 구조를 해석하고 1차 가공하는 능력을 키울 수 있어요
Python과 핵심 라이브러리를 사용하여 대용량 데이터를 효율적으로 처리하는 실력을 쌓을 수 있어요
SQL을 활용하여 기업 데이터베이스에서 필요한 데이터를 직접 추출하고 관리하는 능력을 갖출 수 있어요
웹 크롤링 및 API 연동을 통해 데이터 분석에 필요한 외부 데이터셋을 직접 구축하는 역량을 키울 수 있어요
데이터 결측치와 이상치를 정제하고 분포 패턴을 파악하여 데이터 품질을 향상하는 실력을 쌓을 수 있어요
머신러닝 알고리즘을 적용하여 과거 데이터 기반으로 미래 수치를 예측하는 능력을 갖출 수 있어요
데이터 시각화 도구를 활용하여 이해관계자를 위한 인터랙티브 대시보드를 구현하는 역량을 키울 수 있어요

교육기관 정보

아이티윌

기관 소개가 없습니다.

일정 & 수업

모집기간~2026-05-26

수업기간2026-05-27 ~ 2026-11-17

수업방식오프라인

수업시간월, 화, 수, 목, 금 / 09:00 - 18:00

모집정원30명

총 수업115일(920시간)

수강료 & 지원금

내배카 여부필요함

자기 부담금400,000원

정부 지원금8,333,560원

훈련수당(월)300,000원

이런 절차로 지원할 수 있어요.

서류심사

면접

훈련 목표

일반적인 신입 데이터 분석가보다 뛰어난 SQL 활용 능력을 갖춰, 현업에서 DB에 쌓인 데이터를 직접 추출하고 가공할 수 있습니다

강사진 소개

미상

강사진에 대한 소개가 없습니다.

지원 서비스

교재 제공

이력서 첨삭

모의 면접

취업 지원

수료 후 지원

프로젝트 정보

프로젝트 수3개

프로젝트 기간4주

팀 구성자율구성

협업 도구Notion

멘토 지원

멘토 지원 있음

커리큘럼

📢 각 항목을 클릭하면 세부 내용을 확인할 수 있어요.

메인 커리큘럼

R 기본 문법

R 기초 문법: 변수 할당, 데이터 타입, 데이터 프레임 데이터 처리 및 변환: 데이터 전처리, 변환, 문자열 처리 기초 통계 분석: 통계량 계산, 분포 분석, 가설 검정

파이썬 기본문법

Python 기본: 내장 함수, 데이터 타입, 제어문 모듈 및 패키지 사용: 모듈 임포트, 주요 라이브러리, 패키지 관리 파일 입출력: 파일 읽기 및 쓰기, CSV, JSON

파이썬 판다스

Pandas 기본 문법: Series와 DataFrame, 데이터 로딩 및 저장 데이터 분석 및 처리: 정렬, 그룹화, 결측치 처리 고급 Pandas 기법: 시계열 데이터, 멀티 인덱스, 데이터 병합

SQL

Oracle DBMS: 오라클 설치 및 SQL 기본문법 SQL 문법 및 함수: DML, DDL, 트랜잭션 관리 고급 SQL 쿼리: 뷰, 인덱스, With절, 정규식 함수

리눅스&하둡

Linux 기본: 파일 시스템, 사용자 관리, 쉘 스크립트 작성법 Hadoop 기본: 설치 및 구성, HDFS 이해 및 사용, MapReduce 실습 하둡 에코시스템: Hive, Pig, HBase, 스파크 연동

몽고DB&스파크

MongoDB 기본: 설치 및 몽고디비 기본 구조의 이해 고급 MongoDB: 몽고디비 기본 명령어 100문제 풀이 및 공공 데이터 활용 Spark 기본: 설치 및 설정, RDD와 DataFrame, SQL 및 데이터 처리

파이썬 웹스크롤링

Python 데이터 분석: 웹 스크래핑 기초, BeautifulSoup, 데이터 전처리 크롤링 실습: HTML 구조, 데이터 추출 및 저장 고급 웹 스크롤링: AJAX 처리, 동적 페이지 크롤링, 자동화

도커

컨테이너 관리: 설치 및 기본 명령어, 이미지 관리, 컨테이너 배포 고급 Docker 사용법: Compose 사용, 네트워킹, 볼륨 관리 도커와 클라우드: 이미지 배포, 클라우드 사용, Kubernetes

R 머신러닝

머신러닝 개념 이해: 지도 학습, 비지도 학습, 수치예측을 위한 회귀분석 실습 및 응용: 기계학습 방법의 이해, 기계학습의 성능을 높이는 방법 학습 고급 머신러닝 기법: 앙상블 기법, k-hold 교차검정, kaggle 우승조 모델의 이해

파이썬 판다스 머신러닝

Pandas를 활용한 데이터 전처리: 데이터 정제, 데이터 시각화 기본 머신러닝 알고리즘 적용: 회귀 분석, 분류 모델, 클러스터링 모델 평가 및 개선: 교차 검증, 성능 평가, 하이퍼파라미터 튜닝

딥러닝

Python 딥러닝: 텐서플로우 및 케라스 기초, 신경망 구현, 모델 평가 고급 딥러닝: CNN 및 RNN 이해, 모델 튜닝, 모델 배포 딥러닝 데이터 전처리, 기본 딥러닝 모델 설계구현

R 데이터 시각화

기초 시각화: 기본 그래프, ggplot2 패키지 활용, R 내장 함수 그래프 사용 고급 시각화: 복합 그래프, plotly 패키지 사용, 공공 데이터 시각화

테블로 시각화

데이터 시각화 도구: 설치 및 사용법, 대시보드 작성, 데이터 시각화 실습 고급 딥러닝: CNN 및 RNN 이해, 모델 튜닝, 모델 배포 데이터 스토리텔링: 시각화 자료 해석, 보고서 작성, 스토리텔링

사회 이슈 통계자료를 활용한 데이터 분석과 예측 프로젝트(중간 프로젝트)

선택1 : 전국 의료 불균형 실태 분석과 예측 [데이터 수집]- 데이터 출처: 정부 공개 데이터, 건강보험심사평가원, 통계청, 공공 의료 데이터베이스- 데이터 종류: 인구 통계 데이터 (연령, 성별, 지역별 인구)- 의료 기관 분포 데이터 (병원, 의원, 약국 등)- 의료 자원 데이터 (의료진 수, 병상 수, 의료 장비 현황)- 건강보험 청구 데이터 (진료 과목별, 질병별, 지역별) [데이터 전처리]- 결측치 처리- 데이터 정규화- 이상치 탐지 및 처리 [데이터 분석]- 기술적 분석: 지역별 의료 자원 분포 분석 (병원 수, 의료진 수, 병상 수 등)- 인구 대비 의료 자원 비율 분석- 질병 발생 빈도와 의료 서비스 접근성의 상관관계 분석- 시각화: 지도 시각화 (지역별 의료 자원 분포도), 히트맵, 바차트 등을 통한 데이터 시각화- 통계적 분석: 회귀분석을 통한 의료 서비스 접근성과 건강 지표 간의 관계 분석, 군집분석을 통한 의료 서비스가 부족한 지역 식별 [예측 모델 개발]- 모델 선정: 다중 회귀분석, 시계열 분석 모델 (ARIMA, LSTM 등), 머신러닝 모델 (랜덤 포레스트, XGBoost 등)- 모델 학습 및 평가: 훈련 데이터와 테스트 데이터로 분리하여 모델 학습 교차 검증을 통한 모델 성능 평가- 평가 지표: RMSE, MAE, R^2 등 선택2 : 인구수 감소에 따른 통폐합될 학교 예측 데이터 수집]- 데이터 출처: 교육부, 통계청, 지방자치단체, 학교 정보 공개 데이터베이스- 데이터 종류: 인구 통계 데이터 (연령, 성별, 지역별 인구 변화)- 학교별 학생 수, 교사 수, 학급 수- 학교 시설 현황 및 이용률- 지역별 출생률 및 유입/유출 인구 데이터- 과거 통폐합 사례 데이터 [데이터 전처리]- 결측치 처리- 데이터 정규화- 이상치 탐지 및 처리 [데이터 분석]- 기술적 분석: 지역별 인구 변화 추이 분석- 학교별 학생 수 및 교사 수 변화 분석- 학급 규모 및 시설 이용률 분석- 통폐합된 학교들의 특성 분석- 시각화: 지역별 인구 변화 지도 시각화, 학교별 학생 수 및 교사 수 변화 그래프, 학급 및 시설 이용률 히트맵- 통계적 분석: 회귀분석을 통한 인구 변화와 학교 통폐합 간의 관계 분석, 군집분석을 통한 통폐합 위험이 높은 학교 식별 [예측 모델 개발]- 모델 선정: 다중 회귀분석, 시계열 분석 모델 (ARIMA 등), 머신러닝 모델 (랜덤 포레스트, XGBoost 등)- 모델 학습 및 평가: 훈련 데이터와 테스트 데이터로 분리하여 모델 학습 교차 검증을 통한 모델 성능 평가- 평가 지표: RMSE, MAE, R^2 등 선택3 : 가뭄의 빈도에 따른 우리나라 국내 댐별 물 보유량 예측 {데이터 수집] [데이터 전처리] [데이터 분석] [예측 모델 개발] 선택4 : 서울시 부동산 실거래가 분석을 통해 가격에 가장 큰 영향을 미치는 요인 분석 [데이터 수집] [데이터 전처리] [데이터 분석] [예측 모델 개발] 선택5 : 자유주제 또는 음원 차트 히트곡들의 특징 추출 및 패턴 찾기 [데이터 수집] [데이터 전처리] [데이터 분석] [패턴 찾기 및 모델 개발] * 굴자수 부족으로 상세내용 훈련운영계획서 및 사업개요서 참조

바이오 이미지 데이터 분석 프로젝트_바이오, 얼굴, 상품 분석(파이널 프로젝트)

선택1: 진단킷 바이오 이미지 데이터 분석을 활용한 질병 분석 [데이터 수집]-애완동물 및 질병정보-진단킷 색상정보 [데이터 전처리]-이미지 정규화 및 스케일링-이미지 이진화 및 라벨링-데이터 증강(Data Augmentation) 기법 적용-잡음 제거 및 이미지 개선(필터링, 해상도 조정 등)-메타 데이터와의 매칭 및 통합 [데이터 분석]-이미지 데이터의 기본 통계 분석-주요 특징 시각화(히스토그램, 분포 그래프 등)-이상치 탐지 및 처리-이미지 처리 기법을 활용한 주요 특징 추출 (경계선 검출, 텍스처 분석 등)-CNN을 활용한 자동 특징 추출 [모델 개발 및 평가] 1) 모델 선정-머신러닝 모델: 랜덤 포레스트, SVM 등-딥러닝 모델: CNN, ResNet, VGG 등 2) 모델학습-훈련 데이터와 검증 데이터를 통한 모델 학습-교차 검증을 통한 모델 성능 평가 3) 모델 평가-정확도, 정밀도, 재현율, F1 스코어 등 평가 지표 계산-ROC 커브 및 AUC 분석 [결과 분석 및 시각화]-모델의 최종 성능 요약-주요 특징 및 패턴 분석 결과-애완동물 질병 진단 모델의 실용성 평가-진단 결과 및 주요 특징 시각화-모델 성능 평가 그래프(ROC 커브 등) 선택2 : 실시간 얼굴인식 인디케이터를 활용한 신원(범죄)조회 시스템 [데이터 수집]-공개 데이터셋 활용-예시 데이터셋: LFW (Labeled Faces in the Wild), CelebA, VGGFace2 등-장점: 다양한 얼굴 이미지가 포함되어 있어 모델 학습에 유용-카메라 설치 및 데이터 수집: 프로젝트 진행을 위해 카메라를 설치하여 다양한 환경에서 얼굴 이미지를 수집-고해상도 카메라를 설치하여 얼굴 이미지 데이터를 수집-온라인 데이터 수집: 웹 크롤링 및 스크래핑 기술을 활용하여 인터넷에서 얼굴 이미지 데이터 수집 [데이터 전처리]-중복 데이터 제거: 중복된 얼굴 이미지와 신원 정보 제거-노이즈 제거: 이미지 데이터에서 노이즈 제거 및 품질 향상 [데이터 데이터 레이블링]-신원 정보 라벨링: 수집된 얼굴 이미지와 신원 정보를 매칭하여 라벨링-범죄 기록 라벨링: 범죄 기록 데이터를 신원 정보와 연결하여 라벨링 [데이터 증강]-이미지 증강: 다양한 조명, 각도, 표정 변화를 적용하여 데이터 증강-기법: 회전, 확대/축소, 밝기 조절, 노이즈 추가 등-모델의 일반화 능력 향상 [데이터 저장 및 관리]-데이터베이스 구축: 효율적인 데이터 관리를 위해 데이터베이스 구축-선택 기술: SQL, NoSQL 데이터베이스-관리 방식: 데이터 백업, 정기적인 데이터베이스 점검 및 최적화 [평가 계획]-기능성 평가: 시스템의 주요 기능이 제대로 동작하는지 평가-성능 평가: 얼굴인식 정확도, 실시간 처리 속도 평가-사용성 평가: 사용자 인터페이스의 사용성 평가-보안 평가: 데이터 보안 및 접근 제어 평가 선택3: 제품 이미지 분석을 활용한 제품정보 제공 프로젝트 또는 자유주제 [데이터 수집]-웹스크래핑: BeautifulSoup, Scrapy를 사용하여 웹에서 제품 이미지를 수집하고, 필요한 데이터를 추출. [데이터 전처리]-데이터 정제: Pandas를 활용하여 결측치 처리, 데이터 정규화, 중복 제거 등 데이터 정제 수행-이미지 전처리: OpenCV, Pillow를 사용하여 이미지 크기 조정, 색상 보정, 노이즈 제거 등 이미지 전처리 [데이터 분석]-CNN을 활용하여 제품 이미지에서 특징을 추출 [모델 개발]-딥러닝 모델: TensorFlow, Keras, PyTorch를 사용하여 CNN, RNN 등의 딥러닝 모델을 설계하고 학습

후기

후기를 불러오는 중...

아이티윌

모집마감