전체 글 42

[본캠프] 데이터기반 QA/QC 부트캠프 33일차

1. 오늘의 학습 목표오늘은 머신러닝 모델을 만들 때 데이터를 어떻게 나누고, 어떻게 평가해야 하는지를 중심으로 학습했다.이전에는 데이터 수집, EDA, 이상치, 결측치, 인코딩, 스케일링처럼 모델링 전에 필요한 전처리 과정을 정리했다면, 오늘은 그 다음 단계인 데이터 분리와 모델 검증 과정을 다뤘다.오늘의 목표는 크게 세 가지다.첫 번째는 과적합이 무엇인지 이해하는 것이다. 모델이 학습 데이터에만 지나치게 잘 맞고, 새로운 데이터에는 약해지는 상황을 배웠다.두 번째는 train/test 데이터를 분리해서 모델을 평가하는 흐름을 익히는 것이다. 모델을 학습하는 데이터와 평가하는 데이터를 나눠야 실제 예측 성능을 조금 더 객관적으로 확인할 수 있다.세 번째는 교차 검증과 GridSearch의 개념을 정리하..

내일배움캠프 2026.06.26

[본캠프] 데이터기반 QA/QC 부트캠프 32일차

1. 오늘의 학습 목표오늘은 머신러닝 모델을 만들기 전에 필요한 전체 흐름을 다시 정리했다.이전까지는 모델을 학습하고 평가하는 부분을 중심으로 봤다면, 오늘은 그 앞단에 있는 데이터 수집, EDA, 데이터 전처리 과정을 학습했다. 모델링 자체도 중요하지만, 실제 데이터 분석에서는 모델을 만들기 전까지의 과정이 훨씬 많은 시간을 차지한다는 점을 확인했다.오늘의 목표는 크게 세 가지였다.첫 번째는 예측 모델링 프로세스가 어떤 순서로 진행되는지 이해하는 것이다. 데이터 수집부터 전처리, EDA, 모델링과 평가, 배포까지 이어지는 전체 흐름을 정리했다.두 번째는 EDA를 통해 데이터를 어떻게 이해하는지 보는 것이다. 기술통계와 시각화를 활용해서 데이터의 분포, 관계, 이상치, 범주별 차이를 확인하는 방법을 학습..

내일배움캠프 2026.06.25

[본캠프] 데이터기반 QA/QC 부트캠프 31일차

1. 오늘의 학습 목표오늘은 머신러닝과 통계학을 나누어 학습했다.머신러닝에서는 로지스틱 회귀를 마무리하고, 회귀와 분류 모델의 차이를 다시 정리하는 것이 목표였다. 선형회귀와 로지스틱 회귀가 어떤 점에서 비슷하고, 어떤 문제에서 다르게 사용되는지 확인했다. 특히 로지스틱 회귀는 분류 문제에서 사용되며, 정확도와 F1-score 같은 평가 지표로 모델을 판단한다는 점을 다시 짚었다.통계학에서는 가설검정을 사용할 때 조심해야 할 부분들을 학습했다. 단순히 p-value가 0.05보다 작다고 해서 바로 의미 있는 결과라고 받아들이면 안 되고, 분석 과정에서 결과를 왜곡할 수 있는 여러 상황을 함께 봐야 한다는 점이 핵심이었다.2. 오늘 학습한 내용머신러닝로지스틱 회귀 정리로지스틱 회귀는 이름에 “회귀”가 들어..

내일배움캠프 2026.06.24

[본캠프] 데이터기반 QA/QC 부트캠프 30일차

1. 오늘의 학습 목표오늘도 크게 통계와 머신러닝 내용을 나누어 학습했다.통계에서는 회귀분석의 기본 개념과 상관관계를 중심으로 배웠다.단순선형회귀, 다중선형회귀, 범주형 변수 처리, 다항회귀, 스플라인 회귀를 정리했고, 이어서 피어슨 상관계수, 스피어만 상관계수, 켄달의 타우, 상호정보까지 함께 살펴봤다.머신러닝에서는 선형회귀를 실제 데이터에 적용하는 방법과 로지스틱 회귀를 중심으로 학습했다.선형회귀 모델을 훈련하고 평가하는 과정, 범주형 데이터를 다루는 방법, 로지스틱 회귀의 개념, 그리고 분류 모델을 평가하는 정확도와 F1-score까지 정리했다.오늘의 목표는 단순히 공식이나 코드를 외우는 것보다는, 각 개념이 어떤 문제를 해결하기 위해 사용되는지 이해하는 것이었다.2. 오늘 학습한 내용통계1. 단순..

내일배움캠프 2026.06.23

[본캠프] 데이터기반 QA/QC 부트캠프 29일차

1. 오늘의 학습 목표오늘은 크게 통계학 개념과 머신러닝 기초 개념을 함께 학습했다.통계학에서는 여러 확률분포와 가설검정을 중심으로 배웠고,머신러닝에서는 회귀분석 평가 지표와 모델 성능을 어떻게 판단하는지에 대해 정리했다.처음에는 분포, 검정, 회귀 평가 지표가 한 번에 나와서 조금 복잡하게 느껴졌다.특히 통계학은 이름부터 어려운 개념이 많아서 처음 볼 때는 괜히 더 멀게 느껴지는 것 같다.그래도 오늘 학습의 목표는 모든 공식을 완벽하게 외우는 것보다는,각 개념이 어떤 상황에서 사용되는지 이해하는 것에 두었다.오늘의 학습 목표는 다음과 같다.회귀분석 모델의 평가 지표를 이해한다.정규분포, t분포, 카이제곱분포, 이항분포, 푸아송분포의 특징을 구분한다.A/B 테스트와 가설검정의 기본 흐름을 이해한다.p-v..

카테고리 없음 2026.06.22

[본캠프] 데이터기반 QA/QC 부트캠프 28일차

1. 오늘 학습 목표2. 오늘 학습 한 내용오늘 학습한 내용오늘은 통계학에서 중요한 개념인 모집단과 표본, 그리고 표본오차와 신뢰구간에 대해 학습했다.처음에는 모집단과 표본이라는 단어가 그냥 통계에서 나오는 기본 용어 정도로 느껴졌는데, 내용을 보다 보니 데이터 분석에서 꽤 중요한 출발점이라는 생각이 든다.결국 우리가 데이터를 분석할 때 항상 전체 데이터를 다 가지고 있는 것은 아니다.그래서 전체를 전부 조사하지 못할 때, 일부 데이터를 뽑아서 전체를 추정하는 방식이 필요하다.모집단은 전체, 표본은 그 전체 중에서 뽑은 일부라고 생각하면 된다.1. 모집단과 표본모집단이란?모집단은 관심의 대상이 되는 전체 집단을 의미한다.예를 들어 한 국가의 모든 성인을 대상으로 조사하고 싶다면, 그 국가의 모든 성인이 ..

내일배움캠프 2026.06.19

[본캠프] 데이터기반 QA/QC 부트캠프 26~27일차

1. 오늘 학습 목표2. 오늘 학습 한 내용오늘 학습한 내용오늘은 통계학 기초와 머신러닝 기초를 함께 학습했다.처음에는 통계학과 머신러닝이 서로 다른 내용처럼 느껴졌는데, 정리해보니 두 개념은 자연스럽게 연결된다.통계학은 데이터를 이해하고 해석하기 위한 기본기이고, 머신러닝은 데이터를 바탕으로 패턴을 학습해 예측이나 분류를 수행하는 방법이다.결국 데이터 분석을 잘하려면 통계학으로 데이터를 이해하고, 머신러닝으로 데이터의 패턴을 활용할 수 있어야 한다.1. 통계학 기초1-1. 데이터 분석에서 통계가 중요한 이유데이터 분석에서 통계는 데이터를 이해하고 해석하는 데 중요한 역할을 한다.데이터를 단순히 모아두기만 하면 의미 있는 판단을 내리기 어렵다.하지만 통계를 활용하면 데이터를 요약하고, 패턴을 찾고, 이를..

내일배움캠프 2026.06.17

[본캠프] 데이터기반 QA/QC 부트캠프 25일차

1. 오늘 학습 목표2. 오늘 학습 한 내용오늘은 취업 방향과 이력서, 인턴 경험, 자격증 준비, AI면접 준비에 대한 개인 상담을 진행했다. 상담을 통해 느낀 핵심은 단순히 스펙을 많이 쌓는 것보다, 내가 어떤 직무를 목표로 하고 있는지에 맞춰 경험과 키워드를 정리하는 것이 중요하다는 점이다. 특히 요즘 채용에서는 이력서와 자기소개서가 단순히 사람이 읽는 문서가 아니라, AI 적합성 검사까지 고려해야 하는 자료라는 점이 인상 깊다. 1. 인턴 경험의 중요성상담에서 가장 먼저 강조된 부분은 인턴 경험이었다.대외활동도 의미가 있지만, 실제 취업에서는 대외활동보다 인턴 경험이 더 중요하게 평가될 수 있다.특히 단순히 아무 경험이나 쌓는 것보다, 가능하다면 네임드 기업에서의 인턴 경험이 더 강하게 작용할 수 ..

내일배움캠프 2026.06.16

[본캠프] 데이터기반 QA/QC 부트캠프 24일차

1. 오늘 학습 목표- 기초프로젝트 발표의 날~! 2. 오늘 학습 한 내용나의 간단 소감- 오늘 드디어 발표를 마쳤다. 발표는 팀원분이 해주셨는데 너무 잘해주셔서 맘에 들었다. 피드백도 꽤 긍정적인 피드백을 받아서 좋았고, 다만 아쉬운점은 충분히 우리가 넣을 수 있는 내용이었음에도 분량상빼거나 안넣어도 될것같다고 판단한 내용들인데 그 자료들을 넣었으면 좋았겠다고 하셔서 좀 아쉽지만 다음이 있는거니까. 다음엔 좀 더 완벽에 가까운 피피티로 만들어 보겠다! 그리고 오늘 다같이 미니게임을 했는데 생각보다 재밌었다ㅋㅋㅋㅋㅋㅋ 근데 나는 계속 광탈한게 웃음벨ㅋㅎㅋㅎㅋㅎㅋㅎ난 mvp와 우수 프로젝트를 노려보겠다. 딱대 발롱도르,,,,,🥇

내일배움캠프 2026.06.15

[본캠프] 데이터기반 QA/QC 부트캠프 23일차

1. 오늘 학습 목표2. 오늘 학습 한 내용오늘의 코드카타오늘은 코드카타 문제 2개를 풀었다.이번 문제에서는 반복문을 이용해 같은 문자열을 여러 줄 출력하는 방법과 최대공약수, 최소공배수를 구하는 방법을 연습한다.첫 번째 문제는 출력 형태를 정확히 맞추는 것이 중요하고, 두 번째 문제는 두 수의 관계를 이용해 계산하는 것이 핵심이다.1. 직사각형 별찍기문제 설명두 개의 정수 n, m이 주어진다.별 * 문자를 이용해서 가로 길이가 n, 세로 길이가 m인 직사각형을 출력하는 문제다.예를 들어 입력이 5 3이라면 가로로 별 5개를 출력하고, 이 줄을 총 3번 반복하면 된다.입출력 예입력5 3출력***************문제 접근이 문제는 별을 한 줄에 몇 개 출력할지, 그리고 그 줄을 몇 번 반복할지만 생각..

내일배움캠프 2026.06.12