내일배움캠프

[사전캠프] 데이터기반 QA/QC 부트캠프 5일차

min0jun 2026. 5. 4. 03:33

1. 오늘 학습 목표

- subquery, join 사용법 배우기

 

2. 오늘 학습 한 내용

  • subquery - 연산식이 길어질 때, 긴 쿼리문보다 효율적으로 사용할 때
select order_id, restaurant_name, if(over_time>0, over_time, 0) over_time
from 
(
select order_id, restaurant_name, food_preparation_time-25 over_time
from food_orders
) a
  • join - 여러 테이블에서 데이터를 불러 올 때
select a.order_id,
       a.customer_id,
       a.restaurant_name,
       a.price,
       b.name,
       b.age,
       b.gender
from food_orders a left join customers b on a.customer_id=b.customer_id
-- LEFT JOIN
select 조회 할 컬럼
from 테이블1 a left join 테이블2 b on a.공통컬럼명=b.공통컬럼명

-- INNER JOIN
select 조회 할 컬럼
from 테이블1 a inner join 테이블2 b on a.공통컬럼명=b.공통컬럼명

Left의 경우 하나의 테이블의 값이 없더라도 모두 조회, Inner Join의 경우 겹치는 값만 조회

 

 

 

Tip. 중복되는 값을 없애기 위해선 컬럼 앞에 distinct 쓰기!

 

3. 오늘의 과제

미션 3. GPT로 공정 문제 원인분석 보고서 쓰기

  • STEP 1. 시나리오 파악하기
    Q1. 2라인 불량률이 급증하기 시작한 시점?
    - 3월부터
    Q2. 그 시점 전후로 바뀐 것이 있나요? 있다면 무엇인가요?
    - 프레스기 정기 점검, 원자재 공급사 변경, 야간 조 작업자 2명 교체
    Q3. 가장 의심되는 원인은 뭐라고 생각하나요? (직관적으로)
    - 원자재 공급사 변경?
  • STEP 2. GPT로 1차 원인 분석하기
더보기
더보기

Q1. 2라인 불량률 급증 시점

데이터를 보면:

  • 1월: 1.9%
  • 2월: 2.1%
  • 3월: 4.3% (급증 시작)
  • 4월: 5.7%
  • 5월: 5.1%

급증 시작 시점은 3월
(2%대 → 4%대로 약 2배 상승)


Q2. 해당 시점 전후 변경 사항

3월 전후로 의미 있는 변화가 여러 개 존재:

1) 설비 관련

  • 3월 초: 2라인 프레스기 정기 점검 완료

2) 자재 관련

  • 3월 중순: 원자재 공급사 변경 (B사 → C사)

3) 인력 관련

  • 2라인 야간조 작업자 2명 교체

→ 즉, 설비 / 자재 / 인력 3가지가 동시에 변화


Q3. 가장 의심되는 원인

결론:

원자재 변경 (B → C)이 1순위 의심

판단 근거

1. 불량 유형 구조

  • 치수 불량 68% (압도적 비중)

→ 치수 불량은 보통:

  • 금형/설비 문제
  • 자재 물성 변화
    와 강하게 연관됨

2. 시점 정합성

  • 3월 초: 설비 점검 → 일반적으로 불량 감소 방향
  • 3월 중순: 자재 변경 이후 급격한 상승 지속

→ 설비 점검보다 자재 변경 타이밍이 더 의심스러움


3. 지속성 패턴

  • 3월: 4.3%
  • 4월: 5.7%
  • 5월: 5.1%

→ 일시적 문제가 아니라 지속적 문제

→ 인력 문제라면:

  • 교육/적응 후 안정화되는 경우 많음

→ 하지만 현재는:

  • 지속 상승 → 공정 입력(자재) 문제 가능성 높음

최종 정리

항목판단
급증 시점 3월
주요 변경 설비 점검 / 자재 변경 / 인력 교체
1순위 원인 원자재 변경 (C사 물성 문제)

 

  • STEP 3. GPT와 대화를 이어가며 심화 분석하기
    3-1. 반론 제기 프롬프트
너는 자동차 부품 제조업 품질관리 전문가야.

A사 2라인 불량률 급증 사건에 대해 나는 “3월 중순 원자재 공급사 변경(B사 → C사)이 가장 의심된다”고 판단했어.

하지만 이 결론이 틀릴 가능성도 검토하고 싶어.

다음 조건을 바탕으로 원자재 변경 외에 가능한 반론을 제기해줘.

[데이터]
- 1라인 불량률: 1월 1.8%, 2월 1.7%, 3월 1.9%, 4월 1.8%, 5월 2.0%
- 2라인 불량률: 1월 1.9%, 2월 2.1%, 3월 4.3%, 4월 5.7%, 5월 5.1%

[변경점]
- 3월 초: 2라인 프레스기 정기 점검 완료
- 3월 중순: 원자재 공급사 변경(B사 → C사)
- 2라인 야간조 작업자 2명 교체

[불량 유형]
- 치수 불량 68%
- 표면 불량 23%
- 기타 9%

다음 형식으로 답변해줘.

1. 원자재 변경이 원인이 아닐 수 있는 이유
2. 설비 점검이 원인일 가능성
3. 작업자 교체가 원인일 가능성
4. 데이터상 추가로 확인해야 할 허점
5. 최종적으로 가장 위험한 가정은 무엇인지

      3-2. 우선순위 결정 프롬프트

너는 자동차 부품 제조업 품질관리 전문가야.

A사 2라인 불량률 급증 사건에서 원인 후보가 3가지 있어.

[원인 후보]
1. 3월 초 2라인 프레스기 정기 점검 이후 설비 조건 변화
2. 3월 중순 원자재 공급사 변경(B사 → C사)
3. 2라인 야간조 작업자 2명 교체

[현상]
- 2라인 불량률이 3월부터 급증
- 1라인은 1.7~2.0% 수준으로 안정적
- 2라인은 2월 2.1% → 3월 4.3% → 4월 5.7%로 상승
- 불량 유형은 치수 불량 68%, 표면 불량 23%, 기타 9%

각 원인 후보에 대해 아래 기준으로 우선순위를 매겨줘.

[평가 기준]
- 발생 시점과의 일치성
- 불량 유형과의 연관성
- 영향 범위
- 검증 용이성
- 조치 시 기대 효과

[답변 형식]
| 원인 후보 | 시점 일치성 | 불량 유형 연관성 | 영향 범위 | 검증 용이성 | 조치 기대 효과 | 우선순위 |
|---|---|---|---|---|---|---|

마지막에 “가장 먼저 확인해야 할 원인”과 “그 이유”를 3문장 이내로 정리해줘.
  • STEP 4. 원인분석 보고서 초안 작성하기
**[ A사 2라인 불량률 급증 원인분석 보고서 ]**

작성일: 2026-05-04
작성자: 민영준

■ 현황 요약
-최근 3개월간 2라인에서 불량률이 눈에 띄게 올라감.
■ 데이터 분석
-2라인 불량률
 1월 1.9%, 2월 2.1%, 3월 4.2%, 4월 5.7%, 5월 5.1%
■ 추정 원인 (상위 3가지)

1.프레스기 고장 / 근거: 3월초 2라인 프레스기 정기 점검 완료 / 확인 방법: 프레스기 재점검
2.원자재 문제 / 근거: 3월 중순 원자재 공급사 변경 / 확인 방법: 원자재 재확인, 전 공급사와 원자재 차이점 비교
3.작업자 숙련도 부족 / 근거: 2라인 야간 조 작업자 2명 교체 / 확인 방법: 작업 환경 감독

■ 권고 조치 (우선순위 순)

1.원자재 문제 확인 / 2.작업 환경 감독 / 3.프레스기 재점검

■ 기타 의견

STEP 5. GPT로 보고서 피드백 받고 마무리하기

최종 피드백
작성한 보고서는 방향은 좋지만, 실무 보고서로는 근거와 확인 방법이 더 구체적이어야 합니다.
수치 오류 수정: 3월 4.2% → 4.3%
단정 표현 수정: 프레스기 고장 → 설비 조건 변화 가능성
확인 방법 구체화: 재확인/감독 → 성적서 비교, LOT 분석, 조건 비교, 시험 생산

 

 

[ A사 2라인 불량률 급증 원인분석 보고서 ]

작성일: 2026-05-04
작성자: 민영준

■ 1. 현황 요약
최근 3개월간 A사 2라인의 불량률이 급격히 상승하였다.
2라인 불량률은 1~2월 약 2% 수준이었으나, 3월 4.3%, 4월 5.7%, 5월 5.1%로 증가하였다.
반면 1라인은 1.7~2.0% 수준으로 안정적으로 유지되어, 2라인 특이 요인에 의한 불량 증가 가능성이 높다.

■ 2. 데이터 분석
- 1라인 불량률: 1월 1.8%, 2월 1.7%, 3월 1.9%, 4월 1.8%, 5월 2.0%
- 2라인 불량률: 1월 1.9%, 2월 2.1%, 3월 4.3%, 4월 5.7%, 5월 5.1%
- 주요 불량 유형: 치수 불량 68%, 표면 불량 23%, 기타 9%

분석 결과, 2라인은 3월부터 불량률이 급증하였으며, 주요 불량 유형이 치수 불량에 집중되어 있다.
따라서 원자재 물성 변화, 프레스 조건 변화, 금형 정렬 상태 등을 우선 확인할 필요가 있다.

■ 3. 추정 원인

1. 원자재 변경 영향
- 근거: 3월 중순 원자재 공급사가 B사에서 C사로 변경됨.
- 치수 불량은 원자재의 두께, 경도, 탄성, 마찰 특성 변화와 관련될 수 있음.
- 확인 방법:
  ① B사/C사 원자재 성적서 비교
  ② 원자재 두께, 경도, 표면 상태, LOT별 불량률 확인
  ③ B사 원자재와 C사 원자재를 동일 조건에서 시험 생산하여 불량률 비교

2. 설비 조건 변화 가능성
- 근거: 3월 초 2라인 프레스기 정기 점검 완료 이후 불량률 상승이 시작됨.
- 정기 점검 과정에서 프레스 압력, 스트로크, 금형 위치, 세팅값이 변경되었을 가능성이 있음.
- 확인 방법:
  ① 점검 전후 설비 세팅값 비교
  ② 프레스 압력 및 스트로크 측정
  ③ 금형 정렬 상태와 마모 상태 확인
  ④ 1라인과 2라인의 동일 품목 생산 조건 비교

3. 작업자 변경 영향
- 근거: 2라인 야간조 작업자 2명이 교체됨.
- 신규 작업자의 작업표준 미준수, 투입 방향 오류, 검사 누락 가능성이 있음.
- 확인 방법:
  ① 주간조/야간조 불량률 비교
  ② 작업자별 불량 발생률 확인
  ③ 작업표준 준수 여부 현장 관찰
  ④ 신규 작업자 교육 이력 및 숙련도 확인

■ 4. 권고 조치

1. B사/C사 원자재 비교 시험 실시
2. 2라인 프레스 조건 및 금형 상태 재점검
3. 야간조 작업표준 준수 여부 확인
4. LOT별, 작업조별, 설비별 불량률을 추가 분석하여 원인 후보를 좁힘

■ 5. 기타 의견

현재 데이터 기준으로는 원자재 변경과 설비 조건 변화가 가장 유력한 원인 후보이다.
다만 두 요인이 비슷한 시기에 발생했기 때문에, 단일 원인으로 단정하기보다는 원자재 LOT별 불량률과 점검 전후 설비 조건을 함께 비교해야 한다.
특히 치수 불량이 전체 불량의 68%를 차지하므로, 치수에 영향을 주는 원자재 물성과 프레스 조건을 최우선으로 검증할 필요가 있다.

 

7) 랭크게임 하다가 싸워서 피드백 남겼어요...

25.

SELECT id, user_name, satisfaction_score, feedback_date 
FROM lol_feedbacks 
ORDER BY satisfaction_score DESC

 

26.

SELECT user_name, MAX(feedback_date) 
FROM lol_feedbacks 
GROUP BY user_name

27.

SELECT COUNT(*) 
FROM lol_feedbacks 
WHERE satisfaction_score = 5

28.

SELECT user_name, COUNT(*) AS feedback_count 
FROM lol_feedbacks 
GROUP BY user_name 
ORDER BY feedback_count DESC 
LIMIT 3

29.

SELECT feedback_date 
FROM lol_feedbacks 
GROUP BY feedback_date 
ORDER BY AVG(satisfaction_score) DESC 
LIMIT 1

8) LOL을 하다가 홧병이 나서 병원을 찾아왔습니다.

30.

SELECT name 
FROM doctors 
WHERE major = ‘성형외과’

31.

SELECT major, COUNT(*) 
FROM doctors 
GROUP BY major

32.

SELECT COUNT(*) AS num_of_doctors 
FROM doctors 
WHERE hire_date <= DATE_SUB(CURDATE(), INTERVAL 5 YEAR)

33.

SELECT name, DATEDIFF(CURDATE(), hire_date) AS working_days 
FROM doctors

9) 아프면 안됩니다! 항상 건강 챙기세요!

34.

SELECT gender, COUNT(*) 
FROM patients 
GROUP BY gender

35.

SELECT COUNT(*) 
FROM patients 
WHERE birth_date <= DATE_SUB(CURDATE(), INTERVAL 40 YEAR)

36.

SELECT id, name, birth_date, gender, last_visit_date 
FROM patients 
WHERE last_visit_date <= DATE_SUB(CURDATE(), INTERVAL 1 YEAR)

37.

SELECT COUNT(*) 
FROM patients 
WHERE birth_date BETWEEN '1980-01-01' AND '1989-12-31’

 

 

나의 간단 소감

- 오늘 배운건 기억나는데 그전에 배운걸 조금씩 까먹는다.... 복습해야겠다.