테스팅에 관한 모든것

기계학습이란 무엇일까? QA가 반드시 알아야 할 머신러닝 기초 본문

STA 교육센터

기계학습이란 무엇일까? QA가 반드시 알아야 할 머신러닝 기초

STA공식블로그 2026. 3. 25. 11:17

 

 

 

“이거… QA가 꼭 알아야 하나요?”

AI 기반 서비스를 테스트하다 보면 QA가 자주 듣는 말이 있습니다.

“이 모델은 지도학습이에요.”

“비지도학습이라 기준 잡기 어려워요.”

설명을 듣고 고개는 끄덕였지만, 막상 테스트를 설계하려고 하면 이런 고민이 생깁니다.

기계학습을 모르면 테스트 설계가 어려운 걸까?

어디까지 이해해야 QA 역할을 할 수 있을까?

사실 QA가 알고리즘을 구현할 필요는 없습니다. 하지만 어떤 방식으로 학습된 모델인지 이해하지 못하면 테스트 기준 자체가 흔들릴 수 있습니다. AI 시스템은 기존 소프트웨어와 동작 방식이 다르기 때문입니다.

전통적인 소프트웨어는 개발자가 규칙을 만들고, 입력에 따라 항상 같은 결과가 나옵니다. QA는 기대 결과를 기준으로 맞다/틀리다를 판단하면 됩니다. 하지만 기계학습은 다릅니다. 규칙이 코드가 아니라 데이터에서 만들어지고, 결과는 확률적으로 달라집니다. 같은 입력이라도 결과가 바뀔 수 있습니다. 그래서 QA는 기존 테스트 방식만으로는 기준을 세우기 어려워집니다.

이 차이를 정리하면 다음과 같습니다.

 

 

✔ 기존 소프트웨어 vs 기계학습

구분
전통 소프트웨어
기계학습
규칙
개발자가 직접 정의
데이터로부터 학습
결과
결정적
확률적
테스트 기준
명확
모호할 수 있음
결과 변화
거의 없음
데이터에 따라 변함

이 차이 때문에 QA는 단순히 기능이 맞는지를 확인하는 것이 아니라, 왜 이런 결과가 나왔는지 설명하기 어려운 시스템을 다루게 됩니다. ISTQB AI Testing에서는 이러한 기계학습을 세 가지로 구분합니다.

지도학습, 비지도학습, 그리고 강화학습입니다. 중요한 점은 이 구분이 개념 설명이 아니라 QA 테스트 전략과 직접 연결된다는 것입니다. 먼저 지도학습입니다.

 

 

 

 

 

지도학습은 입력 데이터와 정답을 함께 제공하여 입력과 결과의 관계를 학습하는 방식입니다. 이미지 분류, 스팸 탐지, 음성 인식 등이 여기에 해당합니다. 정답이 있기 때문에 QA는 정확도나 재현율 같은 정량적인 지표를 활용해 평가할 수 있습니다.

다만 여기서 중요한 점은 정답 데이터 자체가 완벽하지 않을 수 있다는 것입니다. 라벨 오류나 데이터 편향이 있으면 모델도 그 문제를 그대로 학습하게 됩니다. 따라서 지도학습에서는 결과 비교뿐 아니라 데이터 품질도 함께 확인해야 합니다.

 

 

 

 

 

다음은 비지도학습입니다. 비지도학습은 정답 없이 데이터의 구조나 패턴을 찾는 방식입니다. 군집화, 이상 탐지, 고객 세그먼트 분석 등이 대표적인 예입니다. 이 경우 QA는 정답과 비교하는 테스트를 할 수 없습니다. 대신 결과가 의미 있는지, 해석 가능한지, 목적에 맞는지 판단해야 합니다. 즉 비지도학습에서는 정확도보다 결과 해석과 품질 기준 설계가 핵심이 됩니다.

 

 

 

 

강화학습입니다. 강화학습은 모델이 환경과 상호작용하면서 보상과 벌점을 통해 학습하는 방식입니다. 자율주행, 게임 AI, 추천 시스템 최적화 등이 여기에 해당합니다. 강화학습에서는 한 번의 실행 결과만으로 모델을 평가하기 어렵습니다. 중요한 것은 시간이 지나면서 행동이 어떻게 안정화되는지입니다. 따라서 QA는 단일 테스트가 아니라 시나리오 기반 반복 평가를 수행해야 합니다.

이 세 가지 유형을 QA 관점에서 정리하면 다음과 같습니다.

🔍 기계학습 유형별 QA 테스트 접근

유형
QA 테스트 접근
지도학습
정량적 성능 평가 중심
비지도학습
결과 해석 및 의미 검증
강화학습
시나리오 기반 장기 평가

이렇게 보면 왜 AI 테스트가 기존 테스트와 다르게 느껴지는지 자연스럽게 이해됩니다. 지도학습은 수치로 평가할 수 있지만, 비지도학습은 기준 자체를 정의해야 하고, 강화학습은 반복적인 행동 흐름을 검증해야 합니다. 즉 학습 방식이 곧 테스트 전략을 결정합니다. 이걸 모르면 현장에서 이런 상황이 반복됩니다.

 

왜 기준이 이렇게 모호하지?

왜 결과가 계속 바뀌지?

왜 재현이 안 되지?

 

 

하지만 실제로는 모델 문제가 아니라, 학습 방식에 맞지 않는 테스트 접근을 사용했을 가능성이 큽니다.

그래서 QA에게 필요한 것은 복잡한 알고리즘 이해가 아닙니다. 지도학습인지, 비지도학습인지, 강화학습인지 그리고 그 방식이 테스트 전략에 어떤 영향을 주는지 이해하는 것입니다. 이 차이만 이해해도 AI 테스트의 절반은 이미 이해한 것과 같습니다.

기계학습은 결국 데이터를 통해 규칙을 만들어내는 방식입니다. 그리고 QA의 역할은 그 규칙이 만들어지는 방식을 이해하고, 그에 맞는 검증 전략을 설계하는 것입니다.

다음 글에서는 “AI 성능은 왜 데이터에 따라 달라질까? QA가 데이터 품질을 봐야 하는 이유”에 대해 이어서 살펴보겠습니다. 이외의 자세한 내용을 배우고 싶으시다면 교육 신청은 STEN 홈페이지에서 확인하실 수 있습니다.

교육신청은 STEN 홈페이지에서! (www.sten.or.kr)

전화(02-6248-1701)

이메일(edu@sta.co.kr) 문의 환영!

“본 포스팅은 ISTQB AI Testing(CT-AI) 실라버스 중, 3.1 기계학습 종류(지도·비지도·강화학습) 기반으로 구성되었습니다.”