AI 시대의 학습 윤리 v2
프롬프트 허용 수업의 평가 규칙(허용/경고/부정행위)
2026-01-01
AI가 교육 현장에 들어오면서 질문이 하나 생겼다. “어디까지가 허용되는 도구 활용이고, 어디서부터가 부정행위인가?”
이번 학기 프로그래밍 수업에서는 시험에서 AI 사용을 금지하지 않았다. 대신 학생들은 자신이 사용한 프롬프트를 제출해야 했고, 결과물과 프롬프트를 함께 평가했다. 그 과정에서 한 가지 원칙이 분명해졌다.
AI 사용의 윤리 기준은 ‘AI를 썼냐/안 썼냐’가 아니라, 내가 조건을 세우고 → 실행하고 → 검증하고 → 관찰을 내 언어로 남겼는가에 달려 있다.
이 문서(v2)는 그 원칙을 수업 운영에 적용하기 위해, 평가 규칙을 3단계(허용/경고/부정행위)로 정리한 것이다.
시험 문제 소개: 두 로봇의 탐색 전략 비교
대회장은 1차원 필드이며, 위치 x에 따른 보물 가치 V(x)가 주어진다. 이 지형에는 두 개의 봉우리가 있다. 작은 봉우리는 x≈4 근처에, 큰 봉우리는 x≈15 근처에 있다.

그림 1. 보물 가치 지형 V(x): x≈4의 작은 봉우리와 x≈15의 큰 봉우리
팀 A 로봇(그리디)은 “현재보다 좋은 곳으로만 이동”하는 전략을 쓴다. 후보지의 가치가 현재보다 높으면 이동하고, 그렇지 않으면 절대 이동하지 않는다.
팀 B 로봇은 전략이 비공개다. 학생들은 블랙박스 코드를 실행하여 팀 B의 이동 데이터를 얻고, 히스토그램과 경로 그래프를 통해 팀 B의 전략을 역으로 분석해야 한다.
왜 ‘프롬프트 제출’을 요구했나: 결과의 주인을 가르는 최소 장치
AI를 사용하면 결과물은 쉽게 그럴듯해진다. 그래서 나는 “AI를 쓰지 마라”가 아니라, “어떤 질문을 했는지(프롬프트)와 무엇을 확인했는지(검증 흔적)를 함께 제출하라”로 방향을 잡았다.
핵심은 이것이다.
· AI는 일반론을 잘 만든다.
· 하지만 이 데이터에서 실제로 무엇이 보였는지(어떤 패턴이 나타났는지)는, 실행·그래프·수치 근거가 있을 때만 구별된다.
평가 규칙(3단계): 허용 / 경고 / 부정행위
아래 기준은 “AI 사용 여부”가 아니라 학습 과정의 증거(재현성·검증·관찰)를 평가한다.
1) 허용(OK): 도구 활용 + 재현 가능한 검증 + 관찰이 남아 있다
다음 중 2개 이상이 명확하면 “허용”으로 본다.
· 조건이 명시된 프롬프트(규칙/제약/반복/seed 등)
· 실행 흔적(코드, 출력, 그래프, 표)
· 관찰의 구체성(예: x≈4, x≈15 등 위치/수치가 들어감)
· 검증 문장(“단서/힌트 조건을 만족하는지 확인” 같은 체크)
예를 들어 코드 작성에서 좋은 프롬프트는 이런 형태다.
현재 위치 x,
xcand = x + N(0,2)에서 난수 생성,
v(xcand)와 v(x)를 비교해서 전자가 크면 이동, 그렇지 않으면 제자리.
현재 위치 x를 저장하는 for문 작성해줘.
반복 횟수는 10000번, set.seed(20251217), 탐색 범위는 2로 해줘.
이 프롬프트가 좋은 이유는 “문제 이해”가 문장으로 드러나고, seed/반복 수가 있어 결과를 재현할 수 있기 때문이다. AI는 여기서 구현 도구 역할을 하고, 학생은 조건 설정과 검증을 담당한다.
2) 경고(Warning): 그럴듯하지만 ‘근거’가 약하다 (감점 또는 보완 요구)
다음 경우는 “경고”로 분류한다.
· 프롬프트가 모호하거나 “코드 짜줘/요약해줘” 수준에서 멈춤
· 결과 서술이 일반론 중심(예: Local/Global Optima 등)인데 그래프/수치/관찰이 거의 없음
· 실행은 했더라도, 검증 기준(무엇을 보면 맞는지)이 글에 없음
예: “팀 B는 가끔 손해를 보더라도 이동하는 전략이라 Local Optima를 탈출합니다.” 이 문장은 틀린 말은 아닐 수 있지만, 이 데이터에서 실제로 보이는 패턴인지가 확인되지 않는다. 이 경우에는 근거(그래프/수치) 추가를 요구하거나 감점할 수 있다.
3) 부정행위(Academic misconduct): 사고 과정 자체를 AI에 위임했고, 검증 흔적이 없다
다음은 “부정행위”로 본다(또는 강한 제재 대상으로 본다).
· “내 생각을 대신 써줘” 유형의 프롬프트(예: “대학생처럼 써줘”, “내 생각이 들어가게 써줘”, “말투만 바꿔줘(근거 없이)”)
· 결과물에 재현 가능한 실행 흔적이 없음(코드/그래프/표 없음)
· 관찰이 아니라 정답 문장만 존재(근거 없이 결론만)
핵심은 “AI를 썼다”가 아니라, 검증 가능한 근거 없이 ‘사고의 주체’를 넘겼는가다.
좋은 사용의 대표 사례: [문제 5] 공식 검증(수치로 단서를 체크)
나는 특히 학생들이 공식을 ‘설명’으로 끝내지 않고, 숫자를 넣어 검증한 답안을 높게 평가한다. 왜냐하면 이건 “답변 생성”이 아니라 “단서 충족 여부 확인”이라는 검증 행위이기 때문이다.
(이동 확률 공식)
팀 B의 이동 확률 결정 공식: P = V(x_cand) / V(x)
후보지 가치가 현재와 비슷하면 P가 1에 가까워지고, 후보지가 형편없으면 P가 0에 가까워진다.
공식 검증(두 가지 상황)
1. 검증 1: 가치 차이가 적을 때(비슷하게 나쁠 때)
· 상황: V(x_cand) = 0.8, V(x) = 1.0
· 계산: P = 0.8 / 1.0 = 0.8
· 해석: → 80% 확률로 이동(조금 나쁜 길은 자주 시도)
2. 검증 2: 가치 차이가 클 때(많이 나쁠 때)
· 상황: V(x_cand) = 0.1, V(x) = 1.0
· 계산: P = 0.1 / 1.0 = 0.1
· 해석: → 10% 확률로 이동(너무 나쁜 길은 드물게 시도)
이런 답안은 “AI가 준 문장”처럼 보일 수 있다. 하지만 핵심은 문장 솜씨가 아니라, (1) 단서와 연결했고 (2) 수치로 검증했다는 점이다. 즉, 검증 행위가 답안에 남아 있다.
데이터 기반 관찰의 증거: ‘구체성’은 그래프에서 나온다
AI를 사용하든 말든, 제출물에서 가장 강하게 드러나는 차이는 이것이다.
• 데이터를 본 답안: 구체적인 위치/수치/패턴이 있다.
• 데이터를 보지 않은 답안: 일반론은 많지만 구체성이 비어 있다.
예를 들어 팀 A(그리디)는 아래처럼 방문 분포가 x≈4에 몰리는 패턴을 보인다.

그림 2. 팀 A(그리디)의 방문 분포가 x≈4에만 집중 - 작은 봉우리에 고착(지역 최적해)
팀 B는 경로 그래프에서 어느 시점에 x≈4 부근을 벗어나 x≈15 근처로 이동하는 패턴이 관찰된다(점프처럼 보이는 변화가 나타남).

그림 3. 팀 B의 초기 경로(일부) - x≈4 부근에서 탐색하다가 x≈15로 이동 후 머무는 패턴
결론: 공유 가능한 한 줄 규칙
AI는 도구다. 도구는 사용할 수 있다. 하지만 평가(그리고 학습)는 “그럴듯함”이 아니라 검증 가능한 흔적을 기준으로 해야 한다.
프롬프트는 허용하되, 평가는 “재현 가능한 실행 흔적(코드·그래프·수치) + 관찰”로 한다.
이 기준을 세우면 논쟁이 줄어든다. “AI를 썼냐”가 아니라 “학생이 무엇을 이해했고 무엇을 검증했는가”로 이동하기 때문이다.
부록: 빠른 체크리스트(교수/조교/학생 공용)
· 프롬프트에 규칙/제약/반복/seed가 있는가?
· 실행 결과(코드/그래프/표)가 제출물에 포함되는가?
· 관찰이 구체적인가? (위치·수치·패턴)
· 단서/가설을 수치로 검증했는가? (예: 0.8/0.1 계산)
· 설명이 일반론으로만 끝나지 않는가?
'AI와 교육의 방향' 카테고리의 다른 글
| AI 시대, 어떤 인재를 원하는가 (1) | 2026.01.23 |
|---|---|
| AI를 써서 데이터를 다룰 때, 무엇이 나의 것으로 남는가 (0) | 2026.01.05 |
| AI를 허용한 평가에서 주의할 점 (0) | 2026.01.05 |
| AI 시대의 학습 윤리:도구 활용과 사고 위임의 경계 (1) | 2026.01.02 |
| 시대 별 디지털 교육과 수학교육 (2) | 2025.07.26 |