# AI 한글 티 분류 체계 v1.5.1 (Korean AI-Tell Taxonomy) LLM(ChatGPT·Claude·Gemini 등)이 생성한 한글 글에서 반복적으로 관찰되는 "AI 티" 패턴을 10개 대분류 × 서브 패턴으로 정리한다. 탐지기·윤문가·리뷰어가 공유하는 단일 진실 원천(SSOT). 각 패턴마다 (1) 정의, (2) 시그니처 예문, (3) 심각도(S1 결정적 / S2 강함 / S3 약함), (4) 윤문 처방을 제공한다. > **v1.5.1 추가 (2026-04-27):** Category E에 `E-4 단문 일변도 (복문·중문 부재)` [S2] 신설. 인간 필자는 단문과 복문을 무의식적으로 섞어 호흡을 만드는데, AI가 "간결하게" 의도하면 단문만 늘어놓아 끊어진 리듬이 그 자체로 시그니처가 된다. > > **v1.5 변경 (2026-04-26):** v1.2 voice profile · v1.3 candidate pool · v1.3.1 권한 위계는 모두 제거됐다. 이유는 핫패스 비용. v1.5는 v1.1 5인 파이프라인 구조 + monolith fast 1콜로 단순화됐고, 분류 체계 본진(이 파일)은 v1.3.1까지 발굴된 신규 패턴(C-9·C-10·D-7·H-3·I-3·I-4 보강 등)을 그대로 유지한다. ## 심각도 기준 - **S1 결정적(critical)**: 한 번만 나와도 "이건 AI"라고 거의 확신하게 되는 패턴. 무조건 제거. - **S2 강함(high)**: 1~2회는 자연스러울 수 있으나 문서에서 3회 이상 반복되면 티 남. 밀도 기반 제거. - **S3 약함(low)**: 개별로는 문제 아님. 다른 패턴과 중첩될 때 AI 인상을 강화. 리듬 조정 수준. ## 목차 A. 번역투(Translation-ese) B. 영어 인용·용어 과다 C. 구조적 AI 패턴 (서식·레이아웃) D. AI 특유의 관용구 (Signature Phrases) E. 리듬·문장 길이 균일성 F. 과도한 수식·중복 G. 과도한 Hedging (완곡) H. 접속사 남발 I. 형식명사·의존명사 과다 J. 시각 장식 남용 --- ## A. 번역투 (Translation-ese) — S1~S2 영어·일본어식 구문을 한국어 어순·조사 체계로 무리하게 옮긴 흔적. AI 글의 가장 결정적 시그니처. ### A-1. "~에 대하여/대해서" 남발 [S1] - 패턴: `X에 대해(서) Y` (영어 `about/regarding X`) - 예: "AI 규제**에 대해** 논의할 필요가 있다" → "AI 규제를 논의해야 한다" - 처방: 목적격 조사로 직결. 또는 주제 조사 "는". ### A-2. "~를 통하여/통해" 남발 [S1] - 패턴: 수단·경로를 거의 모두 "통해"로 처리 (영어 `through/via`) - 예: "데이터 분석**을 통해** 인사이트를 얻는다" → "데이터를 분석해 인사이트를 얻는다" - 처방: "~로", "~해서", "~함으로써" 등으로 분산. ### A-3. "~에 있어(서)" [S1] - 패턴: 전제·상황 도입 (영어 `in terms of / when it comes to`) - 예: "이 문제**에 있어서** 중요한 것은" → "이 문제에서 중요한 것은" / "이 문제를 볼 때" ### A-4. "~라는 점에서" [S2] - 패턴: 근거 제시 (영어 `in the sense that`) - 예: "확장성이 뛰어나**다는 점에서** 의미가 있다" → "확장성이 뛰어나서 의미가 있다" - 주의: 때로는 자연스러움. 한 문서에 3회+ 반복될 때만 제거. ### A-5. "~와 관련하여" / "~와 관련된" [S2] - 패턴: 주제 지시 (영어 `regarding / related to`) - 예: "보안**과 관련하여** 주의해야 한다" → "보안에 주의해야 한다" ### A-6. "~에 기반하여" / "~을 바탕으로" 남발 [S2] - 패턴: 근거 (영어 `based on`) - 예: "데이터**에 기반하여** 판단한다" → "데이터로 판단한다" / "데이터를 보고 판단한다" ### A-7. "가지고 있다" [S1] - 패턴: 소유·특성 서술 (영어 `have/possess`) - 예: "강한 경쟁력을 **가지고 있다**" → "경쟁력이 강하다" - 처방: 형용사형으로 돌려 서술어 없애거나 "있다"로 단순화. ### A-8. 이중 피동 "~되어진다" / "~지게 된다" [S1] - 예: "판단**되어진다**" → "판단된다" / "판단한다" - 처방: 가능하면 능동으로. 못 바꾸면 단일 피동. ### A-9. "~에 의해" 피동문 [S2] - 패턴: by-passive (영어 수동태 직역) - 예: "AI**에 의해** 생성된 이미지" → "AI가 만든 이미지" - 처방: 행위자를 주어로 복귀. ### A-10. "~할 수 있다" 남발 [S2] - 패턴: 가능형 서술 (영어 `can/be able to`) - 예: "효율을 높**일 수 있다**. 비용을 줄**일 수 있다**. 시간을 단축**할 수 있다**." - 처방: 확정 서술 ("높인다", "줄인다")로 톤 전환. 꼭 가능성을 말할 때만 남김. ### A-11. "~을 위해" 목적절 남발 [S2] - 패턴: `X을 위해 Y한다` (영어 `in order to`) - 예: "고객 만족**을 위해** 노력한다" → "고객이 만족하도록 일한다" ### A-12. "만들어지다" / "이루어지다" [S2] - 패턴: 자동화된 피동 - 예: "합의가 **이루어졌다**" → "합의했다" / "합의에 이르렀다" ### A-13. 명사 나열 (조사 생략) [S2] - 패턴: 영어식 명사구를 조사 없이 붙임 - 예: "AI 기술 발전 속도 가속화" → "AI 기술의 발전 속도가 빨라지고 있다" - 처방: 적절한 조사("의", "가", "를") 복원. ### A-14. 접속부사 "그리고" 절 연결 [S2] - 패턴: 영어 `and`처럼 "그리고"로 평문 연결 - 예: "그는 보고했다. **그리고** 자리에 앉았다." → "그는 보고하고 자리에 앉았다." - 처방: "-고", "-며", "-면서" 등 연결어미로 압축. ### A-15. 추상 주어 + 만능 동사 [S2] · v1.1 신규 - 패턴: 영어 `The X shows / provides / brings Y` 직역. 주어가 사건·현상이고 술어가 "보여준다·제공한다·가져온다·시사한다" - 예: "DeepSeek-V4**의 등장은** ~을 **보여줍니다**" / "이 전략**은** 지형**을 흔들고 있습니다**" / "X**는** Y**를 제공합니다**" - 처방: 주어를 행위자(사람·팀·회사)로 돌리거나, 주어·동사 자체를 없애고 직접 서술. "DeepSeek는 ~ 원칙을 이렇게 증명했다" 식. --- ## B. 영어 인용·용어 과다 — S2 ### B-1. 괄호 병기 관습 [S2] - 패턴: 처음 등장할 때 모든 전문용어에 영어 병기 - 예: "인공지능**(AI)**은 거대언어모델**(LLM)**과 다르다." - 처방: 해당 문서가 전문 독자 대상이면 1회만 병기, 이후 한국어만. 일반 독자 대상이면 영어 병기 자체를 최소화. ### B-2. 영어 용어 비번역 [S2] - 패턴: `pipeline`, `framework`, `leverage`, `seamless`, `robust` 등 한국어로 쓸 수 있는데 영어 그대로. - 예: "이 **framework**를 **leverage**하여" → "이 체계를 활용해" - 예외: 고유명사·업계 표준 용어(Transformer, API, SDK 등)는 유지. ### B-3. 과도한 영어 인용구 [S2] - 패턴: 영어 문장을 인용문으로 그대로 박아넣고 번역도 병기 - 처방: 정말 원문 어감이 필요한 경우가 아니면 한국어로 풀어쓰고 출처만 병기. ### B-4. "~라고 알려진", "~로 일컬어지는" [S3] - 패턴: 영어 `known as / so-called` 직역 - 예: "**'AGI'라고 알려진** 범용 인공지능" → "범용 인공지능(AGI)" --- ## C. 구조적 AI 패턴 (서식·레이아웃) — S1~S2 ### C-1. 기계적 병렬 열거 [S1] - 패턴: "첫째, ~. 둘째, ~. 셋째, ~."가 문단 전체를 지배. - 처방: 3개 중 1~2개만 서술문으로 녹이거나, "우선 / 다음으로 / 마지막으로" 등으로 어휘 변주. 열거가 꼭 필요하면 유지하되 각 항목 길이·구조를 일부러 흐트러뜨림. ### C-2. 과도한 불릿 리스트 [S2] - 패턴: 에세이·칼럼·리포트에서 3개 이상 연속 불릿 블록. - 처방: 불릿을 산문으로 "녹이기". 정말 나열이 의미 있는 지점만 남김. ### C-3. 반복적 섹션 헤딩 [S2] - 패턴: `## 도입 ## 본론 ## 결론` 같은 도식적 분절. - 처방: 산문형 글이면 헤딩 자체를 제거. 리포트형이면 헤딩 문구를 구체화("AI 규제의 세 가지 균열점"). ### C-4. 문단 첫 문장 요약 공식 [S2] - 패턴: 매 문단 첫 문장이 그 문단의 요약(topic sentence). 영어 작문 교본식. - 처방: 일부 문단은 사례·장면·인용으로 시작하도록 순서를 흐트러뜨림. ### C-5. 이모지 남발 [S1] - 패턴: `✅ 🚀 💡 ⚠️ 📊` 같은 이모지가 리스트 머리·헤딩·강조에 박혀 있음. - 처방: 에세이/리포트 문맥이면 전량 제거. SNS·제품 카피가 아닌 이상 AI 티가 극단적으로 강함. ### C-6. 헤딩 아래 한 줄 요약 박스 [S2] - 패턴: 모든 섹션 헤딩 직후 "이 섹션에서는 ~를 다룬다" 같은 안내문. - 처방: 삭제. 본문이 바로 들어가야 한국어 글답다. ### C-7. 문단 간 기계적 "먼저·반면·결국" 3단 공식 [S2] · v1.1 신규 - 패턴: 문단 문두가 순서대로 "먼저 ~ / 반면 ~ / 결국 ~" 또는 "첫째 ~ / 둘째 ~ / 마지막으로 ~"로 고정. 한국 필자도 가끔 쓰나, 3연속 이상이면 AI 특유. - 예: 본 문서 v1 초안 (문단 2 "먼저", 문단 3 "반면", 문단 6 "결국") - 처방: 3개 중 2개 삭제. 순서 의미는 문단 자체 흐름으로 전달. 문두 접속사 없는 문단도 섞음. ### C-8. 대칭 대구 공식 "A인가, B인가" 반복 [S2] · v1.1 신규 - 패턴: 동일 문서에서 이항 대립이 3회 이상 평행구로 반복. 영어 수사학 직역. - 예: "독점**인가**, 확산**인가**" / "전략가에게는 ~, 입안자에게는 ~" / "누가 더 ~, 누가 더 ~" - 처방: 3개 중 2개는 비대칭으로 재배치. 한쪽만 질문형·다른 쪽은 서술형으로 섞거나, 한쪽을 더 길게 풀어쓰고 다른 쪽은 짧게. ### C-9. 숫자 괄호 인덱싱 "1) 2) 3)" [S2] · v1.3 신규 - 패턴: 동일 문단 또는 인접 문장에서 항목을 `1) ... 2) ... 3) ...` 형식으로 나열. C-1(첫째·둘째·셋째)·C-2(불릿)와 별개의 표기 시그니처. 한국어 인간 필자도 보고서에서 가끔 쓰지만, LLM 산출물에서는 3개 항목이 있을 때 거의 자동으로 숫자 괄호 인덱싱이 등장하는 빈도가 압도적으로 높음. - 예: "**1)** 표준화된 인프라가 일반화되면서 학습 데이터 확보가 용이해졌다. **2)** 도메인 특화 LLM이 성숙하면서 비정형 텍스트의 활용 범위가 넓어졌다. **3)** 클라우드 GPU 단가가 크게 하락하면서 자체 학습이 비용 측면에서 정당화 가능한 수준에 들어왔다." - 처방: 3개 중 1개는 서술문으로 녹이고, 나머지 2개도 1)·2) 표기 대신 "우선~", "다음으로~" 형식으로 어휘 변주. 정말 동일 구조 나열이 의미 있을 때만 숫자 괄호를 유지하되 한 문서에 1회 이하. ### C-10. 콜론 부제 헤딩 공식 "X: Y" 또는 "X: A에서 B로" [S2] · v1.3.1 신규 - 패턴: 헤딩에 거의 자동으로 콜론을 사용해 "메인 라벨: 부제" 또는 "메인 라벨: 주제 명사구" 형태로 구조화. C-3(반복 헤딩) 인접하지만 별개 — C-3는 도식적 분절(`## 도입 ## 본론 ## 결론`)이고 C-10은 헤딩 자체에 메타 라벨 + 콜론 + 부제를 박는 공식. Gemini-우세 시그니처(회차 3 검증). - 예: "### **서론**: 제조업의 미래, AI에 달려있다" / "### **본론 1**: 빛과 그림자, 대기업과 중소기업의 디지털 격차" / "## 2026년 핀테크, '일상'을 넘어 '생태계'로 진화하다" - 처방: 헤딩에서 콜론 + 부제 자체를 제거하고 단일 명사구·동사구로 압축. 정말 부제가 필요하면 (a) 본문 첫 문장에 녹이기, (b) 콜론 대신 — 또는 줄바꿈 활용. 한 문서에 콜론 부제 헤딩 1회 이하. --- ## D. AI 특유의 관용구 (Signature Phrases) — S1 한국어 인간 필자가 거의 쓰지 않지만 LLM이 반복적으로 산출하는 상투구. 발견 즉시 교체. ### D-1. 종결·요약류 - "결론적으로", "요약하면", "종합하면", "정리하자면" - "~라고 할 수 있다" / "~라고 볼 수 있다" - "~라 하겠다", "~라 할 것이다" - "~에 다름 아니다" ### D-2. 의의·중요성 과장 - "매우 중요하다", "반드시 기억해야 한다" - "시사하는 바가 크다", "주목할 만하다" - "간과할 수 없다", "무시할 수 없다" - "~의 지평을 연다", "~에 방점을 찍는다" - "그 의미가 적지 않다", "의미심장하다" ### D-3. 열거 도입 - "크게 세 가지로 나눌 수 있다" - "다음과 같은 특징을 가진다" - "다음과 같이 요약할 수 있다" ### D-4. AI 티 특화 - "혁신적인", "획기적인", "전례 없는" (hype 어휘) - **Gemini-우세 hype 어휘 셋 (v1.3.1 보강)**: "압도적·막강한·폭발적·파격적·대대적·강력한·치열한·뜨거운" - "**압도적** 1위 카카오뱅크는 ~ **막강한** 월간 활성 이용자(MAU)" - "**파격적인** 예적금 금리" - "**폭발적인** 호응을 얻고 있다" - "**대대적인** 개편이 필요합니다" - "~의 가능성을 열어준다" - "~의 새로운 장을 열다" - "~시대가 도래했다" ### D-5. 의인화된 추상 주어 [S2] · v1.1 신규 - 패턴: 사건·기술·개념을 주어로 삼아 인간 행위처럼 서술. AI가 글을 "무게감 있게" 보이게 하려는 기본 동작. - 예: "**두 지능의 충돌**이 질문을 **던집니다**" / "**AI 대전**이 **끝나지 않습니다**" / "**지능의 가성비**가 **증명합니다**" - 처방: 실제 행위자로 주어 교체("두 회사의 경쟁은", "엔지니어들은"), 또는 의인화 동사 약화("던집니다"→"남습니다"·"생깁니다"). 단, 상징적 제목·요약 1회 정도는 허용. ### D-6. 완결 공식형 결말 "~할 때입니다 / 시점입니다" [S2] · v1.1 신규 - 패턴: 칼럼·리포트 마지막 문장이 "~해야 할 때입니다", "~로 나아갈 시점입니다", "~할 순간입니다" 공식. - 예: "에이전트 정부의 시대로 **나아가야 할 때입니다**" - 처방: 동일 의미를 구체 동사 단언으로. "에이전트 정부 단계로 **넘어갈 때입니다**" 정도까지는 허용(덜 과장). 한 문서에 한 번만. ### D-7. 변환 공식 "X에서 Y로 / X을 넘어 Y로" [S2] · v1.3.1 신규 - 패턴: 패러다임 전환·진화·고도화를 표현할 때 거의 자동으로 사용. D-1·D-2·D-6와 별개의 결산/슬로건 공식. C-8(A인가 B인가, 질문형)과도 다른 시그니처 — **변환의 방향성**을 강조. Gemini-우세 시그니처(회차 3 검증, 7회·2도메인 분산). - 예: "**'규모의 경쟁'에서 '전략의 경쟁'으로**", "**'지식 전달자'에서 '학습 조력자'로**", "**'무엇을'에서 '어떻게'로**", "**'데이터 조회'를 넘어 '맞춤형 금융 비서'로**" - 처방: 변환 공식을 직접 단언으로 (예: "'지식 전달자'에서 '학습 조력자'로" → "교사는 더 이상 지식 전달자가 아니다. 학생 곁에서 학습을 돕는다"). 한 문서에 변환 공식 1회 이하. 정말 패러다임 전환이 핵심 메시지일 때만 본문 결산에서 1회. **처방:** 대부분 **삭제**. 의미가 필요하면 구체 명사·동사로 치환("중요하다"→"핵심이다" 혹은 구체 근거로). --- ## E. 리듬·문장 길이 균일성 — S2 ### E-1. 문장 길이 표준편차 낮음 - 모든 문장이 30~50자 부근에 몰려 있음. - 처방: 의도적으로 단문(10~15자) 1~2개를 문단마다 끼워 넣어 리듬 변주. 장문(80자+) 1개도 혼용. ### E-2. 동일 종결어미 반복 - "~이다. ~이다. ~이다." - "~한다. ~한다. ~한다." - 처방: "~다"·"~았다"·"~인 것"·명사형 종결을 섞음. 인간 필자는 무의식적으로 변주함. ### E-3. 모든 문단 3~4문장 공식 - 문단 길이도 균일. - 처방: 1문장 문단 / 6문장 문단을 의도적으로 섞음. ### E-4. 단문 일변도 (복문·중문 부재) [S2] · v1.5.1 신규 - 패턴: 문장 대부분이 단문(주어-서술어 1쌍)으로만 끊어져 있고 연결어미·관형절·인용절을 활용한 복문·중문이 거의 없음. "간결하게 써라" 지시를 받았거나 짧은 호흡을 의도한 AI 출력에서 빈출. 인간 필자는 단문과 복문을 무의식적으로 섞어 호흡을 만들기 때문에, 단문만 줄지어 나오는 리듬 자체가 시그니처가 된다. E-1(길이 균일성)과 짝패턴 — E-1은 길이의 표준편차, E-4는 구조의 단조성을 지적. - 예: "AI는 빠르게 발전한다. 기업은 따라가야 한다. 시간이 없다. 데이터가 핵심이다. 인재도 부족하다." - 비교(인간 톤): "AI가 빠르게 발전하는 가운데 기업은 따라가야 한다. 시간은 없고 데이터는 핵심이며, 인재마저 부족하다." - 처방: 인접한 단문 2~3개를 연결어미("-며·-고·-는데·-면서·-자")·관형절("~하는 N", "~인 N")·인용절·조건절로 묶어 복문화. 단문 비중을 60% 전후로 조절하고 복문·중문을 30% 이상으로. 단문은 강조·전환·결정타에만 의도적으로 사용. --- ## F. 과도한 수식·중복 — S2 ### F-1. 정도부사 중독 - "매우", "정말", "진짜로", "대단히", "극히" - 처방: 대부분 삭제. 강조가 필요하면 구체 수치·사례로 대체. ### F-2. 동의어 이중 수식 - "중요하고 핵심적인 역할" - "새롭고 혁신적인 접근" - "지속적이고 꾸준한 노력" - 처방: 두 수식어 중 하나만 남김. ### F-3. 기능+역할 복합구 - "~로서의 역할과 기능" - "~의 의미와 가치" - 처방: 하나만. ### F-4. 과잉 접두·접미 - "~적 측면", "~적 관점" - "~성(性)", "~화(化)" 남발 - 예: "**근본적 관점**에서 **구조적 변화**가 **필연적**이다" → "구조가 근본부터 바뀐다" ### F-5. "~적 N" 복합 추상어 체인 [S2] · v1.1 신규 - 패턴: 명사 앞 "~적 N" 형태가 한 문서에 3회 이상 반복. F-4와 달리 추상 관형("적 측면/관점")이 아닌 **구체 명사 앞 "~적 N"** 체인. 원문의 지적 권위를 AI가 흉내 낼 때 빈출. - 예: "에이전트**적** 자율성", "기술**적** 안정성", "경제**적** 자립", "기술**적** 토대", "시스템**적** 접근", "구조**적** 변화" - 처방: 해당 "~적 N"을 (a) "~로서의 N" ("에이전트로서의 자율성"), (b) 동사구 ("기술이 얼마나 안정적인가"), (c) 구체 명사 ("토대") 중 하나로 해체. 문서 전체에서 "~적 N" 밀도를 절반 이하로. --- ## G. 과도한 Hedging (완곡) — S2 ### G-1. 추측·관측형 종결 - "~할 수 있을 것으로 보인다" - "~인 것으로 판단된다" - "~라고 여겨진다" - "~인 듯하다"가 모든 문장 끝에 붙음 - 처방: 단언할 수 있는 곳은 단언. hedging은 정말 불확실한 지점에만. ### G-2. 이중·삼중 완곡 - "~할 가능성이 있을 수 있다" - "~로 보여질 수 있다" - 처방: 하나만 남김. --- ## H. 접속사 남발 — S2 ### H-1. 문두 접속사 과다 - 매 문장·매 문단 시작에 "또한", "따라서", "즉", "나아가", "아울러", "게다가", "더욱이" - 처방: 70% 이상 제거. 논리 흐름은 문장 내용 자체로 드러나야 함. 정말 역접·인과 강조가 필요할 때만. ### H-2. "하지만"과 "그러나" 혼용 남발 - 역접이 문단마다 등장. - 처방: 반절 이상 삭제. 대비가 자명하면 접속사 없이도 통함. ### H-3. "이는 ~" 지시 반복 - "이는 ~을 의미한다" - **메타 진입 변종 (v1.3 보강)**: "이 점에서 ~ / 이 관점에서 보면 ~ / 이 말은 ~" — 본진 H-3와 같은 기능(앞 문장을 받아 부연 설명)이지만 형태소가 다른 결합형 - "**이 관점에서 보면** AI 시대 유망 직무도 다시 보인다" - "**이 말은** 결국 기술 도입보다 인력 전환이 더 큰 병목이 될 수 있다는 뜻이다" - "**이 점에서** 앞으로 강해질 인재는 크게 다섯 부류다" - 처방: 앞 문장과 붙이거나 구체 서술로 치환. 결합형도 동일 처방 — 메타 진입 자체를 삭제하고 본 서술로 직진. ### H-4. 재정의 접속사 "즉" 남발 [S2] · v1.1 신규 - 패턴: 영어 `i.e.` / `that is` 직역. 보충 설명이 필요할 때마다 "즉"을 앞에 붙임. - 예: "AI 민주화, **즉** 경제성 측면에서" - 처방: "곧", "말하자면", "다시 말해", "바꿔 말하면"으로 어휘 변주. 또는 아예 생략하고 앞뒤를 쉼표로만 연결. 한 문서에 "즉" 2회 이하로 제한. --- ## I. 형식명사·의존명사 과다 — S2 ### I-1. "것이다" 종결 남발 - "~한 것이다", "~일 것이다"가 문단의 대표 종결. - 처방: 확정 서술로. "~다"로 끝맺음. ### I-2. "점", "바", "수", "데" 반복 - "주목할 **점**은", "나아갈 **바**는", "할 **수**가 있다", "하는 **데**에" - **결합형 변종 (v1.3 보강)**: "X은 ~라는 **점에 있다**" 강조 위치 서술 - "핵심은 진입장벽이 빠르게 낮아지고 있다**는 점에 있다**" - "의의는 표준화가 사업장별로 들쭉날쭉하다**는 점에 있다**" - "주목할 부분은 수익 모델이 정착되지 않았다**는 점에 있다**" - 처방: 구체 명사·동사로 치환 또는 삭제. 결합형은 "X은 ~다" 형태 단언으로 직결. ### I-3. "~라는 것" - "변화가 크**다는 것이다**." - **결말 단언 변종 (v1.3 보강)**: "~라는 뜻이다 / ~다는 뜻이다" — GPT가 결산 문장을 형식명사로 마무리할 때 거의 자동으로 등장 - "기술 도입보다 인력 전환이 더 큰 병목이 될 수 있**다는 뜻이다**" - "한국에서는 이 문제가 더 민감하**다는 뜻이다**" - "더 큰 시장은 응용 산업에서 나올 가능성이 높**다는 뜻이다**" - 처방: "변화가 크다." (종결어미 직결). 결말 변종은 "~다" 직접 종결로 (예: "병목은 인력 전환이다"). 한 문서에 형식명사 결산("~다는 것이다 / ~다는 뜻이다 / ~다는 점이다") 합산 2회 이하. ### I-4. "~할 필요가 있다" + 정책 보고서 권고형 결말 - 영어 `should/need to` 직역. - **권고형 결말 변종 (v1.3.1 보강)**: "~해야 한다 / ~해야 합니다"가 정책·보고서 결말마다 자동 등장. **한 문서에 5회 초과 시 S2 강화** (자동 생성 시그니처). - "공유 플랫폼을 **구축해야 한다** / 바우처 지원 사업을 대폭 확대하여 ~ **낮춰야 한다** / 핵심 인재를 양성하는 것이 **중요하다**" - "균형을 **맞춰야 합니다** / **구축해야 합니다** / **마련해야 합니다** / **지원해야 합니다**" - 처방: "~해야 한다 / ~해야 합니다"를 (a) 구체 동사 단언("~를 시급히 추진"), (b) 주체 명시 동사("정부는 ~를 도입한다"), (c) 조건문("~이 충족되면 ~가 가능하다") 중 하나로 변주. 한 문서 5회 초과 권고형 결말은 회피. ### I-5. "~이/가 필요하다" - "혁신이 필요하다", "변화가 필요하다" - 처방: 누가 무엇을 해야 하는지 주어·동사로 구체화. ### I-6. "~능력" 추상명사 연쇄 [S2] · v1.1 신규 - 패턴: "N 능력"이 한 문서에 3회 이상 반복되며 동사 대신 명사구로 능력을 서술. 영어 `ability to X / X capability` 직역 감성. - 예: "사고 **능력**", "워크플로우 수행 **능력**", "장기 문맥 유지 **능력**", "추론 **능력**" - 처방: 동사형으로 풀기. "사고 능력은 뛰어나다" → "잘 사고한다" / "사고의 수준이 높다". "워크플로우 수행 능력" → "워크플로우를 얼마나 잘 처리하는지". 한 문서에 "~능력" 2회 이하로 제한. --- ## J. 시각 장식 남용 — S2~S3 ### J-1. 과도한 **볼드** - 문장마다 핵심 단어 볼드. - 처방: 본문에서 볼드는 거의 제거. 시각적 소음만 발생. ### J-2. 따옴표 과다 - 개념어·강조어에 "" 남발. - **빈도 임계 명시 (v1.3.1 보강)**: 한 문서에 따옴표 강조 어휘 **5회 초과 시 S2 강화**. Gemini는 한 문서에 17~33회 사례(예: "'옥석 가리기'·'금융 슈퍼앱'·'데이터 피로감'·'규제 샌드박스'·'무대 위의 현자'·'곁에서 돕는 안내자'·'학습 경험 설계자'"). - 처방: 진짜 인용·특수 용례에만 한정. 개념어 강조는 (a) 본문 흐름에 녹이거나 (b) 첫 등장 시 1회만 따옴표 사용 후 이후 한국어 평문으로. ### J-3. 대시(—) 남용 - 영어 em-dash 스타일 부가 설명. - 예: "AI는 도구 — 그 이상도 이하도 아닌 — 이다" - 처방: 쉼표·괄호·별도 문장으로 분해. 1문서에 1~2회 이하. ### J-4. 괄호 부연 과다 - "(이는 ~을 의미한다)" 같은 부연이 반복. - 처방: 괄호 부연 대부분 본문화 또는 삭제. --- ## 탐지 출력 스키마 (Detector → Rewriter 공유 계약) 탐지기는 다음 JSON을 생산한다: ```json { "meta": { "input_length": 1820, "detected_count": 37, "ai_tell_density": 0.203, "severity_weighted_score": 71.5 }, "findings": [ { "id": "f001", "category": "A-2", "category_label": "번역투: ~를 통해 남발", "severity": "S1", "text_span": "데이터 분석을 통해", "start": 142, "end": 153, "reason": "'통해'가 본문에서 6회 반복되어 경로 서술이 기계적", "suggested_fix": "데이터를 분석해서" } ], "category_summary": { "A": 12, "B": 3, "C": 2, "D": 8, "E": 1, "F": 4, "G": 2, "H": 3, "I": 1, "J": 1 } } ``` - `severity_weighted_score`: S1=5, S2=2, S3=0.5 가중 합. 0~100 스케일로 정규화. - `ai_tell_density`: 탐지 span 총 글자 수 / 전체 글자 수. ## 버전 관리 - **v1.5.1** (2026-04-27): **본진 신규 1건** — `E-4` 단문 일변도 (복문·중문 부재) [S2]. 사용자 관찰: "지나친 단문은 AI 티가 난다. 사람이 작성할 때는 적절한 단문과 복문을 섞는다." E-1(문장 길이 표준편차)과 짝패턴이지만 별개 시그니처 — E-1은 "30~50자에 다 몰림", E-4는 "구조 자체가 단순 단문만". 인간 필자가 무의식적으로 만드는 단문+복문 혼합 리듬을 모사하지 못하는 AI 출력의 약점을 분류 체계로 명시화. - **v1.3.1** (2026-04-25): **본진 신규 2건 + 본진 보강 3건** — 사용자 제공 Gemini API 키로 직접 호출한 회차 3 데이터(Gemini Pro 2.5 4편 약 10,058자) 분석 결과: - **본진 신규**: `C-10` 콜론 부제 헤딩 공식 [S2] · `D-7` 변환 공식 'X에서 Y로' [S2] (둘 다 Gemini-우세 시그니처) - **본진 보강**: `D-4` Gemini hype 어휘 셋 추가 (압도적·막강한·폭발적·파격적·대대적·강력한) · `J-2` 빈도 임계 명시(한 문서 5회 초과 S2 강화) · `I-4` 권고형 결말 변종 추가 (~해야 한다·~해야 합니다, 정책 보고서 5회 초과 임계) - **회차 2 hold 후보 검증**: GPT 9회+ 등장한 "결국" 문두 단언이 Gemini 4파일에서 1회만 재현. "A가 아니라 B" 결산 대구도 GPT 7회+ vs Gemini 2회. 5+ 콤마 나열은 Gemini 0회. **회차 2 hold 후보 3건 모두 GPT-우세 시그니처로 추정** — 풀에 hold 유지하면서 status_reason 갱신, 회차 4 국내 모델 검증 시 'GPT-특유' 메타 분류 검토 - **새 hold 후보 1건**: `cand-C-2026-011` 굵은 번호 부제 (Gemini 1파일 4회, Gate 1.2 분산 미달) - **분류 체계의 새 차원 신호**: 회차 1·2·3을 거치며 분류 체계에 "모델 우세 분포" 메타데이터 도입 필요성 부상 (v1.4 검토 사항) - **v1.3** (2026-04-25): **본진 신규 1건(C-9) + 본진 보강 3건(I-2 회차 1·I-3·H-3 회차 2)**, 그리고 **서브 패턴 발굴 운영 체계 도입**. 본진 신규/보강과 운영 인프라 확장이 함께: - **v1.1** (2026-04-24): 실전 1호(AI 전략 칼럼 윤문) 자기 재감사 결과, **재현 2회+ 패턴 7건 승격**: - `A-15` 추상 주어 + 만능 동사 (`X가 Y를 보여준다/제공한다`) - `C-7` 문단 문두 "먼저·반면·결국" 3단 공식 - `C-8` 대칭 대구 공식 "A인가, B인가" 반복 - `D-5` 의인화된 추상 주어 ("두 지능의 충돌", "AI 대전") - `D-6` 완결 공식형 결말 "~할 때입니다 / 시점입니다" - `F-5` "~적 N" 복합 추상어 체인 (에이전트적 자율성·기술적 토대) - `H-4` 재정의 접속사 "즉" 남발 - **v1.3** (2026-04-25): **본진 신규 1건 (C-9 숫자 괄호 인덱싱) + 본진 보강 1건 (I-2 결합형 변종)**, 그리고 **서브 패턴 발굴 운영 체계 도입**. v1.2 이후 멈춰 있던 패턴 발굴이 새 인프라로 깨진 회차: - **본진 신규**: `C-9` 숫자 괄호 인덱싱 "1) 2) 3)" [S2] — `_workspace/taxonomy_changelog.md` 회차 1에서 풀 후보 `cand-C-2026-001`이 6게이트 통과 후 승격 - **본진 보강**: `I-2` 시그니처 예문에 "X은 ~라는 점에 있다" 결합형 변종 4건 추가 — 풀 후보 `cand-I-2026-003`이 Gate 2.2(본진 변종)에서 `merged` 처리되며 흡수 - **운영 인프라 5종 신설**: - **candidate 풀 신설** (`references/pattern-candidates.md`) — detector·rewriter·naturalness-reviewer가 미분류 의심 패턴을 단일 그릇에 누적. 임시 ID(`cand-{대분류}-{YYYY}-{NNN}`)·4상태(pending/promoted/rejected/merged)·기각 사유 5종 라벨·90일 미재현 자동 만료 정책 - **3개 에이전트 적재 채널 명문화** — detector(미분류 span)·rewriter(윤문 저항·반복 잔존)·naturalness-reviewer(외부 시각, voice profile 미주입)에 풀 적재 트리거·절차 추가. 적재 실패는 메인 파이프라인 막지 않음 - **taxonomist 풀 운영자 역할 추가** — 4가지 trigger(사용자 명시 / pending 10건 / 단일 후보 occurrences ≥ 3 / 외부 PR) 기반 점검. 점검 6단계 절차와 changelog 표준 형식 명문화 - **외부 샘플 수집 파이프라인** (`references/sample-collection.md`) — 4축 다양성 매트릭스(모델·장르·길이·작가), 4종 채널(사용자 자발·합성 샘플·공개 데이터·외부 contributor), 익명화·저작권 5대 정책 - **승격 자동 검증 체크리스트** (`references/promotion-checklist.md`) — 6개 게이트(사전 점검·재현·본진 중복·분류 적합성·처방 적합성·본진 위계). 일부 게이트(0.2·0.3·1.1·1.2·5.2)는 향후 스크립트 자동화 가능 - **v1.3 발행 전 파일럿 회차 결과**: - **회차 1 (인프라 검증, 합성 샘플 2건)**: 미분류 후보 3건 발견 → promoted 1건(C-9 숫자 괄호 인덱싱) · hold 1건(메타 진입 '~을 살펴보면', Gate 1.3 분산 미달) · merged 1건(I-2 결합형). 인프라 작동 확인. - **회차 2 (외부 진짜 데이터, 뉴스핌 [AI로 읽는 경제] 시리즈 ① ② — ChatGPT 작성 명시 GPT 출력)**: 미분류 후보 5건 발견 → merged 2건(I-3 보강 '~다는 뜻이다' 결말 변종, H-3 보강 '이 점에서·이 관점에서·이 말은' 메타 진입 변종) · hold 3건(H-N 후보 '결국' 문두 단언 9회+, D-N 후보 'A가 아니라 B' 부정-긍정 대구 7회+, C-N 후보 5~8개 콤마 빠른 나열 4회). hold 3건은 Gate 1.3 분산 보호장치가 진짜 외부 데이터에서 정확히 작동한 결과 — 같은 GPT·같은 기자 시리즈의 노이즈가 본진을 오염시키지 않으면서 다음 회차에 다른 모델·다른 작가 데이터에서 재현되면 즉시 promoted 가능한 강력 후보로 풀에 누적 - **v1.2** (2026-04-25): Issue #1(simonsez9510) 후속 — 패턴 신설 0건, **권한 위계와 운영 체계 추가**: - **권한 위계 §1~§6 신설** — 객관 분류 vs 작가 voice profile의 권한 경계 명문화. opt-in 명시 주입, 패턴 ID 단위 무력화만 허용, 자유 텍스트 mandate 금지, A-8·C-5·D-1~D-6 무력화 불가, naturalness-reviewer 분리 검증층 보존, 회귀 게이트 정책 - **임계 완화 multiplier 캡표** — 일반 ≤ 2.0, D-1~D-6 ≤ 1.5, A-8·C-5 = 1.0 고정 (임계 우회를 통한 사실상 무력화 방지) - **`author-context.yaml` 스키마** 신설 (`references/author-context-schema.md`) — opt-in voice profile 주입 양식, Schema validator 책임(무력화 불가 disable 거부, multiplier 캡 위반 거부, prompt injection escape character 검증), Telemetry 정책(`voice_profile_log.json`) - **에이전트 정의 갱신** — detector·rewriter·auditor에 voice profile 주입, naturalness-reviewer 의도적 미주입 명문화 - **경로 토큰화** — SKILL.md 절대 경로 제거, `_workspace/`는 cwd 기준 - **다운스트림 caller reference** — `references/proposals/`(PR #3, simonsez9510 어댑터 reference, 메인테이너 SSOT 외부 격리) - 확장 원칙: 실전 입력에서 재현 2회 이상 + 인간 필자가 거의 안 쓰는 패턴만 서브 항목 추가.