Eight Ways
a Text Speaks
여덟 가지 방식으로, 글은 말한다
한국어 산문을 읽고, 그 글이 가진 인지·정서적 결을 분해해 여덟 유형 중 하나로 분류합니다. 핵심은 '왜 그렇게 분류했는가'를 끝까지 되짚을 수 있다는 것 — 결론만 내놓고 근거를 감추는 거대 모델과 달리, 모든 판단이 규칙과 점수로 한 단계씩 추적됩니다. 화이트박스, 그리고 편향으로부터의 독립.
풀고자 한 문제
텍스트가 독자에게 일으키는 반응은 깔끔하게 떨어지지 않습니다. 같은 글도 누군가에겐 잔잔하고 누군가에겐 불편합니다. 반응은 텍스트에 박힌 고정된 속성이 아니라, 텍스트와 독자가 만나는 지점에서 비로소 발생하는 사건이기 때문입니다.
최근의 큐레이션 시스템 대부분은 이 문제를 거대 언어모델에 통째로 맡깁니다. 빠르고 그럴듯하지만 두 가지 대가를 치릅니다 — 판단의 근거가 모델 내부에 잠겨 추적되지 않고(블랙박스), 모델이 학습 과정에서 흡수한 취향과 편향이 결과에 새어 듭니다.
GQ-Engine은 정반대의 길을 택했습니다. 글의 자질을 규칙으로 계량하고, 모든 중간 결과를 드러내며, '애매한 것은 애매하다'고 정직하게 말합니다.
네 단계
글은 네 개의 분석 계층을 한 방향으로 통과합니다. 각 단계의 출력이 다음 단계의 입력이 됩니다.
글을 문장 단위로 나눕니다. 종결 부호와 줄바꿈을 기준으로 삼아, 작가가 의도한 호흡과 단락의 결을 그대로 살립니다.
각 문장이 '어떤 방식으로 말하고 있는가'를 먼저 가립니다 — 고백·질문·단정·도발·묘사·은유·회상·논증·역전. 단어의 뜻을 세기 전에 말투의 맥락을 먼저 잡는 것, 이 순서가 정확도의 핵심입니다.
문장에서 수십 가지 언어 자질을 뽑고, 앞 단계가 정한 발화 맥락이 그 해석 비중을 조정합니다. 그 위에서 열 개의 사유 노드가 점수화됩니다 — 글의 완성도를 재는 형식 노드와, 글이 무엇을 다루는지 보여주는 내용 노드로 나뉩니다.
노드 점수를 세 개의 축으로 정리합니다 — 문체(흐르는 글 / 따지는 글), 긴장(불편함 / 잔잔함), 시선(개인 / 세상). 이 세 축의 조합이 글을 여덟 유형 중 하나로 확정합니다.
보조 판정자 — 관점 취하기
배심원은 의견을 내고, 판결은 판사가 합니다.
세 축이 불편함을 경계에서 결정하지 못할 때에 한해, 경량 한국어 모델이 한시적으로 합류합니다. 모델은 그 글의 유형에 맞는 독자로 빙의해, 경계에 걸린 문장을 읽고 자신의 감정을 자유롭게 서술합니다. 같은 독자의 두 면 — 결론을 원하는 쪽과 열린 결말을 즐기는 쪽 — 을 각각 시뮬레이션해 그 반응을 대조합니다.
그러나 그 감정 서술은 결코 라벨이 되지 못합니다. 엔진이 다시 규칙으로 계산한 결과로 환원되어 불편함 축에 반영될 뿐입니다. 언어모델은 의견을 보탤 뿐, 판정은 끝까지 규칙 엔진의 몫입니다 — 유연한 생성 능력과 완전한 추적 가능성을 분리해 결합한 구조입니다.
세 가지 약속
여덟 인물
최종 산출물은 여덟 개의 유형입니다. 각 유형은 그리스 신화의 인물로 형상화되어, 추상적인 분류를 직관적인 얼굴로 전합니다. (제품 안에서 독자에게 유형명은 직접 보이지 않습니다 — 이름은 엔진의 언어입니다.)
독자와의 연결
GQ-Engine의 분류는 독자를 위한 것입니다. 독자에게 유형명은 직접 노출되지 않습니다. 대신 각 글에 독자 성향 유형(LECT) 세 개가 태깅됩니다 — 가장 잘 맞는 유형, 무난한 유형, 그리고 의도적으로 포함된 반대 성향의 유형.
마지막 한 태그가 핵심입니다. 자기 입맛에 맞는 글만 읽으면 지적 편향이 굳어집니다. GQ-Engine은 독자가 의식하지 못하는 사이, 자신의 사유 지형을 조금씩 넓히도록 설계되어 있습니다.
이상(李箱)의 「오감도」 제1호를 자극 텍스트로 삼아, GQ-Engine이 문장의 결을 한 단계씩 스캔하는 과정을 시뮬레이션합니다.
엔진의 안쪽이
궁금하다면.
발화 유형을 가르는 방식, 열 개 노드의 구성, 세 축 판정 로직과 보조 판정자의 게이트 조건, 그리고 판정 축이 기대는 이론적 토대까지 — 전체 구조는 기술 개요서에 담겨 있습니다.