← 전체 목차02

02 — 카테고리 분류 — 듀꼰이 다이어트 레시피북

02. 카테고리 분류 — 데이터에서 발견된 축

대상: 레시피로 판별된 글 917개. 한 글이 여러 축에 동시에 속할 수 있어서 각 축의 합은 글 수보다 크다.

축 A — 식사 타입

제목/본문에 명시된 식사 시점 키워드 기반. 미명시 글이 많음.

라벨 글 수 비율
아침 387 42.2%
저녁 335 36.5%
점심 209 22.8%
간식 196 21.4%
도시락 61 6.7%
야식 12 1.3%

축 B — 조리 방식

라벨 글 수 비율
냄비/끓이기 254 27.7%
219 23.9%
171 18.6%
전자레인지 82 8.9%
오븐 62 6.8%
에어프라이어 53 5.8%
노쿡 36 3.9%
그릴/구이 9 1.0%

축 C — 주재료

미분류 글 105개 — 사전 확장 필요할 수 있음.

라벨 글 수 비율
면(라면/파스타/국수) 324 35.3%
유제품 302 32.9%
해산물 298 32.5%
계란 276 30.1%
과일 255 27.8%
빵/토르티야 161 17.6%
돼지고기 160 17.4%
밥(쌀/현미/잡곡) 156 17.0%
양배추 150 16.4%
두부 115 12.5%
감자 110 12.0%
닭가슴살 98 10.7%
토마토 96 10.5%
소고기 95 10.4%
오이 77 8.4%
콩/병아리콩 75 8.2%
버섯 60 6.5%
고구마 45 4.9%
오트밀 26 2.8%
닭다리/통닭 25 2.7%
곤약/곤약면 9 1.0%
단호박 9 1.0%

축 D — 요리 형태

미분류 글 146개.

라벨 글 수 비율
면요리 340 37.1%
찜/조림 219 23.9%
수프/국/찌개 205 22.4%
볶음 148 16.1%
샌드위치/토스트/랩 146 15.9%
음료/스무디 138 15.0%
샐러드 132 14.4%
비빔밥/김밥 128 14.0%
구이/오븐 125 13.6%
디저트/베이킹 89 9.7%
전/부침/팬케이크 81 8.8%
도시락 65 7.1%
덮밥/볶음밥 62 6.8%

축 E — 목적/컨텍스트

다이어트·건강 관점에서의 자기서술. 본문에 명시되어야 잡힘.

라벨 글 수 비율
저칼로리 408 44.5%
고단백 221 24.1%
면역/제철 167 18.2%
장건강 48 5.2%
해독/디톡스 39 4.3%
저탄수 36 3.9%
벌크업 6 0.7%

대안 분류 체계 (목차 후보)

데이터가 가장 풍부한 두 축(주재료, 요리 형태)을 기반으로 책 구조 후보 3안을 제시한다.

대안 1 — 주재료 중심 (Cooking-by-ingredient)

장 = 주재료 그룹. 다이어터가 "집에 닭가슴살이 있을 때 뭐 만들지?" 식으로 책을 펼치는 모델.

챕터 후보 글 수
닭가슴살로 98
두부/콩으로 190
계란으로 276
오트밀·귀리로 26
고구마·단호박으로 54
채소(오이/토마토/양배추 등) 383
해산물 298
유제품·요거트로 302
과일로 255

대안 2 — 요리 형태 중심 (Cooking-by-form)

장 = 한 끼 형태. "오늘은 면이 당겨" / "샐러드 하나 만들고 싶어" 식으로 펼치는 모델. 독자의 식욕·기분 기반 진입에 강함.

챕터 후보 글 수
샐러드 & 포케 132
덮밥 & 비빔밥 190
샌드위치·토스트·랩 146
면요리 340
국·수프·스튜 0
오븐·에어프라이어 한판 125
볶음·찜·조림 367
음료·스무디 138
디저트·간식 89
도시락 65

대안 3 — 시나리오 중심 (Hybrid: 시점 × 목적)

장 = 다이어터의 실제 사용 시나리오. 예) "운동 전", "바쁜 평일 아침", "외식 다음 날 리셋". 이 분류는 키워드 매칭만으로는 부족 — 큐레이션이 필요하지만 책의 "드라마"를 만드는 데 가장 강하다.

현재 자동 태깅으로는 식사 시점이 잘 안 잡힌다 —

시나리오 후보 자동 매칭 글 수 (참고용)
바쁜 아침 5분 387
배 든든한 점심 도시락 270
죄책감 없는 저녁 한 끼 335
밤이 길 때, 야식 자리에 두는 12
운동 전/후 단백질 보충 227
외식 다음 날 리셋 447
계절 보양·면역 한 그릇 167

추천

1순위: 대안 2 (요리 형태 중심) — 데이터 분포가 가장 고르고 자동 태깅 커버리지가 높아, 원고 분량 추정과 페이지 배분 설계가 즉시 가능하다. 또한 다이어터의 책 펼침 동기("오늘 뭐 만들지?")와 직접 맞아 떨어진다. 2단계 시장성 평가에서 "형태 중심 vs 시나리오 중심" 경쟁작 비교를 해 보고, 필요하면 챕터 도입부에 시나리오(대안 3) 큐레이션을 보조 레이어로 얹는다.

2순위: 대안 1 (주재료) — 다이어터의 또 다른 강력한 동기("집에 X가 있어")와 맞지만, 닭가슴살·두부 한쪽으로 쏠릴 위험이 있다. 보조 색인으로 두면 좋다.

3순위: 대안 3 (시나리오) — 가장 매력적이지만 자동 분류만으로는 불충분. 5단계 샘플 챕터에서 한 시나리오를 시범 구성해 보고 채택 여부 결정.