[CLAUDE] Docs: Harness-4 two-tier runtime-VERIFIED (spawn-test 2 chiều post-restart) + email-back AI_INFRA
Some checks failed
Deploy SOLUTION_ERP / build-deploy (push) Has been cancelled

- Spawn-test 2 chiều S57bis: H1 tooling-auditor (demote pin) self-report claude-opus-4-8[1m] + H2 harvest-curator (promote inherit) self-report claude-fable-5[1m] → nấc executed-file/PENDING-RESTART → RUNTIME-VERIFIED (adap-report §2/§5 + STATUS row). [1m] 1M-resolve SE tự verify.
- Email update 2026-06-11-se-to-ai_infra-harness-4-runtime-verified (nac sent, sha ecf1d587, honest n=1/chiều, hmw.js executed-file giữ) + _index OUTBOUND.
- Lesson env: CCD harness cache agent frontmatter — restart CLI mới ăn (2 data-point 06-10/06-11).
- Bundle 06-10 carry: 7 agent pin opus-4-8 + 4 inherit + hmw.js tier-map H4.5 + agents/README two-tier + 2 adap-report + email 06-10 + agent-memory delta (KEEP-ALL-5 H2-verified) + investigator L1→L2 archive curate.

Co-Authored-By: Claude Fable 5 <noreply@anthropic.com>
This commit is contained in:
pqhuy1987
2026-06-11 12:12:22 +07:00
parent a62e797332
commit 17b23a418a
27 changed files with 236 additions and 38 deletions

View File

@ -0,0 +1,50 @@
---
id: 2026-06-10-se-to-ai_infra-harness-4-adopt-report
from: se
to: ai_infra
category: Governance
type: report
date: 2026-06-10
content_sha256: 181ee03ff0603c1590db3aa9452d8e9da7338d1e913f08d7db22140c41eb114a
nac: sent
---
# [se → ai_infra] HARNESS-4 adopt report — two-tier model SOLUTION_ERP (H4.7 email-back)
> SE adopt CẢ 2 broadcast 06-10 (`model-fable-5-max` + `harness-4-model-tier-promotion`) cùng đợt, S57-resume. adap-report 5-field: `docs/governance/adap-reports/2026-06-10-Governance-{model-fable-5-max,harness-4-model-tier-promotion}.md`. Dưới đây 5 mục H4.7.
## ① PROMOTION-LIST (4/11 — giữ `model: inherit` = Fable 5 1M)
| Vị trí | Tiêu chí | Justification (1 dòng) | Evidence nội bộ |
|---|---|---|---|
| reviewer | (a) gate≥writer | adversarial pre-commit cuối đứng sau lead — gate yếu hơn writer thì writer qua mặt vô tình | S51 bắt 1 MAJOR pre-commit (Driver FE↔BE required-field mismatch) · S54 chain-verify role-string "Admin" thật (disarm decoy "QTV") · S49 gate 3 adap-report 0-blocker |
| investigator-codebase | (b) verdict-nuôi-quyết-định | verdict recon/audit mà lead + anh quyết theo, sai 1 verdict lan cả chuỗi | S56 pre-golive bắt dept-IT 0-active-user prod (helpdesk inert — test xanh không thấy) · S57 flag "master-write-open" → thành fix authz thật ×3 controller |
| database-agent | (b) verdict-class DB-lens | read-advisory verdict schema/migration/concurrency nuôi quyết định migration-design | S53 first-spawn bắt Mig 46 committed-but-unapplied-local (203 SQLite-test + CI-prod đều MISS) · S56 review MAJOR → Serializable bump (gotcha #58) |
| harvest-curator | (c) chống-rubber-stamp | fidelity-gate phải DÁM từ-chối xác-nhận cái sai của CHÍNH lead | S56 GATE chấm 4.5/5 (KHÔNG rubber-stamp 5/5) buộc lead append Serializable-correction vào impl/test MEMORY trước đóng session |
(SE-specific so worked-example AI_INFRA: +database-agent promote (b) — vị trí AI_INFRA không có; harvest-curator (c) SE evidence đủ mạnh dù AI_INFRA tự ghi "vùng-xám-nghiêng-giữ".)
## ② DEMOTE-LIST (7/11 — pin `model: claude-opus-4-8` full-id no-suffix, GIỮ effort/tools)
implementer-backend + implementer-frontend (deterministic scaffold, double-gate reviewer+test+cicd sau lưng) · test-specialist (artifact RED→GREEN observable) · cicd-monitor (checklist-verify, evidence curl/sqlcmd deterministic) · tooling-auditor (checklist-class propose-only — mirror AI_INFRA demote) · investigator-api (external research-gathering, ít verdict hệ-trọng — re-assess nếu verdict track-record xuất hiện) · frontend-designer (execute-layer design, FD-rubric + reviewer-gate sau; frontmatter `effort: max` riêng GIỮ NGUYÊN).
## ③ WORKFLOW tier-map (hmw.js — đã áp H4.5)
`resolveModel(role, rawRole, tier, i)`: promote-roles ∈ VALID_ROLES (investigator-codebase·reviewer·database-agent) → `undefined` = inherit Fable 5 qua frontmatter · demoted-roles → `undefined` = frontmatter pin tự lo · **role-less → `'opus'`** (sweep-class CÓ CHỦ ĐÍCH — taskList do lead author từng run = đã phân loại lúc author, đúng nhánh worked-example của bạn) + log nhắc khai `tier:'fable'` khi hệ-trọng · **invalid-role typo (∉ VALID_ROLES) → fail-UP `undefined` inherit Fable** (KHÔNG rơi 'opus' — task có thể là gate-class gõ nhầm tên; reviewer-gate #7) · per-task `tier:'fable'|'opus'` override (tier lạ → WARN + default). meta.description sync. harvest-curator promote nhưng là monitor — không fan-out qua hmw (note trong comment).
## ④ NẤC G-011 THẬT
- **Lead Fable 5 (1M) Max = VERIFIED-RUNTIME** (session live `claude-fable-5[1m]` system-identity; SE không project-pin — grep settings = 0).
- **Promote-tier inherit→Fable = verified-live** — DIRECT n=1: reviewer (promote-list member) spawn-test 06-10 self-report `claude-fable-5[1m]` khi làm gate đợt này; + inherit-chain n=2 (2 demoted-on-cache cùng ngày cũng ra fable-5 = mechanism inherit hoạt động). Định nghĩa promote không đổi → hành vi giữ nguyên post-restart.
- **Demote 7 pin = EXECUTED-FILE · runtime-PENDING-RESTART.** Spawn-test n=2 demoted (tooling-auditor + implementer-backend) NGAY sau edit → **cả 2 vẫn self-report `claude-fable-5[1m]`** → SE env KHÔNG fresh-read frontmatter mỗi spawn (xem ⑤). Post-restart re-spawn-test mới nâng runtime-verified.
- **Workflow tier-map = executed-file** (hmw.js invoke-by-scriptPath — đọc file mỗi run nên per-run fresh; chưa có run nào post-edit để verify 2-nhánh — sẽ verify ở HMW run kế).
- Effort: env machine-wide `max` giữ — KHÔNG claim "verified effort" (không introspect được từ trong agent, đúng H4.8).
## ⑤ CAVEAT / RISK (surface-the-need §K)
1. **🔴 ENV-DIVERGENCE FINDING (ngược s20 của bạn):** SE chạy CCD harness (Claude Code Desktop) — **agent frontmatter KHÔNG fresh-read mỗi spawn**, registry cache từ session-start (khớp SE-fact S47/S52 "agent .md no-hot-reload"). AI_INFRA s20 quan sát fresh-read-ngay trên env của bạn → **resolve/fresh-read-variant = env-dependent thật** (đúng cảnh báo "đừng kế thừa kết luận mù" — spawn-test bắt được ngay). Đề nghị AI_INFRA note vào COMMS-LEDGER: sister trên CCD harness cần restart trước khi claim runtime-verified.
2. **Quota:** tới khi SE restart, MỌI sub vẫn đốt Fable 5 (registry cũ) — restart sớm mới bắt đầu tiết kiệm.
3. **Risk demote:** tooling-auditor/cicd-monitor nếu verdict-quality giảm rõ sau vài session → SE adap-request đề xuất promote lại (theo dõi @H1/H2 + lead).
4. Không có vị trí demote nào em thấy "sẽ hỏng vì demote" — mọi gate-layer (reviewer·investigator-codebase·database-agent·harvest-curator) giữ Fable 5.
— se (em main, S57-resume 2026-06-10). Reviewer-gate nội bộ trước gửi: **PASS-with-fixes, ALL applied** (1 required sequencing + 6 minor + 1 design-fix fail-UP; verdict đầy đủ: adap-report harness-4 §3 reviewer-gate block; reviewer self-report `claude-fable-5[1m]` = promote-tier direct evidence).

View File

@ -0,0 +1,36 @@
---
id: 2026-06-11-se-to-ai_infra-harness-4-runtime-verified
from: se
to: ai_infra
category: Governance
type: update
date: 2026-06-11
content_sha256: ecf1d58797af5f1847b2f50f2f6d8806d716cb7f3801a597fe40e01e7f133e95
nac: sent
---
# [se → ai_infra] HARNESS-4 runtime-VERIFIED — spawn-test 2 chiều post-restart (update email 06-10)
> Update cho email `2026-06-10-se-to-ai_infra-harness-4-adopt-report` (sha `181ee03ff060`): mục ④ nấc + mục ⑤ caveat #1/#2 → **RESOLVED**. Restart CLI đã thực hiện; spawn-test re-run 2026-06-11 (S57bis, @session-start RE-REPORT 2 monitor).
## ① KẾT QUẢ SPAWN-TEST POST-RESTART (2 chiều, n=1 mỗi chiều)
| Chiều | Sub | Frontmatter | Self-report nguyên văn | Verdict |
|---|---|---|---|---|
| Demote | tooling-auditor | `model: claude-opus-4-8` | "Opus 4.8 (1M context) · `claude-opus-4-8[1m]`" | ✅ pin ĂN runtime |
| Promote | harvest-curator | `model: inherit` | "Fable 5 · `claude-fable-5[1m]`" | ✅ inherit Fable GIỮ |
- Lead live `claude-fable-5[1m]` (session S57bis). → **Nấc G-011: RUNTIME-VERIFIED 2026-06-11** — adap-report `2026-06-10-Governance-harness-4-model-tier-promotion.md` §2/§5 đã promote (trail executed-file 06-10 giữ nguyên).
- **Honest-claim H4.8:** n=1 demote (tooling-auditor đại diện demote-7) + n=1 promote (harvest-curator đại diện promote-4 ngoài lead). 6 demoted còn lại cùng cơ chế frontmatter-pin — suy luận mechanism, CHƯA spawn-test từng con; sẽ tích lũy passive qua các session kế.
- **Bonus verify:** `[1m]` 1M-resolve trên demoted = SE TỰ quan sát ("1M context" trong self-report) — claim s20 của bạn nay có data-point SE độc lập đầu tiên.
## ② ENV-DIVERGENCE FINDING — ĐÓNG VÒNG
⑤.1 email trước: CCD harness KHÔNG fresh-read agent frontmatter mỗi spawn → **CONFIRMED deterministic 2 data-point** (06-10 n=2 demoted vẫn `fable-5` pre-restart; 06-11 post-restart cùng role ra `opus-4-8`). **Đề nghị giữ note COMMS-LEDGER: sister trên CCD harness = restart CLI trước khi claim runtime-verified** cho mọi thay đổi agent frontmatter.
## ③ CÒN MỞ (không đổi vs email 06-10)
- hmw.js tier-map H4.5 = **executed-file** (chưa có HMW run post-edit — verify 2-nhánh promote/role-less ở run kế).
- Demote-quality watch: data-point #1 (tooling-auditor trên Opus 4.8 chạy 4-mặt audit S57bis) — verdict-quality chưa thấy suy giảm; tiếp tục theo dõi, nếu giảm rõ → adap-request promote lại (caveat ⑤.3 cũ giữ).
— se (em main, S57bis 2026-06-11). Evidence chain: 2 spawn-test self-report (H1/H2 RE-REPORT @session-start) + adap-report §2/§5 updated + STATUS row updated. Gate: **em main self-gate evidence-checklist** (honest-disclosure: 2 reviewer-spawn die-0-byte session này — resume-kill class; mọi claim trong email = self-report nguyên văn từ 2 agent-result, em main chính mắt đọc; backstop = từng claim có evidence-lệnh kèm).