Files
solution-erp/docs/governance/adap-reports/2026-06-20-Governance-harness-14.md
pqhuy1987 33d519eda0 [CLAUDE] Docs: adopt User-Mark (H-12/13 canonical §P) + Harness-14 + RC-signature (S79)
Áp canonical §P đầy-đủ (P1-P10) khi anh gõ /user-mark-active-high "áp đầy-đủ
chính-xác nhất theo AI_INFRA". 0 production code.

- 4 lệnh /user-mark-{active-high,active,medium,disable} (DACI report-before-stamp)
- ledger .claude/governance/ACTIVE-MARKS.md (4 cấp Active-High/Active/Medium/Disable
  + display-filter) + 3 mark Active-High stamped anh-confirm
  (RC-pqhuy1987-20-06-2026-10-29-09/10/11 = objective-criteria/User-Mark/time-age)
- harness-11-engine.md §E (P1-P10) + §F (Harness-14 3-mức maturity honest)
- rules.md §6.6 objective-criteria (KHÔNG quy-mô-đội / KHÔNG thời-gian-tuổi)
- session-start §2.1.4 + session-end §L.b(h) mark-display
- 4 Workflow: invest wf_82337f7f-95c + review wf_a7cbe93e-912
  + align-re-review wf_9d3beebb-a95 (§P 10/10) + H14-review wf_4d4eba6f-8a0 (§F 6/6)
- completeness-gate H-6→H-13 ĐẠT (H-8 11/11 inherit no-[1m])
- 3 adap-report + email ai_infra (7b8615b3) + check-email STAGE 2

State THẬT GIỮ NGUYÊN: Mig 57 · 88 bảng · 354 test · gotcha 71 · bundle CsJetgZH/BVS0ApIm.
Restart CLI để activate 4 lệnh + session-cmd (no hot-reload).

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-20 10:53:23 +07:00

46 lines
5.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# adap-report — Harness-14 (Eval / Budget / Outcome theo hướng "khối-lượng × chất-lượng")
- **id:** 2026-06-20-Governance-harness-14
- **source broadcast:** `ai_infra/broadcasts/outbox/all/2026-06-20-Governance-harness-14-adopt.md` (`status: 🟢 ADOPT` · `reviewer_gate: PASS` · `content_sha256: 8da7e8b1854493f6e0f84211d82c04fbd2fe915b2b5686c0ab8033107ddefc0a`) + checklist `2026-06-20-Governance-checklist-harness-14.md` (`e96930da…`)
- plan-announce tiền-thân `2026-06-19-Governance-harness-all-update-v-2-0.md` = **SKIP n-a** (visibility-only PLAN-status, content_sha256 chưa stamp, superseded bởi adopt-broadcast này — KHÔNG áp riêng)
- directed heads-up `outbox/se/2026-06-20-ai_infra-to-se-harness-14-adopt-notify.md` (inbox verify ✓ whole-file `94c533cf` + body `37ae1b19`)
- **adopted by:** se (SOLUTION_ERP) · **session:** S79 · **date:** 2026-06-20
- **protocol:** Harness-9 PART-2 = workflow IMPLEMENT + REVIEW tách biệt + report-with-run-id
- INVESTIGATE `wf_82337f7f-95c` (budget/eval audit stream) → IMPLEMENT em-main single-writer (D9) → REVIEW `wf_4d4eba6f-8a0` (2× reviewer — §F floor **6/6 MET** + maturity **HONEST** + SE-state **ACCURATE**)
- **project-fit:** ✅ FIT — SE có L1/L2/L3 memory + archive-gate + `eval/` golden-set harness + memory-budget seed-by-measure.
## VERDICT: ✅ ADOPTED — 🔴 rule-floor codify + neo Active-High · 🟡 method honest 3-mức maturity
H-14 = đo chất-lượng + định-cỡ bộ-nhớ trên nguyên-lý "mọi con-số suy từ nhu-cầu thật, KHÔNG đặt-cứng". **Phát-hiện then-chốt (investigate): SE đã ALIGNED sẵn 2/3 cơ-chế** (budget no-decay + baseline-drift canonical-anchor) — adopt = codify rule tường-minh + map method onto cái SE THẬT có + khai honest 3-mức.
## Nấc theo phần (review `wf_4d4eba6f-8a0`)
| Phần | Trạng-thái | Nấc |
|---|---|---|
| 🔴 **RULE time/age = false-proxy** (§A 4 mục floor) | `rules.md §6.6` (bảng "Căn-cứ SAI" time/age cạnh team-size) + mark `RC-…10-29-11` Active-High + `memory-budget.json` 0 núm-decay + drift canonical-anchor | floor 4/4 MET · convention (rule) + mechanized (config no-decay) |
| 🔴 **Outcome** (§D 2 mục floor) | `§F.4` + `rules §6.6` (indicator-tied-to-outcome + Goodhart tức-thì, tổng-quát H8.2 "KHÔNG hạ model") | floor 2/2 MET · convention |
| 🟡 **Eval-precision** (Mức 1) | `§F.2` map onto `eval/` harness sẵn có (golden-set 14-q + evaluator.md recall@5≥0.7 + trial-state-lock) | **executed-file + convention** (weekly-MANUAL, CHƯA mechanized-CI; RAG re-index = AI_INFRA-op) |
| 🟡 **Budget** (Mức 1 ALIGNED) | `§F.3` = seed-by-MEASURE + archive_gate hysteresis/keep-floor/2-strike, 0 decay-knob (= PHẦN A) | **mechanized ALIGNED** (config) |
| 🟡 **Budget-hit-rate + outcome-correlation** (Mức 2) | `§F.3`/`§F.4` khai rõ "có công-cụ ĐO chưa đủ data" — SE chưa có đếm-lượt-truy-cập + thu-đánh-giá có cấu-trúc | **Mức-2 tool-pending-data** (KHÔNG trình như xong) |
| ◦ **Trần nhiễu ngữ-cảnh** (Mức 3) | `§F.1` ghi-nhận sao-bắc-đẩu, KHÔNG ép số | ack-only |
**Completeness-gate:** 6/6 🔴 floor (§A×4 + §D×2) MET (review xác-nhận meta-gate "tổng 6 mục sàn"; data-gate §C KHÔNG đếm thành mục thứ-7).
## Tailoring (SE-specific)
- §F gom vào `harness-11-engine.md` (engine governance hợp-nhất) — H-14 budget = PHẦN A đã có, eval = `eval/` đã có → map-onto thay vì dựng mới.
- 🔴 rule neo qua User-Mark mark-3 (cùng cụm §P) — self-sign RC-sig của SE.
## Honest caveats (KHÔNG nói quá — chính cốt-lõi H-14)
- **3-mức maturity trung-thực:** chỉ eval-precision Mức-1 dùng-được-ngay (NHƯNG manual-weekly, KHÔNG mechanized-CI); budget-hit-rate + outcome-correlation = Mức-2 **có công-cụ chưa-ra-số** (KHÔNG bịa); trần-nhiễu = Mức-3 tạm-gác. KHÔNG nâng mức thấp lên cao.
- **eval = đã CÓ, KHÔNG phải gap mới-dựng** — `§F.2` khai đúng "SE đã có harness (KHÔNG phải gap)", map nguyên-lý onto, không claim tự-chạy.
- **budget ALIGNED là may-mắn cấu-trúc** (seed-by-measure từ Harness-9), KHÔNG phải H-14 mới làm — khai rõ.
- Con-số AI_INFRA tự-đo (cỡ golden-set, recall) = bằng-chứng của HỌ, KHÔNG mục-tiêu áp-cứng SE — SE suy số riêng từ nhu-cầu mình.
## Reverse-findings (đề-xuất ngược AI_INFRA)
1. **SE đã obey 2/3 H-14 TRƯỚC khi adopt** (budget no-decay + drift canonical-anchor) — vì Harness-9 seed-by-measure + Harness-11 detector canonical-anchor đã ép đúng hướng. Xác-nhận: H-9/H-11 là tiền-đề cấu-trúc của H-14; dự-án nào đã chắc H-9/H-11 thì H-14-budget gần như free.
2. **Eval-precision automation = gap chung khả-dĩ:** SE có harness nhưng manual-weekly (RAG re-index AI_INFRA-owned). Nếu AI_INFRA mở tooling re-index/eval-CI cho sister, Mức-1 sẽ lên mechanized — hiện là nút-thắt cross-project, KHÔNG riêng SE.
## Evidence
- run-id: `wf_82337f7f-95c` (budget/eval audit: budget ALIGNED + eval GENUINE) · `wf_4d4eba6f-8a0` (§F floor 6/6 + maturity HONEST + state ACCURATE).
- Mark stamped: `ACTIVE-MARKS.md` `RC-pqhuy1987-20-06-2026-10-29-11` Active-High.
- 0 production code. State THẬT GIỮ NGUYÊN: Mig 57 · 88 bảng · 354 test · gotcha 71 · menu 54 · bundle `CsJetgZH`/`BVS0ApIm`.