12 недель · 1 продукт · 1 регион · только английский язык · теневой режим без риска для пациентов. Цель — доказать техническую состоятельность перед масштабированием.
Цель и ограничения
К концу Phase 1 — работающий BioBERT NER и классификатор серьёзности, запущенные в shadow mode на реальных кейсах Opella, с утверждённой QA документацией IQ/OQ.
Фокус — один продукт, один регион, только английский язык. Никакого production-влияния на кейсы до Go/No-Go решения.
Пре-фаза · Измерение базового состояния
Пишем read-only SQL-запросы к Oracle Argus Safety Database для извлечения из audit log хронологии каждого кейса: когда поступил, когда прошёл triage, когда был закодирован в MedDRA.
Измеряем: медиану и p90 времени по каждому шагу, объём на специалиста, процент переработок (rework rate), разбивку по источникам (email / web-form / E2B XML).
Данные из ARGUS загружаем через pandas, считаем перцентили (p50/p90/p99) по каждому шагу pipeline. Wilcoxon signed-rank test и bootstrap 95% CI — доказываем статистическую значимость для QA-отчёта.
Результат — PDF baseline-отчёт с boxplots и heatmaps, которые войдут в Project Charter, и живой Power BI дашборд для PV-менеджеров.
Временная шкала
shadow_comparison: human_serious, ai_serious, ai_confidence, matchedИнфраструктура
Phase 1 — это не production. Большая часть разработки идёт локально. Облако используется точечно: GPU только на период обучения, shadow mode на минимальном VM.
Критерии выхода
Все три должны быть выполнены одновременно. Нарушение любого — No-Go и дополнительный цикл улучшения.
Следующий шаг