gRPC-сервис инференса моделей

Runtime ML-gating обращается к Python gRPC сервису инференса.

Внешний интерфейс:

Запуск / остановка

Запускайте и останавливайте inference-сервис вашим deployment-инструментом (Docker/Kubernetes/systemd и т.д.).

Адрес по умолчанию:

Адрес для runtime:

ML_GRPC_ADDRESS=127.0.0.1:50051

PredictRequest:

PredictResponse:

Сервис ищет модели в MODEL_DIR:

Если найдены ensemble-файлы, вероятность усредняется по всем участникам.

Типичный локальный сценарий:

Поэтому aliases после тренировки (./data/ml/models/<Strategy>.joblib) сразу доступны inference-сервису.

На стороне runtime, ML-gating:

Если сервис недоступен, runtime пишет ошибку в лог и возвращает null для ML-решения.

npx @tradejs/cli doctor --require-ml