ML Infer gRPC Service

Runtime ML gating calls a Python gRPC inference service.

Public interface:

Start / Stop

Start and stop the inference service with your deployment tooling (Docker/Kubernetes/systemd/etc).

Default endpoint:

Set runtime address:

ML_GRPC_ADDRESS=127.0.0.1:50051

PredictRequest:

PredictResponse:

Service resolves model files from MODEL_DIR:

If ensemble files exist, prediction is mean probability across members.

Typical local setup:

So aliases written by training (./data/ml/models/<Strategy>.joblib) are immediately visible to inference.

On runtime side, ML gating:

If service is unavailable, runtime logs error and returns null for ML decision.

npx @tradejs/cli doctor --require-ml