在过去的一周里,我发现我的 GAE 灵活环境中的实例数量降至 0,并且没有新实例启动。我对灵活环境的理解是,这不应该是可能的......(


直到上周,这对我来说才成为问题,现在看来我必须每隔几天重新部署我的环境(没有任何更改),只是为了“重置”实例。值得注意的是,我在同一个 App Engine 项目下有两个服务,都运行灵活的版本。但我似乎只对其中一项服务(我称之为工作人员服务)有这个问题。

App Engine UI 的屏幕截图:

日志 UI 的屏幕截图显示了正在发送的 SIGTERM:

PS - 这是否与最近出现的 Google 计算问题有关......

编辑:添加“worker”服务的 yaml 文件。请注意,我使用 Honcho 添加端点以通过 Flask 监控工作线程服务的运行状况。我也添加了这些代码示例。

yaml 文件

service: worker
runtime: python
threadsafe: yes
env: flex
entrypoint: honcho start -f /app/procfile worker monitor

  python_version: 3

  cpu: 1
  memory_gb: 4
  disk_size_gb: 10

  min_num_instances: 1
  max_num_instances: 20
  cool_down_period_sec: 120
    target_utilization: 0.7

Honcho 的 Procfile

default: gunicorn -b :$PORT main:app
worker: python
monitor: python /tmp/


import os
import sys

from flask import Flask

# The app checks this file for the PID of the process to monitor.

# Create app to handle health checks and monitor the queue worker. This will
# run alongside the worker, see procfile.
monitor_app = Flask(__name__)

def health():
    The health check reads the PID file created by main and checks the proc
    filesystem to see if the worker is running.
    if not os.path.exists(PID_FILE):
        return 'Worker pid not found', 503

    with open(PID_FILE, 'r') as pidfile:
        pid =

    if not os.path.exists('/proc/{}'.format(pid)):
        return 'Worker not running', 503

    return 'healthy', 200

def index():
    return health()

if __name__ == '__main__':
    PID_FILE = sys.argv[1]'', 8080)



