如何对 kubernetes 中运行的 Inception 服务的部署进行故障排除

2024-01-08

我正在关注使用 TensorFlow Serving 和 Kubernetes 服务 Inception 模型 https://tensorflow.github.io/serving/serving_inception.html当我尝试从本地主机进行推理时,工作流程和一切都运行良好,直到通过 k8s 提供初始模型的最终服务。

我正在运行 Pod 并输出$kubectl describe serviceinception-service 与中的工作流程建议的一致使用 TensorFlow Serving 和 Kubernetes 服务 Inception 模型 https://tensorflow.github.io/serving/serving_inception.html.

然而,当运行推理时,事情就不起作用了。这是跟踪:

$bazel-bin/tensorflow_serving/example/inception_client --server=104.155.175.138:9000 --image=cat.jpg

Traceback (most recent call last):
File "/home/dimlyus/serving/bazel-
bin/tensorflow_serving/example/inception_client.runfi
les/tf_serving/tensorflow_serving/example/inception_client.py", line 56, in 
tf.app.run()

File "/home/dimlyus/serving/bazel-
bin/tensorflow_serving/example/inception_client.runfi
les/org_tensorflow/tensorflow/python/platform/app.py", line 48, in run
_sys.exit(main(_sys.argv[:1] + flags_passthrough))

File "/home/dimlyus/serving/bazel-
bin/tensorflow_serving/example/inception_client.runfi
les/tf_serving/tensorflow_serving/example/inception_client.py", line 51, in 
main
result = stub.Predict(request, 60.0) # 10 secs timeout

File "/usr/local/lib/python2.7/dist-
packages/grpc/beta/_client_adaptations.py", line 32
4, in call
self._request_serializer, self._response_deserializer)

File "/usr/local/lib/python2.7/dist-
packages/grpc/beta/_client_adaptations.py", line 21
0, in _blocking_unary_unary
raise _abortion_error(rpc_error_call)
grpc.framework.interfaces.face.face.AbortionError: 
AbortionError(code=StatusCode.UNAVAILABLE, details="Connect Failed")

我在 Google Cloud 上运行所有内容。设置是从 GCE 实例完成的,k8s 在 Google 容器引擎内部运行。 k8s 的设置遵循上面链接的工作流程中的说明并使用inception_k8s.yaml https://github.com/tensorflow/serving/tree/master/tensorflow_serving/example/inception_k8s.yaml file.

服务设置如下:

apiVersion: v1
kind: Service
metadata:
  labels:
    run: inception-service
  name: inception-service
spec:
  ports:
  - port: 9000
    targetPort: 9000
  selector:
    run: inception-service
  type: LoadBalancer

任何有关如何解决此问题的建议将不胜感激!


该错误消息似乎表明您的客户端无法连接到服务器。如果没有一些附加信息,就很难排除故障。如果您发布您的部署和服务配置,并提供一些有关环境的信息(它是否在云上运行?哪一个?您的安全规则是什么?负载均衡器?),我们也许能够提供更好的帮助。

但您可以立即检查以下一些事项:

  1. 如果您在某种云环境(Amazon、Google、Azure 等)中运行,它们都有安全规则,您需要在运行 Kubernetes 集群的节点上显式打开端口。因此,您的 Tensorflow 部署/服务正在使用的每个端口都应在控制器和工作节点上打开。

  2. 您是否只部署了一个Deployment对于应用程序或者也是Service?如果你运行一个Service它是如何暴露的?您是否忘记启用NodePort?

Update:您的服务类型是负载均衡器。因此,GCE 中应该创建一个单独的负载均衡器。您需要获取负载均衡器的IP,并通过负载均衡器的IP访问服务。请参阅此链接中的“查找您的 IP”部分https://kubernetes.io/docs/tasks/access-application-cluster/create-external-load-balancer/ https://kubernetes.io/docs/tasks/access-application-cluster/create-external-load-balancer/

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何对 kubernetes 中运行的 Inception 服务的部署进行故障排除 的相关文章

随机推荐

  • 在 Hive 中将字符串转换为时间戳

    我有一个值 2017 09 27T19 25 15 927 07 00 有什么方法可以将其转换为时间戳吗 我使用 Hive 1 1 0 select unix timestamp 2017 09 27T19 25 15 927 07 00
  • 使用 HaskellDB 取消映射表记录的基本示例

    假设我有以下 PostgreSQL 表定义 CREATE TABLE books id serial NOT NULL title character varying NOT NULL PRIMARY KEY id 以及以下记录定义 dat
  • jquery wcf 肥皂调用失败

    有人知道我可以对 wcf 服务进行 jquerysoap 调用吗 我的 JQuery 代码 ajax url http localhost oseop orderingservice svc HelloWorld data txtTestR
  • Android 上的 Facebook 集成 fbconnect 断开的链接

    我正在尝试将 Facebook 集成到我的 Android 应用程序中 它可以正常登录 Facebook 但当它尝试将访问令牌传递回应用程序时 它只会返回 网页位于 fbconnect success access token 访问令牌 可
  • 使用 Caliburn.Micro 视图模型优先方法时如何在设计器中显示内容控制?

    我在 WPF 应用程序中使用 ViewModel first 方法使用 Caliburn Micro CM 我正在用命令栏和活动项目组成主视图 主 viewModel 设置命令栏 viewModel 的属性 并正确导航到活动项目 运行时一切
  • 如何缩放 UIButton 的 imageView?

    我使用以下命令创建了一个名为 button 的 UIButton 实例 其中包含图像 UIButton setImage forState Button frame 大于图像的大小 现在我想缩小这个按钮的图像 我尝试改变button ima
  • Typescript:如何基于数据结构生成和打印 AST

    我正在开始一个新项目 作为其界面的一部分 我们有一大堆 令牌 一个带有字符串值的递归对象 如下所示 const colors accent f90 primary active fff inactive silver 我们提供了一个实用程序
  • 使用 Eclipse AST

    我最近需要修改一些Java代码 添加方法 更改某些字段的签名和删除方法 我认为所有这些都可以通过使用Eclipse SDK的AST来完成 我从一些研究中知道如何解析源文件 但我不知道如何执行上述操作 有谁知道一个好的教程或者有人可以给我一个
  • kmean 需要三角不等式吗?

    我想知道对于 kmeans 中使用的距离度量是否需要三角不等式 k 均值是designed for 欧几里得距离 正好满足三角不等式 使用其他距离函数是有风险的 因为它可能会停止收敛 然而原因是not三角不等式 但是平均值可能不会最小化距离
  • Android Listview - 仅当用户停止滚动时将图像加载到项目中

    当用户快速滚动浏览项目时 开始请求图像来填充这些项目似乎是多余的 毕竟 用户滚动速度太快 它们永远不会被及时下载 显示 当用户实际暂停滚动时 是否有任何类型的方法 事件首先触发 尝试使用此代码来检测滚动停止 setOnScrollListe
  • 减少 WAV 声音文件大小,而不损失质量

    我的应用程序需要播放声音文件 我可以使用的唯一跨平台文件格式是 WAVE 我正在使用QSound http doc trolltech com 4 5 qsound html detailsQt 框架 这些声音的文件大小非常大 我想知道是否
  • InteractivePopGestureRecognizer 导致应用程序冻结

    在我的应用程序中 我有不同的控制器 当我将controller1推到导航控制器并滑动到后面时 一切正常 但是 如果我推导航控制器1 然后推入控制器1推控制器2并尝试向后滑动 我会得到一个冻结的应用程序 如果通过后退按钮返回一切正常 我怎样才
  • 如何在 Android Studio 运行时获取构建变体?

    我想在运行时获取构建变体 这是否可能不需要任何额外的配置或代码 查看生成的BuildConfig class public final class BuildConfig public static final boolean DEBUG
  • sqlite3_fts5使用标点符号时出错

    我有一个问题字符串变量 其中包含 我的车在哪里 一词 当我尝试对此运行选择时 它崩溃了 String sql Select from tblHALv2001 WHERE tblHALv2001 MATCH question fts5 附近的
  • plotly.js 中的分类轴顺序

    我有一个plotly js 条形图 我试图使 calcategories 轴的顺序正确 每个类别都有一个条形 但有时它们是绿色的 有时是黄色的 条形图应按从最高到最低的顺序排列 但情节似乎是根据不同的填充对它们进行排序 数据 var dat
  • 不可选择的下拉列表

    有没有什么方法可以让下拉列表中没有任何项目可供选择 所以基本上 我只是想用它作为显示 隐藏列表的一种方式 我不想要任何悬停突出显示 也不希望能够更改所选项目 您能否建议这是否可能 或者如果有人有任何其他想法来实现类似的目标 您能否给我指出一
  • 如何更改用户控件的访问修饰符

    我在 xaml 中创建了一个用户控件 将其命名为 View 在 View xaml cs 中 我将类 View 的访问修饰符更改为内部 internal partial class View ViewBase 更改访问修饰符后 编译器会显示
  • 如何在 linux (RedHat 6) 上检查 java 版本

    I am trying to check what java version I have installed in my linux machine I have tried which java 我得到 usr bin java 但是当
  • XAML - 设置样式后文本未显示在我的文本框中

    因此 我在正在开发的应用程序中设置了文本框的样式 突然间我看不到绑定到文本框的任何文本 我觉得我缺少某种 ContentPresenter 无论如何 这是样式
  • 如何对 kubernetes 中运行的 Inception 服务的部署进行故障排除

    我正在关注使用 TensorFlow Serving 和 Kubernetes 服务 Inception 模型 https tensorflow github io serving serving inception html当我尝试从本地