python 脚本在 docker 内运行时无法导入 kafka 库 [重复]

2024-04-13

我有以下 python 脚本，可以从 twitter 中提取推文并将其发送到 kafka 主题。该脚本运行完美，但是当我尝试在 docker 容器内运行它时，它无法导入 kafka 库。它说“语法错误：语法无效”。

以下是 python 脚本（twitter_app.py）的内容：

import socket
import sys
import requests
import requests_oauthlib
import json
import kafka
from kafka import KafkaProducer
import time
from kafka import SimpleProducer
from kafka import KafkaClient

###################################################
# My own twitter access tokens
####################################################
ACCESS_TOKEN = '28778811-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'
ACCESS_SECRET = 'HBGjTXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'
CONSUMER_KEY = '#################################'
CONSUMER_SECRET = '############################################'

my_auth = requests_oauthlib.OAuth1(CONSUMER_KEY, CONSUMER_SECRET,ACCESS_TOKEN, ACCESS_SECRET)

####################################################
# Kafka Producer
####################################################
twitter_topic="twitter_topic"
client = KafkaClient("10.142.0.2:9092")
producer = SimpleProducer(client)
#producer = kafka.KafkaProducer(bootstrap_servers='10.128.0.2:9092')

def get_tweets():
    print("#########################get_tweets called################################")
    url = 'https://stream.twitter.com/1.1/statuses/filter.json'
    #query_data = [('language', 'en'), ('locations', '-130,-20,100,50'),('track' ,'#')]
    #query_data = [('language', 'en'), ('locations', '-3.7834,40.3735,-3.6233,40.4702'),('track','#')]
    query_data = [('language', 'en'), ('locations', '-3.7834,40.3735,-3.6233,40.4702'),('track','Madrid')]
    query_url = url + '?' + '&'.join([str(t[0]) + '=' + str(t[1]) for t in query_data])
    #print("Query url is", query_url)
    response = requests.get(query_url, auth=my_auth, stream=True)
    print(query_url, response)
    return response

def send_tweets_to_kafka(http_resp):
    print("########################send_tweets_to_kafka called#################################")
    for line in http_resp.iter_lines():
        print("reading tweets")
        try:
            full_tweet = json.loads(line)
            tweet_text = full_tweet['text']
            print("Tweet Text: " + tweet_text)
            print ("------------------------------------------")
            tweet_text = tweet_text + '\n'
            producer.send_messages(twitter_topic, tweet_text.encode())
            #producer.send(twitter_topic, tweet_text.encode())
            time.sleep(0.2)
        except:
            print("Error received")
            e = sys.exc_info()[0]
            print("Error: %s" % e)
    print("Done reading tweets")

##############
# Actual Execution starts here
###############
resp = get_tweets()
send_tweets_to_kafka(resp)

但是，现在我尝试在 docker 容器内运行此脚本，但它失败了，并且出现以下错误：

Traceback (most recent call last):
  File "twitter_app.py", line 6, in <module>
    import kafka
  File "/usr/local/lib/python3.7/site-packages/kafka/__init__.py", line 23, in <module>
    from kafka.producer import KafkaProducer
  File "/usr/local/lib/python3.7/site-packages/kafka/producer/__init__.py", line 4, in <module>
    from .simple import SimpleProducer
  File "/usr/local/lib/python3.7/site-packages/kafka/producer/simple.py", line 54
    return '<SimpleProducer batch=%s>' % self.async
                                                  ^
SyntaxError: invalid syntax

以下是 Dockerfile 的内容供您参考（请注意，当我使用相同的 Dockerfile 和一个不使用 kafka 的简单脚本时，它工作得很好）：

FROM python:3
MAINTAINER kamal.nandan@<myemailservice>

RUN apt-get update
RUN apt-get install -y python3
RUN pip install requests
RUN pip install requests_oauthlib
RUN pip install kafka

ADD twitter_app.py /
CMD python3 twitter_app.py

这几天我一直在与它斗争，但我一直无法弄清楚问题所在。任何帮助将非常感激。提前致谢。

该错误仅发生在 python 3.7 中，因为不兼容的更改，async 是保留关键字 https://docs.python.org/3/whatsnew/3.7.html从这个版本开始。

解决方案是继续使用python 3.6，直到库适应新版本，有一个已经关闭issue https://github.com/dpkp/kafka-python/issues/1566:

FROM python:3.6
MAINTAINER kamal.nandan@<myemailservice>

RUN pip install requests requests_oauthlib kafka

ADD twitter_app.py /
CMD python3 twitter_app.py

（我冒昧地减少了Dockerfile）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Docker

ApacheKafka

python 脚本在 docker 内运行时无法导入 kafka 库 [重复] 的相关文章

Python 3 os.urandom

在哪里可以找到完整的教程或文档os urandom 我需要获得一个随机 int 来从 80 个字符的字符串中选择一个字符如果你只需要一个随机整数你可以使用random randint a b 来自随机模块 http docs pytho
Twisted 的 Deferred 和 JavaScript 中的 Promise 一样吗？

我开始在一个需要异步编程的项目中使用 Twisted 并且文档非常好所以我的问题是 Twisted 中的 Deferred 与 Javascript 中的 Promise 相同吗如果不是有什么区别你的问题的答案是Yes and No
如何以“正确”的方式处理带有空字节的 Python unicode 字符串？

Question PyWin32 似乎很乐意将 null 终止的 unicode 字符串作为返回值我想以正确的方式处理这些字符串假设我得到一个像这样的字符串 u C Users Guest MyFile asy x00 x00sy
为什么删除临时文件时出现WindowsError？

我创建了一个临时文件向创建的文件添加了一些数据已保存然后尝试将其删除但我越来越WindowsError 编辑后我已关闭该文件如何检查哪个其他进程正在访问该文件 C Documents and Settings Administra
保留完整姓氏，在 pandas 列中获取名字的首字母（如果有的话，还有中间名）

我有一个 pandas 数据框其中有一列表示几位网球运动员的姓氏和姓名如下所示 Player 0 Roddick Andy 1 Federer Roger 2 Tsonga Jo Wilfred 我想保留完整的姓氏并获取姓名的首字母和中
检查 Python 中的可迭代对象中的所有元素的谓词是否计算为 true

我很确定有一个常见的习语但我无法通过谷歌搜索找到它这是我想做的用Java Applies the predicate to all elements of the iterable and returns true if all ev
工作日重新订购 Pandas 系列

使用 Pandas 我提取了一个 CSV 文件然后创建了一系列数据来找出一周中哪几天崩溃最多 crashes by day bc DAY OF WEEK value counts 然后我将其绘制出来但当然它按照与该系列相同的排名顺序绘制
Pandas：如果单元格包含特定文本则删除行

pandas 中的这段代码不起作用如果该列包含提供的任何文本数字我希望它删除该行目前我只能在单元格与我的代码中传递的确切文本匹配时才能使其工作因为它只删除显示 Fin 的单元格不是金融或金融 df2 df df Team Fin
没有名为 StringIO 的模块

我有Python 3 6 我想从另一个名为 run py 的 python 文件执行名为 operation py 的 python 文件 In operation py I do from cStringIO import StringI
一段时间后终止线程的最 Pythonic 方法

我想在线程中运行一个进程它正在迭代一个大型数据库表当线程运行时我只想让程序等待如果该线程花费的时间超过 30 秒我想终止该线程并执行其他操作通过终止线程我的意思是我希望它停止活动并优雅地释放资源我认为最好的方法是通过Thre
Django send_mail SMTPSenderRefused 530 与 gmail

一段时间以来我一直在尝试使用 Django 从我正在开发的网站接收电子邮件现在我还没有部署它并且我正在使用Django开发服务器我不知道这是否会影响它这是我的 settings py 配置 EMAIL BACKEND djang
通过索引访问Python字典的元素

考虑一个像这样的字典 mydict Apple American 16 Mexican 10 Chinese 5 Grapes Arabian 25 Indian 20 例如我如何访问该字典的特定元素例如我想在对 Apple 的第一个
用 python 编写的数学语法检查器

我需要的只是使用 python 检查字符串是否是有效的数学表达式为了简单起见假设我只需要运算符也作为一元带有数字和嵌套括号为了完整性我还添加了简单的变量名称所以我可以这样测试 test 3 2 1 valid test 3
Mac OSX 10.6 上的 Python mysqldb 不工作

我正在使用 Python 2 7 并尝试让 Django 项目在 MySQL 后端运行我已经下载了 mysqldb 并按照此处的指南进行操作 http cd34 com blog programming python mysql pyth
Elasticsearch 通过搜索返回拼音标记

我用语音分析插件 https www elastic co guide en elasticsearch plugins current analysis phonetic html由于语音转换从弹性搜索中进行一些字符串匹配我的问题是
Django Admin 中的反向内联

我有以下 2 个型号现在我需要将模型 A 内联到模型 B 的页面上模型 py class A models Model name models CharField max length 50 class B models Model n
混淆矩阵不支持多标签指示符

multilabel indicator is not supported是我在尝试运行时收到的错误消息 confusion matrix y test predictions y test is a DataFrame其形状为 Horse
从 pandas DataFrame 中删除少于 K 个连续 NaN

我正在处理时间序列数据我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题我尝试查看一些链接例如标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此
多个对象以某种方式相互干扰[原始版本]

我有一个神经网络 NN 当应用于单个数据集时它可以完美地工作但是如果我想在一组数据上运行神经网络然后创建一个新的神经网络实例以在不同的数据集甚至再次同一组数据上运行那么新实例将产生完全错误的预测例如对 XOR 模式进行训练

随机推荐

“事件”已被弃用，应该使用什么来代替？

我正在使用找到的使用事件的代码它有效但我想知道应该使用什么来代替我是一名新手程序员我缺少一些概念在本例中我使用的是在网上找到的代码可以在下一个链接中找到 https codepen io galulex pen eNZRV
Java程序要故意填充PermGen？

当 PermGen 已满时 Glassfish 有时无法停止在这种情况下asadmin stop domain domain1不起作用在 Glassfish 2 1 1 中它会永远坐在那里在 3 x 之后超时AS ADMIN REA
Rails 测试错误：WHERE 的参数必须是布尔类型，而不是整数类型

用户可以通过 has many 关联为帖子投票我在运行测试时收到此错误 ActiveRecord StatementInvalid PG DatatypeMismatch ERROR argument of WHERE must be t
Spring 集成 Java DSL - 动态创建 IntegrationFlows

我正在使用 Spring Boot 1 5 13 RELEASE 和 Spring Integration 4 3 16 RELEASE 开发一个应用程序我对 Spring Integration 还很陌生并且遇到了一个问题所以基本的
删除换行符，除非前面有

我需要从某些文本中删除额外的换行符我只需要保留紧接着句号句点字符的换行符在下面的示例文本中我只需要保留 2 个换行符后一个 arcu rhoncus 以及之后的一张 ac in est Donec viverra mi quis
Flutter FirebaseAuth：当电子邮件地址格式错误时，SignInWithEmailAndPassword 无法处理错误

这是我的 FirebaseAuthService 类中的电子邮件登录方法 override Future
无法使用数据断点 C++、Visual Studio 2013

我将调试器设置为仅限本机解决方案配置为调试但新数据断点选项仍然呈灰色我无法使用它谁能提示我还需要更改什么确保活动项目调试器设置为 Native Only 用另一个普通断点开始调试然后可以看到新建数据断点可以点击换句
加密/解密 json 字符串的最佳方法是什么

我有一个运行 mysql 和 php 的网络服务器它将数据发送到 json 字符串我有第二个网络服务器它读取数据然后显示它目前一切正常我需要在字符串中添加一些敏感数据所以我想知道使用 php 加密解密 json 的最佳方法是什
在上传之前使用环回组件存储中的远程挂钩重命名文件

在上传到环回组件存储之前我很难重命名文件看起来环回并没有提供相同的内置选项对于从角度形式上传我使用了角度上传器 beforeupload 方法来使用以下方法更改文件名 this fileExtension item file na
退出 Excel 中的嵌套循环

我在宏中有一个循环我正在编写以下结构本书中有两个工作表原始数据因此是端点数据变量和总账总账表因此是端点GL变量有三种for该函数中的循环 1 第一个循环迭代原始数据文件中的每条记录 2 第二个循环迭代已验证的匹配项REGE
检测二进制文件的 GCC 编译时标志

有没有办法找出特定二进制文件编译时使用的 gcc 标志快速浏览一下 GCC 文档并没有发现任何问题 Boost 人员是一些最聪明的 C 开发人员他们resort http www boost org doc libs 1 36 0 mo
php中如何获取一个类的所有子类

是否有可能在php中获取给定类的所有子类 function getSubclassesOf parent result array foreach get declared classes as class if is subclass o
在 XMPP 中交换自定义 XML 元素的最佳方式？

我有一个 XMPP 应用程序其中两个客户端进行交互 1 一个机器人编程Smack http www igniterealtime org projects smack Scala Java 和 2 一个 GUI 聊天客户端strophe
使用 Microsoft Access 创建独立应用程序

有一次我看到一个用 MS Access 制作的数据库它可以像普通程序一样工作即带有一个可执行文件可以打开漂亮的 UI 并允许访问表单和报告我也尝试做同样的事情我什至用谷歌搜索但没有找到如何做有人知道如何使用 Access 构建
Java 保持价格的最佳类型[重复]

这个问题在这里已经有答案了可能的重复用 Java 表示货币值 https stackoverflow com questions 285680 representing monetary values in java 哪种java类型适
jQuery Mobile 只滚动内容，而不是整个页面

我正在使用 jQuery Mobile 和 Phonegap 构建一个应用程序现在当我获得一个页面并需要滚动时 jQuery Mobile 会滚动整个页面而不是内容滚动条应该仅位于内容部分所在的位置但看起来滚动条会滚动整个页面它
链接服务器是否有“IF EXISTS”测试？

我希望能够以编程方式在 T SQL 中检查当前服务器和数据库是否已存在特定的链接服务器这样如果链接尚不存在我可以创建它我尝试过这样的事情 IF OBJECT ID myserver devdb 1 IS NULL BEGIN P
是否可以使用 Google App Engine 作为 Android 应用程序的后端数据库？

我想为 Android 编写一个客户端应用程序使用 Google App Engine 作为数据库后端我的 Android 客户端将连接到 App Engine 以保存信息然后稍后连接以获取报告是否可以像这样使用App Engine
C++：为什么对于内置（即类似 C）类型，按值传递通常比按引用传递更有效

正如标题所示编译器供应商通常会将引用实现为指针指针的大小往往与许多内置类型相同或更大对于这些内置类型无论您是按值传递还是按引用传递都将传递相同数量的数据 In然而为了获取实际数据您需要取消引用该内部指针这可以在生成的代码中添
python 脚本在 docker 内运行时无法导入 kafka 库 [重复]

这个问题在这里已经有答案了我有以下 python 脚本可以从 twitter 中提取推文并将其发送到 kafka 主题该脚本运行完美但是当我尝试在 docker 容器内运行它时它无法导入 kafka 库它说语法错误语法无效

python 脚本在 docker 内运行时无法导入 kafka 库 [重复]

python 脚本在 docker 内运行时无法导入 kafka 库 [重复] 的相关文章

随机推荐

热门标签