lxml
对于它使用的第 3 方库有点挑剔,而且它通常需要比 Apple 提供的版本更新的版本。建议您阅读并遵循说明here用于建筑lxml
从 Mac OS X 上的源代码开始,包括构建自己的静态链接库。那应该有效。 (我有点惊讶 homebrew 还没有 lxml 配方。)
更新:根据您评论中的有限信息,很难确定究竟发生了什么。我怀疑你没有使用你认为的 Python 版本。有多种方法可以成功安装 lxml;这就是问题的一部分:选择太多。这可能是使用 Apple 提供的系统 Python 2.7 在 10.7 上获取有效 lxml 的最简单方法,而不是尝试调试您的设置。
$ sudo STATIC_DEPS=true /usr/bin/easy_install-2.7 lxml
然后你应该能够使用lxml.etree
这边走:
$ /usr/bin/python2.7
Python 2.7.1 (r271:86832, Jun 16 2011, 16:59:05)
[GCC 4.2.1 (Based on Apple Inc. build 5658) (LLVM build 2335.15.00)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> from lxml import etree
>>> etree.__file__
'/Library/Python/2.7/site-packages/lxml-2.3.1-py2.7-macosx-10.7-intel.egg/lxml/etree.so'
>>>
我注意到虽然lxml
静态构建过程不会产生有效的通用构建。您可能会在lxml
安装:
ld: warning: ignoring file /private/tmp/easy_install-83mJsV/lxml-2.3.1/build/tmp/libxml2/lib/libxslt.a, file was built for archive which is not the architecture being linked (i386)
假设您机器上的默认架构是 64 位,如果您尝试在 32 位模式下运行:
$ arch -i386 /usr/bin/python2.7
Python 2.7.1 (r271:86832, Jun 16 2011, 16:59:06)
[GCC 4.2.1 (Based on Apple Inc. build 5658) (LLVM build 2335.15.00)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> from lxml import etree
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ImportError: dlopen(/Library/Python/2.7/site-packages/lxml-2.3.1-py2.7-macosx-10.7-intel.egg/lxml/etree.so, 2): Symbol not found: _htmlParseChunk
Referenced from: /Library/Python/2.7/site-packages/lxml-2.3.1-py2.7-macosx-10.7-intel.egg/lxml/etree.so
Expected in: flat namespace
in /Library/Python/2.7/site-packages/lxml-2.3.1-py2.7-macosx-10.7-intel.egg/lxml/etree.so
>>> ^D
还有您最初报告的错误消息!所以根本原因似乎是静态库(libxml2
等)那个lxml
构建并不通用。只要你不需要使用lxml
在 32 位进程中(对于大多数用途来说不太可能),这应该不是问题。您最初使用的 Python 很可能是纯 32 位的;这与您报告的其他一些消息一致。