使用 Python 的 Vcard 解析器

2023-11-25

我正在解析我的 vcard 信息（复制到 txt 文件）以提取name:number并将其放入字典中。

数据样本：



BEGIN:VCARD  
VERSION:2.1  
N:MEO;Apoio;;;  
FN:Apoio MEO  
TEL;CELL;PREF:1696  
TEL;CELL:162 00  
END:VCARD  
BEGIN:VCARD  
VERSION:2.1  
N:estrangeiro;Apoio MEO;no;;  
FN:Apoio MEO no estrangeiro  
TEL;CELL;PREF:+35196169000  
END:VCARD

import re
file = open('Contacts.txt', 'r')
contacts = dict()

    for line in file:
            name = re.findall('FN:(.*)', line)
            nm = ''.join(name)

            if len(nm) == 0:
                continue
            contacts[nm] = contacts.get(nm)
    print(contacts)

有了这个，我得到了一本带有名字的字典，但对于数字，我没有得到。{'name': None, 'name': None}.

我可以用 re 来做这个吗？使用相同的名称和号码提取re.findall表达？

编辑 2023：vobject 库自2018年以来未更新过，我不建议与那个合作，因为我相信应该有更现代和更好的选择。不过，我不知道哪个更好，所以如果您有任何建议，请在评论中告诉我。

你最好使用已经现有图书馆而不是尝试重新发明轮子：

pip install vobject

然后在 python 中

>>> import vobject
>>> s = """\
... BEGIN:VCARD
... VERSION:2.1
... N:MEO;Apoio;;;
... FN:Apoio MEO
... TEL;CELL;PREF:0123456789
... TEL;CELL:0123456768
... END:VCARD
... BEGIN:VCARD
... VERSION:2.1
... N:estrangeiro;Apoio MEO;no;;
... FN:Apoio MEO no estrangeiro
... TEL;CELL;PREF:+0123456789
... END:VCARD """
>>> vcard = vobject.readOne(s)
>>> vcard.prettyPrint()
 VCARD
    VERSION: 2.1
    TEL: 1696
    TEL: 162 00
    FN: Apoio MEO
    N:  Apoio  MEO

你就完成了！

所以如果你想用它制作一本字典，你需要做的就是：

>>> {vcard.contents['fn'][0].value: [tel.value for tel in vcard.contents['tel']] }
{'Apoio MEO': ['1696', '162 00']}

所以你可以将所有这些变成一个函数：

def parse_vcard(path):
    with open(path, 'r') as f:
        vcard = vobject.readOne(f.read())
        return {vcard.contents['fn'][0].value: [tel.value for tel in vcard.contents['tel']] }

从那里，您可以改进代码以处理多个vcards 在一个单一的vobject文件，并更新dict与更多的电话。

注意：我留给您作为练习，将上面的代码从读取文件中的一张且仅一张 vcard 更改为可以读取多个 vcard 的代码。暗示：阅读以下文档vobject.

注意：我正在使用你的数据，并且我认为无论你写什么，它都是毫无意义的。但有疑问，我已经修改了电话号码。

只是为了好玩，让我们看一下您的代码。首先存在缩进问题，但我认为这是由于复制/粘贴错误造成的 ☺。

① import re
② file = open('Contacts.txt', 'r')
③ contacts = dict()

④ for line in file:
⑤     name = re.findall('FN:(.*)', line)
⑥     nm = ''.join(name)

⑦     if len(nm) == 0:
⑧         continue
⑨     contacts[nm] = contacts.get(nm)

⑩ print(contacts)

首先，第②行有两个问题。您正在使用打开文件open()，但您没有关闭该文件。如果您调用此函数来打开十亿个文件，您将耗尽系统的可用文件描述符，因为您没有关闭这些文件。作为一个好习惯，你应该始终使用 with 结构：

with open('...', '...') as f:
    … your code here …

它会为您处理文件描述符，并更好地显示您可以在哪里使用打开的文件。

第二个问题是你正在调用你的变量file，这是阴影file类型。希望，filetype 很少使用，但这是一个坏习惯，因为有一天您可能无法理解由于使用变量隐藏类型而发生的错误。只是不要使用它，有一天它会为你省去麻烦。

第 ⑤ 行和第 ⑥ 行，您正在应用re.findall每行的正则表达式。你应该更好地使用re.match()，因为您已经迭代了每一行，并且您不会FN: something在那条线之内。这会让你避免不必要的事情''.join(name)但是，不要使用正则表达式来完成如此简单的事情，您最好使用str.split():

if 'FN:' in line:
    name = line.split(':')[-1]

第 ⑦ 行不仅是多余的 — 如果您使用if上面，但实际上是错误的。因为这样你就会跳过所有没有的行FN:在其中，这意味着您永远不会提取电话号码，而只会提取姓名。

最后，第 ⑧ 行完全没有意义。基本上，你正在做的事情相当于：

if nm in contacts.keys():
    contacts[nm] = contacts[nm]
else:
    contacts[nm] = None

总而言之，在您的代码中，您所做的只是提取姓名，甚至不需要考虑电话号码。所以当你说：

有了这个，我得到了一本带有名字的字典，但对于数字，我没有得到

这是没有意义的，因为您实际上并没有尝试提取电话号码。

我可以用 re 来做这个吗？使用相同的名称和号码提取re.findall表达？

是的，您可以使用看起来像这样的东西（未经测试的正则表达式很可能不起作用），在整个文件上，或者至少对于每个电子卡：

FN:(?P<name>[^\n]*).*TEL[^:]*:(?P<phone>[^\n])

但是，当您拥有一个可以完美满足您需求的库时，为什么还要麻烦呢！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Python 的 Vcard 解析器的相关文章

根据随机选择的列生成随机天数

我有一个如下所示的数据框感谢 SO 社区在以下方面提供的帮助 df1 pd DataFrame person id 11 11 12 13 14 date birth 01 01 1961 12 30 1961 05 29 1967 01
根据 pandas 中的条件交换列值

我想按条件重新定位列如果国家地区是日本我需要将姓氏和名字反向重新定位 df pd DataFrame France Kylian Mbappe Japan Hiroyuki Tajima Japan Shiji Kagawa Eng
如何用spaCy获取依赖树？

我一直在尝试寻找如何使用 spaCy 获取依赖树但我找不到任何有关如何获取树的信息只能在如何导航树 https spacy io usage examples subtrees 如果有人想轻松查看 spacy 生成的依赖关系树一种解决
对打开文件的脚本进行单元测试

我编写了一个脚本它打开一个文件读取内容并进行一些操作和计算并将它们存储在集合和字典中我该如何为这样的事情编写单元测试我的问题具体是我会测试文件是否打开文件很大这是unix字典文件我如何对计算进行单元测试我真的必须手动计算
为 PyCharm 中的所有配置设置相同的环境变量

我有一个与 Celery 和很多不同的工作人员一起的项目如何避免每次将 PyCharm 中的环境变量复制粘贴到每个运行调试配置有什么方法可以在项目设置中设置它们吗找到解决方案here https stackoverflow com
如何检查包含 NaN 的列表 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案在我的 for 循环中我的代码生成一个如下所示的列表 list 0 0 0 0 sum 0 0 0 0 该循环生成所有其他数字向量但它也
如何像在浏览器中一样检索准确的 HTML

我正在使用 Python 脚本来呈现网页并检索其 HTML 它适用于大多数页面但对于其中一些页面检索到的 HTML 不完整我不太明白为什么这是我用来废弃此页面的脚本由于某种原因每个产品的链接不在 HTML 中 Link http
在 GAE/Python 中放置一次性代码和每次代码的最佳位置在哪里？

我是 Google App Engine 和 Python 的新手我无法理解有关在 Google App Engine 上运行的 Python 应用程序的一些基本问题如果我想要执行代码对于每个传入的请求我应该将其放在哪里我们正在捕
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
如何在 Keras 中使用部分输入进行训练，其余部分用于损失函数

我是 Keras 新手正在尝试实现神经网络机器学习模型输入张量看起来像 X1 X2 和输出 Y 注意 X1 和 X2 是相关的在模型中只有 X1 将用于训练但 X1 和 X2 都将传递给损失函数该损失函数是 X1 X2 y pr
将具有不同大小的行的数据加载到 Numpy 数组中

假设我有一个包含如下数据的文本文件 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 如何将它加载到 numpy 数组中使其看起来像这样 1 2 3 4 5 0 6 7 8 0 0 0 9 1
Matplotlib 将颜色图 tab20 更改为三种颜色

Matplotlib 有一些新的且非常方便的颜色图选项卡颜色图 https matplotlib org examples color colormaps reference html 我错过的是生成像 tab20b 或 tab20c 这
如何将reportlab与Google应用程序引擎一起使用

我无法在谷歌应用程序引擎下正确导入reportlab 根据以下guide http blog notdot net 2010 04 Generating PDFs on App Engine Python and introducing M
Docker 日志中的 Python 异常标记为流：stdout

我想解析和处理来自 docker 容器的所有错误但当我期望 stderr 时 Python 异常标记为 stdout 举个简单的例子app py raise Exception 然后我在 docker 容器中运行这个文件但在 var l
使用 pandas 绘制带有误差线的条形图

我正在尝试从 DataFrame 生成条形图如下所示 Pre Post Measure1 0 4 1 9 这些值是我从其他地方计算出来的中值我还有它们的方差和标准差以及标准误差我想将结果绘制为具有适当误差线的条形图但指定多个误差值
本地设置的 Cython 编译器指令是否影响一个或所有函数？

我正在努力使用 Cython 加速一些 Python Numpy 代码并且对本地设置如定义的here http docs cython org en latest src reference compilation html在文档中
Pandas DataFrame：如何计算组中第一行和最后一行的差异？

这是我的熊猫数据框 import pandas as pd import numpy as np data column1 338 519 871 1731 2693 2963 3379 3789 3910 4109 4307 4800 4
Windows 与 Linux 文本文件读取

问题是我最近从 Windows 切换到 Ubuntu 我的一些用于分析数据文件的 python 脚本给了我错误我不确定如何正确解决我当前仪器的数据文件输出如下 Header 有关仪器等的各种信息 Data 状态代码温度字段等 0
Melt() 函数复制数据集

我有一个这样的表 id name doggo floofer puppo pupper 1 rowa NaN NaN NaN NaN 2 ray NaN NaN NaN NaN 3 emma NaN NaN NaN pupper 4 sop
Python 中的迭代器 (iter()) 函数。 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案对于字典我可以使用iter 用于迭代字典的键 y x 10 y 20 for val in iter y print val 当

随机推荐

从双精度数到无符号 64 位整数的安全转换

在我的平台上打印 9223372036854775808 double x 1e19 std cout lt lt static cast
注释顺序重要吗？

如您所知注释驱动编程越来越多地融入到我们现在使用的大多数框架中即 Spring Lombok 等此外我们有时需要创建自定义注释例如使用切面记录给定类的所有公共方法的进入退出跟踪 LogAroundMethods 因此给定的类
如何更改角度4中输入类型=“日期”的输出日期格式？

实际上我正在使用 Angular 4 应用程序我遇到这样的情况我必须发送日期日月年到服务器我使用属性作为输入类型日期但这个属性返回的值是这样的年月日那么如何更改 Date txt 的输出格式呢学生 html
Python 多处理：运行时错误：“队列对象只能通过继承在进程之间共享”

我知道 multiprocessing Manager 以及如何使用它来创建共享对象特别是可以在工作人员之间共享的队列有这个question this question 和这个question 但是这些链接没有提到为什么我们可以使用继
System.Net.HttpWebResponse.GetResponseStream() 在 WebException 中返回截断的正文

由于某种超出我理解的原因向特定网站发出的请求 https learningnetwork cisco com people mrollins view profile 产生一个响应对象其响应流包含网站的截断版本该流在 65536 字节后
Music21：从 MIDI 文件获取每个乐器的所有音符

我正在按照指示解析 MIDI 文件here 我的代码如下所示 from music21 import converter instrument or import file converter parse sample mid compon
Java：无需 jmap 或无需挂起应用程序即可获取堆转储

在少数情况下我们的应用程序使用大约 12 GB 内存我们尝试使用 jmap 实用程序获取堆转储由于应用程序使用了一些 GB 的内存因此会导致应用程序停止响应并导致生产问题在我们的例子中堆使用量在 6 小时内突然从 2 3 GB
Azure 暂存 Web 部署失败，并显示 ERROR_USER_NOT_AUTHORIZED_FOR_CREATEAPP 但不适用于生产

我正在尝试在 Azure 中进行自动化网站部署并且正处于运行 Web 部署命令的阶段用于生产的命令工作正常并更新内容但用于暂存的命令失败标题中出现错误代码我不确定问题出在哪里如果是授权问题我不确定在哪里为临时帐户设置更多权限
如何设置 sqldatasource 参数的值？

我正在尝试设置的值sqldatasource s selectcommand范围 ClientID如下面的代码所示但它不起作用 My code Dim strCommand SELECT caller id phone name emai
Spring MVC：如何为标签指定默认值？

我在提供时遇到问题
rows.add 和 importRow 之间的区别

在vb net中向数据表添加行时 rows add和importRow有什么区别 Dim dt As DataTable Dim dr As DataRow Add row this way dt rows add dr or this w
了解 malloc 和 free 指针

指针在 C 中是一个非常棘手的东西对于很多人来说很难理解它所以为了更好地理解我编写了以下代码 include
在 Spring Webflux 功能应用程序中验证请求的最佳方法是什么

在传统的 Web 应用程序中很容易在控制器方法中验证请求主体例如 ResponseEntity create Valid ResponseBody Post post 如果是 MVC 应用程序我们可以通过注入一个来收集错误Bindin
编译 CUDA 示例出现构建错误

我运行的是 Windows 7 64 位带有 Visual Studio 2008 我安装了 CUDA 驱动程序和 SDK SDK 附带了很多示例包括编译的可执行文件和源代码编译后的可执行文件运行得非常好当我打开 vc90 解决方案
jQuery Ajax：如何等到 *async* 请求成功完成后再继续？

我在加快 ajax 速度时遇到问题and功能性的这是伪原型代码 function blah1 arg1 arg1 is an array roughly 10 elements var arr each arg1 function i
Laravel：Form::open() 中的 HTTPS

我在我的登录中为我的网站使用 SSL Cloudflare HTTPS 因为我使用 Laravel 不会将我的网站链接转换为 SSL 版本它显示http版本我如何强制 Laravel 使用https for me 例如
不安全的 JavaScript 尝试访问 Google Chrome 中的框架

我们的网络应用程序基于 HTML5 SVG 和 JS 在除 Google Chrome 之外的所有浏览器中运行良好在 Google Chrome 中正常的 javascript 事件运行良好但是附加到 iFrame 的所有 jav
PowerShell - Set-Culture 似乎没有改变任何东西

我有一个云服务 Web 角色需要在其上运行一些 PowerShell 以确保服务器始终设置为正确的区域性 en AU 原因是微软可以随时重置文化价值观当我跑步时 Get Culture I get 1033 en US English
从数组中删除多个索引

我有一个数组我想删除一堆索引 var arr 0 1 2 3 4 5 6 var rmIndices 1 4 5 从 arr 中删除索引 1 4 5 的最佳方法是什么注意PermutationGenerator在 Swift 3 中将会
使用 Python 的 Vcard 解析器

我正在解析我的 vcard 信息复制到 txt 文件以提取name number并将其放入字典中数据样本 BEGIN VCARD VERSION 2 1 N MEO Apoio FN Apoio MEO TEL CELL PREF 1

使用 Python 的 Vcard 解析器

使用 Python 的 Vcard 解析器 的相关文章

随机推荐

热门标签

使用 Python 的 Vcard 解析器的相关文章