如何从Python字符串中提取国家/地区

2024-04-26

我有一些文本，其中可能包含也可能不包含国家/地区名称。例如：

“尼日利亚：Hotspot Network LTD 农村电话可行性研究”

这就是我从中提取国家/地区名称的方法。在我的第一次尝试中：

findcountry("Nigeria: Hotspot Network LTD Rural Telephony Feasibility Study")

def findCountry(stringText):
    for country in pycountry.countries:
        if country.name.lower() in stringText.lower():
            return country.name
    return None

不幸的是，它给了我错误的输出[Niger]而正确的是尼日利亚。注意尼日尔和尼日利亚是世界上两个不同的现有国家。

在第二次尝试中：

def findCountry(stringText):
    full_list =[]
    for country in pycountry.countries:
        if country.name.lower() in stringText.lower():
            full_list.append(country)

    if len(full_list) > 0:
        return full_list

    return None

I get ['Niger', 'Nigeria']作为输出。但我找不到办法让尼日利亚作为我的最终输出。如何实现这一目标。

注意：在这里我知道尼日利亚是正确的答案，但稍后我会将其放入代码中以选择最终的国家/地区名称（如果出现在文本中），并且它应该具有非常高的检测准确性。

始终首先搜索最长的字符串；这将防止您遇到的那种错误。

countries = sorted(pycountry.countries, key=lambda x: -len(x))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

如何从Python字符串中提取国家/地区的相关文章

了解 Beautiful Soup 中的 Find() 函数

我知道我想做的事情很简单但这让我感到悲伤我想使用 BeautifulSoup 从 HTML 中提取数据为此我需要正确使用 find 功能这是我正在使用的 HTML div class audit div class profile
单元测试 python 代码，其中 configparser 从配置文件中读取

我是 python 单元测试的新手我学习并进行了示例单元测试其中方法接受输入并返回输出但对于下面提到的代码我有一些疑问如何在unittest中模拟init方法的configparser 路径 config program cfg
lxml 中的通配符命名空间

如何使用 xpath 忽略 xml 命名空间进行查询我正在使用 python lxml 库我尝试了以下解决方案this https stackoverflow com questions 13463871 xpath selecting
有没有办法使用 Mayavi 填充陀螺仪表面的一侧？

我正在使用 Mayavi 绘制陀螺仪的等值面我的问题是我需要通过填充两个生成区域的一侧来获得更坚固的结构在下面的图片中您可以看到我生成的等值面的外观以及填充一侧后的外观我生成的等值面它应该是什么样子等值面可以通过以下方程生成 U
字符串的“相关矩阵”。名义数据的相似度

这是我的数据框 df store 1 store 2 store 3 store 4 0 banana banana plum banana 1 orange tangerine pear orange 2 apple pear melon
Pythonic方式逐行读取文件？

以下两种方法中逐行读取文件的 Pythonic 方法是什么 with open file r as f for line in f print line or with open file r as f for line in f read
Python - 重写 print()

我正在使用 mod wsgi 想知道是否可以覆盖 print 命令因为它没用这样做是行不通的 print myPrintFunction 因为这是一个语法错误 Print 不是 Python 2 x 中的函数因此这不能直接实现但是
Pandas 数据框列总和并收集结果

给定以下数据框 import pandas as pd p1 name willy age 11 interest Lego p2 name willy age 11 interest games p3 name zoe age 9 int
如何在 Django 中创建多选框？

我正在尝试创建多选框字段来自姜戈选择 2 https github com applegrew django select2库如下图所示我使用了下一个代码但它返回简单的选择多个小部件我想我忘了补充一些东西我的错误在哪里有人可以告诉
PySide2/QML 填充 Gridview 模型/委托并为其设置动画

我是 QML 的新手正在寻求以下几点帮助如何基于 TextField 输入如 Regex 通过 PySide2 过滤 Gridview 模型中的 QAbstractListModel 数据标题如何在鼠标悬停时为 Gridview
Python：从字符串访问变量[重复]

这个问题在这里已经有答案了这可能是非常基本和简单的事情我可能只是在谷歌上搜索错误的术语但希望这里有人可以帮助我我仍然是编程的初学者这从这个问题中可能是显而易见的我正在寻找一种从字符串访问变量的方法像这样 A1 B1 C1 my
Pytest 插件：覆盖 pytest_runtest_call 和朋友

我正在为我的一个项目使用 pytest 开发一个测试套件由于项目的性质我需要创建一个 Pytest 插件来控制测试的运行方式它们不是在本地运行而是发送到不同的进程来运行我知道关于xdist但我认为这并不能解决我的问题我一直在通过
python 中打印变量和字符串

好吧我知道如何打印变量和字符串但是我如何打印类似我的字符串 card price 的内容它是我的变量我的意思是这是我的代码 print I have and here I would like to print my varia
返回 OSError 异常类的子类实例的逻辑在哪里？

我一直在寻找一些对某些人来说可能相对愚蠢的东西但对我来说非常有趣输入和输出错误已合并为OSError在 Python 3 3 中异常类层次结构发生了变化关于内置类的一个有趣的特性OSError是这样它在传递时返回它的子类errno
随机数生成器每次仅返回一个数字

Python 是否有一个随机数生成器每次只返回一个随机整数next 函数被调用数字不应该重复并且生成器应返回区间内的随机整数 1 1 000 000 这是独一无二的我需要生成超过一百万个不同的数字这听起来好像非常消耗内存以防所有数
在 matplotlib 中添加新的导航模式

我正在编写一个 wx matplotlib 应用程序并且在向 matplotlib 导航工具栏添加新工具时遇到相当大的困难基本上我想添加选择工具选取框套索等以切换受控子图的鼠标模式到目前为止我还没有找到任何功能可以让我轻松地做
如何按分层类别结构中的值对 pandas 中的数据框进行排序

我有一个 pandas 数据框 pd DataFrame category Transport Transport Car Transport Train Household Household Utilities Household Ut
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
在 python 中使用 org.mpris.mediaplayer2.player PlaybackStatus 属性

The 规格页 http specifications freedesktop org mpris spec latest Player Interface html summary对于这个特定的接口说 PlaybackStatus s P
将 sudo 与 Python 脚本结合使用

我正在尝试编写一个小脚本来在每次执行脚本时安装 VirtualBox 共享文件夹我想用Python 来做这件事因为我正在尝试学习它来编写脚本问题是我需要特权才能启动挂载命令我可以将脚本作为 sudo 运行但我更喜欢它自己创建 su

随机推荐

使用 dockerfile 成功安装 java 但它说找不到 java 命令

这是我的 docker 文件 RUN apt get install y no install recommends software properties common RUN add apt repository y ppa openj
Hashcode() 与 Equals()

我有下面这两门课 class Emp implements Comparable String name job public String getName return name public void setName String na
String s="abc"+"xyz" 中将创建多少个String对象；在 Java 1.5 的早期版本中？

按照这个link https stackoverflow com questions 6578133 how many java string objects will be created in the statement string
移动网站可以进行生物识别吗？

我有移动网站在这个应用程序中我想使用设备的本机PIN Faceid and Fingerprint身份验证这实际上可能吗因为我认为浏览器不会允许我这样做我还听说如果我想要这种行为我应该创建 PWA 渐进式网络应用程序那么从浏
如何在使用 https 克隆后通过 SSH 访问 git 存储库？

我有一个已经在我的计算机上克隆的存储库https 我想将此存储库设置为ssh这样我就不必每次 git push 时都输入用户名和密码关于如何转换它的任何建议https将存储库克隆到ssh而不必实际重新克隆它这样我就可以避免一直输入我的凭
python paramiko 模块中长时间运行的 ssh 命令（以及如何结束它们）

我想运行一个tail f logfile使用 python 的 paramiko 模块在远程计算机上运行命令到目前为止我一直在尝试以下方式 interface paramiko SSHClient snip the connection
使用 OOP 在 WordPress 中添加动作？

我正在学习 OOP 并且我想我已经掌握了它的窍门我的问题是为什么 WordPress 样板插件的作者会写这样的添加操作函数 add action admin init array this admin init 根据法典我理解add ac
从 firebase 云消息传递中获取所有订阅的主题

使用新的 FirebaseMessaging 可以通过以下方式轻松取消订阅主题 FirebaseMessaging getInstance subscribeToTopic FirebaseMessaging getInstance un
我可以让部分 Google Apps 脚本代码以我的身份执行，而其余部分以访问用户的身份执行吗？

我有一个应用程序脚本 Web 应用程序可以写入融合表以及定期缓存的一些电子表格我不想向同事提供对融合表的编辑访问权限他们可以根据自己的需要编辑条目目前 Web 应用程序以用户身份执行适用于我组织内的任何人这就是目的但是我希
如何让用户会话持续24小时？

我搞乱了我的 apache 和 php ini 文件我的网站的用户仍然抱怨网站在很短的时间后或每次关闭并打开同一个浏览器时都会将他们注销我正在运行 Apache 和 PHP 我应该进行哪些设置才能使用户会话持续 24 小时这样他们就不
类型推导后函数模板中的替换顺序是否有保证？

考虑这个函数模板 template
如何在 Angular Reactive 表单中根据条件以动态方式显示/隐藏字段

我的场景是我有 3 个用户 1 admin将有 3 个字段电子邮件名字姓氏 2 雇员将有 4 个字段电子邮件名字姓氏联系人 3 前台将有 5 个字段电子邮件名字姓氏航空公司详细信息供应商人名堆栈闪电战链接 https
是否可以使用 UINavigationController 但隐藏其导航栏（用自定义工具栏替换它）和返回按钮

我希望使用 UINavigationController 在 2 个 UIViewController 之间切换 AUIViewController BUIViewController与UIView AView BView相关 AView
如何追加到 Swift 字典中的值数组

假设我有一个字典它接受字符串作为键和数组作为值 var d String Int d k Int 现在我想append 到下面的数组 k 我怎么做 Int d k append 1 error d k as Int append 1 er
如何循环遍历列表并删除 groovy 中的项目？

我试图弄清楚如何从循环内的 groovy 列表中删除项目 static main args def list1 1 2 3 4 for num in list1 if num 2 list1 remove num println list1
小型开发团队的 Git 分支策略 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我们有一个网络应用程序几乎每天都会更新和发布我们使用 git 作为我们的版本控制系统我们当前的分支策略非常简单且不完善我们有一个主分支
扩大 x 轴上刻度线之间的间距

我想扩大 R 中 x 轴刻度线之间的间距我在 x 轴上有年份c 2005 2012 y 轴上每年一个值说 A lt c 5 4 6 7 3 8 4 2 B lt c 2005 2012 plot B A type l 我现在需要扩大每个
对象Vba读取项目

我无法读取电影对象我不知道为什么我试图将 JSOn API 返回到 Excel 中的工作表但我无法读取电影对象 Sub getData Dim Movie As Object Dim R As Object Dim scriptCon
检查 datagridview 单元格是否为空或为空[重复]

这个问题在这里已经有答案了我必须更改单元格的背景颜色当它们的值为字符串或空时这是我编写的代码与此处的其他代码类似 for int rowIndex 0 rowIndex lt dataGridView1 RowCount rowIn
如何从Python字符串中提取国家/地区

我有一些文本其中可能包含也可能不包含国家地区名称例如尼日利亚 Hotspot Network LTD 农村电话可行性研究这就是我从中提取国家地区名称的方法在我的第一次尝试中 findcountry Nigeria Hotspo

如何从Python字符串中提取国家/地区

如何从Python字符串中提取国家/地区 的相关文章

随机推荐

热门标签

如何从Python字符串中提取国家/地区的相关文章