我将使用一些列表来完成我需要的操作。
首先,让我们创建模式:
pattern = re.compile(r"[^\u0E00-\u0E7Fa-zA-Z' ]|^'|'$|''")
我将使用一个名为test_string
,包含您的示例:
test_string="ทรูวิชั่นส์ ประกาศถ่ายทอดสดศึกฟุตบอล พรีเมียร์ ลีก อังกฤษ ครบทุกนัดเป็นเวลา 3 ปี ตั้งแต่ฤดูกาล 2016/2017 - 2018/2019 พร้อมด้วยอีก 5 ลีกดัง อาทิ ลา ลีกา สเปน, กัลโช เซเรีย เอ อิตาลี และลีกเอิง ฝรั่งเศส ภายใต้แพ็กเกจสุดคุ้ม ทั้งผ่านมือถือ และโทรทัศน์ some, English words here! abc123"
首先,让我们在列表中获取要删除的字符:
char_to_remove = re.findall(pattern, test_string)
然后,让我们创建一个由原始字符串中的字符组成的列表,不包含这些字符:
list_with_char_removed = [char for char in test_string if not char in char_to_remove]
我们将此列表转换为字符串,就完成了。
result_string = ''.join(list_with_char_removed)
结果是:
'ทรูวิชั่นส์ ประกาศถ่ายทอดสดศึกฟุตบอล พรีเมียร์ ลีก อังกฤษ ครบทุกนัดเป็นเวลา ปี ตั้งแต่ฤดูกาล พร้อมด้วยอีก ลีกดัง อาทิ ลา ลีกา สเปน กัลโช เซเรีย เอ อิตาลี และลีกเอิง ฝรั่งเศส ภายใต้แพ็กเกจสุดคุ้ม ทั้งผ่านมือถือ และโทรทัศน์ some English words here abc'
如果您有更干净的方法来执行任何步骤/有任何问题,请不要犹豫!