lmmp.net
当前位置:首页 >> python 去掉标点符号 >>

python 去掉标点符号

用下面这串代码即可去掉标点符号 import string m = l.translate(None, string.punctuation) Python具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用P...

不需要用split啊,split是分割 用replace(src, des)#des为需要替换成的目标字串,src为需要替换的源字串 如: >>> str = "My name is xxx, and yours? ..." >>> print str My name is xxx, and yours? ... >>> str = str.replace(',','') >>> pr...

你应该先定义变量 punctuation,其内容应该是所有的标点符号,比如下面的代码 (我没有列出所有的标点) import repunctuation = '!,;:?"\''def removePunctuation(text): text = re.sub(r'[{}]+'.format(punctuation),'',text) return text.str...

先转成unicode,然后判断每个字符是不是标点,如果是,判断后面一个字符是不是,两个条件都满足就把后面的删掉吧

isalpha() #是否全是字母,并至少有一个字符 如果是非中文的东西可以用此函数,循环判断每一个字符,将不是字母的去掉 如果是中文的话要判断中文 ,这个不怎么好办,需要用到正则表达式

我的理解是 python’s的“ ’ ”也是字符 ,和标点符号一样。你只要把去除的字符都加到正则表达式的括号中就可以了。 ,所以: import re r='[’!"#$%&\'()*+,-./:;?@[\\]^_`{|}~]+' line=re.sub(r,'',"python’s") print line

import ref = open('word.txt','r')word = f.read()f.close()# ------- 1 -------wList1 = []word1 = word.split(',')for i in word1:wList1.append(i.lower())wLen1 = len(wList1)print 'number of word:', wLen1, '\n', wList1# ------- 2 ---...

删除文本中的标点示例。供参考。# coding:UTF-8f=open('e:/python27/biaodian.txt','r')lines=f.readlines()f.close()# 以下新建的文件中只保留英文字母和数字# 仍按原始的行结构存储chardigit='ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrst...

import rea='asdas,ad,ad.adasd,adq,eqasdad!adas@asd#asdsa$adasd%adsa&asd'print re.sub('[^a-zA-Z0-9]',"",a)

词法分析器首先是断句,可以考虑用正则表达式,下面的例子可以参考 import res = "hello, "s = "My name is Mike."s = "I'm ab!"while s != '': match = re.search('^[a-z|A-Z|\']+', s) if match: print('') s = s[match.end():] else: print('...

网站首页 | 网站地图
All rights reserved Powered by www.lmmp.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com