python 用正則表達(dá)式篩選文本信息的實(shí)例

來(lái)源：本站原創(chuàng)|時(shí)間：2020-01-11|欄目：正則表達(dá)式|點(diǎn)擊：次

本文主要介紹如何對(duì)多個(gè)文本進(jìn)行讀取，并采用正則表達(dá)式對(duì)其中的信息進(jìn)行篩選，將篩選出來(lái)的信息存寫(xiě)到一個(gè)新文本。

文本基礎(chǔ)操作

打開(kāi)文件：open(‘文件名'，‘打開(kāi)方式')>>>file=open(r'C:\Users\yuanlei\Desktop\mytxt.txt','w+').為避免報(bào)錯(cuò)，在文件名的引號(hào)前加個(gè)r.

文件打開(kāi)方式：只讀——r或rt,rb為二進(jìn)制文件；打開(kāi)文件前清空文件內(nèi)容——w或wt；在文末寫(xiě)入——a+；

清空內(nèi)容然后在文末寫(xiě)入——w+；寫(xiě)到文件任意位置——r+;

關(guān)閉文件：文件打開(kāi)運(yùn)行好后必須要關(guān)閉——文件名.close()>>>mytxt.close()

讀取文件中的內(nèi)容：將每行內(nèi)容，包括換行符，作為一個(gè)元素存入數(shù)組——lines=file_object.readlines()，但是這樣會(huì)把換行符也賦進(jìn)去

去除換行符——new_lines=lines.splitlines()

os包：import os 獲取文件地址——os.listdir(父文件地址)

下面附上實(shí)現(xiàn)摘要中說(shuō)的功能的完整代碼：

# coding: utf-8
#讀取文本中的中英文數(shù)據(jù)并使用正則表達(dá)式將所需數(shù)據(jù)篩選入到一個(gè)新文本中
import re
import os

#zhengze函數(shù)對(duì)讀取到的數(shù)據(jù)進(jìn)行篩選，并將篩選好的數(shù)據(jù)存入數(shù)組new_lines
new_lines=[]    #申明new_lines數(shù)組
def zhengze(f):
 regex_str=".*?(l.*?e).*"
 for x in f:
  new_x = x.splitlines()  #注意：splitlines是將傳入的字符串去除'\n'之后以數(shù)組的形式傳出，而不是字符串形式
  match_obj=re.match(regex_str,new_x[0])
  if match_obj:
   new_lines.append(match_obj.group(1))
  else:
   new_lines.append('no')
 return new_lines

#獲取指定文件夾下的所有文本的絕對(duì)地址，并存入數(shù)組file_path
path=r'C:\Users\yuanlei\Desktop\new_file_txt'
file_path=[]
for filename in os.listdir(path):  #獲取path下所有文件的路徑
 file_path.append((os.path.join(path,filename)))
print file_path

#對(duì)每個(gè)文本調(diào)用正則函數(shù)進(jìn)行篩選,篩選過(guò)后的數(shù)據(jù)存入數(shù)組final
for adress in file_path:
 file_object=open(adress)
 lines = file_object.readlines( )  #將文本中的內(nèi)容以數(shù)組的形式（每行為一個(gè)元素）賦給lines
 file_object.close()
 final=zhengze(lines)
print final

#將篩選出來(lái)的數(shù)據(jù)寫(xiě)入新文本re_new.txt
file_2=open(r'C:\Users\yuanlei\Desktop\re_new.txt','w+')
for x in final:
 file_2.write(x)
 file_2.write('\n')
file_2.close()

以上這篇python 用正則表達(dá)式篩選文本信息的實(shí)例就是小編分享給大家的全部?jī)?nèi)容了，希望能給大家一個(gè)參考，也希望大家多多支持我們。

上一篇：正則表達(dá)式之匹配數(shù)字范圍

欄目：正則表達(dá)式

下一篇：正則表達(dá)式實(shí)現(xiàn)添加、刪除、替換三種功能

本文標(biāo)題：python 用正則表達(dá)式篩選文本信息的實(shí)例

本文地址：http://mengdiqiu.com.cn/a1/zhengzebiaodashi/11233.html

更多正則表達(dá)式

欧美大屁股bbbbxxxx,狼人大香伊蕉国产www亚洲,男ji大巴进入女人的视频小说,男人把ji大巴放进女人免费视频,免费情侣作爱视频

正則表達(dá)式

python 用正則表達(dá)式篩選文本信息的實(shí)例

您可能感興趣的文章

閱讀排行

本欄相關(guān)

隨機(jī)閱讀