Mám zoznam v textového súboru adries Url s niektoré nežiaduce texty som napísal regulárny výraz, ktorý bude spĺňať moje potreby, a to je práca v poriadku, ale ja som čelí problému, kde regulárny výraz pridať na výstup nežiaduce vzoriek ["] pod príklady:
obsah súboru zoznam adries Url:
http://www.example.com/52 (Status: 403) [Size: 919]
http://www.example.com/details (Status: 403) [Size: 919]
http://www.example.com/h (Status: 403) [Size: 919]
http://www.example.com/affiliate (Status: 403) [Size: 919]
http://www.example.com/56 (Status: 403) [Size: 919]
na regulárny výraz som použil, je: "^[://.a-zA-Z0-9-_]*"
výstup ako je uvedené nižšie:
['http://www.example.com/52']
['http://www.example.com/details']
['http://www.example.com/h']
['http://www.example.com/affiliate']
['http://www.example.com/56']
Potrebujem výstup, ktorý bude vyzerať takto:
http://www.example.com/52
http://www.example.com/details
http://www.example.com/h
http://www.example.com/affiliate
http://www.example.com/56
kód použitý pre tento program nižšie:
import re
with open("test.txt","r") as test:
for i in test:
x = re.findall("^[://.a-zA-Z0-9-_]*",i)
print(x)