Python regulárny výraz zodpovedajúce adresy Url

0

Otázka

Mám zoznam v textového súboru adries Url s niektoré nežiaduce texty som napísal regulárny výraz, ktorý bude spĺňať moje potreby, a to je práca v poriadku, ale ja som čelí problému, kde regulárny výraz pridať na výstup nežiaduce vzoriek ["] pod príklady:

obsah súboru zoznam adries Url:

http://www.example.com/52                   (Status: 403) [Size: 919]
http://www.example.com/details              (Status: 403) [Size: 919]
http://www.example.com/h                    (Status: 403) [Size: 919]
http://www.example.com/affiliate            (Status: 403) [Size: 919]
http://www.example.com/56                   (Status: 403) [Size: 919]

na regulárny výraz som použil, je: "^[://.a-zA-Z0-9-_]*"

výstup ako je uvedené nižšie:

['http://www.example.com/52']
['http://www.example.com/details']
['http://www.example.com/h']
['http://www.example.com/affiliate']
['http://www.example.com/56']

Potrebujem výstup, ktorý bude vyzerať takto:

http://www.example.com/52
http://www.example.com/details
http://www.example.com/h
http://www.example.com/affiliate
http://www.example.com/56

kód použitý pre tento program nižšie:

import re

with open("test.txt","r") as test:
    for i in test:
        x = re.findall("^[://.a-zA-Z0-9-_]*",i)
        print(x)
python python-3.x re regex
2021-11-22 04:26:30
1

Najlepšiu odpoveď

0

findall vytvára zoznam reťazcov, môžete buď vytlačiť prvý prvok v dôsledku print(x[0]) alebo stačí použiť match namiesto toho, pre tento prípad použitia, pretože tam je 1 url na líniu.

with open("test.txt","r") as test:
    for i in test:
        x = re.match(r"[://.a-zA-Z0-9-_]*", i)
        print(x.group(0))
2021-11-22 04:43:38

V iných jazykoch

Táto stránka je v iných jazykoch

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................