Учебники

Python — извлечение писем из текста

Чтобы извлечь письма из текста, мы можем взять регулярное выражение. В приведенном ниже примере мы используем помощь пакета регулярных выражений для определения шаблона идентификатора электронной почты, а затем используем функцию findall () для извлечения текста, соответствующего этому шаблону.

import re
text = "Please contact us at [email protected] for further information."+\
        " You can also give feedbacl at [email protected]"


emails = re.findall(r"[a-z0-9\.\-+_]+@[a-z0-9\.\-+_]+\.[a-z]+", text)
print emails

Когда мы запускаем вышеуказанную программу, мы получаем следующий вывод: