Чтобы извлечь письма из текста, мы можем взять регулярное выражение. В приведенном ниже примере мы используем помощь пакета регулярных выражений для определения шаблона идентификатора электронной почты, а затем используем функцию findall () для извлечения текста, соответствующего этому шаблону.
import re text = "Please contact us at [email protected] for further information."+\ " You can also give feedbacl at [email protected]" emails = re.findall(r"[a-z0-9\.\-+_]+@[a-z0-9\.\-+_]+\.[a-z]+", text) print emails
Когда мы запускаем вышеуказанную программу, мы получаем следующий вывод: