Проверка орфографии является основным требованием при любой обработке или анализе текста. Пакет pyspellchecker пакета python предоставляет нам эту возможность, чтобы найти слова, которые могли быть неправильно написаны, а также предложить возможные исправления.
Во-первых, нам нужно установить требуемый пакет с помощью следующей команды в нашей среде Python.
pip install pyspellchecker
Теперь мы увидим ниже, как пакет используется, чтобы указать неправильно написанные слова, а также сделать некоторые предложения о возможных правильных словах.
from spellchecker import SpellChecker spell = SpellChecker() # find those words that may be misspelled misspelled = spell.unknown(['let', 'us', 'wlak','on','the','groun']) for word in misspelled: # Get the one `most likely` answer print(spell.correction(word)) # Get a list of `likely` options print(spell.candidates(word))
Когда мы запускаем вышеуказанную программу, мы получаем следующий вывод:
group {'group', 'ground', 'groan', 'grout', 'grown', 'groin'} walk {'flak', 'weak', 'walk'}
С учетом регистра
Если мы используем Let вместо let, тогда это становится чувствительным к регистру сравнения слова с ближайшими подобранными словами в словаре, и результат теперь выглядит иначе.
from spellchecker import SpellChecker spell = SpellChecker() # find those words that may be misspelled misspelled = spell.unknown(['Let', 'us', 'wlak','on','the','groun']) for word in misspelled: # Get the one `most likely` answer print(spell.correction(word)) # Get a list of `likely` options print(spell.candidates(word))
Когда мы запускаем вышеуказанную программу, мы получаем следующий вывод: