Учебники

Python — проверка орфографии

Проверка орфографии является основным требованием при любой обработке или анализе текста. Пакет pyspellchecker пакета python предоставляет нам эту возможность, чтобы найти слова, которые могли быть неправильно написаны, а также предложить возможные исправления.

Во-первых, нам нужно установить требуемый пакет с помощью следующей команды в нашей среде Python.

 pip install pyspellchecker 

Теперь мы увидим ниже, как пакет используется, чтобы указать неправильно написанные слова, а также сделать некоторые предложения о возможных правильных словах.

from spellchecker import SpellChecker

spell = SpellChecker()

# find those words that may be misspelled
misspelled = spell.unknown(['let', 'us', 'wlak','on','the','groun'])

for word in misspelled:
    # Get the one `most likely` answer
    print(spell.correction(word))

    # Get a list of `likely` options
    print(spell.candidates(word))

Когда мы запускаем вышеуказанную программу, мы получаем следующий вывод:

group
{'group', 'ground', 'groan', 'grout', 'grown', 'groin'}
walk
{'flak', 'weak', 'walk'}

С учетом регистра

Если мы используем Let вместо let, тогда это становится чувствительным к регистру сравнения слова с ближайшими подобранными словами в словаре, и результат теперь выглядит иначе.

from spellchecker import SpellChecker

spell = SpellChecker()

# find those words that may be misspelled
misspelled = spell.unknown(['Let', 'us', 'wlak','on','the','groun'])

for word in misspelled:
    # Get the one `most likely` answer
    print(spell.correction(word))

    # Get a list of `likely` options
    print(spell.candidates(word))

Когда мы запускаем вышеуказанную программу, мы получаем следующий вывод: