Находим опечатки в тексте  с Python

https://t.me/python_job_interview – вопросы с собеседований на Python.

Полезный пакет spellchecker позволяет находить опечатки в тексте и даже дает возможные варианты исправлений. 

Под капотом модуль использует алгоритм расстояния Левенштейна. А сам код основан на статье, написанной в блоге Питера Норвига. Короче, реализация интересная, советую поизучать. 

Но даже если не вникать в подробности, то пакет использовать крайне легко. Примеры использования класса SpellChecker и его методов correction и candidates показаны на картинке. 

Пакет поддерживает 6 языков, включая русский. Но за подробностями отправляю вас читать документацию

Пример кода:

from spellchecker import SpellChecker

spell = SpellChecker()

# find those words that may be misspelled
misspelled = spell.unknown(['something', 'is', 'hapenning', 'here'])

for word in misspelled:
    # Get the one `most likely` answer
    print(spell.correction(word))

    # Get a list of `likely` options
    print(spell.candidates(word))
+1
0
+1
0
+1
0
+1
1
+1
2

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *