Инструментарий естественного языка является библиотекой Python для компьютерной лингвистики.

Естественный язык ToolKit (NLTK) является библиотекой Python для компьютерной лингвистики. Это в настоящее время доступно для версий 2.7 или 3.2 Python +

NLTK включает большое количество общих инструментов для обработки естественного языка включая токенизатор, фрагментатор, теггер части речи (POS), стеммер, лемматизатор и различные классификаторы, такие как Наивные Байесовы и Деревья решений. В дополнение к этим инструментам NLTK создал во многих общих корпусах включая Брауновский корпус, Агентство Рейтер и WordNet. Корпусный набор NLTK также включает несколько неанглийских корпусов в португальский, польский и испанский язык.

Книга Обработка естественного языка с Python - Анализ текста с Инструментарием естественного языка Steven Bird, Ewan Klein и Edward Loper в свободном доступе онлайн под Атрибуцией Creative Commons, Некоммерческой Никакие Производные Работы 3.0 американских Лицензии. Статья на который можно сослаться NLTK: ToolKit естественного языка был сначала опубликован в 2003 и с другой стороны в 2006, чтобы исследователи подтвердили вклад в продолжающемся исследовании в Компьютерной лингвистике.

NLTK в настоящее время распределяется в соответствии с лицензией версии 2.0 Apache.