Processamento de Linguagem Natural

Para os interessados, disponível um eBook* sobre Natural Language Processing (Processamento de Linguagem Natural). Por “linguagem natural” entende-se as linguagens que são utilizadas para comunicações do dia a dia por seres humanos; línguas como o inglês, ou o português.
Em contraste com as linguagens artificiais como as linguagens de programação e notações matemáticas, as linguagens naturais evoluem à medida que passam de geração em geração, e é difícil descrevê-las por completo por meio de regras explícitas. Considera-se o termo Natural Language Processing — ou, brevemente, NLP — num sentido amplo para englobar qualquer tipo de manipulação computacional de linguagens naturais. De modo abreviado, pode ser considerado como algo tão simples quanto a contagem da frequência de palavras para comparar diferentes estilos de escrita. No outro extremo, o NLP envolve “compreender” enunciados humanos completos, pelo menos até o ponto de ser capaz de fornecer respostas úteis a estes.
Uma das ferramentas mais utilizadas para processamento de linguagem natural é o NLTK (Natural Language Toolkit – http://www.nltk.org/), que foi desenvolvido em Python e apresenta uma gama muito grande de recursos, como: classificação, tokenização, stemming, tagging, parsing e raciocínio semântico.
Natural Language Toolkit (página no GitHub)
*Ebook gratuito, Natural Language Processing with Python