Descrição:
O pacote Analisador_Texto_pt_br_e_eng é utilizado para:
- Identificação das palavras mais comuns.
- Remoção de stopwords.
- Outras análises de processamento de linguagem natural. Ele utiliza a biblioteca spaCy para realizar o processamento de linguagem em ambos os idiomas.
Use o gerenciador de pacotes pip para instalar o pacote:
pip install analisador_texto_pt_br_e_eng
Português
from analisador_texto_pt_br_e_eng.analisador_texto_pt_br import pt_br
pt_br.analise_texto("Seu texto em português aqui.")
Inglês
from analisador_texto_pt_br_e_eng.analyze_text_eng import eng
eng.analyze_text("Your English text here.")
Para assegurar o correto funcionamento do pacote, é necessário realizar o download dos modelos de linguagem do spaCy para português e inglês.
Para analisar textos em português, você pode escolher entre três tamanhos de modelos:
pt_core_news_sm (small): Modelo leve e rápido.
-
Benefícios: Ideal para análises rápidas ou ambientes com restrições de memória.
-
Desvantagens: Menos preciso e captura menos variações linguísticas.
Comando para instalar
python -m spacy download pt_core_news_sm
pt_core_news_md (medium): Modelo balanceado.
-
Benefícios: Melhor precisão do que o modelo "small", com um desempenho razoável.
-
Desvantagens: Ocupa mais memória e tempo de processamento.
Comando para instalar
python -m spacy download pt_core_news_md
pt_core_news_lg (large): Modelo grande, mais preciso.
-
Benefícios: Captura mais nuances linguísticas e tem maior precisão nas análises.
-
Desvantagens: Mais pesado, consome mais memória e tempo de processamento.
Comando para instalar
python -m spacy download pt_core_news_lg
Da mesma forma, para textos em inglês, há diferentes modelos disponíveis:
en_core_web_sm (small): Modelo leve e rápido.
-
Benefícios: Ótimo para tarefas simples ou quando o desempenho é uma prioridade.
-
Desvantagens: Menor precisão, captura menos informações detalhadas.
Comando para instalar
python -m spacy download en_core_web_sm
en_core_web_md (medium): Modelo médio, balanceado.
-
Benefícios: Melhor precisão em comparação com o modelo pequeno.
-
Desvantagens: Um pouco mais lento e consome mais memória.
Comando para instalar
python -m spacy download en_core_web_md
en_core_web_lg (large): Modelo grande e mais robusto.
-
Benefícios: Alta precisão, captura mais nuances do idioma.
-
Desvantagens: O modelo mais pesado, consome mais recursos de memória e processamento.
Comando para instalar
python -m spacy download en_core_web_lg
Alexsandro Da Silva Bezerra