Processamento de Linguagem Natural (PLN)
Os alunos exploram os fundamentos do PLN, incluindo análise de sentimento, tradução automática e chatbots.
Sobre este tópico
O Processamento de Linguagem Natural (PLN) permite que os computadores compreendam e gerem linguagem humana, um tema central nesta unidade. Os alunos do 12.º ano exploram fundamentos como a análise de sentimento, que classifica textos como positivos, negativos ou neutros; a tradução automática, que converte línguas com base em modelos probabilísticos; e os chatbots, que simulam conversas através de padrões e redes neurais. Estes conceitos ligam-se diretamente às bases de dados e sistemas de informação, promovendo o pensamento computacional avançado ao questionar como os sistemas lidam com ambiguidade e contexto na linguagem natural.
No currículo nacional, o PLN aborda os impactos da tecnologia, preparando os alunos para analisar questões como a privacidade em assistentes virtuais ou o viés em análises de sentimento. Os alunos investigam modelos como o BERT ou transformers, compreendendo que o PLN depende de grandes conjuntos de dados treinados por machine learning. Esta perspetiva desenvolve competências em programação e ética digital, essenciais para o secundário.
O PLN beneficia particularmente de abordagens de aprendizagem ativa porque os conceitos são abstratos e dependem de experimentação prática. Quando os alunos processam datasets reais em Python ou constroem chatbots simples, ganham compreensão intuitiva dos desafios linguísticos e criam modelos funcionais que demonstram sucessos e limitações.
Questões-Chave
- Como os sistemas de PLN compreendem e geram linguagem humana?
- Analise os desafios de processar a ambiguidade e o contexto na linguagem natural.
- Explique o impacto dos chatbots e assistentes virtuais na interação humana-computador.
Objetivos de Aprendizagem
- Analisar a estrutura de dados de texto para identificar entidades nomeadas, relações e intenções em frases.
- Comparar a eficácia de diferentes modelos de PLN (ex: redes neuronais recorrentes vs. transformers) na resolução de tarefas específicas como análise de sentimento.
- Criar um protótipo de chatbot simples utilizando bibliotecas de PLN em Python para responder a perguntas sobre um tópico específico.
- Avaliar o impacto ético da implementação de sistemas de PLN em aplicações como moderação de conteúdo ou personalização de notícias.
Antes de Começar
Porquê: É fundamental que os alunos possuam conhecimentos básicos de programação em Python para poderem trabalhar com bibliotecas de PLN e manipular dados textuais.
Porquê: A compreensão de listas, dicionários e strings é essencial para a manipulação e processamento de texto, que são centrais no PLN.
Porquê: Uma noção introdutória sobre treino de modelos e a importância de datasets é útil para entender como os sistemas de PLN aprendem a processar linguagem.
Vocabulário-Chave
| Tokenização | O processo de dividir um texto em unidades menores, como palavras ou subpalavras, chamadas tokens, que são a base para a análise computacional. |
| Análise de Sentimento | A técnica de PLN que determina a polaridade emocional (positiva, negativa, neutra) expressa num texto, sendo crucial para a análise de feedback de clientes ou redes sociais. |
| Entidades Nomeadas (NER) | A tarefa de identificar e classificar entidades específicas num texto, como nomes de pessoas, organizações, locais ou datas, permitindo a extração de informação estruturada. |
| Embeddings de Palavras | Representações vetoriais densas de palavras que capturam relações semânticas e sintáticas, permitindo que modelos de PLN processem o significado das palavras de forma mais eficaz. |
Atenção a estes erros comuns
Erro comumO PLN compreende linguagem exatamente como os humanos.
O que ensinar em alternativa
Os sistemas de PLN processam padrões estatísticos, não intenções profundas, o que falha em sarcasmos ou contextos culturais. Abordagens ativas como análise manual de textos ambíguos ajudam os alunos a comparar modelos humanos e máquinas, revelando limitações através de discussões em grupo.
Erro comumChatbots são inteligentes e conscientes.
O que ensinar em alternativa
Chatbots seguem regras ou modelos treinados, sem consciência real. Atividades de construção de chatbots simples permitem que os alunos vejam como respostas emergem de dados, fomentando debates que esclarecem a diferença entre simulação e inteligência verdadeira.
Erro comumA tradução automática é sempre precisa.
O que ensinar em alternativa
Erros ocorrem devido a ambiguidades idiomáticas. Experiências comparativas com ferramentas reais mostram falhas, e ajustes colaborativos em datasets ajudam os alunos a interiorizar a necessidade de contexto humano.
Ideias de aprendizagem ativa
Ver todas as atividadesAnálise de Sentimento: Dataset de Reviews
Forneça um dataset de reviews de produtos em português. Os alunos usam bibliotecas como NLTK ou TextBlob para classificar sentimentos, comparando resultados manuais com automáticos. Discutem discrepâncias em grupo e ajustam o modelo com dados adicionais.
Construção de Chatbot: Diálogos Simples
Utilize ferramentas como Dialogflow ou código Python com Rasa para criar um chatbot que responda a perguntas sobre o currículo escolar. Testem em pares, registando falhas de contexto, e refinam intenções e entidades. Apresentem o chatbot à turma.
Tradução Automática: Comparação de Ferramentas
Os alunos traduzem textos ambíguos com Google Translate e DeepL, analisando precisão em contexto cultural. Registam métricas de qualidade e propõem melhorias baseadas em PLN avançado. Discutem em plenário.
Debate Ético: Impactos do PLN
Divida a turma em grupos para debater privacidade em chatbots e viés em análise de sentimento. Pesquisem casos reais e preparam argumentos com exemplos de código. Votam e concluem com recomendações.
Ligações ao Mundo Real
- Empresas como a Google utilizam PLN extensivamente nos seus produtos, desde o Google Translate para tradução automática, passando pelo Google Assistant para interação por voz, até aos algoritmos de pesquisa que compreendem as intenções do utilizador.
- Bancos e instituições financeiras empregam PLN para analisar relatórios de mercado, detetar fraudes em transações e automatizar o atendimento ao cliente através de chatbots especializados em serviços financeiros.
- Plataformas de redes sociais como o Twitter ou o Facebook usam PLN para moderar conteúdo, identificar discurso de ódio e analisar tendências de opinião pública através da análise de sentimento em larga escala.
Ideias de Avaliação
Entregue a cada aluno um parágrafo curto com texto ambíguo. Peça-lhes para escreverem duas interpretações possíveis do texto e explicarem que informação adicional seria necessária para determinar o significado pretendido.
Inicie uma discussão com a questão: 'Quais são os maiores desafios éticos que enfrentamos ao desenvolver chatbots que interagem com humanos de forma cada vez mais natural?'. Incentive os alunos a citarem exemplos concretos de dilemas.
Apresente aos alunos uma lista de frases e peça-lhes para classificarem cada uma como positiva, negativa ou neutra em termos de sentimento. Em seguida, peça-lhes para justificarem a sua classificação para duas das frases, focando-se nas palavras-chave.
Perguntas frequentes
Como os sistemas de PLN compreendem linguagem humana?
O que é análise de sentimento no PLN?
Como a aprendizagem ativa ajuda no ensino de PLN?
Qual o impacto dos chatbots na interação humano-computador?
Mais em Bases de Dados e Sistemas de Informação
Arquitetura de Redes e Modelo OSI
Os alunos estudam o modelo OSI e os protocolos que permitem a comunicação global, compreendendo a estrutura das redes.
2 methodologies
Protocolos TCP/IP e Endereçamento
Os alunos aprofundam os protocolos TCP/IP, endereçamento IP (IPv4 e IPv6) e o funcionamento do DNS.
2 methodologies
Dispositivos de Rede e Topologias
Os alunos identificam e compreendem a função de dispositivos de rede (routers, switches, hubs) e diferentes topologias de rede.
2 methodologies
Criptografia Simétrica e Assimétrica
Os alunos analisam métodos de cifragem simétrica e assimétrica para garantir a confidencialidade da informação.
2 methodologies
Assinaturas Digitais e Certificados
Os alunos compreendem o funcionamento de assinaturas digitais e certificados para garantir autenticidade e integridade de dados.
2 methodologies
Ameaças Cibernéticas e Vetores de Ataque
Os alunos identificam diferentes tipos de malware, phishing, ataques de negação de serviço e outros vetores de ataque.
2 methodologies