Aplicações Informáticas B · 12.º Ano · Bases de Dados e Sistemas de Informação · 3.º Período

Processamento de Linguagem Natural (PLN)

Os alunos exploram os fundamentos do PLN, incluindo análise de sentimento, tradução automática e chatbots.

Em síntese:O Processamento de Linguagem Natural trata de sistemas que interpretam e geram linguagem, um desafio complexo que exige aplicação prática para ser verdadeiramente compreendido. Atividades hands-on permitem que os alunos testem limites de modelos de PLN, como detetar ironia ou traduzir expressões culturais, o que torna abstrato em concreto.

Aprendizagens EssenciaisDGE: Secundário - Pensamento ComputacionalDGE: Secundário - Impactos da Tecnologia

Sobre este tópico

O Processamento de Linguagem Natural (PLN) permite que os computadores compreendam e gerem linguagem humana, um tema central nesta unidade. Os alunos do 12.º ano exploram fundamentos como a análise de sentimento, que classifica textos como positivos, negativos ou neutros; a tradução automática, que converte línguas com base em modelos probabilísticos; e os chatbots, que simulam conversas através de padrões e redes neurais. Estes conceitos ligam-se diretamente às bases de dados e sistemas de informação, promovendo o pensamento computacional avançado ao questionar como os sistemas lidam com ambiguidade e contexto na linguagem natural.

No currículo nacional, o PLN aborda os impactos da tecnologia, preparando os alunos para analisar questões como a privacidade em assistentes virtuais ou o viés em análises de sentimento. Os alunos investigam modelos como o BERT ou transformers, compreendendo que o PLN depende de grandes conjuntos de dados treinados por machine learning. Esta perspetiva desenvolve competências em programação e ética digital, essenciais para o secundário.

O PLN beneficia particularmente de abordagens de aprendizagem ativa porque os conceitos são abstratos e dependem de experimentação prática. Quando os alunos processam datasets reais em Python ou constroem chatbots simples, ganham compreensão intuitiva dos desafios linguísticos e criam modelos funcionais que demonstram sucessos e limitações.

Questões-Chave

Como os sistemas de PLN compreendem e geram linguagem humana?
Analise os desafios de processar a ambiguidade e o contexto na linguagem natural.
Explique o impacto dos chatbots e assistentes virtuais na interação humana-computador.

Objetivos de Aprendizagem

Analisar a estrutura de dados de texto para identificar entidades nomeadas, relações e intenções em frases.
Comparar a eficácia de diferentes modelos de PLN (ex: redes neuronais recorrentes vs. transformers) na resolução de tarefas específicas como análise de sentimento.
Criar um protótipo de chatbot simples utilizando bibliotecas de PLN em Python para responder a perguntas sobre um tópico específico.
Avaliar o impacto ético da implementação de sistemas de PLN em aplicações como moderação de conteúdo ou personalização de notícias.

Antes de Começar

Introdução à Programação em Python

Porquê: É fundamental que os alunos possuam conhecimentos básicos de programação em Python para poderem trabalhar com bibliotecas de PLN e manipular dados textuais.

Estruturas de Dados Fundamentais

Porquê: A compreensão de listas, dicionários e strings é essencial para a manipulação e processamento de texto, que são centrais no PLN.

Conceitos Básicos de Machine Learning

Porquê: Uma noção introdutória sobre treino de modelos e a importância de datasets é útil para entender como os sistemas de PLN aprendem a processar linguagem.

Vocabulário-Chave

Tokenização	O processo de dividir um texto em unidades menores, como palavras ou subpalavras, chamadas tokens, que são a base para a análise computacional.
Análise de Sentimento	A técnica de PLN que determina a polaridade emocional (positiva, negativa, neutra) expressa num texto, sendo crucial para a análise de feedback de clientes ou redes sociais.
Entidades Nomeadas (NER)	A tarefa de identificar e classificar entidades específicas num texto, como nomes de pessoas, organizações, locais ou datas, permitindo a extração de informação estruturada.
Embeddings de Palavras	Representações vetoriais densas de palavras que capturam relações semânticas e sintáticas, permitindo que modelos de PLN processem o significado das palavras de forma mais eficaz.

Atenção a estes erros comuns

Erro comumO PLN compreende linguagem exatamente como os humanos.

O que ensinar em alternativa

Os sistemas de PLN processam padrões estatísticos, não intenções profundas, o que falha em sarcasmos ou contextos culturais. Abordagens ativas como análise manual de textos ambíguos ajudam os alunos a comparar modelos humanos e máquinas, revelando limitações através de discussões em grupo.

Erro comumChatbots são inteligentes e conscientes.

O que ensinar em alternativa

Chatbots seguem regras ou modelos treinados, sem consciência real. Atividades de construção de chatbots simples permitem que os alunos vejam como respostas emergem de dados, fomentando debates que esclarecem a diferença entre simulação e inteligência verdadeira.

Erro comumA tradução automática é sempre precisa.

O que ensinar em alternativa

Erros ocorrem devido a ambiguidades idiomáticas. Experiências comparativas com ferramentas reais mostram falhas, e ajustes colaborativos em datasets ajudam os alunos a interiorizar a necessidade de contexto humano.

Ideias de aprendizagem ativa

Ver todas as atividades→

Aprendizagem Maker

Análise de Sentimento: Dataset de Reviews

Forneça um dataset de reviews de produtos em português. Os alunos usam bibliotecas como NLTK ou TextBlob para classificar sentimentos, comparando resultados manuais com automáticos. Discutem discrepâncias em grupo e ajustam o modelo com dados adicionais.

45 min·Pequenos grupos

Aprendizagem Maker

Construção de Chatbot: Diálogos Simples

Utilize ferramentas como Dialogflow ou código Python com Rasa para criar um chatbot que responda a perguntas sobre o currículo escolar. Testem em pares, registando falhas de contexto, e refinam intenções e entidades. Apresentem o chatbot à turma.

50 min·Pares

Aprendizagem Maker

Tradução Automática: Comparação de Ferramentas

Os alunos traduzem textos ambíguos com Google Translate e DeepL, analisando precisão em contexto cultural. Registam métricas de qualidade e propõem melhorias baseadas em PLN avançado. Discutem em plenário.

35 min·Pequenos grupos

Ligações ao Mundo Real

Empresas como a Google utilizam PLN extensivamente nos seus produtos, desde o Google Translate para tradução automática, passando pelo Google Assistant para interação por voz, até aos algoritmos de pesquisa que compreendem as intenções do utilizador.
Bancos e instituições financeiras empregam PLN para analisar relatórios de mercado, detetar fraudes em transações e automatizar o atendimento ao cliente através de chatbots especializados em serviços financeiros.
Plataformas de redes sociais como o Twitter ou o Facebook usam PLN para moderar conteúdo, identificar discurso de ódio e analisar tendências de opinião pública através da análise de sentimento em larga escala.

Ideias de Avaliação

Bilhete de Saída

Entregue a cada aluno um parágrafo curto com texto ambíguo. Peça-lhes para escreverem duas interpretações possíveis do texto e explicarem que informação adicional seria necessária para determinar o significado pretendido.

Questão para Discussão

Inicie uma discussão com a questão: 'Quais são os maiores desafios éticos que enfrentamos ao desenvolver chatbots que interagem com humanos de forma cada vez mais natural?'. Incentive os alunos a citarem exemplos concretos de dilemas.

Verificação Rápida

Apresente aos alunos uma lista de frases e peça-lhes para classificarem cada uma como positiva, negativa ou neutra em termos de sentimento. Em seguida, peça-lhes para justificarem a sua classificação para duas das frases, focando-se nas palavras-chave.

Perguntas frequentes

Como os sistemas de PLN compreendem linguagem humana?

Os sistemas de PLN usam modelos de machine learning treinados em vastos corpora de texto para prever palavras ou intenções. Técnicas como tokenização, embeddings e redes neurais capturam padrões semânticos. No entanto, desafios como ambiguidade persistem, exigindo contexto adicional, o que os alunos exploram através de exemplos práticos no currículo.

O que é análise de sentimento no PLN?

A análise de sentimento classifica textos quanto a polaridade emocional usando algoritmos que detetam palavras-chave, negações e estruturas sintáticas. Modelos avançados como LSTM melhoram precisão. Os alunos aplicam isto a redes sociais, discutindo aplicações em marketing e monitorização de opinião pública, alinhado com impactos tecnológicos.

Como a aprendizagem ativa ajuda no ensino de PLN?

A aprendizagem ativa torna o PLN acessível através de projetos hands-on, como processar tweets reais para sentimento ou programar chatbots. Estes métodos revelam limitações dos modelos, promovem pensamento crítico e retenção, pois os alunos depuram código colaborativamente e testam em cenários reais, conectando teoria à prática quotidiana.

Qual o impacto dos chatbots na interação humano-computador?

Chatbots melhoram acessibilidade em serviços, mas levantam questões éticas como dependência e perda de empregos. No currículo, os alunos analisam usabilidade e viés, construindo protótipos para avaliar interações naturais, preparando-os para inovações digitais responsáveis.

Mais em Bases de Dados e Sistemas de Informação

Arquitetura de Redes e Modelo OSI

Os alunos estudam o modelo OSI e os protocolos que permitem a comunicação global, compreendendo a estrutura das redes.

8 methodologies

Protocolos TCP/IP e Endereçamento

Os alunos aprofundam os protocolos TCP/IP, endereçamento IP (IPv4 e IPv6) e o funcionamento do DNS.

8 methodologies

Dispositivos de Rede e Topologias

Os alunos identificam e compreendem a função de dispositivos de rede (routers, switches, hubs) e diferentes topologias de rede.

8 methodologies

Criptografia Simétrica e Assimétrica

Os alunos analisam métodos de cifragem simétrica e assimétrica para garantir a confidencialidade da informação.

8 methodologies

Assinaturas Digitais e Certificados

Os alunos compreendem o funcionamento de assinaturas digitais e certificados para garantir autenticidade e integridade de dados.

8 methodologies

Ameaças Cibernéticas e Vetores de Ataque

Os alunos identificam diferentes tipos de malware, phishing, ataques de negação de serviço e outros vetores de ataque.

8 methodologies

Edited by Adriana Perusin, Editor-in-Chief, Flip Education