segunda-feira, 25 de março de 2024

Padrões relevantes

Em artigo na Science, pesquisadores descrevem fórmula estatística que identifica como as redes neurais são recursos de aprendizagem demonstrando que a inserção da fórmula em sistemas de computação, que não dependem de redes neurais, permitiu que os sistemas aprendessem de modo mais rápido e eficiente. O estudo é parte de esforço maior do grupo de pesquisa para desenvolver teoria matemática que explique como funcionam as redes neurais ao demonstrar que a fórmula estatística usada para entender como as redes neurais aprendem, conhecida como Produto Externo de Gradiente Médio, AGOP, poderia ser aplicada para melhorar o desempenho e a eficiência em outros tipos de arquitetura de aprendizado de máquina que não incluem redes neurais. O autovetor principal do AGOP de dois modelos separados, MLPs e máquinas de kernel Laplace, capturou recursos semelhantes, similaridade de cosseno maior que 0,99, quando treinado nos mesmos dados do CelebA em tarefas que sistemas de aprendizado de máquina imaginados precisariam menos poder computacional e, portanto, menos energia da rede para funcionar, menos complexos e mais fáceis de entender.

Redes neurais impulsionam avanços na IA incluindo modelos de linguagem utilizados em vasta gama de aplicações, de finanças a recursos humanos e cuidados de saúde, no entanto, continuam ser caixa preta cujo funcionamento interno engenheiros e cientistas lutam para compreender. Equipe liderada por cientistas de dados e da computação da Universidade da Califórnia deu às redes neurais o equivalente a um raio X para descobrir como realmente aprendem e descobriram que uma fórmula usada na análise estatística fornece descrição matemática simplificada de como redes neurais, como o GPT-2, precursor do ChatGPT, aprendem padrões relevantes nos dados, conhecidos como recursos, sendo que a fórmula explica como as redes neurais usam esses padrões relevantes para prever. Ferramentas baseadas em IA difundidas no cotidiano, em que bancos utilizam para aprovar empréstimos, hospitais para analisar dados médicos como raios X e ressonância magnética, empresas as utilizam para selecionar candidatos, sendo difícil compreender o mecanismo que as redes neurais usam para tomar decisões e os preconceitos nos dados de treinamento que podem impactar. Redes neurais, artificiais, são ferramentas computacionais para aprender relações entre características de dados, ou seja, identificar objetos ou rostos específicos em uma imagem, um exemplo de tarefa é determinar se em uma nova imagem uma pessoa está usando óculos ou não, daí, o aprendizado de máquina aborda o problema fornecendo à rede neural exemplos de imagens, de treinamento, rotuladas como imagens de “uma pessoa usando óculos” ou “uma pessoa sem óculos”. A rede neural aprende a relação entre as imagens e seus rótulos e extrai padrões de dados, ou recursos, nos quais precisa se concentrar para tomar uma decisão e uma das razões pelas quais sistemas IA são considerados caixa preta é porque é difícil descrever matematicamente quais critérios os sistemas utilizam para fazer previsões, incluindo potenciais enviesamentos, aí, o novo trabalho fornece explicação matemática simples de como os sistemas estão aprendendo esses recursos. Recursos são padrões relevantes nos dados, no exemplo acima, há ampla gama de recursos que as redes neurais aprendem e usam para determinar se de fato uma pessoa em uma fotografia está usando óculos ou não, uma característica que seria necessário atenção é a parte superior do rosto enquanto outras características podem ser a área dos olhos ou nariz, onde os óculos costumam ficar, daí, a rede presta atenção seletivamente às características que aprende que são relevantes e descarta as outras partes da imagem, como a parte inferior do rosto, cabelo e assim por diante, enquanto o aprendizado de recursos é a capacidade de reconhecer padrões relevantes nos dados e, em seguida, usá-los para fazer previsões, no exemplo dos óculos, a rede aprende prestar atenção na parte superior do rosto.

Moral da Nota: estudo liderado por pesquisadores da Universidade da Carolina do Norte no Instituto Chapel Hill para o Meio Ambiente, Escola de Saúde Pública da Universidade de Boston e Fundo de Defesa Ambiental, descobriu que a poluição decorrente liberação e queima de petróleo e gás resulta em US$ 7,4 bilhões em danos à saúde, mais de 700 mortes prematuras e 73 mil exacerbações de asma entre crianças anualmente, além do que as emissões são sub notificadas e seu controle não só é lucrativo aos operadores, mas, melhora a saúde pública nas comunidades. A prática petroleira de ventilar e queimar para libertar excesso de gás na produção de petróleo bruto, contribui à poluição do ar nas comunidades vizinhas e a favor do vento, resultando aumento de hospitalizações, de emergência, agravamento da asma e morte prematura. Publicado na GeoHealth, esclarece que atividades de queima e ventilação contribuem com US$ 7,4 bilhões em riscos à saúde e 710 mortes prematuras anualmente nos EUA, dessas mortes, 360 são atribuíveis a partículas finas, PM2,5, ozônio, O3, e dióxido de nitrogênio, NO2, sendo as partículas finas amplamente conhecidas por danos à saúde, além dos impactos do O3 e do NO2 que não devem ser negligenciados. A quantificação das emissões na indústria do petróleo é difícil pela natureza intermitente da prática e a forma como são comunicadas, ao passo que a pesquisa usou imagens de satélite do instrumento Visible Infrared Imaging Radiometer Suite no satélite Suomi National Polar-orbiting Partnership para observar atividades de queima e ventilação em combinação com dados relatados estaduais e locais encontrando emissões até 15 vezes maiores à partículas finas, 2 vezes maior à dióxidos de enxofre e 22% maior à óxidos de nitrogênio que o relatado nos Inventários Nacionais de Emissões da EPA dos EUA, sendo que o Texas, Pensilvânia e Colorado, tiveram os maiores encargos de saúde nesta análise respondendo por 45% do número total de mortes por excesso de poluição atmosférica por queima e ventilação. Descobriram que os encargos à saúde da qualidade do ar decorrentes queima e ventilação recaem sobre comunidades de baixa renda, hispânicas e nativas americanas e das mortes precoces causadas por queima e ventilação, 1 em cada 3 ocorreu em setores censitários de baixa renda, 30% ocorreram em setores censitários hispânicos/latinos e 10% ocorreram em setores censitários de nativos americanos e, dos 73 mil casos de asma infantil, 40% ocorreram em setores censitários hispânicos/latinos.