ONU e IBM lançam ferramenta IA à energia do Sul Global, através de dois modelos preditivos IA que usam conjuntos de dados para prever acesso à eletricidade e desenvolvimento de energia limpa e, assim, democratizar o acesso IA à transição energética sendo que a parceria visa o Desenvolvimento de modelo de Previsão de Acesso à Eletricidade e Índice de Equidade em Energia Limpa. Os modelos buscam dar a formuladores de políticas ferramentas de promoção ao desenvolvimento sustentável, exemplo de modelos avançados gratuitos e acessíveis ao público, sendo que o modelo Electricity Access Forecasting prevê o acesso à eletricidade até 2030 em 102 países na África, América Latina, Ásia-Pacífico e Oriente Médio usando produtos de software da IBM como a plataforma comercial IA generativa e dados científicos watsonx, bem como biblioteca de aprendizado de máquina, ML, de código aberto, que avalia dados de população, infraestrutura, urbanização, elevação e uso do solo por satélite para fazer previsões. O Índice de Equidade em Energia Limpa, de acordo com Laurel Patterson, que lidera equipe de integração de metas de desenvolvimento sustentável do PNUD, combina análises geoespaciais com fatores ambientais e sociais como emissões de gases efeito estufa e riqueza relativa, destacando necessidades e oportunidades de desenvolvimento de energia limpa em 53 países africanos, sendo os modelos disponíveis online, que pretendem “fornecer base de evidências confiável para ajudar países fazerem progressos significativos e práticos em direção a transição energética justa”, fazendo parte do GeoHub do Data Futures Exchange do PNUD, coleção de dados e serviços geoespaciais. O lançamento é o mais recente de ferramentas alimentadas por IA que oferecem eficiência através de informações ao setor de energia, com empresas utilizando modelos IA para dar suporte a desenvolvedores na escolha de locais à projetos de energia limpa, coletar dados de calor para implementar intervenções de resfriamento e ajudar gerenciar aumento na demanda de energia, no entanto, a maioria das ferramentas se concentra na América do Norte ou Europa e o acesso a dados de energia tende a ser pago e, quando se trata de eletrificação e gerenciamento de rede, modelos básicos de IA treinados em grandes quantidades de dados são considerados particularmente valiosos, pois têm potencial de melhorar planejamento, autorização, operações e a resiliência da rede.
Neste processo disruptivo, a IBM Research apresenta técnicas de processamento de dados para agilizar treinamento de modelos IA usando recursos de CPU, melhorando eficiência, com o objetivo de dimensionar pipeline de processamento de dados à treinamento IA empresarial, conforme a IBM Research, esses avanços são projetados para agilizar criação de modelos IA como os modelos Granite da IBM, aproveitando capacidade das CPUs. Antes de treinar modelos IA, grandes quantidades de dados devem ser preparadas e geralmente vêm de fontes diversas, como sites, PDFs e artigos de notícias, devendo passar por etapas de pré-processamento que incluem filtrar código HTML irrelevante, remover duplicatas e rastrear conteúdo abusivo,tarefas, embora críticas, não limitadas pela disponibilidade de GPUs, com Petros Zerfos, pesquisador da IBM Research para engenharia de dados watsonx, enfatizando importância do processamento eficiente de dados ao esclarecer que, “grande parte do tempo e esforço no treinamento desses modelos é preparar dados aos modelos”, sendo que sua equipe desenvolveu métodos para aumentar eficiência dos pipelines de processamento de dados extraindo expertise de vários domínios, incluindo processamento de linguagem natural, computação distribuída e sistemas de armazenamento. Etapas de processamento de dados envolvem computações “paralelas”, permitindo que o documento seja processado de modo independente, processamento paralelo que pode acelerar a preparação de dados ao distribuir tarefas entre CPUs, no entanto, etapas como remoção de documentos duplicados exigem acesso a todo o conjunto de dados que não pode ser realizado em paralelo e, para acelerar o desenvolvimento do modelo Granite da IBM, foi desenvolvido processos para provisionar e utilizar milhares de CPUs, abordagem, que envolve reunir capacidade CPU ociosa na rede de data centers em nuvem IBM, garantindo largura de banda de comunicação entre CPUs e armazenamento de dados com os sistemas tradicionais de armazenamento de objetos fazendo com que CPUs fiquem ociosas devido baixo desempenho, portanto, empregando o sistema de arquivos Storage Scale de alto desempenho da IBM para armazenar em cache dados ativos de forma eficiente. Em 2023, a IBM escalou 100 mil vCPUs na IBM Cloud, processando 14 petabytes de dados brutos para produzir 40 trilhões de tokens para treinamento de modelos de IA, automatizando esses pipelines de dados usando o Kubeflow na IBM Cloud, métodos, que provaram ser 24 vezes mais rápidos no processamento de dados do Common Crawl comparados com técnicas anteriores, já que os códigos e modelos de linguagem Granite de código aberto da IBM foram treinados usando dados preparados através de pipelines otimizados, além disso, a IBM fez contribuições à comunidade IA ao desenvolver o Data Prep Kit, kit de ferramentas hospedado no GitHub, que simplifica preparação de dados à grandes aplicativos de modelos de linguagem, dando suporte a casos de uso de pré-treinamento, ajuste fino e geração aumentada de recuperação, RAG, construído em estruturas de processamento distribuídas como Spark e Ray, permite que desenvolvedores criem módulos personalizados escaláveis.
Moral da Nota: o governo da Califórnia processa a ExxonMobil no dia seguinte a assinatura pelo governador da lei que proíbe todas as sacolas plásticas nos supermercados, sob alegação de ter enganado o público durante 50 anos ao prometer que a reciclagem resolveria a crise global da poluição plástica, com o gabinete do procurador-geral do estado, liderado pelo procurador-geral Rob Bonta, dizendo que mesmo com programas de reciclagem, menos de 5% do plástico é reciclado em outro produto plástico nos EUA, embora os itens sejam rotulados como “recicláveis”, como resultado, aterros sanitários e oceanos ficam cheios de resíduos plásticos. O procurador disse que coalizão de organizações ambientais sem fins lucrativos entrou com processo semelhante contra a petrolífera, um dos maiores produtores globais de plásticos, sendo que o processo do estado é ação separada em que ambos os processos alegam que a ExxonMobil enganou o público através de declarações e campanhas de marketing, com os promotores dizendo em comunicado que Bonta espera forçar a ExxonMobil acabar com práticas enganosas e garantir fundo de redução e penalidades civis pelos danos causados. "ExxonMobil, durante décadas, tem enganado o público à nos convencer que a reciclagem de plástico poderia resolver a crise dos resíduos plásticos e da poluição, quando sabiam claramente que não era possível”, segundo o comunicado do procurador, esclarece ainda que “a ExxonMobil mentiu para aumentar lucros recordes à custa do planeta e possivelmente colocando em perigo nossa saúde”, já que sabia que o plástico é “extremamente caro e difícil de erradicar” que se desintegra em microplásticos nocivos, mas promoveu a reciclagem como solução chave através de plataformas de notícias e redes sociais, de acordo com o processo, ao mesmo tempo, a produção de plástico aumentou, sendo que ultimamente a ExxonMobil tem promovido a “reciclagem avançada”, conhecida como “reciclagem química”, e afirma que converterá melhor os plásticos antigos em novos produtos, segundo o processo.
Nota de rodapé: o mundo gera 51,7 milhões de toneladas de resíduos plásticos por ano, maior parte no sul global.