A privacidade dos dados é a maior preocupação no treinamento de modelos de inteligência artificial (IA), e o aprendizado federado (AF), ou federated learning (FL), resolve a questão. Mesmo quando o treinamento é compartilhado com outros hospitais, as informações sensíveis se mantém dentro da instituição.
E este é um dos maiores benefícios desta técnica: permitir a colaboração entre múltiplas instituições, respeitando rígidas normas de privacidade, para criar modelos maiores, e com maior variedade de dados.
O que é o aprendizado federado e como funciona
Conceito
O aprendizado federado é uma abordagem de aprendizado de máquina, o chamado machine learning, na qual os participantes compartilham os parâmetros, gradientes e atualizações do modelo através de um servidor central, sem enviar seus dados originais.
Estes parâmetros compartilhados são variáveis internas do modelo, como pesos e vieses, que são ajustados durante o treinamento local com base nos dados da instituição. Esses parâmetros moldam o comportamento do modelo. Já o gradiente é um vetor que aponta a direção de maior crescimento da função de perda, e é utilizado para calcular as atualizações dos parâmetros, com o objetivo de minimizar o erro do modelo por meio da descida do gradiente.
Funcionamento na prática
- Modelo global é distribuído: um servidor central é selecionado, inicia o processo de aprendizado com seus parâmetros ou pesos, e os envia para os participantes que irão colaborar com o treinamento;
- Treinamento local: cada instituição, utilizando o modelo recebido, treina uma versão local, mantendo os dados brutos dentro dos firewalls da instituição;
- Envio de atualizações do modelo: as instituições compartilham as “características do modelo”, como parâmetros, gradientes e atualizações, de volta para o servidor central;
- Agregação e atualização do modelo global: o modelo global é atualizado e refinado com base nas informações recebidas dos participantes, podendo ser realizada através de média ponderada;
- Iteração: uma nova rodada de treinamento é realizada, com os mesmos participantes, ou um novo conjunto, e se repete até que o modelo atinja um desempenho satisfatório.
Vantagens do uso aprendizado federado em hospitais
- Preservação da Privacidade e Conformidade Regulatória: garantindo a conformidade com rigorosas regulamentações de privacidade e leis de proteção de dados, as informações sensíveis do paciente permanecem na instituição e não são compartilhadas;
- Acesso a Dados Maiores e Mais Diversos: permite um treinamento maior, com dados diversos, diferente de treinar um modelo localmente, na qual têm-se o risco do chamado “silos de dados”, quando as informações ficam isoladas e refletem apenas uma pequena parte da população;
- Melhora da Qualidade e Generalização do Modelo: a literatura demonstra que modelos treinados com aprendizado federado alcançam melhores níveis de desempenho, e são menos enviesados do que aqueles treinados localmente;
- Redução de Custos: uma vez que o compartilhamento de informações é menor, o custo da transferência é mais baixo;
- Fomento à Inovação: a colaboração entre hospitais, instituições e pesquisadores é incentivada em prol de um bem comum, concentrando os recursos na resolução de necessidades clínicas.
Riscos e desvantagens do aprendizado federado na área da saúde
- Trade-Off Entre Privacidade e Desempenho: ao compartilhar apenas parte das informações, adicionando ruído ou usando criptografia, pode-se obter um desempenho inferior ao desejado, afetando diretamente a precisão do modelo;
- Heterogeneidade e Qualidade dos Dados: a heterogeneidade e qualidade dos dados médicos, com variações devido a diferenças de aquisição, fabricantes de dispositivos ou demografia local, pode atrasar a convergência do modelo;
- Requisitos de Infraestrutura e Computacionais: é necessário que todos os participantes possuam infraestrutura suficiente para o treinamento do modelo e compartilhamento de informações;
- Obstáculos Organizacionais e Logísticos: há uma dificuldade em convencer departamentos de TI e stakeholders a participar, pois exige pessoal local disponível, supervisão e gerenciamento de falhas;
- Questões de Propriedade Intelectual: avaliação da contribuição de cada instituição, negociação de contratos, e incentivos justos aos participantes são assuntos a serem abordados no planejamento do aprendizado federado;
- Explicabilidade do Modelo: uma vez que não há acesso direto aos dados originais, a explicabilidade do modelo torna-se desafiadora.
Aplicações do aprendizado federado na área da saúde
Revisão publicada na revista Cell Reports Medicine
Em fevereiro de 2024, pesquisadores afiliados a instituições de Singapura, divulgaram uma revisão sistemática abrangente na revista Cell Reports Medicine. Eles avaliaram 612 artigos para entender como o aprendizado federado está sendo aplicado na área da saúde.

Foi verificado que apenas 5,2% dos estudos analisados foram aplicados em cenários clínicos reais, o que demonstra que a abordagem apresenta desafios importantes para sua implementação clínica. A grande maioria dos estudos (65%) são de design técnico com protótipos simulados.
Entretanto, destacaram um aumento exponencial de artigos publicados sobre o assunto, ano a ano, após 2020, o que demonstra o crescente interesse por essa abordagem.

Os pesquisadores observaram também que a radiologia e medicina interna são as especialidades mais comuns no uso do aprendizado federado, sendo imagens médicas, o tipo de dado mais comum (41,7%), seguido de prontuários eletrônicos (23,7%).
Plataforma de IA para Diagnóstico e Tratamento de COVID-19 no Brasil
Entre maio e agosto de 2020, a Novartis Foundation analisou mais de 10.000 imagens de pulmões de pacientes, e identificou 70% como positivos para COVID-19. Para isso, foram utilizadas radiografias de tórax e tomografias de mais de 50 hospitais no Brasil, ajudando os médicos a priorizar tratamentos e decidir sobre as melhores opções.
A iniciativa contou com a parceria com o governo do estado de São Paulo e o Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo.
Projeto Melloddy na descoberta de medicamentos
O Projeto Melloddy (MachinE Learning Ledger Orchestration for Drug DiscoverY) é uma iniciativa europeia que envolve o consórcio de dez empresas farmacêuticas, cujo objetivo foi implementar a aprendizagem federada para otimização do processo de descoberta de medicamentos. As empresas envolvidas: Amgen, Astellas, AstraZeneca, Bayer, Boehringer Ingelheim, GSK, Janssen, Merck KGaA, Novartis e Servier
Neste projeto, a aprendizagem federada foi utilizada para treinar um modelo preditivo comum que inferisse como compostos químicos se ligam a proteínas, sem que as empresas tivessem que revelar seus valiosos dados internos.
Para isso, o modelo construído se baseou na técnica QSAR (Relacionamento Quantitativo Estrutura-Atividade), que consiste em prever o comportamento biológico de uma molécula a partir de sua estrutura química. Em outras palavras, o algoritmo aprende a identificar padrões entre a forma e composição dos compostos químicos e os efeitos que eles podem gerar no organismo, como a capacidade de se ligar a uma proteína-alvo.
O volume de dados utilizado no projeto foi impressionante: 2,6 bilhões de pontos de dados de atividade experimental confidenciais, documentando mais de 21 milhões de pequenas moléculas físicas e mais de 40 mil ensaios em farmacodinâmica e farmacocinética.
Esta iniciativa trouxe grandes benefícios para o setor farmacêutico, e é um exemplo concreto de aplicação real e economicamente relevante de aprendizagem federada.
Conclusão
O aprendizado federado apresenta um enorme potencial para a área da saúde. Ao mesmo tempo que protege a privacidade dos dados, permite o avanço da inteligência artificial médica, a criação de modelos mais robustos e equitativos, e a colaboração entre instituições e pesquisadores.
Entretanto, desafios técnicos, organizacionais, legais e de incentivo ainda persistem, o que requer um esforço coordenado para superá-los e, assim, implementar a técnica em larga escala.
🔗 Referências e Leitura Complementar
- Brazil COVID-19 Response – Novartis Foundation
- MELLODDY: Cross-pharma Federated Learning at Unprecedented Scale – Journal of Chemical Information and Modeling
- Real-world Federated Learning in Radiology: Hurdles to Overcome and Benefits to Gain – PubMed
- Federated Benchmarking of Medical Artificial Intelligence with MedPerf – Nature Machine Intelligence
- Federated Machine Learning in Healthcare: A Systematic Review – ScienceDirect
- The Future of Digital Health with Federated Learning – npj Digital Medicine
O Neural Explica! é nosso glossário de inteligência artificial. Nesta seção explicamos os mais variados termos de IA, aplicados à área da saúde, com foco em exemplos reais.
— 🧠 **Por Gustavo Giannella, para o Neural Saúde** Biomédico especialista em diagnóstico por imagem e inteligência artificial aplicada à saúde. Editor do portal NeuralSaude.com.br, dedicado a mapear e explicar como a IA está transformando a medicina no Brasil. 📩 Quer acompanhar as novidades? Siga o [Instagram @neuralsaude] ou visite o site [www.neuralsaude.com.br] —



