Abril 25, 2021

FLoC: o que é e como funciona a alternativa do Google aos cookies

Por Walter Berg

Nas últimas semanas, o Google surpreendeu mais uma vez ao revelar uma nova política de coleta de dados dos usuários com a promessa de aprimorar a experiência com os anúncios. Os “novos cookies” são chamados de Federated Learning of Cohorts (FLoC), ou “Aprendizagem Federada de Coorte”, em tradução livre.

Na prática, os FLoC têm o mesmo objetivo do seu antecessor: entender o comportamento das pessoas para oferecer produtos e serviços com base no seu gosto. A diferença primordial é que o novo sistema faz isso de forma grupal, em vez de individualizado como é hoje.

Em vez analisar caso a caso, o FLoC pega uma grande amostra de usuários com características semelhantes — sexo, idade, classe social, formação acadêmica, hobbies — para entender como todos pensam, agem e reagem a propagandas específicas. Ainda não há detalhes mais específicos de que tipo de grupos seriam focados, mas dá para ter uma ideia com base no modelo de propaganda atual.

Isso é feito de forma local, no navegador da máquina, e transmitido aos servidores do Google de forma criptografada. Em tese, essa informação poderia ser interceptada no meio do caminho, mas isso exigiria a decodificação da mensagem, o que dificulta e muito o processo para criminosos virtuais.

A pronúncia do termo em inglês lembra a palavra “flock”, que significa bando. E a ideia é essa mesmo: categorizar hábitos semelhantes, em bando, para o direcionamento de conteúdo.

Propagandas mais direcionadas

Inicialmente, pode parecer um retrocesso, já que você perde o caráter individualizado do anúncio, mas, na prática, isso se mostra muito mais efetivo sob a ótica dos resultados. Basta traçar um paralelo com as pesquisas eleitorais, por exemplo: quando conduzidas por entidades sérias, elas costumam antecipar o resultado das urnas com uma margem de erro bem pequena (2 ou 3% para mais ou para menos).

É muito mais eficaz exibir anúncios sobre computadores para jovens adultos que acessam sites como o Canaltech regularmente do que para aquela pessoa na faixa dos 60 anos que entrou apenas uma vez para seguir um tutorial de como desabilitar sua conta no Instagram. Pelos cookies atuais, ambos poderiam estar qualificados para receber a propaganda, mas, pelo FloC, o primeiro grupo seria contemplado.

Cookies hoje são usados na maioria do sites (Imagem: Captura)

Justamente essa premissa é o que tem colocado o novo mecanismo de rastreio no centro de discussões sobre privacidade. Quais dados ele coleta dos usuários e em quais momentos? É preciso estar com o navegador aberto ou isso ocorrerá em segundo plano? Recursos do celular, como câmera e microfone, se usados em determinado site, poderiam ser utilizados como parte dos dados apurados pelo FLoc? Até o momento, não se sabe nada sobre isso.

Ativação inadvertida

Em fase de testes, o FLoC passou a ser usado sem qualquer aviso para cerca de 0,5% da base de usuários do Chrome. Essa pode ter sido uma estratégia do Google para evitar que as pessoas mantenham seus hábitos comuns e o resultado seja o mais fiel possível.

Mas não há como negar que essa atitude, no mínimo questionável, adentra terrenos bastante instáveis da segurança digital e da transparência. Como manter a confiança em alguém que impõe algo dessa magnitude sem avisar ao principal impactado?

Além disso, o recurso não é fácil de ser desabilitado, já que envolve a desativação de todos os cookies de terceiros, o que pode impedir a navegação em vários sites. Até o momento, não há sequer um tutorial do Chrome com orientações para impedir o novo tipo de monitoramento.

Essa foi uma das razões pela qual várias desenvolvedoras de navegadores decidiram bloquear o FLoC em seus programas. MicrosoftMozillaOpera, Vivaldi, Brave e DuckDuckGo se uniram em um golpe sem precedentes contra o Google. A maior perda sentida pode ter sido a do Microsoft Edge, o segundo navegador mais popular da web e um dos browsers construídos sobre a plataforma Chromium. “Nós apoiamos soluções com que levem em conta o consentimento do usuário, e não aquelas que sobrepõem as suas escolhas”, teria dito a empresa, em comunicado enviado ao site The Verge.

O perigo de tantos dados coletados

A falta de consentimento e a facilitação para métodos de rastreamento como fingerprinting são apontados como os grandes vilões do FLoC. O primeiro caso foi mencionado logo acima e envolve a perda da confiança das pessoas.

Já o segundo diz respeito aos perigos de se ter uma base de dados tão grande, com informações personalizadas dos usuários. Fingerprint significa impressão digital e transmite exatamente este conceito para o ramo da computação: a identificação única do usuário. Ainda que o FLoC use técnicas para não “dar nomes aos bois”, se as informações coletadas forem reunidas, dá para montar o quebra-cabeça e descobrir quem é quem.

O temor é das informações cairem nas mãos de quem não deve (Imagem: mstandret/Envato)

Há ainda o risco iminente de vazamentos, algo relativamente comum nas grandes empresas de tecnologia. Imagine o quão valioso são esses dados segmentados e como isto pode despertar a atenção de cibercriminosos. Por mais que o Google invista em segurança, é praticamente impossível garantir que as informações não caiam nas mãos de gente mal-intencionada.

Por fim, um questionamento pertinente: seria interessante para o mundo moderno ter tantos dados sensíveis nas mãos de uma só empresa? O Google já responde a processos no mundo inteiro por acusação de monopólio e outras práticas anticompetitivas. Com uma tecnologia mais invasiva, e potencialmente mais “indiscreta”, não estaria a gigante das buscas estabelecendo uma oligarquia mundial no setor de publicidade?

CT: Já chegaram a notar algum tipo de conflito entre esses “novos cookies” e as ferramentas/políticas da empresa?

DB: Assim como os cookies, que são pequenos pedaços de informação, o FLoC tem o mesmo conceito de permitir a veiculação de anúncios. Isso não gera nenhum tipo de detecção nas ferramentas de proteção, pois seu uso não pode ser classificado como malicioso.

Existe algum impacto, seja ele positivo ou negativo, na privacidade do usuário? Quais seriam eles?

Pelo que se pode ver, o FLoC ainda está evoluindo e se desenvolvendo, mas seu objetivo é tornar a experiência do usuário mais privada, já que quem anuncia só terá informações de um grupo de consumidores, não de usuários individuais. Como qualquer outro serviço dos milhares que são oferecidos gratuitamente na Internet, por trás de um modelo de negócios que sustenta as empresas, cada usuário deve estabelecer sua expectativa de privacidade e estar ciente dos dados que está entregando em troca do uso de aplicativos e serviços.

Se a tecnologia utilizada não atender à expectativa de privacidade do usuário, o impacto será negativo para o usuário. Por outro lado, se estiver em linha com as necessidades do usuário, o impacto será positivo.

Embora o FloC monitore usuários em grupos de coorte, em vez de fazê-lo individualmente, aparentemente a nova modalidade coleta mais dados do que os cookies atuais. Isso é verdade? Se sim, não haveria o risco de criminosos interceptarem tais dados para uso próprio e individualizado?

As características do FLoC mostram que ele irá coletar dados de navegação em geral. Cookies de rastreamento podem agregar muitas informações sobre o comportamento online e informações da própria equipe. Se ele irá coletar mais ou menos informações, dependerá de como é implementado. Acho que o alerta sobre um dimmer vale a pena; as informações transmitidas para promover os anúncios serão apenas métricas, e não o comportamento em si.

O que vimos sobre os recursos do FLoC é que ele criptografa as informações localmente e as processa. Se os criminosos tiverem acesso a essas informações criptografadas e forem capazes de quebrar essa criptografia, isso pode mostrar os padrões de uso da Internet pelos criminosos e se tornar um risco para os usuários.

A centralização de informações poderia facilitar ou dificultar práticas como o fingerprinting? Como a empresa poderia se proteger neste sentido? Há algo que o usuário possa fazer?

Existem muitos métodos utilizados para rastrear pessoas. Muitos deles ocorrem no navegador e alguns usam cookies. Normalmente, essa coleta de informações é realizada diretamente no computador do usuário, ou seja, uma abordagem do lado do cliente. Por ter uma implementação focada na segurança, como parece ser o caso, o acesso às informações contidas no FLoC não estaria disponível, evitando a coleta por terceiros maliciosos.

Mantendo o foco sobre o tópico, é possível configurar os navegadores para que os scripts não rodem sem permissão, inibindo Java ou implementando inibidores de execução. Outra forma de impedir a execução de scripts mal-intencionados é sempre ter uma solução de proteção ativa, atualizada e configurada para impedir ameaças, o que ajudará a proteger os usuários se algo mal-intencionado tentar ser executado sem seu conhecimento.

Uma das críticas ao Google com o FloC é o fato de ter sido habilitado sem aviso prévio. Isso configuraria uma violação de privacidade? Como comunicar isso de forma eficaz ao usuário?

A única informação que vi sobre o FLoC é que ele está sendo usado em ambientes de teste do Chrome, e acho que o Google tem sido cauteloso ao usar novas tecnologias no ambiente de teste em termos de aceitação fornecida aos usuários. A privacidade dependerá da implementação da tecnologia, e será necessário vê-la em uso para medir adequadamente os impactos que podem ocorrer.

Acredito que a melhor forma de comunicação é a estabelecida por lei, seja pela LGPD (no Brasil) ou a GDPR (na Europa), que exige que o acesso aos dados do usuário seja feito apenas para uma finalidade específica e com seu consentimento direto.

Na sua opinião, há uma solução que consiga, ao mesmo tempo, garantir a privacidade do usuário e não ferir o modelo de negócio de anúncios das empresas da internet?

Exceto pelos pontos de atrito que estão ocorrendo com essa nova tecnologia, o FLoC tem exatamente essa intenção: aumento da privacidade e continuidade do modelo de publicidade digital de forma viável.

Há algo que possa ser feito, em termos de ferramentas, para bloquear o FloC ou, ao menos, restringir os dados coletados?

Para saber as maneiras adequadas de contornar uma determinada tecnologia, primeiro é necessário saber como essa tecnologia funcionará. Se os navegadores que a utilizam possuirão um botão para habilitá-la/desabilitá-la ou se será necessário um bloqueador externo.

Levando em consideração a tecnologia que temos atualmente no mercado, que são os cookies, não é possível escolher o que eles acessarão ou não, sendo necessário tomar outras medidas para evitar problemas, tais como: evitar instalar extensões desconhecidas e softwares dos quais você não conhece o fabricante; ter um sistema de proteção instalado, atualizado e configurado para bloquear ameaças; usar bloqueadores de execução de script no navegador.


E você, o que acha da nova política de coleta de dados Google? Acredita que ela possa ser benéfica, como um todo, ou pode gerar problemas de segurança e privacidade?