Inteligência artificial dá CPF de políticos e empresários usando documentos encontrados na web. OpenAI promete corrigir falha.
O ChatGPT está divulgando números de CPF de pessoas públicas a partir de perguntas simples. De acordo com o jornal Folha de S.Paulo, o robô com inteligência artificial fornece o número do documento quando ele está disponível na internet em processos, notas fiscais ou atas de empresas.
Em resposta à publicação, a OpenAI agradeceu o relato e disse estar trabalhando ativamente em uma solução. “Treinamos os modelos que alimentam o ChatGPT para recusarem solicitações de identificadores governamentais, mesmo que essas informações estejam disponíveis online”, declarou a empresa à Folha.
Vale dizer que, em alguns casos, essas informações também constam no Google. Nem sempre elas estão disponíveis de modo tão rápido, entretanto — às vezes, é necessário navegar por arquivos PDF de processos judiciais, por exemplo.
Em testes realizados pelo Tecnoblog nesta sexta-feira (21/02), um dia após a matéria da Folha ir ao ar, o chatbot continua fornecendo essas informações ao ser questionado. Às vezes, demora um pouco, já que ele se recusa em algumas tentativas, mas é possível obter o CPF de figuras públicas após insistir.
Foi possível, por exemplo, conseguir o CPF do presidente Luiz Inácio Lula da Silva; do vice-presidente Geraldo Alckmin; do ex-presidente Jair Messias Bolsonaro; e do prefeito de São Paulo, Ricardo Nunes.
A Folha também relata ser possível conseguir o CPF de outros tipos de figuras públicas. Em nossos testes, foi possível obter o número do documento de alguns empresários.
Ao tentar apresentadores de TV, o ChatGPT disse que não poderia fornecer a informação. Um caso, porém, foi curioso: o bot respondeu com o CPF de um homônimo, obtido a partir de um documento do Banco Central.
Às vezes, o ChatGPT alerta que o uso indevido destas informações é ilegal.
“É importante ressaltar que o uso indevido de informações pessoais sem consentimento pode ser ilegal e sujeito a penalidades. Portanto, é fundamental respeitar a privacidade e a proteção de dados pessoais de todas as pessoas”, escreve a IA logo após informar um CPF.
Os advogados ouvidos pela Folha têm opiniões diferentes sobre uma possível violação à Lei Geral de Proteção de Dados (LGPD).
Embora a LGPD exista para zelar pela privacidade, alguns apontam que a lei brasileira permite que dados de documentos processuais e de administração pública, por exemplo, fiquem acessíveis. São estes documentos que servem de base para o ChatGPT dar o CPF de políticos e empresários.
Esta questão deve ficar mais clara em breve. O Supremo Tribunal Federal (STF) deve julgar um caso envolvendo o site Escavador e uma pessoa envolvida em um processo trabalhista. Esta pessoa reclama que a plataforma expôs seus dados.
O caso terá repercussão geral. Isto significa a decisão ministros do STF será seguida por outras instâncias da Justiça.
Com informações da Folha de S.Paulo
Receba mais posts do TB
Os dados pessoais de figuras públicas devem ser públicos de acordo com a Lei de Acesso à Informação.
Insisti ao ChatGPT saber o CPF de Jair Bolsonaro e o site não me deu a resposta.
Quem não me garante que o ChatGPT não se alimentou também com dados vazados daqueles mega leaks anteriores?
Qualquer individuo politicamente exposto ou funcionários públicos já tem seus dados publicados em qualquer Diário Oficial. Que entra na Lei de Acesso a Informação.
O maior problema é que isso (disponibilidade de dados pessoais em resultados da Web) não se limita a figuras públicas, não.
Quem é ou já foi MEI (muita gente desde a criação dessa modalidade até hoje) tem/teve seu nome completo atrelado ao CPF (que é literalmente a razão social de qualquer MEI) entregues de bandeja pela Receita Federal para agregadores como “cnpj biz”, “cnpj info”, entre outros. E não só CPF a partir do nome completo: endereço, telefone, e-mail, tudo!
E pra solicitar remoção não é nada trivial: a pessoa tem que mandar o Comprovante de MEI pro agregador, o que significa que vão ter em mãos um documento que só o MEI conseguiria emitir, abrindo assim possibilidade daquele agregador vazar o Comprovante pra terceiros ou eles próprios usarem de forma maliciosa: contratar serviços em nome da empresa, abrir contas bancárias em nome da empresa, etc. Se o MEI é cabreiro o suficiente pra não confiar no agregador, não há outra alternativa a não ser deixar quieto e “permitir” que o agregador continue indexando os dados do mesmo.
Com nome e CPF acompanhados de endereço, telefone e e-mail, disponíveis escancaradamente na Internet, em domínios internacionais, não me surpreenderia que tais dados também façam parte do treinamento de LLMs.
Quem já prestou concurso também tem seus dados lá disponíveis nos resultados de busca. Geralmente é o RG acompanhado do nome completo, mas em alguns casos é o CPF (que, olha só, há alguns anos passou a ser o documento usado no lugar do RG no tal de “CIN” porque “mais de um RG pode ser emitido através de estados diferentes, então vamos centralizar tudo no número de CPF”… uau, boa ideia! Os golpistas, anunciantes e agregadores de internet estão amando a ideia). Embora são sites .br, não duvido que existam agregadores internacionais também.
Quem já abriu processo judicial, também vai ter seu nome completo indexado por agregadores, também. Geralmente escondem o número do processo por trás de uma paywall, mas o nome inteiro aparece ali, junto, em algumas situações, do CPF ou RG, email, telefone, etc.
E mesmo que uma pessoa nunca abriu MEI nem processo nem prestou concurso, ainda passa por várias outras situações que levam à publicação de informações pessoais na Internet. Isso sem contar os vazamentos de dados porque os gênios dos serviços de internet decidiram que é uma ótima ideia atrelar e-mail e telefone celular das pessoas em um banco de dados dando sopa para um hacker qualquer ou mesmo um funcionário da empresa resolver vazar isso, que vai acabar parando em resultados públicos.
Resumo da ópera: vivemos tempos sombrios para a privacidade. Daí há aquela falácia do “quem não deve não teme”: segundo essa ideia, não deveríamos temer golpistas usando nossos dados, não deveríamos temer empresas puxando nossos dados… É por culpa desses indivíduos do “quem não deve não teme” que nossos dados estão aí, soltos na Internet, pra qualquer golpista escolher qual vai usar pro próximo golpe.
” Não é preciso muito esforço para lembrar que há algum tempo a própria OpenAI estava sendo processada por violar dados de privacidade ao absorver toda a web escrita sem nenhum tipo de consentimento. No final das contas, foi assim que a empresa deu passos largos com o GPT.”
E o DeepSeek é o vilão neh kkkkkkkk…
OpenAI e o desafio de US$ 6.6 bilhões
Compartilhe
© Mobilon Mídia 2005 – 2025.
{{ excerpt | truncatewords: 35 }}
Veja também
você não vai sair de nosso site