O Brasil enfrenta um desafio crítico em relação à organização de seus dados culturais, conforme alerta Jorge Brivilati, cofundador e CEO da Bamboo Data. A falta de estruturação adequada pode levar a uma representação distorcida da cultura brasileira em modelos de inteligência artificial (IA).
A questão do viés cultural
Quando solicitamos a um modelo de IA que gere imagens de manifestações culturais brasileiras, como o Maracatu ou um mercado público nordestino, as respostas frequentemente se mostram genéricas ou incorretas. Isso não se deve a falhas nos algoritmos, mas à origem dos dados que alimentam esses sistemas.
A importância da estruturação de dados
Brivilati destaca que a discussão sobre IA deve começar pela origem dos dados. Sem bases estruturadas, a tecnologia aprende sobre o Brasil de forma superficial. A Bamboo Data atua na criação de datasets audiovisuais que refletem a diversidade cultural do país, permitindo treinos mais precisos e representativos.
Pesquisas e evidências de viés
Estudos realizados por pesquisadores do laboratório FAIR da Meta revelaram que modelos de IA apresentam menor diversidade quando solicitados a representar regiões como África e Ásia Ocidental. Além disso, outro estudo identificou que ao utilizar prompts genéricos, como 'EUA', os modelos tendem a retornar imagens de cenários metropolitanos, excluindo áreas menos urbanizadas.
O impacto na comunicação empresarial
Para as empresas que utilizam IA generativa, essas lacunas nos dados têm consequências diretas. A visão de mundo que a tecnologia oferece não representa adequadamente o público-alvo, impactando a comunicação e o atendimento ao cliente.
Movimentos em prol da soberania de dados
O Brasil está começando a se mover em direção à soberania de dados, com investimentos significativos em inteligência artificial. O governo federal anunciou R$ 23 bilhões até 2028, enquanto iniciativas estaduais, como o programa SoberanIA, buscam coletar dados em conformidade com a legislação e com foco na cultura brasileira.
