O ‘Batom na Cueca’ do GEO

engajesite
27 de fev
3 min de leitura

O saudoso jornalista Ricardo Boechat já dizia que, na hora de provar algo, não bastam indícios, é necessário apresentar evidências muito bem documentadas ou, como ele gostava de colocar, o ‘batom na cueca’. Isso se faz ainda mais relevante em momentos de disrupção, nos quais precisamos rever conceitos e caminhos, muitas vezes arraigados em nossas certezas.

Tendo tudo isso em mente, achei relevante aproveitar este recomeço pós Carnaval da série de artigos sobre o GEO (Generated Engine Optimization – conjunto de técnicas para otimizar uma marca e site/conteúdo para as ferramentas de buscas por IA) para trazer suas principais referências técnicas. A proposta aqui é contribuir para termos um patamar técnico para essas conversas. Importante pontuar que, sim, usei ferramentas de IA para me ajudarem nesta pesquisa. Mas chequei tudo, fiquem tranquilos (estou acrescentando os links de cada estudo aqui também – ‘batom na cueca’).

Tudo começou em novembro de 2023, quando um grupo de pesquisadores das Princeton University, Georgia Tech e Allen Institute for IA publicaram o artigo intitulado "GEO: Generative Engine Optimization". Além de cunhar o novo termo, o estudo mostrou que citar fontes e usar linguagem de autoridade são a melhor técnica para aumentar em mais de 40% a probabilidade de ser citado numa resposta de IA (a pesquisa comparou com diversos outros modelos, inclusive os do SEO tradicional).

O ponto aqui é que um site não pode simplesmente afirmar que tem a autoridade que pretende apresentar (as IAs não compram isso). Por isso precisa citar (ou ser citado) por fontes externas com credibilidade e relevância.

Mas antes mesmo disso, em maio de 2020, pesquisadores da META AI publicaram um paper importante para entendermos como acontece, na prática, esse processo de construção das respostas pelas IAs. Intitulado ‘Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks’, ele parte da premissa de que as IAs modernas, por mais poderosas que sejam, não têm capacidade de acumular todo o conhecimento sobre todos os fatos (desde quem foi David Bowie até o melhor lugar para se comer Tiramisú em São Paulo).

Desta forma, elas foram projetadas para vasculhar a web na busca por informações para essas e outras respostas. E, como eu posso ter uma resposta diferente da sua sobre o melhor Tiramisù (que seguramente também é diferente da forma como a doçaria da esquina descreve sua versão do doce italiano em seu próprio site), as ferramentas de Inteligência Artificial se baseiam em dados fornecidos por fontes com alta autoridade – em geral, uma vez mais, sites de notícias independentes, especializados e de grande credibilidade.

Finalmente, a documentação técnica da OpenIA do GPT-4 mostra o papel do feedback humano, por meio de uma técnica que a empresa batizou de RLHF (Reinforcement Learning from Human Feedback), no treinamento da nova versão, visando melhorar a qualidade e acurácia das respostas. E, para este feedback, os treinadores humanos são instruídos a sempre usarem como fonte para as suas avaliações, fontes externas críveis, especialmente especialistas e imprensa independente. Este processo, por fim, ‘ensina’ a IA a dar preferência à linguagem neutra e jornalística como fonte primária de dados para suas respostas.

A partir dessas fontes técnicas e científicas, é possível comprovar que as técnicas utilizadas no GEO, tanto nas melhorias do site quanto, principalmente, na implementação do Digital PR com foco específico em IA, são o melhor e mais bem embasado caminho para ampliar a probabilidade de que uma marca seja citada nesta modalidade de buscas.

Apresentadas as evidências, avançamos com nosso tema na semana que vem.

O ‘Batom na Cueca’ do GEO

Posts recentes

Comentários